(Видео) Мона Лиза стана раперка: Новиот модел на ВИ на „Мајкрософт“ прави анимации од ликови


Мона Лиза сега може да направи повеќе од насмевка, благодарение на новата технологија за вештачка интелигенција од „Мајкрософт“.

Минатата недела, истражувачите на „Мајкрософт“ детализираа нов модел на вештачка интелигенција што го развија, а кој може да направи видео од слика на лице и аудио клип со реален изглед на тоа лице што зборува. Видеата – кои можат да се направат од фотореалистични лица, како и од цртани или уметнички дела – се комплетирани со привлечна синхронизација на усните и природни движења на лицето и главата.

Во едно демо видео, истражувачите покажаа како ја анимирале Мона Лиза да изведува комичен рап од актерката Ен Хатавеј.

Излезите од моделот со вештачка интелигенција, наречен VASA-1, се и забавни и малку застрашувачки во нивната реалност. „Мајкрософт“ соопшти дека технологијата може да се користи за образование или за „подобрување на пристапноста за поединци со комуникациски предизвици“ или потенцијално за создавање виртуелни придружници за луѓето. Но, исто така е лесно да се види како алатката може да се злоупотреби и да се користи за да се имитираат вистински луѓе.

Тоа е загриженост што оди подалеку од „Мајкрософт“: како што се појавуваат повеќе алатки за создавање убедливи слики, видеа и аудио генерирани со вештачка интелигенција, експертите се загрижени дека нивната злоупотреба може да доведе до нови форми на дезинформации. Некои, исто така, се загрижени дека технологијата може дополнително да ги наруши креативните индустрии од филм до рекламирање.

Засега, „Мајкрософт“ рече дека не планира веднаш да го објави моделот VASA-1 во јавноста. Потегот е сличен на начинот на кој партнерот на „Мајкрософт“, OpenAI се справува со грижите околу неговата видео алатка генерирана со вештачка интелигенција, Сора (Sora): OpenAI објави тизер за Сора во февруари, но досега ја направи достапна само за некои професионални корисници и професори за сајбер безбедност за цели на тестирање.

„Ние сме против какво било однесување за создавање на заблуда или штетна содржина на вистински лица“, велат истражувачите на „Мајкрософт“ во блог пост. Но, додаваат тие, компанијата „нема планови да го објави“ производот јавно „додека не бидеме сигурни дека технологијата ќе се користи одговорно и во согласност со соодветните прописи“.

Создавање на анимации од ликови

Новиот модел на „Мајкрософт“ за вештачка интелигенција беше обучен на бројни видеа од лицата на луѓето додека зборуваат, а дизајниран е да ги препознава природните движења на лицето и главата, вклучително и „движење на усните, изразување (не усни), поглед на очите и трепкање, меѓу другото“, велат истражувачите. Резултатот е пореално видео кога VASA-1 анимира неподвижна фотографија.

На пример, во едно демо видео поставено на клип на кој некој звучи вознемирено, очигледно додека игра видеоигри, лицето што зборува има избраздени веѓи и свиткани усни.

Алатката за вештачка интелигенција може да се насочи и да произведе видео каде субјектот гледа во одредена насока или изразува одредена емоција.

Можностите на вештачката интелигенција восхитуваат, но истоврмено и загрижуваат: ЛИНК до видеата

Кога се гледа внимателно, сè уште има знаци дека видеата се генерирани од машина, како што се ретко трепкање и претерани движења на веѓите. Но, „Мајкрософт“ посочува дека верува дека неговиот модел „значително ги надминува“ другите слични алатки и „го отвора патот за ангажмани во реално време со реални аватари кои имитираат човечко разговорно однесување“. (Си-Ен-Ен)