Хашем Ал-Гаили е јеменски молекуларен биолог, популаризатор на науката и режисер, најпознат по неговата истоимена Фејсбук страница, која ја лансираше во 2008 година. На неа, тој објавува инфографици и кратки видеа за научни вести и истражувања. Од октомври 2022 година, страницата имаше повеќе од 32 милиони следбеници, а тој има речиси милион следбеници на Инстаграм.
Со неверојатниот успех на алатките што користат вештачка интелигенција за обработка на фотографии, текст или видеа, се појави голем интерес за „оживување“ на историски личности. Имено, врз основа на бисти, скулптури и слики, Хашем користел вештачка интелигенција за да покаже како навистина изгледале некои познати историски личности. Иако вештачката интелигенција не е секогаш точна, конечниот резултат е најблиску до тоа како тие навистина изгледале, објави порталот „Новости магазин“.
Во видеото се прикажани Нефертити, Сократ, Никола Коперник, Исак Њутн, Галилео Галилеј, Наполеон, Бетовен, Вилијам Шекспир…
Како вештачката интелигенција прави видео од фотографија или биста на историска личност?
Historical icons brought back to life by AI.
by Hashem Al-Ghaili pic.twitter.com/rce9Dn3WgC
— The Figen (@TheFigen_) June 22, 2025
Процесот вклучува неколку клучни технологии во областите на компјутерски вид, длабоко учење и синтеза на движење и глас. Подолу се наведени главните фази:
1. Анализа на лице од фотографија или биста
Вештачката интелигенција користи алгоритми за препознавање на лице за да идентификува клучни точки на лицето – како што се очи, веѓи, усни, брада и контури на лицето. Дури и во случај на биста (скулптура), системот ги препознава основните форми и ориентација на лицето.
Негова цел е да ја разбере анатомијата и изразите на лицето за да може да ја „мапира“ анимацијата.
2. Анимација на лице со користење на модели на движење
Потоа се користи генеративен модел (обично некоја варијанта на Генеративни непријателски мрежи – GAN или вештачка интелигенција за пренос на движење), кој, врз основа на постоечка фотографија или биста, симулира движења на лицето – како што се зборување, трепкање, навалување на главата итн.
Вештачката интелигенција користи примерок – да речеме, видео од вистинско лице кое зборува – и го „пренесува“ тоа движење на статична слика. Ова се нарекува пренос на снимање на движење.
3. Конечна обработка: осветлување, позадина, текстури
Конечно, вештачката интелигенција ги додава последните детали:
– осветлување и сенки според сцената
– која било позадина
– боја на кожа, текстура на облеката итн.