Фото: Пиксабеј

Моделите што постојано ги ажурираат своите бази на податоци и учат од нив би можеле драматично да ги променат роботиката, зголемената реалност и мноштво други области. Како што моделите што го напојуваат ЧетГПТ се обучени да предвидуваат текст, оние за генерирање видеа предвидуваат што е статистички најверојатно да се прикаже следно. Но проблемот е што вештачката интелигенција во двата случаја нема јасно дефиниран модел на светот што постојано го ажурира. Поради тоа, се случуваат чудни ситуации во кои, на пример, одредени објекти во видеото исчезнуваат или се претвораат во нешто друго.
Истражувачи во голем број области на вештачката интелигенција работат на создавање светски модели, со импликации што се протегаат подалеку од генерирањето видео и употребата на роботи што брборат, до зголемена реалност, роботика, автономни возила, па дури и човечка интелигенција – или општа вештачка интелигенција. Едноставен начин да се разбере моделирањето на светот е преку четиридимензионални или 4Д-модели (три димензии плус време).
Да се ​​потсетиме на 2012 година, кога филмот „Титаник“, 15 години по неговата премиера, беше макотрпно претворен во стереоскопски 3Д. Ако требаше да го замрзнете кој било кадар, ќе имавте впечаток на растојание меѓу ликовите и предметите на бродот. Но ако Леонардо Дикаприо беше свртен со грб кон камерата, не можевте да го заобиколите за да му го видите лицето. Кинематографската 3Д-илузија е создадена со помош на стереоскопија: две малку различни слики, често проектирани брзо едноподруго, една за левото и една за десното око. Секој во киното гледа ист пар слики и затоа има слична перспектива. Повеќекратните перспективи се приближуваат до реалноста благодарение на изминатата деценија истражувања. Почнувајќи од 2020 година, алгоритмите НеРФ (неврално поле на зрачење) понудија начин за создавање фотореалистични рендерирања, но бараа комбинирање на многу фотографии за системот со вештачка интелигенција да генерира 3Д-рендерирање.
Други 3Д-пристапи користат вештачка интелигенција за предвидливо пополнување на информациите што недостигаат, што повеќе отстапува од реалноста. Замислете дека секој кадар во „Титаник“ е претставен во 3Д, така што филмот постои во 4Д. Можете да се движите низ времето за да видите различни моменти или да се движите низ просторот за да го гледате од различни перспективи. Ова се рани резултати, но тие навестуваат поширок тренд: модели што ја ажурираат внатрешната мапа на сцената додека се генерираат.