Вештачка интелигенција го преведе клинестото писмо
Колку и да е тежок процесот на преведување, ништо не се споредува со предизвикот да се преведе антички јазик на современ. Тие преведувачи не само што мора да ги оживеат изумрените јазици од пишани извори туку мора да поседуваат и длабоко познавање за тоа како културите што ги создале тие извори се развивале низ вековите. Ако тоа не е доволно, нивните извори често се фрагментирани, што значи дека клучниот контекст е изгубен со текот на времето. Поради тоа, бројот на луѓе способни да преведуваат древни јазици е мал, а нивните напори честопати не можат да бидат во чекор со обемот на текстови што го откриваат археолозите.
Процесот на преведување е двофазен
Земете го на пример античкиот акадски јазик. Овој ран семитски јазик е еден од најдобро документираните од античкиот свет. Стотици илјади, според некои извори дури и повеќе од милион, акадски текстови се откриени и денес се зачувани во музеи и во универзитети. Многу се дури и дигитализирани. Секој од овие текстови има потенцијал да нѐ научи за животот, политиката и верувањата на првите цивилизации, но тоа знаење останува „заклучено“ поради времето и човечките ресурси потребни за нивно преведување.
За да се промени тоа, мултидисциплинарен тим од археолози и компјутерски научници разви вештачка интелигенција што може да преведува акадски речиси веднаш, отклучувајќи ги историските записи зачувани во овие 5.000 години стари таблети.
Акадскиот јазик бил мајчин јазик на Акадската Империја, која се појавила околу 2.300 година пр. н.е., благодарение на освојувањата на нејзиниот основач, Саргон Велики. Како говорен јазик, акадскиот на крајот се разделил на асирски и вавилонски дијалекти, пред да биде целосно заменет со арамејски во почетокот на првиот милениум пр. н.е. Денес тој е навистина изумрен јазик, без потомци што ќе го продолжат неговото наследство.
Како писмен јазик, сепак, акадскиот се покажал поиздржлив. Империјата го усвоила клинестото писмо на својот претходник, сумерската цивилизација. Тој систем за пишување користел перо од трска за да втисне клинесто писмо во влажни глинени плочи пред да испукаат (оттука и името „клинесто писмо“, што на латински значи „клин во облик“). Дури и откако арамејскиот го заменил акадскиот како заеднички јазик во регионот, научниците продолжиле да пишуваат на акадско клинесто писмо до првиот век од нашата ера – дури и во антиката, се чини дека академиците биле неверојатно упорни.
Процесот на преведување на акадскиот јазик е двофазен. Прво, експертите ги транслитерираат знаците со клинесто писмо, односно ги транскрибираат користејќи слични фонетски звуци на целниот јазик. Потоа, научниците користат транслитерација за да го преведат текстот на современ јазик.
Развиен модел на машинско преведување
За да се забрза тој процес, кој одзема многу време, истражувачкиот тим развил модел на машинско преведување за акадското клинесто писмо, користејќи ја истата технологија што го овластува Гугл транслејт. Моделот со вештачка интелигенција бил обучен на примерок од текстови и потоа научил да преведува на два начина: од транслитерации на оригиналните текстови и директно од клинесто писмо.
Резултатите се ветувачки, но има уште работа. Моделот најдобро функционира со кратки и средни реченици и со поформални жанрови, како што се кралски декрети и административни записи. Со поголема обука за поголем сет на податоци, истражувачите се надеваат дека ќе ја подобрат точноста на преводот. На крајот на краиштата, целта е моделот на вештачка интелигенција да стане виртуелен асистент за човечки научници, обезбедувајќи брзи преводи што експертите можат дополнително да ги усовршат.
– Стотици илјади глинени плочи со клинесто писмо ја документираат политичката, социјалната, економската и научната историја на античка Месопотамија. Сепак, повеќето од овие документи остануваат непреведени и недостапни поради нивниот огромен број и ограничениот број експерти способни да ги читаат – пишува тимот во студијата.
Ова претставува голем чекор кон зачувување и проширување на културното наследство на античка Месопотамија, пишува „Нова рс“.