Во речиси половина свет или 74 држави, меѓу кои и Македонија оваа година се одржуваат избори, а тоа е период кога во политичката битка меѓу политичките опоненти се заострува реториката, се интензивира говорот на омраза на социјалните медиуми, а се зголемува и фреквенцијата на користење дезинформации.
На оваа тема МИА разговараше со проектната менаџерка на Текстгеин, Лидиа Ел Кури, која во Скопје учествуваше на меѓународниот симпозиум „Медиумската писменост во доба на вештачката интелигенција: Проширување на границите на возможното“, во организација на Институтот за комуникациски студии и ИРЕКС, што е дел од проектот на УСАИД за медиумска писменост „Младите размислуваат“.
-Развивме многу различни алатки и техники за изнаоѓање и идентификување дезинформации. Ние сме дел од европската мрежа наречена Европска опсерваторија за дигитални медиуми – ЕДМО што има за цел да идентификува дезинформации. Таа е важен дел, особено оваа година бидејќи 74 земји во светот ќе имаат избори, речиси половина свет, а нивото на дезинформации е доволно голема причина за загриженост и е нешто на што постојано работиме. Мораме постојано да воведуваме иновации и да се адаптираме на ситуацијата како што се менува, нагласува таа.
Ел Кури, која над 20 години работи во сферата на слободата на говорот, но и на медиумски програми посветени на диверзитетот, инклузијата, медиумската писменост, слободата на говор и говорот на омраза на Балканот, Европа, Јужен Кавказ, Блиски Исток, Северна Африка, во разговор за МИА ни го појасни функционирањето на Европската опсерваторија за онлајн говор на омраза, која е дел од активностите на Текстгејн, а со чија помош всушност се детектира говорот на омраза на социјалните медуми. Опсерваторијата оперира на околу 30 јазици, а во моментов се работи и на составување лексикон на македонски и албански јазик, со што оваа плаформа ќе може се користи и за детектирање на говор на омраза во земјава.
Досега не е користена во изборни процеси, а Ел Кури, напомена дека може да се искористи, особено што досега е создаден лексикон со над шест илјади зборови на македонски и на албански јазик кои може да се поврзат со ширење говор на омраза, кој се очекува да биде комплентиран од крајот на месецов.
-Не сме ја користеле контролната табла во предизборен период претходно, но имаме други алатки и технологии што ги користиме. Но, се разбира дека може да се искористи, следниве неколку месеци ќе работиме со македонски новинари и академици кои ќе имаат пристап до контролната табла, ќе можат да ја користат за да развијат свои истражувачки прашања. Ќе можат да видат каде се одвиваат токсичните разговори на различни платформи во Македонија и да ги анализираат со помош на нашата веб-скрејпинг алатка, вели Ел Кури за МИА.
Говорот на омраза на социјалните медуми може да го креираат поединци, групи, но може да произлезе и од вештачката интелигенција. За тоа како обичниот граѓанин да препознае дали нешто произлегува од човечкиот фактор или од АИ, Ел Кури вели дека има повеќе знаци или црвени знаменца.
-Тешко е да се каже, но постојат одредени знаци, црвени знаменца. На пример, ако има граматички грешки во текстот би можело да значи дека е создаден од бот, или пак се користи преведувачки софтвер за да се шират токсични информации или да се наруши општеството или демократијата. Тоа е еден од знаците на кои треба да внимавате. Но постојат и генерички знаци. Често може да забележите дека луѓето кои ги користат социјалните медиуми за да шират дезинформации имаат генерички кориснички имиња, како кориснички имиња што се состојат од бројки, или пак имаат фотографии кои изгледаат лажни. Треба да внимавате на ваквите нешта и навистина би препорачала да пријавите на социјалната мрежа ако мислите дека некој се однесува како бот, сее раздор или поттикнува нарушувања. Пријавете ги на социјалните мрежи, тие имаат должност да реагираат. Зависи од платформата, некои прават повеќе од други, но минатата седмица Европската унија го усвои Законот за дигитални услуги со кој ќе се осигура дека социјалните мрежи ги почитуваат правилата, нагласува Ел Кури во интервју за МИА.
Ќе може ли да ни појасните со што се занимава Текстгеин, фокусирани сте на ловење говор на омраза на социјалните медиуми преку Европската опсерваторија за онлајн говор на омраза, како функционира оваа платформа, кои социјални медиуми ги следите, во кои држави?
-Текстгејн е производ од Универзитетот во Антверпен во Белгија, така што ние сме разновидна група на компјутерски научници, научници за податоци, луѓе од органите на прогон, луѓе кои работат во граѓански организации, како мене, и социолози. Ние сме група луѓе кои сакаат да ја користат вештачката интелигенција за позитивни општествени промени. Ги следиме социјалните мрежи и трендови кои можат да се поврзат со говор на омраза или дезинформации. Еден од нашите големи проекти е Европската опсерваторија за онлајн говор на омраза, што во основа е контролна табла за истражување преку која луѓето можат да анализираат податоци. Информациите се автоматски генерирани за луѓето да можат да гледаат различни работи на социјалните мрежи. Достапна е речиси на 30 јазици.
Дали секој може да ја користи оваа платформа?
-Таа е достапна ширум ЕУ, т.е. на 24-те службени јазици на ЕУ, вклучувајќи ги и рускиот и арапскиот јазик, како значајни јазици на Европа, а сега со новиот проект и македонскиот и албанскиот јазик. Набљудува 12 мејнстрим платформи на социјалните медиуми како што се Фејсбук, Инстаграм, Твитер, кој, пак, сега се смета за гранична платформа, односно платформа која е нерегулирана и не модерирана, или помалку регулирана и модерирана, каде што е многу полесно да се најдат токсични пораки или говор на омраза.
Дали вештачката интелигенција (АИ) може без никакви негативни последици да лови говор на омраза, имајќи предвид дека станува збор за комбинација на често користени зборови, но зборот сам по себе не мора да предизвика говор на омраза доколку не е во контекст, колку АИ може да го улови контекстот, а при тоа да не предизвика штета?
-Методологијата што ја користиме не се заснова првично на технологија, туку на човечки фактор. Работиме со анотатори низ цела Европа, како и во Албанија и Македонија, кои потоа следат социјалните мрежи и ги изнаоѓаат зборовите и фразите што се користат, па потоа ги рангираат. На пример, 0 значи навредлив јазик кој не е незаконски – односно говор на омраза, но може да се користи во таков контекст, а 4 значи користење насилен и заканувачки јазик. Повремено може да има случаи некои од пораките да се означени како лажно позитивни, затоа користиме разни технологии во обид да го ублажиме тоа и да се осигураме тоа да се случува што е можно помалку, со цел да се фокусираме на пораките кои ќе ни помогнат да разбереме што се случува во интернет сферата и на социјалните мрежи и да направиме нешто околу тоа.
Човечкиот фактор е многу важен во овој процес?
-Човечкиот фактор е најважен. Сѐ почнува од тоа, па да се креираат зборовите што се користат онлајн без помош на Гугл транслејт или која било друга технологија за да се создаде групата зборови. Сето тоа поминува низ нашиот алгоритам (технологијата), кој е транспарентен и потоа им се враќа на луѓето за да ги користат тие податоци и информации најдобро што можат.
Развивате и технологија за ловење на дезинформации, колку АИ може успешно да дефинира дезинформација без човечки фактор?
-Потребата за технологијата треба да потекнува од луѓето кои се засегнати, без разлика дали се работи за граѓанското општество, органите на прогон или академската заедница. Развивме многу различни алатки и техники за изнаоѓање и идентификување дезинформации. Ние сме дел од европската мрежа наречена Европската опсерваторија за дигитални медиуми – ЕДМО што има за цел да идентификува дезинформации. Таа е важен дел, особено оваа година бидејќи 74 земји во светот ќе имаат избори, речиси половина свет, а нивото на дезинформации е доволно голема причина за загриженост и е нешто на што постојано работиме. Мораме постојано да воведуваме иновации и да се адаптираме на ситуацијата како што се менува.
Споменавте избори, во Северна Македонија престојат двојни избори, период кога се заострува атмосферата меѓу политичките противници, дали Европската опсерваторија за говор на омраза е користена во изборни процеси?
-Не сме ја користеле контролната табла во предизборен период претходно, но имаме други алатки и технологии што ги користиме. Но, се разбира дека може да се искористи, следниве неколку месеци ќе работиме со македонски новинари и академици кои ќе имаат пристап до контролната табле, ќе можат да ја користат за да развијат свои истражувачки прашања. Ќе можат да видат каде се одвиваат токсичните разговори на различни платформи во Македонија и да ги анализираат со помош на нашата веб-скрејпинг алатка.
Работите и во земјава со лингвисти по македонски и албански јазик, може ли повеќе да ни кажете за оваа активност?
– Ако се вратите на човечкиот фактор, кој го споменавме на почетокот од суштинско значење е да соработуваме со луѓе на кои јазиците што се користат во Македонија им се мајчин јазик, па така соработуваме со четворица лингвисти кои создаваат лексикон од повеќе од шест илјади зборови кои се навредливи или заканувачки – насилен вокабулар што се користи онлајн. Нивната помош околу создавањето на лексиконот значи дека можеме автоматски да ги откриеме и процениме проблемите поврзани со говорот на омраза.
Дали е ова е процес, кој се уште трае, дали ги собравте сите зборови?
-Стигнавме до шест илјади зборови и сѐ уште собираме, ќе го завршиме анотацискиот дел до крајот на март, но одлично соработуваме со Институтот за комуникациски студии-ИКС со кого го развивме проектот, како и со три универзитети со лингвисти во Македонија.
Дали АИ може да креира говор на омраза?
-Да, се разбира дека може, и сигурна сум дека тоа се случува без разлика на форматот. Тоа е дел од причината зошто го правиме она што го правиме, да се обидеме да го откриеме изворот на вештачки-генерирана омраза или онаа создадена од луѓето, и да направиме нешто против тоа, без разлика дали тоа би било информирање на органите за спроведување на законот во случај на закани или разговор со граѓанското општество околу она што тие би можеле да го направат. Особено кога зборуваме за граѓанското општество, мислам дека имаат голема улога кога станува збор за собирање информации и нивна анализа со цел да се процени што треба да се направи за состојбата на социјалните медиуми, и навистина сме среќни дека македонското граѓанско општество ја користи оваа можност.
Вие сте професионалец, но како обичниот граѓанин, да препознае нешто што се категоризира како говор на омраза, дека не е креирано од човек, туку од АИ?
-Тешко е да се каже, но постојат одредени знаци, црвени знаменца. На пример, ако има граматички грешки во текстот би можело да значи дека е создаден од бот, или пак се користи преведувачки софтвер за да се шират токсични информации или да се наруши општеството или демократијата. Тоа е еден од знаците на кои треба да внимавате. Но постојат и генерички знаци. Често може да забележите дека луѓето кои ги користат социјалните медиуми за да шират дезинформации имаат генерички кориснички имиња, како кориснички имиња што се состојат од бројки, или пак имаат фотографии кои изгледаат лажни. Треба да внимавате на ваквите нешта и навистина би препорачала да пријавите на социјалната мрежа ако мислите дека некој се однесува како бот, сее раздор или поттикнува нарушувања. Пријавете ги на социјалните мрежи, тие имаат должност да реагираат. Зависи од платформата, некои прават повеќе од други, но минатата седмица Европската унија го усвои Законот за дигитални услуги со кој ќе се осигура дека социјалните мрежи ги почитуваат правилата.