Новите модели на вештачка интелигенција на Мета беа обучени со Библијата да препознаваат и произведуваат говор на повеќе од 1.000 јазици. Компанијата сега се надева дека овие алгоритми ќе помогнат да се зачуваат јазиците кои се во опасност од исчезнување, пишува „Интерестинг енџиниринг“.
Во моментов во светот има околу 7.000 јазици.
Мета ги објавува своите нови јазични модели за јавноста преку услугата за хостирање на кодови ЏитХаб, така што програмерите кои работат на различни јазици можат да градат нови, поразновидни апликации за говор.
Новите модели беа обучувани за две групи податоци: една што содржи аудио снимки од новозаветната Библија на 1.107 јазици и друга, што содржи неозначени аудио снимки од Новиот завет на 3.809 јазици.
-Можеме да го искористиме она што го научи овој модел, за потоа брзо да изградиме говорни системи со многу малку податоци. За англискиот јазик имаме огромен број добри збирки на податоци, исто така и за уште неколку други јазици, но едноставно немаме за јазиците што ги зборуваат, да речеме, 1.000 луѓе – вели Мајкл Аули, научен истражувачки во Мета, кој активно работеше на проектот.
Истражувачите тврдат дека нивните модели можат да комуницираат на повеќе од 1.000 јазици, но и да препознаат повеќе од 4.000.
Покрај тоа, во споредба со моделите на ривалските компании, вклучително и „ОупенЕјАј Уиспер“, верзијата на Мета имала само 50 отсто од стапката на грешки, и покрај тоа што покрива 11 пати повеќе јазици од нив.
Сепак, не е сè така розово. Научниците изјавија дека нивните нови модели може погрешно да препишат одредени зборови или фрази и дека нивните модели за препознавање говор дале повеќе погрешни зборови од другите модели, иако станува збор за разлика од само 0,7 отсто.
Крис Емезу, истражувач во Масакане, организација што работи на природна обработка на африканските јазици, а кој не бил вклучен во проектот, смета дека употребата на религиозни текстови за обука на моделите може да биде проблематична.
-Во Библијата има многу пристрасност и погрешни претстави. Дали овој развој претставува чекор напред за јазичните модели, или пак е премногу контроверзен за да биде значаен – прашува тој.