Над пет милиони ливчиња со записи од деветте картотеки на Институтот за македонски јазик „Крсте Мисирков“, кои се чуваат во картонски кутии и се во опасност да бидат загубени, уништени или оштетени, ќе бидат трајно заштитени во дигитална копија и на микрофилм. Повеќе од 250 илјади слики од материјали на oдделението за историја на македонскиот јазик се веќе скенирани во Инбокс.
Оваа домашна компанија беше избрана на повикот за дигитализација од Фондот за иновации и технолошки развој (ФИТР) и Министерството за култура, кои со 14 милиони денари ќе го финансираат проектот за соодветно и итно да се заштити лексичкиот материјал и да се создаде дигитална архива во која записите ќе станат достапни за користење за истражувачи од земјава и од странство, за студентите по филологија, како и за сите заинтересирани за македонскиот јазик. Договорот беше потпишан во средината на декември, а проектот треба да биде завршен до крајот на годинава.
Записите од историската картотека на Институтот во јануари почнаа да се обработуваат во Архивскиот дата центар Инбокс (INBOX), кој има околу 50 вработени, а стручен тим од 20-ина работи само на овој проект, на скенирање, индексирање, микрофилмување и печатирање. Во етапи се преземаат со обезбеден транспорт и по сработувањето му се враќаат на Институтот и се земаат други кутии со хартиени материјали собирани со децении од лингвистите.
МИА го посети скен-центарот на Инбокс каде што почнува процесот на дигитализација. Четири скенери продуцираат 50 слики во минута иако имаат перформанси за 150. Наместени се да работат побавно заради висока резолуција на сликите и за да може да запрат ако ултразвучно откријат сензитивни документи и дека нешто не е во ред – на пример ако картичките се извиткани. Материјалот е неповторлив и затоа сѐ мора да биде безбедно, велат луѓето што работат на скенирањето.
Сликите потоа преминуваат во сервер каде што се конвертираат/приспособуваат во специфични формати, а програмери во ИТ-одделот на компанијата се задолжени за индексирање и метадатирање за податоците да може полесно да се најдат. На секоја слика ќе се аплицира и електронски печат на Инбокс, кој е добавувач на серитифицирани електронски услуги. Дигиталниот формат на тој начин не може да биде злоупотребен и не може да биде направена промена во документот и тој со печатирањето станува валиден исто како и хартиениот оригинал.
Јорданчо Митровски, управител и финансиски директор на Инбокс, вели дека првите скенирани материјали веќе влегле во наредната фаза на обработка (валидација и метадатирање), во меѓувреме се преземаат нови материјали од Институтот и безбедно се складирани во архивско депо.
Во вториот квартал на проектот ќе почне микрофилмувањето – фаза што е зависна од претходно создаден дигитален материјал. Потоа процесите ќе течат паралелно.
– Секоја фаза се одвива согласно стриктно утврдени протоколи за да се гарантира безбедноста на преземената документација. Процесот бара високо ниво на координација на соодветни човечки компетенции со сложен техничко-технолошки процес. Создаваме нови формати (дигитален и микрофилм) без да се компромитира постоењето на оригиналниот формат. Документацијата се обработува согласно планираната динамика, не гледаме никакви пречки и сметаме дека проектот со исклучителен квалитет ќе биде завршен во предвидениот рок. Инбокс ја поседува најдобрата технологија за дигитализација што постои во светот и тоа во обем што е многукратно поголем од потребите за овој проект. Затоа времето воопшто не е фактор. Ние сме 100 проценти фокусирани на квалитетот на изработката и засега сме среќни што проектот тече како што е предвидено – изјави Митровски за МИА.
„Отсекогаш, сега и засекогаш” е идејниот наслов на проектот со кој Инбокс аплицираше на повикот за трајна заштита на јазичното наследство и негова достапност во формати блиски за идните генерации и отпорни на ризици. Со трансформацијата на картотеките не само што радикално ќе се подобри заштитата, туку неограничени ќе бидат и достапноста и користењето на содржините – со еден клик од кое било место.
Во компанијата имаат точен план во кој месец од проектот што треба да биде направено, а кога ќе го завршат, Институтот за македонски јазик ќе избере на која платформа ќе ги стави дигиталните копии од картотеките за да може да се читаат и пребаруваат од регистрирани корисници.
– Со проектот радикално ќе се подобри заштитата. Нашето решение прво го мултиплицира ресурсот кој е предмет на обработка, но не го прави тоа праволиниски, туку го менува форматот во кој се создава нов оригинал. Тој формат – дигитален примерок е многу лесно управлив и може да се чува на различни локации. Со тоа имаме две идентични копии од иста содржина што се оригинал. На крајот со микрофилмување и хемиска презервација ќе создадеме, на траен медиум, и трета копија во трета, оптичка форма која не може да се манипулира. Со тоа го создаваме идеалот 3-2-1, што значи дека кој било еден документ постои во најмалку два формата и има можност да се чува на најмалку три различни локации – појаснува Митровски.
Инбокс (INBOX) ДООЕЛ Скопје е специјализирана компанија за чување и управување со документи и информации и има оперативен модел кој овозможува совршена организација на документите така што неговите корисници имаат брз и постојан пристап и непречена употреба. Работи од 2011 година обезбедувајќи услуги за управување со физички документи, со процеси на дигитализација и управување со електронско складирање документи. Првиот клиент за дигитализација на документи компанијата го имала во 2012, а во последните пет години има направено дигитализација на над 30 милиони слики од најразлични формати.
– Нашата технолошка платформа е уникатна, базирана на најдобрите светски софтверски и хардверски добавувачи и таа овозможува Инбокс во исто време да може да извршува десетици сложени проекти за дигитализација. Самиот факт што нашиот скен-центар е димензиониран на 2000 квадратни метри покажува дека Инбокс е создаден по индустриски стандард за масовна дигитализација, а употребата на технологија од KODAK и ABBYY, потврдува дека ние работиме со најголема можна ефикасност – додава Митровски.
Пред овој крупен и системски проект за дигитализација на картотеките на Институтот „Крсте Мисирков“, годишно преку Министерството за култура биле дигитализирани по неколку кутии со картички и за девет години дигитално биле обработени само околу 140 илјади ливчиња.
– Сега многу се забрза работата, ова ќе биде со брзина на светлината во однос на претходната динамика. Ние сме сигурни во Инбокс и сметаме дека многу професионално ќе си ја завршат работата. Дигитализацијата е и задоцнета зашто имаме и избледени ливчиња од стоењето, многу се пишувани со индиго на машина за пишување и се со послаб квалитет уште кога биле создадени – вели за МИА директорката Елена Јованова-Грујовска.
Историската картотека, со која почна дигитализацијата во Инбокс, е најстара од деветте картотеки и содржи материјали од црковнословенскиот период – стотици илјади зборови од стари ракописи од 12 и 13 век пишувани во македонските цркви и манастири. Од оваа картотека се создава и излегува Речникот на црковнословенскиот јазик од македонска редакција. Картотеката има репродукции т.е. снимки од текстови, повеќето напишани на пергамент.
Најстаро рачно напишано ливче што го поседува Институтот, вели директорката, е околу 70 години, односно од времето кога е формиран во 1953 година и кога почнале да се полнат картотеките. На барање на Блаже Конески, прво е формирана картотеката од која е направен тритомниот Речник на македонскиот јазик со српскохрватски толкувања (1961-1966), за кој материјалот го ексцерпирале Трајко Стаматоски, Тодор Димитровски и Благоја Корубин, а како соработник им се приклучил и Кирил Конески. Оваа картотека е основата и на сегашниот Толковен речник во шест тома. Таа е најобемна и има околу еден милион картички во кои се и зборовите кои се користат секојдневно.
Картотеки биле подготвени за петте одделенија на Институтот – картотека на македонската народна поезија, на народната проза и посебна картотека за македонските глаголи од која е направен експертскиот шестомен Интенцијално-синтаксички речник на македонските глаголи – еден од двата во Европа (вториот е во Полска). Другите картотеки се од областите ономастика и дијалектологија. Ономастичките содржат записи за топоними, имиња, презимиња и прекари на Македонците, лични имиња во народното творештво… За нив биле користени матичните книги, а се собирани и на терен, исто како и дијалектолошките кои се создавани од разговори со говорители на македонскиот јазик во над 400 населени места, во етничките и во државните граници.
За разлика од картотеката на Толковниот речник, во која записите се, главно, направени на машина за пишување и подоцна на компјутер или од страници на објавени книги, во историската, ономастичката и дијалектолошката картотека тие се најчесто рачно напишани зашто се бележени зборови со специфични знаци или од црковнословенскиот, старогрчкиот, латинскиот јазик.
– За картотеките е важно дека ние имаме доказ за творештвото и за постоењето на сите културни дејци од македонската понова историја во областа на јазикот и книжевноста. Во нашите картотеки е сето творештво на Марко Цепенков, потоа на Кузман Шапкарев – во македонската народна поезија и проза, го имаме целото творештво на Блаже Конески. Од современото творештво имаме цели автори кои се ексцерпирани и внесени во Толковниот речник, на пример Петре М. Андреевски. Тука се и евангелијата и апостолите, како Вранешничкиот апостол кој, благодарение на лингвистичката анализа на Конески, се прочу во светот како едно од најстарите наши евангелија. Во македонските народни јуначки песни е многу застапен и Гоце Делчев и неговото име често се спомнува во картотеките на народната поезија и на народната проза, во приказните, како и во современото творештво, на пример кај Ванчо Николески. Нашата картотека може да покаже како му течел животниот век и ако ги најдеме сите текстови ексцерпирани со неговото име ќе се појави една цела научна книга за Гоце Делчев – рече Јованова-Грујовска.
Таа нагласува дека во 69-те години колку што постои Институтот, нема негов вработен кој не работел во збогатување на картотеките и секој, вели таа, внел по неколку проценти во нив.
Следен предизвик на Институтот е да се изработи етимолошкиот речник, како што имаат речиси сите словенски јазици. Со нови зборови ќе се дополнува и електронското издание / платформата на Толковниот речник (makedonski.gov.mk), ќе се работи на нови томови од засега четиритомниот Речник на македонската народна поезија и во план е да почне создавање речник што ќе ја опфати лексиката од македонската народна проза.