Рубрика: Информатика
Една е МАИКА – гласовен синтетизатор за македонски јазик
Автори: Невенка Стојановска, Слободан Таневски
Објавено на 27.05.2020 - 11:15

Неодамна пред македонската јавност беше претставен проектот МАИКА – онлајн-алатка за синтетизирање на пишаниот текст на македонски јазик во жив говор со благопријатен глас.

Ова беше основа да поразговараме со Марјан Николовски, основач на Emit Knowledge, компанијата чиешто дело е МАИКА – алатката за претворање текст во говор на македонски јазик

ЕМИТЕР: Гласовните синтетизатори се присутни веќе подолго време, впрочем, во интернет-просторот се наоѓаат и бесплатни алатки од овој тип. Но досега не ни е познато дека некој од нив бил приспособен за гласовна синтеза на текст пишан на македонски јазик. Дали МАИКА користи дел од овие решенија?

Марјан: МАИКА е изработена користејќи ги последните алгоритми за синтеза на говор од Google и нашиот NLP framework – Блаже. Алгоритмите се темелат на длабинско учење, односно за да се даде поддршка на еден јазик, потребно е да се познаваат спецификите на јазикот, соодветно да се приспособат алгоритмите и да се создаде карактеристично множество на тренинг-материјали.

 

ЕМИТЕР: На кој модел се заснова синтезата?

Марјан: Нашиот систем е систем за претворање текст во говор, базиран на длабоко учење. Алатката функционира со тоа што корисникот внесува текст кој минува низ низа претпроцесирачки чекори, по кои текстот се претвора во говор што му се дава како  повратен одговор на корисникот.

Целокупниот процес за креирање ваква алатка се состои од повеќе фази кои вклучуваат собирање податоци, нивна обработка, креирање на алгоритмите за конверзија на текст во говор и циклус на тестирање и подобрување на решението.

 

ЕМИТЕР: Каква база имате користено за тренинг?

Марјан: Базата што ја користевме е од македонски аудио книги, со тоа што имавме потреба од дополнителна аудио обработка и селекција за да се создаде множество за тренинг за мрежите.

 

ЕМИТЕР: Имајќи ја предвид специфичноста на македонскиот јазик, колку долго траеше процесот на развој и тестовите на софтверот?

Марјан: За да стигнеме до оваа алфа верзија, ни беа потребни шест месеци. За да го завршиме и подготвиме за професионална употреба ќе ни бидат потребни уште шест месеци.

 

ЕМИТЕР: Дали самите го работевте софтверот или го работевте тимски? Дали при ова соработувавте со некоја институција (ФЕИТ, ФИНКИ, Институт за македонски јазик...)?

Марјан: МАИКА е резултат на тимот на Emit Knowledge. Немавме соработка со научни и истражувачки институции.

 

ЕМИТЕР: Има ли планови МАИКА да работи и во обратен правец, препознавање на говорот и испишување текст?

Марјан: Препознавањето говор ни е во план, меѓутоа фокусот во прво време ќе биде ставен на подобрување на постоечкото решение, поддршка за нови јазици и автоматски превод.

 

ЕМИТЕР: Дали софтверот може да се користи како готов модул во други апликации, на пример како дел од апликациите за читање електронски книги или како апликација на веб-сајт за да го исчитува текстот за слепи лица?

Марјан: Целта е МАИКА да стане производ што ќе им помогне во секојдневието на лицата со дислексија и на слепите лица. Веќе работиме на интегрирање на МАИКА со Бато, екстензија за Chrome за луѓе со дислексија).

 

ЕМИТЕР: Дали добивте конкретна институционална (државна) поддршка при реализацијата на проектот?

Марјан: До овој момент, проектот е финансиран и поддржан од средствата на компанијата. Не сме побарале поддршка од институциите.