МАКЕДОНСКИ НАУЧНИЦИ РАЗВИЈА АЛАТКА БАЗИРАНА НА ВЕШТАЧКА ИНТЕЛИГЕНЦИЈА ЗА ТРАНСКРИПЦИЈА НА ГОВОР НА МАКЕДОНСКИ ЈАЗИК

October 10, 2024
2 mins read

Официјално може да се користи новата дигитална платформа базирана на вештачка интелигенција за транскрипција на говор на македонски јазик, „Буки“, која овозможува унапредено користење на официјалниот јазик при креирање текстови во дигитална форма. Платформата беше промовирана вчера на Универзитетот „Св. Кирил и Методиј“ во Скопје.

Платформата овозможува пренос на усно изговорена мисла на македонски јазик во пишан текст кој содржи интерпункција, мали и големи букви. Во моментов функционира моделот за литературен јазик, но се работи и на втор, кој би ги препознавал македонските дијалекти. „Буки“ може да им биде од корист на сите кои работат со транскрипција на текст (интервјуа, предавања, теренски белешки, потсетници), на лица со хендикеп, транскрипција и анотација на македонското културно наследство, архиви…

Моделот е креиран од Дејан Порјазовски, експерт за технологии на вештачка интелигенција за препознавање говор од Универзитетот „Алто“ во Финска, како дел од активностите на Центарот за напредни интердисциплинарни истражувања при УКИМ, во соработка со проф. д-р Никола Стиков, професор по биомедицински инженеринг на Политехничката школа при Универзитетот во Монтреал.

„Овој модел може да им биде од корист на сите кои работат со транскрипција на текст, како интервјуа, предавања, теренски белешки и потсетници, но и на лица со хендикеп, а се надеваме дека овој модел ќе најде примена и во многу дигитални алатки кои го прават нашиот живот полесен. Во моментов ја презентираме првата верзија на моделот, но тимот кој го изработи моделот е детерминиран да се изработи и втора, подобрена верзија, како и верзија за транскрипција на дијалектите на македонскиот јазик, која ќе придонесе за научно-истражувачката работа на УКИМ, но и ќе ги зачува дијалектите за наредните генерации“, рече ректорката на УКИМ, проф. д-р Биљана Ангелова.

Додаде дека се планира и изработка на подобрен кориснички интерфејс и решавање на одржливоста на платформата за транскрипција на македонскиот говор.

Платформата ја претстави Порјазовски, кој на презентацијата учествуваше онлајн. Како што рече, се работи за адаптирани верзии на веќе постојните Wav2vec2 и Виспер (Whisper), со тоа што ги тренирале со наши ресури на македонски јазик.

Со цел да се провери работата на „Буки“ во споредба со јавно достапните Виспер (Whisper) од „ОпенАИ“ и MMS од „Мета“, го тестирале на разни видови аудиочитан текст, дијалекти и слично и се покажало дека моделот што го креирале е подобар и со помал процент на грешки при транскрибирањето на македонскиот говор. Идејата за проектот била на Стиков.

„Илјадници часови снимени материјали се распаѓаат во влажните ќошиња на македонските институции, чекајќи да бидат пребарани и индексирани. Моделот ‘Буки’ е првиот чекор кон зачувувањето на ова богатство. Трениран е со само 60 додатни часа говор, но веќе е далеку подобар од конкуренцијата“, кажа Стиков.

Проф. д-р Илина Јакимовска, раководителка на Институтот за етнологија и антропологија при Природно-математичкиот факултет на УКИМ, рече дека дигиталниот архив на етнолошки и антрополошки ресурси на Институтот содржи над 1.250 часа аудиоматеријал, рачно транскрибиран во ворд-документи, голем број визуелни материјали, музичка збирка и дигитализирани ракописи од поранешни професори и донатори.

По промоцијата на моделот, УКИМ ја почна кампањата „Донирај глас“ и секој кој сака да придонесе ќе може да го донира својот глас, односно да прочита текст на македонски и да го прикачи на платформата Мозила.

ИЗВОР: sdk.mk

VERO JUMBO MACEDONIA

EVN MACEDONIA

MATINA DENTAL CLINIC

AUTO SHKOLLA BEKO

Претходно

Совет на Европа: Софија да ги применува истите стандарди за Бугарите во странство и за Македонците во Бугарија

Следно

Јужнокорејската писателка Хан Канг ја доби Нобеловата награда за литература за 2024

Latest from Blog

Американската амбасадорка Агелер со отворено и проштално писмо до македонските граѓани

Драги пријатели, Пред три години пристигнав во Скопје како десетти амбасадор на Соединетите Американски Држави во оваа прекрасна земја. Тогаш, како и денес, бев исполнета со понизност и длабоко почестена од извонредната

Лига на ПАРИТЕ: Реал Мадрид со приход од 1,2 милијарди евра за минатата сезона, ова се ТОП 20 клубови!

ФОТО:facebook.com/RealMadrid Не ЛШ, не Суперлига, туку Лига на ПАРИТЕ. Како може понаку да се протолкува фактот дека ТОП 20 клубови во Европа имаат приход од 12 милијарди евра за минатата сезона. Како

Излезе од печат првата разгледница „Поздрав од Преспа“ посветена на областа Преспа (ФОТО)

Излезе од печат првата разгледница „Поздрав од Преспа“ посветена на областа Преспа, содржи 8 фотографии за овој крај значаен придонес во зачувувањето и промоцијата на македонското културно наследство, која е авторско дело

Коњановски: Време е за модернизација и инвестиции во битолските претпријатија

Градоначалникот на Битола, Тони Коњановски, во обраќање до граѓаните истакна дека јавните претпријатија се соочуваат со предизвици кои влијаат на нивната работа и дека е потребно да се подобри нивната ефикасност и

ВМРО-ДПМНЕ со реакција: Ленче беше дел од криминалната мрежа на СЈО и сега наместо да се извини глуми жртва

Обвинителката Ленче Ристоска беше дел од СЈО, кое заврши со криминален скандал и рекетарска мрежа вредна неколку милиони евра, реагираат од ВМРО-ДПМНЕ. Како дел од таа мрежа, правосилно беше осудена нејзината шефица,
Go toTop