Наши специалисти учат компютрите на български език
Проектът е финансиран от Европейския социален фонд по Оперативна програма "Развитие на човешките ресурси”, в който партньори са Институтът за български език “Проф. Любомир Андрейчин” и Софийският университет "Св. Климент Охридски"
Компютърните лингвисти учат компютрите да разбират езика, каза проф. Светла Коева. Компютърната лингвистика описва езика по такъв начин, че да бъде разбираем за компютрите, с други думи, да могат да бъдат създадени компютърни програми, които да могат да превеждат писмен тест в говорима реч или български на английски например. Компютърната лингвистика е относително нова, но за сметка на това бурно развиваща се област и затова са необходими висококвалифицирани специалисти - за тяхното обучение се грижи проектът „Интегриране на нови практики и знания в обучението по компютърна лингвистика”, финансиран от Европейския социален фонд по Оперативна програма "Развитие на човешките ресурси”, в който партньори са Институтът за български език “Проф. Любомир Андрейчин” и Софийският университет "Св. Климент Охридски".
Млади учени - специализантът Георги Илиев и докторантите Лъчезар Джаков и Стефан Герджиков докладваха свои разработки във връзка с проблемите на машинния превод и “превода’на стари текстове на съвременен език. „Историческият факултет в Дъблин прояви интерес към нашата работа. Те са много ентусиазирани, тъй като има записани автентични разкази от ирландската история - например през 1641 г. за девет години е имало република, а за ирландците това е велико нещо. Записите са от 17 век на стар, архаичен английски, а ние модернизирахме текстовете, така че да са на съвременен английски през компютърна програма”, обясни докторантът Стефан Герджиков.
В областта на машинния превод бяха демонстрирани двата конкуриращи се подхода - машинното обучение въз основа на преводни документи между български и шведски и подходът, базиран на лингвистични правила, които описват синтактични и семантични отношения между думите. Младите учени се занимават и с описание на синтактичната структура на българския език, което може да послужи например за създаването на програма за корекция на правописа, базирана на правила. Целта е младите учени да не само да усъвършенстват своите знания, но и да се научат да мислят творчески, както и да прилагат знания и творчество при различните форми на излагане на научното знание - преподаване, доклади на конференции или семинари.
„Когато преди 13 г. предложихме магистърска програма по компютърна лингвистика, имаше много съпротива и резерви. Дори се чудеха как да нарекат този интердисциплинарен сектор, та беше наречен компютърна хуманитаристика. Но ето след “фаталните” 13 г. имаме добра жътва, защото лингвисти, математици, психолози и дори богослови се записват в магистърската програма”, спомни си доц. Радка Влахова от Софийския университет. В момента в СУ има две магистърски програми: по компютърна лингвистика към Факултета по математика и информатика и по компютърна лингвистика и интернет технологии в хуманитаристиката към Факултета по славянски филологии.
„Компютрите помагат на лингвистите да бъдат по-прецизни, по-бързи и по-точни в своите изследвания. Съвременната лингвистика вече е компютърна лингвистика, защото езиковите правила могат да бъдат представени по такъв начин, че да се опитаме да научим компютрите да разбират езика. Всъщност, много от продуктите, които са резултат от теоретичните разработки в областта на компютърната лингвистика се ползват от милиарди хора всеки ден, но малцина знаят, че това е продукт на тази дисциплина (а и не е нужно).”, коментира проф. Светла Коева от Института по български език, ръководител на проекта.
Проектът е насочен към младите учени, докторантите и специализантите, които са с различна подготовка – лингвисти, компютърни лингвисти и математици, обединени в интердисциплинарни групи. Проектът е осигурил десетки изяви на млади учени на международни научни форуми (например в Италия, Франция, Германия, великобритания, Испания). Лектори от Норвегия, Италия< Франция и Канада пък са изнесли семинари у нас по проблеми на компютърната лингвистика.
„Сега често хората искат да получат веднага, на секундата, най-новата технология. Целта на нашето обучение е да обучаваме хора, които да създават сами езикови технологии, а не да използваме чуждите. Нашите учени трябва да са наясно с последните технологии, но да не потъват в тях, а да се стремят да създават нови”, каза и проф. Тинко Тинчев от СУ, който е представител на математиците в ръководния екип на проекта.