Версия для слабовидящих

Разработка «формализованной» грамматики тувинского языка для программистов

Для реализации задач цифрового развития тувинского языка требуется совместная работа лингвистов и программистов. Лингвисты со своей стороны должны разработать специальную «формализованную» грамматику тувинского языка, написанную на понятном для программистов языке. В «формализованной» грамматике с помощью грамматических тегов и подробного разбора изменяемых и неизменяемых частей речи описывается полная грамматическая система тувинского языка. Такая грамматика включает описание системы словообразования, словоизменения и формообразования тувинского языка, и информацию о структуре предложения в тувинском языке.
Компьютерной системы для тувинского языка, предназначенной для автоматического разбора слов, в настоящее время не существует, и именно «формализованная» грамматика тувинского языка будет являться основой таких компьютерных программ или систем.

Данные формализованной грамматики могут быть использованы многократно, на ее основе разработчикам будет нетрудно составить алгоритмы для системы проверки правописания, тувинского машинного переводчика, словаря поддержки для распознавателя отсканированного текста на тувинском языке, грамматической разметки корпусов тувинского языка, разработки языковых моделей тувинского языка и т.д. До сих пор создание этих систем было невозможно в связи с отсутствием разработанной лингвистами «формализованной» грамматики тувинского языка для программистов.

Основным результатом проекта будет электронная «Формализованная грамматика тувинского языка для программистов», которая станет основой для разработки целого комплекса цифровых технологий для тувинского языка.
– Система проверки правописания имеет большое значение для работы издательств, редакций газет и журналов, также для ученых и для всех, кому приходится набирать тексты на тувинском языке.
– Словарь поддержки тувинского языка для программ, предназначенных для распознавания отсканированных текстов, является одной из самых востребованных приложений, так как в последние годы идет масштабная работа по оцифровке письменного наследия на тувинском языке. С таким словарем доля правильно распознанного тувинского текста на ABBYY FineReader может составить до 98%.
– Грамматическая разметка корпуса тувинского языка позволит искать конкретные слова по словоформам, по лемме, по набору морфологических параметров.
– Под языковой моделью подразумевается набор алгоритмов и признаков, которые способны определять контекст тувинского текста, генерировать новые тексты и т.д.

>>>>скачать проект<<<<

Поделиться ссылкой: