Объектно-ориентированная грамматика
В настоящем документе изложены принципы объектно-ориентированной грамматики естественных языков для их формального моделирования с использованием компьютерных технологий. Лингвистическая интерпретация текста на естественном языке выполняется программными средствами согласно определенным формальным алгоритмам. Интерпретация текста предполагает последовательное восхождение от знаков низшего уровня к знакам высшего уровня. Процесс лингвистической интерпретации предполагает несколько уровней обработки знаков: от символов к лексемам (словам), от лексем к предложениям, от предложений к тексту. Документ ставит целью объяснить ключевые абстракции, структуры данных и алгоритмы, которые необходимы для успешного моделирования знаков разных уровней. Предлагаемая грамматика и технология является открытой и имеет работающую программную реализацию в виде свободно распространяемых модулей системы OOmnik. Данная технология разрабатывалась с 2001 года в рамках научно-исследовательской работы Лаборатории информационных лингвистических технологий Института лингвистических исследований РАН (Санкт-Петербург).