Цели и структура проекта OOmnik
Описание целей и структуры проекта OOmnik
Главной целью проекта является построение открытого лингвистического интерпретатора с универсальным семантическим аппаратом.
Проект по созданию лингвистического интерпретатора русского языка выполняется сотрудниками Лаборатории информационных лингвистических технологий ИЛИ РАН. В настоящее время плановым заданием лаборатории является теоретическое обоснование принципов и порядка работы лингвистического объектно-пропозиционного интерпретатора естественно-языковых русских текстов. Часть сотрудников лаборатории более десяти лет занимаются компьютерным анализом текстов. За эти годы:
- В 1997-2002 гг. проводились пилотные исследования по проекту «Генеральный свод русских текстов». К настоящему времени выполнены эскизные варианты анализатор-синтезатора словоформ русской лексики и анализатора синтаксических конструкций, ведутся разработки автоматического анализатора значений слов.
- С 1989 г. и по настоящее время создается лексикографическая электронная база данных по русскому языку (объем около 170 тыс. слов). На ее основе подготовлен и опубликован ряд толковых словарей. Среди них: «Большой толковый словарь русского языка» (СПб, 1998), «Современный толковый словарь русского языка» (СПб, 2001), «Толковый словарь русского языка» (М., 2003) и др.
- В 2004 г. выполнен проект по созданию лингвистически обработанного корпуса российского законодательства «Буква Закона», который вскоре будет опубликован на нашем портале.