Создание системы контекстного поиска по фразеологии Достоевского

ПРОЕКТ LEXRUS.RU НАХОДИТСЯ НА РЕКОНСТРУКЦИИ

НЕКОТОРЫЕ ФУНКЦИИ САЙТА МОГУТ БЫТЬ НЕДОСТУПНЫ
ПРИНОСИМ ИЗВИНЕНИЯ ЗА ДОСТАВЛЕННЫЕ НЕУДОБСТВА

Проект реализован при поддержке Российского гуманитарного научного фонда

При поддержке РГНФ - грант  № 12-04-12054

Создание системы контекстного поиска по фразеологии Достоевского

Целью проекта является создание нового информационно-поискового модуля, позволяющего извлекать, анализировать и обобщать данные о фразеологизмах у Ф.М. Достоевского. Этот модуль пользовательский интерфейс ввода-вывода поисковых заросов и результатов их обработки. Расположенный на сайте пользовательский интерфейс будет корреспондироваться с серверной частью базы данных, записи которой будут включать следующие виды лексикографической информации: словарная форма идиомы, в том числе ее стандартные и контекстно-зависимые варианты, пример употребления идиомы, источник примера. Предварительная оценка объема базы данных - около 1500 единиц." Разработка системы контекстного поиска по фразеологии Достоевского предполагает, во-первых, выработку критериев выделения идиом как особого лексического класса единиц и выявление примеров употребления идиом и других видов фразеологизмов в текстах Достоевского, а также классификацию фразеологизмов, позволяющую операционально отделять идиомы в точном смысле от других неидиоматичных, но устойчивых сочетаний слов, а также от слабоидиоматичных выражений.
Во-вторых, мы намерены адаптировать разработанную ранее базу данных к решению задачи описания фразеологии Достоевского, уточнить содержание различных ее полей и произвести наполнение базы данных с учетом возможных, в дальнейшем, унификаций и редактирования данных. Наконец, необходимо разработать прототип поисковой системы, обеспечивающей эффективную работу пользователей с Интернет-версией базы данных."
При работе предполагается использовать методы корпусной и компьютерной лингвистики. В частности, будут использованы имеющиеся структуры лексикографических баз данных, созданные в отделе экспериментальной лексикографии Института русского языка РАН, а также корпус текстов, содержащихся в полном собрании произведений Ф.М. Достоевского.

ИПС «Система контекстного поиска по фразеологии Достоевского»