Создание системы контекстного поиска по фразеологии Достоевского

Проект реализован при поддержке Российского гуманитарного научного фонда

При поддержке РГНФ - грант  № 12-04-12054

Создание системы контекстного поиска по фразеологии Достоевского

Целью проекта является создание нового информационно-поискового модуля, позволяющего извлекать, анализировать и обобщать данные о фразеологизмах у Ф.М. Достоевского. Этот модуль пользовательский интерфейс ввода-вывода поисковых заросов и результатов их обработки. Расположенный на сайте пользовательский интерфейс будет корреспондироваться с серверной частью базы данных, записи которой будут включать следующие виды лексикографической информации: словарная форма идиомы, в том числе ее стандартные и контекстно-зависимые варианты, пример употребления идиомы, источник примера. Предварительная оценка объема базы данных - около 1500 единиц." Разработка системы контекстного поиска по фразеологии Достоевского предполагает, во-первых, выработку критериев выделения идиом как особого лексического класса единиц и выявление примеров употребления идиом и других видов фразеологизмов в текстах Достоевского, а также классификацию фразеологизмов, позволяющую операционально отделять идиомы в точном смысле от других неидиоматичных, но устойчивых сочетаний слов, а также от слабоидиоматичных выражений.
Во-вторых, мы намерены адаптировать разработанную ранее базу данных к решению задачи описания фразеологии Достоевского, уточнить содержание различных ее полей и произвести наполнение базы данных с учетом возможных, в дальнейшем, унификаций и редактирования данных. Наконец, необходимо разработать прототип поисковой системы, обеспечивающей эффективную работу пользователей с Интернет-версией базы данных."
При работе предполагается использовать методы корпусной и компьютерной лингвистики. В частности, будут использованы имеющиеся структуры лексикографических баз данных, созданные в отделе экспериментальной лексикографии Института русского языка РАН, а также корпус текстов, содержащихся в полном собрании произведений Ф.М. Достоевского.

ИПС «Система контекстного поиска по фразеологии Достоевского»