Русская идиоматика

Проект реализован при поддержке Российского гуманитарного научного фонда

При поддержке РГНФ - грант  № 07-04-12117в

Информационно-поисковая система «Русская идиоматика»


Поиск
Структура записи


База данных по современной русской идиоматике разрабатывалась под руководством А.Н. Баранова и Д.О. Добровольского в течение почти 15 лет. К настоящему времени База данных включает около 50 тыс. контекстов употребления идиом. С жанровой точки зрения База данных охватывает все основные сферы употребления русского языка – художественная литература, публицистика, различные жаргоны, частично представлена и научная литература. Примеры Базы данных охватывают период времени с 60 гг. XX века по конец 90-х гг. Фрагментарно вводился также материал начала XXI в. Источники расписывались полностью, а не выборочно. Формирование Базы данных по современной идиоматике было завершено, когда регулярно проводившиеся эксперименты на полноту представления материала показали приближающийся к стопроцентному учет данных. Иными словами, когда в случайной выборке текстов рассматриваемого периода по указанным источникам (порядка 10-20 стр. текста) оказался лишь один процент (или менее) новых идиом, последовательное расписывание текстов для Базы и введение новых контекстов прекратилось. На основании сказанного можно утверждать, что База данных представляет собой репрезентативный корпус примеров по русской фразеологии.

В рамках предлагаемого проекта предполагается: расширить корпус примеров до 100 тыс.; увеличение количества примеров будет осуществлено по большей части за счет идиоматики русской классической литературы, тем самым База данных будет содержать отдельный модуль идиом литературы конца XIX-начала XX вв.

База данных по идиоматике в модифицированном варианте активно используется для создания фразеологических словарей русского языка. В настоящее время ее материал привлекается для написания словарных статей для Малого фразеологического словаря русского языка, создаваемого в отделе экспериментальной лексикографии Института русского языка РАН. Перспективная сфера использования создаваемой Интернет-версии базы данных – это информация об употреблении фразеологизмов и создание словарных источников различных типов.