База данных по современной русской идиоматике разрабатывалась под руководством А.Н. Баранова и Д.О. Добровольского в течение почти 15 лет. К настоящему времени База данных включает около 50 тыс. контекстов употребления идиом. С жанровой точки зрения База данных охватывает все основные сферы употребления русского языка – художественная литература, публицистика, различные жаргоны, частично представлена и научная литература. Примеры Базы данных охватывают период времени с 60 гг. XX века по конец 90-х гг. Фрагментарно вводился также материал начала XXI в. Источники расписывались полностью, а не выборочно. Формирование Базы данных по современной идиоматике было завершено, когда регулярно проводившиеся эксперименты на полноту представления материала показали приближающийся к стопроцентному учет данных. Иными словами, когда в случайной выборке текстов рассматриваемого периода по указанным источникам (порядка 10-20 стр. текста) оказался лишь один процент (или менее) новых идиом, последовательное расписывание текстов для Базы и введение новых контекстов прекратилось. На основании сказанного можно утверждать, что База данных представляет собой репрезентативный корпус примеров по русской фразеологии.
|