О некоторых задачах, встающих при создании информационно-поисковой системы...

Проект реализован при поддержке Российского гуманитарного научного фонда

При поддержке РГНФ - грант  № 10-04-12-141в

Информационно-поисковая система «Русский толково-этимологический словарь» (на базе электронной версии «Толкового словаря русского языка с включением сведений о происхождении слов»


О словаре
Толково-этимологический словарь русского языка в Интернете
О некоторых задачах, встающих при создании информационно-поисковой системы...
Поиск

Публикация подготовлена при финансовой поддержке Российского гуманитарного научного фонда, грант №10-04-12-141в

О некоторых задачах, встающих при создании информационно-поисковой системы «Русский толково-этимологический словарь» (на базе электронной версии «Толкового словаря русского языка с включением сведений о происхождении слов»)»1

А.С.Белоусова, Н.Н.Занегина

«Толковый словарь русского языка с включением сведений о происхождении слов» (отв. ред. акад. Н.Ю. Шведова), М., 2007) - первый в русской лексикографии труд, в котором наряду с такими видами лингвистической информации, которые являются общими для всех толковых словарей русского языка (семантика слова, морфологические особенности, орфоэпия, ближайшие словообразовательные связи, стилистические характеристики, фразеологический потенциал и т.д.), приводятся также (во всех необходимых случаях) сведения этимологического характера. В словаре более 15 тыс. слов имеет этимологические зоны, выделенные внутри словарной статьи знаком (·). Этимологические справки, сообщающие читателю новые и важные сведения об истории и происхождении слова, изменяют самый жанр словаря: из собственно толкового словаря он становится толково-этимологическим. Ценность этимологических сведений, сообщаемых словарем, определяется тем, что в современной лексикографии отсутствует общедоступный краткий и доведенный до конца этимологический словарь русского языка, адресованный не только читателю, интересующемуся происхождением слова, но и  широкому кругу преподавателей высших учебных заведений, аспирантов, студентов, специалистов-филологов. Характер сведений, содержащихся в этимологической справке, определяется тем, к какому временному пласту относится этимологизируемое слово - к исконному фонду, унаследованному из индоевропейской и праславянской эпохи, к собственно русским и восточнославянским образованиям, к заимствованиям до начала 18 в., а также заимствованиям нового времени. В этимологической зоне содержится развернутая, объемная информация о родственных связях слова не только в русском языке, но и шире - в славянских и индоевропейских языках, раскрывается словообразовательная структура слова, в случае необходимости приводится исходная форма, реконструируемая для праславянской эпохи, сообщаются сведения о семантической эволюции слова, времени появления слова в русском языке. Этимология остается гипотезой более или менее вероятной. Словарь не ограничивается приведением одной этимологии, наиболее убедительной с точки зрения автора. В этимологической справке приводятся кратко, без ссылок на литературу, основные этимологические версии. В отдельных случаях та или иная этимология поддерживается введением слова в мифологический контекст (ср. бабочка) или в контекст культурно-исторических связей разных народов (ср. медь). Такой подход к освещению этимологии вводит читателя в лабораторию научных поисков, показывает, в каком направлении шло развитие научной мысли. При характеристике словообразовательной структуры слова строго проводится хронологический принцип. Раграничены слова с родственными связями, сложившиеся на уровне морфонологических отношений индоевропейского и праславянского языков (ср. вить: навой, гореть: жар: горн), древние словообразовательные форманты, общие для славянских и балтийских языков (ср. праслав. bъdrъ и лит. budrùs с суф. -r-; праслав. *vétrъ и лит. vetra с суф. -trъ), собственно праславянские образования (ср. *mok-rъ ~ мокнуть, праслав. *kolno ~ лит. kelys 'колено'), новообразования русского и восточнославянских языков (ср. ерепениться, дрянь и т.п.).

Что касается этимологии заимствованных слов, то справки об их происхождении и путях проникновения в русский язык по необходимости кратки и содержат главным образом прототипы заимствований, их латинские, древнегреческие и иные корни, а также сведения о семантических, формальных изменениях, которые могло претерпеть слово в процессе перехода (нередко через языки-посредники) из какого-либо языка в русский язык.

В связи с разработкой информационно-поисковой системы на базе электронной версии Словаря встала задача инвентаризации тех видов этимологической информации, которая может быть использована при информировании поисковых запросов-ответов. Разработанные авторами этимологических зон специальные лексикографические приемы стали основой для создания структурированного перечня информации в виде, соответствующем внутреннему содержанию базы данных. Под каждым из пронумерованных видов информации приводятся технические приемы ее подачи в Словаре (в круглых скобках расшифровывается соответствующий символ).

I.. Реконструкция праславянской формы:
из праслав*
из*

II Сведения о соответствиях в других языках:
- в восточнославянских
др-рус.,
рус,
укр.,
блр.

- в южнославянских:

ст.-слав.,

болг.,

макед.,

с.-хорв.,

словен.,

- в западнославянских:

чеш.,

слвц.,

польск.,

в.-луж.,

н.-луж.;

- сведения о соответствиях в индоевропейских языках:

родств.

III. Словообразовательные связи (затемненные):

производн. с суф.

С преф.,

С другим преф.,

С другими преф.;

Сюда же,

С тем же корнем

связано

К (родственно, производно от указываемого далее слова, принадлежит к гнезду указываемого слова)

IV. Реконструкция исходной формы производного слова:


< (знак означает: образовано от)

> (знак означает: переходит одна форма в другую)

восх. к

Производн. от

Из в-

Из взо-

Из во-

Из воз-

Из вы-

Из до-

Из за-

Из из-

Из изо-

Из на-

Из над-

Из надо-

Из недо-

Из низ-

Из низо-

Из о-

Из об-

Из обез-

Из обер-

Из обо-

Из около-

Из от-

Из пере-

Из по-

Из подо-

Из пре-

Из пред-

Из предо-

Из при-

Из про-

Из противо-

Из раз-

Из разо-

Из ре-

Из с-

Из со-

Из-у

V. Реконструкция семантики:

развитие знач.: ',

стар. знач. ',

первонач. ',

Преобразование значений:

> (знак обозначает: переходит одно значение в другое)

VI. Источник заимствования:

 < (восходит к)

восх. к,

калька

из абхаз.

из авест.

из азерб.

из алб.

из алгонкинск.

из алт.

из амхарск.

из англ.

из англос.

из араб.

из аравакск.

из арам.

из арм.

из ассир.

из атт.

из бав.

из балканором.

из герм.

из др.-англ.

из др.-араб.

из др.-бав.

из др.-в.-нем.

из др.-евр.

из др.-инд.

из др.-ирл.

из др.-исл.

из др.-лит.

из др.-норв.

из др.-осет.

из др.-перс.

из др.-польск.

из др.-рим

из др.-рус.

из др.-сакс.

из др.-серб.

из др.-сканд.

из др.-тюрк.

из др.-чув.

из др.-шв

из зап.

из зап.-герм.

из зап.-рус.

из зап.-слав.

из зырян.

из и.-е.

из иллир.

из инд.

из индоарийск.

из индоир.

из иран.

из ирл.

из исл.

из исп.

из ит.

из казах.

из калм.

из караим

из карач.

из карельск.

из кельт.

из кильд.

из кит.

из кирг.

из кит.

из коряк.

из крым.-тат.

из кумык.

из курд.

из кыпч(ак).

из лат.

из лтш.

из лит.

из малайск.

из манс.

из марийск.

из менгрельск.

из монг.

из морав.

из морд.

из нанайск.

из нар.-лат.

из ненецк.

из нивх.

из нидерл.

из н.-нем.

из нов.-греч.

из нов.-в.-нем.

из нов.-лат.

из нов.-перс.

из н.-перс.

из норв.

из обл.

из олон.

из осет.

из перс.

из полаб.

из полесск.

из польск.

из порт.

из прибалт.-фин.

из прованс.

из протобулг.

из прус.

из рум.

из рус.

из саам.

из санскр.

из сев.-амер.

из сев.-зап.

из сев.-тюрк.

из селькуп.

из сиб.

из сканд.

из слвц.

из словен.

из согд.

из ср(ед).-болг.

из ср.-в.-нем.

из ср.-греч.

из ср.-иран.

из ср.-лат.

из ср.-нем.

из ср.-перс.

из ср.-тюрк.

из ст.-англ.

из ст.-рус.

из ст.-слав.

из ст.-укр.

из ст.-франц.

из ст.-шв.

из с.-хорв.

из ст.-укр.

из ст.-франц.

из тат.

из тоб.-тат.

из тунг.

из тур.

из туркм.

из тюрк.

из удм.

из узб.

из уйг.

из укр.

из фин.

из фин.-уг.

из фрак.

из франц.

из хакас.

из хет.

из церк.-слав.

из чагат.

из черк.

из чечен.

из чеш.

из чув.

из шв.

из шорск.

из шотл.

из южноамер.

из эвенк.

из эст.

из юж.

из южноамер.

из юкаг.

из якут.

из яп.

Из церк.-слав.

  • Из нем. (Далее по такому же образцу даются языки из прилагаемого ниже списка )
  • От англ.
  • От франц.

(Далее по такому же образцу даются языки из прилагаемого ниже списка )

 Посредство в процессе  заимствования:

Через посредство

> (знак обозначает: переходит из одного языка в другой)

VII. Сведения о времени появления слова (18-20 вв.):

 в современном знач. с

 VIII. Этимологические версии:

происх. неясно: 1)...

традиционно,

обычно,

по одной из версий,

другое мнение

Сокращения языков и диалектов

 абхаз. - абхазский

авест. - авестийский

азерб. - азербайджанский

алб. - албанский

алгонкинск. - алгонкинский

алт. - алтайский

амер. - американский

амур. - амурский

амхар. и амхарск. - амхарский

англ. - английский

англос. - англосаксонский

араб. - арабский

аравакск. - аравакский

арам. - арамейский

арм. - армянский

ассир. - ассирийский

атт. - греческий аттический

афр. - африканский

бав. - баварский

балканором. - балканороманский

балкар. - балкарский

балт. - балтийский

балт.-слав. - балтославянский

башк. - башкирский

белудж. - белуджский

блр. - белорусский

болг. - болгарский

брет. - бретонский

булгар. - булгарский

бурят. - бурятский

венг. - венгерский

венет. - венетский

вепс. - вепсский

в.-луж. - верхнелужицкий

вост. - восточный

вост.-азиат. - восточноазиатский

вост.-иран. - восточноиранский

вост.-лит. - восточнолитовский

вост.-лтш. - восточнолатышский

вост.-осет. - восточноосетинский

вост.-слав. - восточнославянский 

вост.-тюрк. - восточнотюркский

вост.-фриз. - восточнофризский

галло-роман. - галлороманский

галльск. - галльский

герм. - германский

гот. - готский

греч. - греческий

груз. - грузинский

дат. - датский

диал. - диалектный

дороман. - дороманский

др.-англ. - древнеанглийский

др.-араб. - древнеарабский

др.-бав. - древнебаварскмй

др.-веп. - древневепсский

др.-в.-нем. - древневерхненемецкий

др.-евр. - древнееврейский

др.-инд. - древнеиндийский

др.-ирл. - древнеирландский

др.-исл. - древнеисландский

др.-лит. - древнелитовский 

др.-норв. - древненорвежский

др.-осет. - древнеосетинский

др.-перс. - древнеперсидский

др.-рим. - древнеримский

др.-рус. - древнерусский

др.-сакс. - древнесакский

др.-серб. - древнесербский

др.-сканд. - древнескандинавский

др.-тюрк. - древнетюркский

др.-чув. - древнечувашский

др.-шв. - древнешведский

зап. - западный

зап.-герм. - западногерманский

зап.-рус. - западнорусский

зап.-слав. - западнославянский

зырян. - зырянский

и.-е. - индоевропейский

иллир. - иллирийский

инд. - индийский

индоарийск. - индоарийский

индоир. - индоиранский

иран. - иранский

ирл. - ирландский

исл. - исландский

исп. - испанский

ит. - итальянский

казах. - казахский

калм. - калмыцкий

караим. - караимский

карач. - карачаевский

карельск. - карельский

кашуб. - кашубский

кельт. - кельтский

кильд. - кильдинский диалект саамского языка

кирг. - киргизский

кит. - китайский

корейск. - корейский

коряк. - корякский

крым.-тат. - крымско-татарский

кумык. - кумыкский  

курд. - курдский

кыпч(ак). - кыпчакский

лат. - латинский

лит. - литовский

лтш. - латышский

малайск. - малайский

манс. - манси, мансийский  

марийск. - марийский

менгрельск. - менгрельский

монг. - монгольский

морав. - моравский

морд. - мордовский

нанайск. - нанайский

нар.-лат. - народно-латинский

науч.-лат. - научно-латинский (о научном термине, возникшем на латинской основе)

ненецк. - ненецкий

нивх. - нивхский

нидерл. - нидерландский

н.-нем. - нижненемецкий

нов.-в.-нем. - нововерхненемецкий

нов.-греч. - новогреческий

нов.-лат. - новолатинский

нов.-перс. - новоперсидский

норв. - норвежский

олон. - олонецкий

осет. - осетинский

перс. - персидский

полаб - полабский

полесск. - полесский

польск. - польский

порт. - португальский

праслав. - праславянский

прибалт.-фин. - прибалтийско-финский

прованс. - прованский

протобулг. - протобулгарский 

прус. - древнепрусский

рум. - румынский

рус. - русский

саам. - саамский

саам. норв. - норвежский диалект саамского языка

санскр. - санскрит

сев.-амер. - северноамериканский

север. - северный

сев.-зап. - северозападный

сев.-тюрк. - севернотюркский

селькуп. - селькупский 

сиб. - сибирский

сканд. - скандинавский

слав. - славянский

слвц. - словацкий 

словен. - словенский

словин. - словинско-кашубский

согд. - согдийский

ср(ед).-болг. - среднеболгарский

ср.-в.-нем. - средневерхненемецкий 

ср.-греч. - среднегреческий

ср.-иран. - среднеиранский

ср.-лат. - среднелатинский

ср.-нем. - средненемецкий

ср.-перс. - среднеперсидский

ср.-тюрк. - среднетюркский

ст.-англ. - староанглийский

ст.-польск. - старопольский

ст.-рус. - староруский

ст.-слав. - старославянский

ст.-укр. - староукраинский 

ст.-франц. - старофранцузский

с.-хорв. - сербохорватский

ст.-чеш. - старочешский

ст.-шв. - старошведский

тат. - татарский

тоб.-тат. - тобольско-татарский

тох. - тохарский

тунг. - тунгусский

тур. - турецкий

туркм. - туркменский 

тюрк. - тюркский

тюркобулг. - тюрко-булгарский

удм. - удмуртский

узб. - узбекский 

уйг. - уйгурский

укр. - украинский

умбр. - умбрский

фин. - финский

фин.-уг. - финно-угорский

фрак. - фракийский

франкск. ‑‑ франкский

франц. - французский

хакас. - хакасский

хант. - хантыйский

хет. - хеттский

ц.-сл. и церк.-слав. - церковнославянский

чагат. - чагатайский

черк. - черкесский

чечен. - чеченский

чеш. - чешский

чув. - чувашский

чук. - чукотский

шв. - шведский

шорск. - шорский

шотл. - шотландский

эвенк. - эвенкийский

эст. - эстонский

юж. - южный 

южноамер. - южноамериканский

юкаг. - юкагирский

якут. - якутский

яп. - японский


1Публикация подготовлена при финансовой поддержке Российского гуманитарного научного фонда, грант №10-04-12-141в