автореферат диссертации по филологии, специальность ВАК РФ 10.02.01
диссертация на тему: Лексикостатистическое моделирование системы славянского языкового родства
Полный текст автореферата диссертации по теме "Лексикостатистическое моделирование системы славянского языкового родства"
Российская академия наук Институт русского языка
На правах рукописи
Анатолий Федоровгч ЖУРАВЛЕВ
ЛЕКСИКОСТАТИСТИЧЕСКОЕ МОДЕЛИРОВАНИЕ. СИСТЕМЫ СЛАВЯНСКОГО ЯЗЫКОВОГО РОДСТВА
10.02.01 — Русский язык 10.02.03 — Славянские языки
Автореферат диссертации на соискание ученой степени доктора филологических наук
Москва, 1992
Работа выполнена в Отделе современного русского яаыка Института русского языка РАН. .
Официальные оппоненты: действительный член РАН, доктор филологических наук Н.И.Толстой, член-корреспондент РАН, доктор филологических наук О.Н.Трубачев, доктор филологических аа-к В.З.Санников.
Ведущее учреждение — кафедра общего и славян«' с ко го языкознания Белорусского государственного университета.
Защита состоится « /& ♦ _ 1992 г.
# /У час. на ааседании специализированного соиэТа Д 002.19.01 при Институте русского языка РАН. (Москва, ул. Волхонка, 18/2).
С диссертацией можно ознакомиться в библиотеке Института русского яаыка РАН (Москва, ул. Волхонка. 18/2)
Автореферат разоелчн « 1992 г.
Ученый секретарь специализированного совета
В.Н. Белоусов
Диссертация ставит своей'задачей установление меры генетической близости между отдельными славянскими языками по данным праславянской лексики, сохраняемой каждым из них, и выяснение возможностей реконструкции на этой базе целостной картины взаимоотношений между диалектами позднепрасла-вянского языка. Исследование праславянских изолекс осуществляется в диссертации с применением статистических методов (предложена формула индекса генети-. ческой близости языков, разработан способ лексикоста-тистичёского выявления феном ша языковой конвергенции и др.).
Особенностью работы является обращение не к коротким выборочным диагностическим перечням лексики типа стословного списка понятий, применяемого в глоттохронологических исследованиях, и не к отдбль-.ным группам лексики, ограниченных по каким-либо тематическим или формальным (словообразовательным, частеречным и т.п.) признакам, а опора ка сплошное статистическое обследование праславянского словаря. При этом квантитативному анализу подвергается доступный в настоящее время праславянский лексический материал в его максимальном объеме (увеличенном привлечением дополнительных источников). , Лексикостатистический анализ проводится с учетом типологических характеристик отдельных славянских языков и их лексических составов. При сопоставлении картины родственных взаимоотношений языков, полученной на основа квантитативного исследования изолекс, с аналогичной картиной, восстанавливаемой по данным сравнительной фонетики, учитываются принципиальные различия в механизмах эволюции лексического и фонетического уровней.
В работе предпринимается попытка реконструкции системы славянского языкового родства с отказом от традиционных дендроидных сх^м, которыо не отражают подлинной природы отношений близости между языками.
Диссертация состоит из двенаг"'чти глав, объединенных в две части. Б первой части (гл. 1—5) рассматриваются теоретические предпосылки работы, во второй части (гл. 6—12) — результаты статистического анализа праславянской лексики современных славянских языков. •
В главе! («Механизмы эволюции словаря и роль лексики в установлении языкового родства») содержится попытка пересмотра если и не общепринятой, то преобладающей в компаративистике точки эре-ния, согласно которой лексика является самым неустойчивым языковым уровнем, а потому в процедурах установления относительной близости между разными " родственными языками (или диалектами одного и того же языка) лексические и словообразовательные данные обладают меньшей значимостью по сравнению с данными фонетики и грамматики (главным образом морфологии).
Проблему большей или меньшей эффективности использования различных — фонетических, грамматических, лексических — данных в установлении степеней языкового родства и при построении генеалогических классификаций вряд ли целесообразно пытаться решать в общем виде. Такому желанному решению, «найденному* однажды и навсегда, препятствует большое многообразие конкретных историко-лингвистичес-кях ситуаций. Сомнительно, что есть возможность подверстать это многообразие к неоспоримой иерархии языковых уровней, служащих в заданной последовательности основаниями' классификационных разбиений различной точности, как к некоему общему знаменателю, пригодному на все случаи.-Может оказаться, что компаративные процедуры, ориентированные на определенную «шкалу предпочтительности* разных языковых уровней, доказав свою эффективность в исследовании одних групп языков, продемонстрируют существенно меньшую разрешающую силу, будучи примененными к иным языковым группам и типологическим ситуациям. Подобные задачи могут решаться по-разно-
pay, в эависттсгти от таксономического рппгп идиомов, подлежащих cpaancimio; от их количества; от их ирп-подлежностп тому плп паоглу грамматическому типу (морфологический критерий малопригоден для выягше-шш степеней родства изолирующих языков); от возраста сравнипаемык лзыкоз, т.о. ид удаленности от cccrti-янпя праязыконого едннг-ва; от эволюции хотя бы одного па сравниваемых яаыкоз па том или ипсгд ее ©fans а относительной пли полной изоляции от родстаеп-яш языков; от палпчил a распоряжении лингвиста сведений о дргзипх периодах развития языков, в частности, от их пряподлезгаго&ти древло- пли младописьменным (Сесписьигепным) и т.д. Определить и утвердить предпочтительность тек пли иных урозней при выяснении гаеры взаимной близости между родственными языками и восстановлении картины отношений кдагзду диалектами праязь.ка а конкретной п'сторико-лиигзшяотесхшй ситуация могкет лишь сам анализ разноуровневых данных, результаты которого многократно корректируются последующими рассмотрениями проблемы. Одпоко есть необходимость обрисовать особенности лексического уровнг, шгадущегося й основу зитассификпцпопных и глоттогеиетлческия построений, я его отличии от иньи уровней, ирзгкдо всего фонетического.
„ Наиболее очевидной чертой лексики шц гепетико-классифпкацпошгой базы является са большой количественный состав. Объем лексических фактов, могущих лечь в осиоаание реконструкции системы родйтва, в сотни раз превосходит любые списки фонетических и грамматических явлений — и это при том, что а указанных целях может быть использована только праязыковая лешмка, сохраненная современными лзыка-кп. Общая величина доступного реконструкции пра-славянского словаря составляет никак не меньше 20 тысяч лексем (см. ниже, гл., 6), тогда как праязыковые фонетические и морфологические изоглоссы насчитывают не более нескольких десятков единиц. Следовательно, лексика дает возможность обнаружения гораздо большего количества схождений и размежезанпй менеду родственными языками и диалектами праязыка, из которых они развились, чем фонетика и морфология, а благодаря большей сложности.} и дифференци-рованности «шкалы» степеней близости между языками — достижения большей «прецизионности» при ро-
конструкции картины родстгн. Огромный объем лексических изоглосс, измеряемый ««мелом поэнинй праяэы-копого словаря, дополняется значительным количеством ТрЛ>1СЛСКССМН1,1Х изоглосс, извлекаемых из того же материала, но не смолимых к словарным позициям (корневых, <|юрминтпых, морфоиологнческих И Т.П., 8 диалектологических атласах обычно выражаемых разветвленной диакритикой при картографическом знаке). Вес это делает лексический мэоглоссный материал несопоставимым по объему с данными фонетики и грамматики.
Другой чертой словаря, отличающей cm как от фонетической, так н от грамматической систем, является нежесткий характер его организации, что прямо связано с величиной м открытостью списка его элементов.
Эволюция лексической системы, в соответствии с-указанными особенностями словаря, осуществляется иными, по сравнению с фонетикой, механизмами, Если фонетика и, в меньшей степени, морфология, буду* ' ' чи системами с жесткой, в некоторых участках почти механической взаимообусловленностью компонентов,, эволюционируют преимущественно путем вы recti е н н я одних элементов и структур другими, то развитие словаря, системы более рыхлой, скорее даже, конгломерата рыхлых систем, протекает главным образом за счет кумуляции элементов (слов). Изменения в фонетической системе часто носят характер цепной реакции, которая охватывает всю систему и изменяет принципы, обеспечивающие ее статическое равновесие, весьма радикальным образом, ср. коренные перестройки славянской фонетики под действием закона открытого слога или вследствие падения редуцированных,. Эволюция словаря протекает гораздо более спокойно, и даже ее этапы, расцениваемые кок чрезвычайно бурные, например, в истории русского языка — петровская и советская эпохи, редко затрагивают центральные участки огромного лексического корпуса.
Различия между лексикой и фонетикой в преобладающих механизмах исторических изменений приводят к тому, что в глоттогенетических исследованиях, при установлении изоглосс, объектами отождествления, в зависимости от уровня языка, служат явления разной природы. Применительно к лексике и словообразованию (не семантике!) внимание сосредоточивается главным дОразом на собственно единицах (корнях.
лексемах:, словообразовательных конструкциях с исторически идентичным морфемным составом), применительно же к фонетическому уровню — главным образом на отношениях, соответствиях материаль-. ных единиц и структур — регулярных корреспонден-цнях, позволяющих выявление закономерных переходов одних единиц в другие. Морфология в этом отношении занимает промежуточное положение. Изменение в лексике состоит как правило в заполнении вновь сформированным элементом некоей пустоты, обнаружившейся при концептуальном освоении мира (при возникновении потребности номинации), реже — из потребностей экспрессии. В фонетике же происходит не заполнение «концептуальных» пустот (их нет), а замена одной единицы или структуры другою, нередко с последующим перестроением всей системы' в целом, что обусловлено жесткостью ее организации, Вследствие относительно малого набора элементов и особенностей их взаимосвязей большую роль в эволюции фонетической системы играют общетипологические моменты, что приводит к известному сходству результатов некоторых частных фонетических процессов в разных языках. В лексике тилологические моменты или, точнее, возможность параллельного образования, играют существенно меньшую роль.
Сказанное позволяет судить о высокой степени у с -т о й ч и в о с т и лексики на фоне других языковых уровней, что служит некоторым исследователям поводом утверждать, что лексика является наиболее консервативным уровнем и потому самым надежным для установления степеней генетической близости между родственными языками. В силу кумулятивного принципа эволюции и неподверженности лавинным перестройкам лексика способна гораздо дольше, чем фонетика и морфология, сохранять следы древних дналек-тообразующих сближений и расхождений.
Из-за огромного количественного превосходства лексических изоглосс над фонетическими и грамматичэс-кими картина межъязыковых связей, построенная на лексических данных, выглядит не столь стройной, но значительно более сложной и труднее читаемой по сравнению с аналогичной картиной, воссоздаваемой на басе фонетических и грамматических изоглосс, оставляя впечатление мозаичности и даже хаоха. Немногие лексические изоглоссы, образующие пучки, попросту
в
тонут в нагромождении изолекс, исчерчивающих карту славянских языков вкривь и вкось. Следует думать,-что справиться с этим нагромождением, увидеть б хаотичности изолекс порядок, определенные тенденции, устойчивые взаимные сближения и отталкивания меж-' ду языками и диалектами может статистический анализ данных праславянгкого словаря.
В г л а в е 2 («Лексшсестатнстика как инструмент • глоттогенктнческого исследования») содержится сжатый критический обзор направления, базирующегося на применении лексикостатистики к области сравнительно-исторического языкознания.
Исполг зование статистических методов для решения задач компаративистики имеет уже почтенную историю (з славистике начало применения статистики к истории языка созывается с именем Я.Чекановского, см. его работу do Ые+^оги екш1ап», 1927). Дале-
ко не всеми языковедами-диахронистами лингвоста-тистика признается полноценным и эффективным методом. Укреплять лингвистов в неприятии квантитативных методов, лотя бы и простейших, могут истори-. ко-лчнгвистические работы, выполненные с применением статистики, ы которых из количественных наблюдений делаются неправомерные выводы и излишне смелые обобщения. Зтот род работ не столь малочислен,' поэтому было сочтено возможным сделать подробный разбор одной такой работы, где, на наш взгляд, сконцентрированы всэ ошибки, которые могут быть допущены при привлечении лексикостатистики к решению проблем исторической лингвистики и смэжных дисциплин. Полнота разбора оправдывается тем, что анализ такого рода дает возможность проще и нагляднее обозначить пределы компетенции квантитативных методов применительно к истории языка и его носителей и извлечь более основательные уроки из чужого неудачного опыта интерпретации количественных данных.
Извлеченные из критического анализа крайне неудачной работы В.М.Стецюка «Определение мест поселения древних славян графоаналитическим методом» (ИАН ОЛЯ, 1987, № 1) некоторые уроки изложены в главе в намеренно догматическом ключе: не все они, » суда по рассмотренной работе, являются столь уж оче-
видной банальностью.
— Вера во всемогущество статистики неосновательна.
Число способно служить сильным подспорьем в «измере- • нии» отношении между родственными языками, но статистическое обследование языков — еще не гарантия и даже не основа для правильных выводов об истории их , носителей (соответствующих этносов). Статистические данные о'языках, в частности о лексике, нельзя напрямую связывать с палеоэтпогеографней. К решению проблем исторической лингвогеографии лингвостатис-тика может привлекаться только при учете множества иных факторов* оказывающих рлпяние на конкретную ландшафтную приуроченность изоглосс.
— Лексикостатистика, как л квантитативное иссле- • дование других языковых уровней, ке должна сводиться к арифметике, т.е. представлять собою простей подсчет слов (форм, «явлений» и т.д.). Абсолютные цифры не отражают глубинных отношений между языками, поскольку зависят от множества виеязыксвых моментов, ни характер действия, ни сам круг которых не «вычислим» вполне однозначно.
— Генетическая близость языков по данным лексики может определяться только при обращении к праязыковому лексическому фонду. Все лексические межъязыко-зые схождения, относительно которых могут возникнуть подозрения в послепраяэыковом происхождении, » результате более поздних этнических и языковых контактов, должны быть безусловно изъяты из статистического анализа глоттогенетической направленности.
— Важнейшее правило глоттогенетических построений — безусловная ориентация на диалектный материал. Опора только на данные словарей литературных языков в решении проблем языковой «доисторич» ведет к аберрацилм историко-лннгвистического зрения и непоправимым перекосам в итоговой картине древнейших межъязыковых (диалектных на уровне праязыка) связей.
— Строгий отбор лексики к лингвостатистическнм подсчетам в целях выявления степени родственной близости языков должен касаться генетической чистоты материала, но не должен ассоциироваться с его тематической фильтрацией. Тематическая и семантическая (равно как и грамматическая — частеречная и проч.) селекция лексического материала, даже (а может быть, в особенности) если она нацелена на выделение чрезвычайно важных в культурно-историческом отношении слов (хозяйственная. в частности, ремесленная, терминология,
ритуальная лексика, социальная номенклатура и т.п.), может привести к срабатыванию фактора неравномерного и рассогласованного развития различных сторон культуры, вследствие чего в итоговой картине такжл могут случиться системные, хотя и не предсказуемые, перекосы. Всякого года тематический отбор в компаративных исследованиях, где применяются количественные методы, по существу противоречит элементарному требованию статистических наблюдений: наиболее достоверные результаты могут быть получены только с помощью случайной выборки.
Из конкретных квантитативных методов, применяемых в компаративистике, наибольшую известность получила глоттохронология М.Сводеша (которую часто, неправомерно ограничивая семантический объем термина, называют лексикостатистшсой). Сравнение процедур, предлагаемых в пе.шел работе, с глоттохро-. нологическими напрашивается само собой — хотя бы для того, чтобы отчетливее выявить особенности нашего подхода.
Основная цель метода Сводеша — абсолютное дати-. роьание этапоа распада праязыка, при котором установление картины языкового родства с определением неравиомощносги отдельных межъязыковых связей — лишь промежуточный результат. Нужно отметить, что глоттохронологическая методика (в традиционной вер-' сии Иводеша или модифицированная, ср. ьерсии С.Гуд-жинскои и А.Родригеса, С.А.Старостина, С.Б.Яхонтова и др.) нередко используется для оценки взаимной близости отдельных языков и языковых групп (семей) без установки на непременное датирование их расхождения, с указанием только процента корьевых совпадений как. меры родства. О методе глоттохронологии много писали, рассматривая в качестве его недостатков прежде всего малый объем basic vocabulary и недоказанность постулата о постоянстве скорости его эрозии. К другим, и чрезвычайно существенным, недостаткам метода глоттохронологии следует отнестг исходное — как правило молчаливое — допущение диалектной монолитности праязыка, т.е. фактически опора на давно скомпрометированное понятие родословного древа; принятие во внимание лишь дивергентных процессов и «замалчивание» вторичного сближения, конвергенции как одного из факторов лексической близости языков; отказ от обсуждения критериев языковой самостоя-
тельности, вследствие че»о разделяющиеся идиомы выступают на страницах глоттохронологических работ бесплотными сущностями, языками «без свойств»; отчетливо осязаемое в результатах применения традиционной версии метода (например, у И.Фодора, у М.Чей-. ки и АЛампрехта п глоттохронологическом исследовании славянских языкоп) занижение реального возраста самостоятельных языков; вытекающая из ограниченности 100-словного диагностического теста невысокая разрешающая способность глоттохронологической «оптики», вследствие чего близкородственные языки характеризуются чрезвычайно однообразными показателями сил связей. Преодоление этих внутренних пороков глоттохронологии как метода составляет необходимое звено в совершенствовании лексикостатистического подхода к компаративистским проблемам.
Ввиду отказа от датировок дивергенции и ограничения лишь задачей воссоздания картины родства наша работа оказывается по своему характеру гораздо ближе к попыткам количественной таксономии языков. Методика А.Я.Шайкевича предполагает обращение не к 100-словному списку Свсдеша, а к значительно превосходящим его по объему спискам понятий (627 понятий по словарю индоевропейских синонимов К.Бака); кроме того, вводится процедура апостериорного взвешива ния признаков, выявляющая меру устойчивости/неус-тойчивостн различных групп лексики в истории языка. Эти особенности методики А.Я.Шайкевича обеспе чивают значительно большую гибкость анализа и на'--дежность результатов. Однако и в данном случае применения лекснкостатнстшт дифференцирующая сила лексического теста является, на наш взгляд, недостаточной. Возможное возражеинэ, состоящее и том, что «коллективный портрет» близкородственных языков и должен оказаться довольно стертым, поскольку речь идет о сходстве на уровне праязыка, следует отклонить на том основашш, что н праязык гораздо более адекватно реальности представлять как диалектно структурированное образование с неравномощнымн внутренними связями его компонентов. Выход видится в значительном расширении исходной лексической базы исследования.
Преодоление недостатков количественных методик, основанных на использовании ограниченных по объему контрольных лексических списков, осуществляется
в двух направлениях. Одно из них опирается на анализ, целого текста (например, работы В.Маньчака по установлению меры близости между языками с помощью статистического исследования параллельных текстов). 1С анализу текстов прибегают и в соображениях усовершенствованна методики глоттохронологии (С.А.Старостин). Другой путь — обращение к сплошному статистическому анализу словаря. На наш вэгчяд, именно такой подход наиболее плодотворен и способен придать квантитативным сценкам лексической близости между языками неоспоримую точность, хота он намного более трудоемок. В виде прпмйра можно сослаться н*г выполненное В.З.Сашшковым тщательнейшее статистическое исследование целых лексических систем, отраженных з древнерусских юридических текстах XI—XIV вв., старорусских и западнорусских юридических текстоз • XV—XVI вв. по памятникам суммарным объемом ок. 70 тыс. словоупотреблении для первой группы и более 100 тыс. — для калсдсш из двух других групп. Заслуживают интереса и исследования, определяющие взаимную близость языков (или диалектоп одного языка) на основе статистического обследования сплошной выборки из массива лексических единиц неопределенно большого размера. Нетрудно обнаружить, что кванти-. тативным исследованиям, опирающимся на статисти-' ческую обработку целых лексических систем или сплошных выборок из mix значительного объема, свойственна несравнимо большая тонкость и детализация в оценках близости между языками, чем работам, которые основываются на коротких диагностических списках лексики.
В глазе 3 («Поиск метода») излагаются отправные положения, на основе которых возможно построение лексикостатистической модели языкового родства, и предлагается формула, с помощью которой выявляется численная мера генетической близости языков.
Мы исходим нз признания лексикостатистических методов наиболее объективным способом установления степени генетической близости между языками. Единственно надежной материальной базой глоттогенети-ческих построений на лексикостатистической основе являютса праязыковые словники современный языков, т.е. своды родственноязыковых лексических коррес-
понденций, возводимых л единым праязыковым реконструкциям. Таким образом, за пределы статисти-. ческих процедур должны быть выведены все неунасле-' дованные слова — лексические образования эпохи «после распада» праязыка, поздние (послепраязыковые) •сорместныа и индивидуальные заимствования из третьих языков и, что следует подчеркнуть, результаты Езаимпого обмена лексикой между данными языками после распада их праязыкового единства, хотя бы эти лексемы в лзыке — источнике иррадиации и восходи-' ли к праязыковому фонду. Можно предполагать, что квантитативные соотношения между праязыковыми словниками современных языков, точнее говоря, пропорции между различными пластам к лексики в завн-. симости от степени ее распространенности (лексика, известная всем сравниваемым языкам, каким-либо их группам и, наконец, узкие праязыковые регионализ-мы данного язык?), в целом с достаточной мерой приближенности отражают реальные связи их протоидио-мов — диалектов самого праязыка.
С предельной строгостью картина языкового родства лексикостатистическими методами может быть воссоздана -на, основе квантитативного анализа всей праязыковой лексики, сохраняющейся в языках-потомках. Ото означает, что применительно к славянским языкам объем материала, привлекаемого для статистического анализа, по сравнению со списком Сводеша должен возрасти на два порядка, что значительнейшим образом повысит надежность результатов. Для современных средств вычисления этот объем, разумеется, отнюдь не является чрезмерным; вопрос состоит лишь в том, чтобы исследователь располагал подобным материалом.
Публикация создаваемых в Москве и Кракове двух словарей, ставящих своей целью реконструкцию пра-славянского лексического фонда в его полном объеме, делает нашу задачу выполнимой, только с той оговор-■ кой, что в основу количественного анализа сейчас может быть положен не весь праславянский словарь, а сплошная выборка из него, равная объему изданной его части..
Использование этимологического словаря, ориентированного на предельно полный охват и статейное перечисление праязыковой лексики, обнаруживаемой а современных языках, принципиально важно для рабо-
ты подобного рода. Они дает сильное преимущество перед работами в духе глоттохронологии, поскольку сводит к минимуму возможное влияние на статистические результаты явчоний лексического взаимопроникновения в языках-потомках: по-нервых, при нынешнем, достаточно доброкачественном, состоянии славянской этимологии и истории языков послгпраязмковые лексические перемещения из языка п гэык в своем большинстве выявляются более или менее надежно; во-вторых, при оперировании лексическими массивами в несколько тысяч единиц возможна, и статистически вполне кирректыа, элиминация сомнительных случаев. Пра возникновений сомнений относительно древности-, шш исконного характера какого-либо слова его включение или невключение в подсчеты для глоттохронологии с ее «малой» статистикой (не следует думать, что 100-словный список Сводеша в силу, его особенной -устойчивости гарантирован от сскнений такого рода) выбор того шш другого решения чреват существенными последствиями: учёт шш неучет только нескольких слов может сдвинуть даты этапов дивергенции на столетия. Для «большой» же статистики, иакие бы ель-терна". ивы & оценках древности в исконности лексики ни были предпочтены, на конечный итог выбор окажет п целом незначительное влшшяе: спорные случаи как г бы растворяются а массе более надежного материала, подвергаемого статистической обработке, и этим сильно смягчается воздействие допущенных погрешностей.
К формуле, с помощью которой выявляется численная мера родства, предъявляется несколько важных требований.
Статистический анализ не должен, как было сказано, сводиться к прос~ой арифметике — определению, количества слов, связывающих данную пару языков (У(А,В)), с дальнейшим его сличением с аналогичным показателем для другой пары. Такой способ, нередко, как мы можем отметить, встречающийся в «лингвоста тистических» работах, не пригоден для каких бы го ни было количественных сравнений глоттогенетической направленности, поскольку эти цифры находятся ь сильнейшей прямой зависимости от объема праязыкового словника, реконструируемого для данного языка. Прямое сличение абсолютных показателей лексических связей «покажет», что болгарский язык генетически ближе к северновеликорусскому наречию, нежели к
македонскому языку, а родство польского и сербохорватского язычов намного глубже, чем родство польского с кашубско-словинским. Следовательно, численные показатели лексически:: связей праязыкового характера между данными двумя языками должны быть отне-
• сены к общим объемам восстанавливаемых праязыковых словников данных языков (т.е. ... / Н(А)'Н(В)).
Количественное сравнение близости языков в различных их парных объединениях не должно замыкаться выявлением сепаратных (эксклюзивных) изо-лекс. Ограничение лишь сепаратными лексическими связями приводит к срабатыванию той же зависимости результатов от объемов праязыковых словников данных языкоз: абсолютные эксклюзивные лексические связи русского и сербохорватского языков преобладают над количеством русско-белорусских, русско-украинских и сербохорватско-словеяских эксклюзивных изо-лекс, что резко противоречит имеющимся представлениям о взаимной близости между упомянутыми языками. Ближайшеродственные пары, составляемые болгарским и македонским или украинским и белорусским, по числу сепаратных цзолекс уступают связям русского языка с сербохорватским, словенским и чешским. Кроме того, ситуация с украинским и белорусским, праславякские словники которых достаточно велики, имеет еще одну — довольно парадоксальную — причину. Как ни странно, малое число объединяющих их эксклюзивных связей объясняется как раз высокой степенью генетической близости между языками восточнославянской (пэд)группы. «Незначительность» исключительных словарных корреспонденций праславян-ского характера между украинским и белорусским коренится в их близком родсгве с третьим языком. Отношения в подсистеме, где преобладают тернарные связи, имеют иную природу, чем отношения в парных подсистемах.. Соседний великорусский язык с его гигантским праславянским словарем еще не успел настолько
• удалиться от белорусского и украинского, чтобы в изоглоссах, связывающих два последние языка, стали внушительными по количеству сепаратные, бинарные связи. Взаимная особенная близость трех языков, а не пар, как в других подгруппах, делает двойственные исключительные связи между составляющими дииной (под)группы менее вероятным», чем тройственные, отличающие их от всех прочих родственных» языков.
Из втого следует вывод, что при всей чрезвычайкой важности сепаратных схождений их нельзя абсолютизировать как свидетельства особо тесных генетических отношений. Вепьма существен фон, на котором разыгрываемся сценарий лингвистического родства. Поучат лексического фона чреват переоценкой относительно высоких абсолютных показателей сепаратных связей между языками, для которых реконструируются пространные п^аяаыковые словники, и, напротив, решительной недооценкой относительно меньших цифр, отражающих эксклюзивные параллели между языками со сравнлтельно небольшим праязыковым лексическим наследием.
Однако обращение ко всей лексике, а не только к узким изоглоссам, требует разграничения разных их видов. Ценность лексических изоглосс в установлении, степени генетической близости языков находится в об- . ратной зависимости от числа охватьшаемых ими языков: наиболее показательными в отношении родственной близости являются исключительные с^язи между языками, наименее — общеславянские (в буквальном смысле) слова. Следовательно, в формулу, с помощью которой будет определяться мера родства языков по данным лексики, должны быть введены коэффициенты (р), которые устраняли бы перекосы, возникающие из уравнивания значимости неравномощных изоглосс. В ' качестве шкалы весомых коэффициентов мы предлагаем последовательность натуральных чисел от 2 (минимальное число сравниваемых идиомов) до п (максимальное), но связываемых с числами, выражающими лексические связи, в обратном порядке, т.е. весовой коэффициент р — а + 2 — ь (В диссертации рассматривается возможность использования и других шкал' весовых коэффициентов),
В конечном виде предлагаемая формула генетической близости языков по данным лексикостатистики представляет собой равенство:
в (А, В) = 2[(п+2—4)'У(Л,В)|] / К(А)*Н(В), где в — показатель * степени родства», А и В— два данных идиома из всей совокупности исследуемых идиомов, V — число общих для двух данных идиомов слов, восходящих к праязыковому лексическому фонду, Н — число всех восстанавливаемых (или привлекаемых к анализу) единиц праязыкового лексического
IS
фонда, отмеченных в данном языке (объем его праязыкового лексического наследия в целом), п — общее число сравниваемых идиомов, i — мощность изоглоссы (число охватываемых ею идиомов).
Пробные применения некоторых стандартных статистических формул меры сходства объектов, в частности, опирающихся на метод четырех клеточной корреляции (коэффициент ассоциации Q, коэффициент сопряженности Ф), показали свою недостаточную эффективность. Они рассматривают отсутствие общего признака у данных двух объектов как их общий признак, что при большом перепаде размеров списков положительных признаков у отдельных сравниваемых объектов (ср. величины Н у лужицких или кашубского языков, с одной стороны, и у русского, чешского или сербохорватского, с другой) приводит к смещению результатов; к тому лее низкие значения коэффициента Ф признаются в статистике не слишком надежными, тогда как именно они представляют главный интерес в итоговой картине языкового родства.
В г л а в е 4 («Материал исследования. Филологическая критика источника. Оценка статистической достаточности материала») глапьоо внимание уделяется проблеме количества и особенно качества лексического материала, непосредственно кладущегося в основу классификационных и компаративных построений на статистической базе.
Выбор источника материала для лексикостатистического определения степеней генетической близости языков в' славянской семье осуществлялся по сути между двумя конкурирующими лексикографическими изданиями — краковским «Stownikiem praslowiaiia-kim» под редакцией Ф.Славского и московским «Этимологическим словарем славянских языков» под редакцией О.Н.Трубачева (брненский «Etymologicky slov-nik elovanskych jazykfl» с предварительным вариантом массива полнозначной лексики «Zakladni vSeslovanakd slovni zäsoba», а также «Vergleichendes Wörterbuch der elavischen Sprachen» Л.Садник и Р.АЙцетмюллера по целому ряду причин" нашим источником служить не могут). Большая продвинутость издания московского словаря (ЭССЯ), а также, ряд качеств, концептуально отличающих его от краковского предприятия (отказ от расписывания материалов этимологичедких словарей
отдельных языков с уже осуществленной поаславян-ской реконструкцией, отказ от п: вдового принципа в пользу установки «словарная статья => отдельное слово», непривлечение в слоьник отдельных звеньев регулярных морфологических парадигм, осторожность в констатации праславянской природы тех или иных формально возможных реконструкций, ограниченное привлечение периферийной междометной и ономатопе-ической лексики и др.), сделали его более предпочтительным в наших глазах.
К моменту начала ввода материала ЭССЯ в ЭВМ свет увидел 15-й вып. этого словаря, оканчивавшийся вокабулой *lohacb '(примерно треть всего праславянско-го лексического списка). Рто составляет 7938 словарных позиций, что почти в SO раз превосходит basic vocabuiary М.Сводеша и более чег^ в 12 раз объем списка понятий для квантитативной таксономии европейт • ских языков у А.Я.Шайкевичг.. Ьез сомнения, это предельная величина добротного, строго выверенного пра-. славянского лексического материала, который к моменту начала нашем работы мог быть подвергнут статистическому анализу.
Основной объект нулевого цикла работы — изоглосса в обобщенном представлении, т.е. фактически позиция в ЭССЯ — список рефлексов пра- ^ славянской формы. Основанием межславянского сравнения и комплектации материала в границах словарной статьи ЭССЯ является не корень, как это обычно практикуется в этимологических лексиконах, а словообразовательная структура, т.е. предметом рассмотрения является не этимологические гнездо, а праславян-ская лексема. Однако принцип цельнолексемного соответствия че может Г лть проведен с неукоснительностью в силу естественною «сопротивления материала» (диффузность, пересекаемость форм, небезусловность некоторых этимологий й т.п.). Отклонения от исповедуемого принципа цельнолексемного соответствия (включение в число керреспонденций заголовочной лексемы форм, находящихся на следующих ступенях деривации: укр. дарбенний ч статье '(1агьЪа...\ подключение нераспространенной формы, не выделяемой в самостоятельную статью, к анализу аффиксального образования: н.-луж. gjars в статье 'съПапъ/^еъНапь...; объединение морфологических вариантов: *сетегь/*£етега, *dryxati/'dryxngtt... — при их разнесении в разные по-
зиции в иных аналогичных случаях: *Ьгегда I, II — Ьгёг&ъ I, II, — *х1еяШ1...\ объединение различ-'
ных по суффиксальному оснащению дериватов: *1еИХ-се/*1егео1§св.неразделение словообразовательных омонимов: статья 'аиойъМса., совмещающая производные от *адойа\ и словообразовательно вторичные образования от 'адосИса...; и др.) демонстрируют, что * набор» лексических изоглосс, если последние исчислять, исходя из словника ЗССЯ, является до некоторой степени условностью. Другие чисто лексикографические решения привели бы к констатации отличных изоглосс, часто иной мощности, что небезразлично- для конечных результатов квантитативного исследования, поскольку разным по мощности изоглоссам в наЖей формуле приписываются разные весовые коэффициенты. В ЭССЯ имеются, с наыей точки зрения, спорные этимологии, уточнение которых (например, ¡адЩь: русск. диал. лглый можно отнести к «незакономерным» продолжениям 'й^ёпди, ср. параллелизм названий сныти укр. диал. Аглйця/дАглиия; с.-хорв. лачити правомернее не связывать с в.-луж. 4иё1с во, а относить к праслав. "7рсШ как заимствование из болгарского или македонского; и др.) могло бы, в весьма незначительной, правда, мере, повлиять на статистическую оценку близости языков. Однако в большинстве случаев -мы избегали вмешательства в этимологические рзшения, принятые в ЭССЯ, как если бы они были единственно возможными.
Серьезнее дела обстоят с лакунами в списках славянских рефлексов заголовочной праформы, имеющихся в каждой сг эваркой статье и представляющих по сути описание ареалов отдельных слов. Неполнота привлеченного материала может оказать влияние на статистические итоги работы. Обнаруживаемые лакуны мы не склонны, относить к недостаткам словаря, поскольку пропуски в лексиконах, подобных ЭССЯ, неизбежны нэ-за огромного объема материала, заведомой неполноты, неравнокачественности и, главным образом, открытости используемых источников диалектной лексики. Стремясь получить максимально достоверные статистические результаты, мы сочли возможным внести в лексические материалы ЭССЯ дополнения, источниками которых послужили около трех десятков изданий диалектной и литературной лекржи, в основном словарей, преимущественно восточнославянских
(русского, белорусского и украинского),, болгарского и верхнечужицкого языков. Посильный вклад в устранение лакун в своде лексических изоглосс, каковым помимо прочего является ЭССЯ, осуществлен з нашей работе «К уточнению представлений о славянских изоглоссах. Дополнения к лексическим материалам «Этимологического словаря славянских языков» (чч. I, II. М., 1990), которая дана приложением к настоящей диссертации.
Сделанное нами пополнение списков континуантов славянских праформ коснулось около 1600 словарных статей ЭССЯ (то есть каждой пятой статьи). Некоторые из них позволили отклонить высказанные составителями сомнения в праславянской древности заголовочной праформы ('Ьегь, 'lesatzjb..,), подозрения г книжной природе отдельных поэднеславянских рефлексов (*big-. úbnbjb, "kozerogb...), расширить ряды формальных вариантов праславя«ских лексем ('brujb к 'bruja, cujadlo к *cudlo, 'kostovalz (очевидно вторичная фор^а) к "kostí-vate, *¡bzskubatt ь 'jbzskubtt...), выявить двучленные эксклюзивные изоглоссы, статистически наиболее значимые в установлении степени близости между языками Cbagrtbje, *Ьа}ипъ, 'basn^ca, 'bazuriti, 'berzujb, 'baz-plodzjb, *bezpgtb, 'ЬШъсе, *b¿s&ti, *bit°lb, 'blosíica, *bodad-lo, 'boltti/'boletl, *boltuxb, 'Ъихугъ, 'buhan, 'bzpadlo, *Ьъг mitl, "d(v)o¡fmhy, *йьг£ь1ь, 'jatzubje, 'hatadlu, *kavyka, *kozvonb(kz), 'krgtovéja, *кгь1ъ, 'lesatzjb, *l§dzka, 'Iqdbce и ДР-).
Еще один род вмешательства ь данные ЭССЯ представляет сегрегационный анализ, обращение к которому вызвано стремлением к тому, чтобы положенный в ochopv расчетов материал был предельно чист в генетическом отношении. Цель сегрегациой-ных процедур — освобождение материала от результатов возможных послепраславянских взаимовлияний, книжной лексики, потенциально поздних образований, сомнительных параллелей и т.п. — всего, что может вносить искажения в синхронную картину генетической близости (тюадне)праславянских диалектов. Достаточным позодом дль констатации небезупречности примера или реконструкции служили явно выраженные сомнения самих составителей ЭССЯ. Прежде всего изымались из подсчетов статьи, в которых выражаются сомнения в праславянской древности заголовочной лексемы; вычеркивались церковнославянские примеры
(«русск.-цслав.», осербск.-делав.») как лексика книжных путей распространения {'аЪгМъ, *ashgdb, *£а-jaznb...), книжные слова живых языков (укр. Оагрий, русск. Cec-tâdnûiU, нлесета, ччтел. hrachor...), слова» двусмысленные в плане реконструкции (например, западнославянские слова с префиксом z-, который может быть возведен и к 'jbz-, и к Vа- (*/ьгЬШ, 'jbzbosti, *jbzda• t'....) и т.д. Изданная часть праславянского словаря сокращена таким образом примерно на 430* единиц (5,4% словника ЭССЯ).
Кроме того, в некоторых случаях устранялась непоследовательность составителей отиоентельйо принципа' цельиолексемного соответствия, и материал ряда статей, объединяющих случаи вариантной вокализации идеофо-иического корня, морфологические варианты, словообразовательные модификации и т.п., был представлен divise, чем усиливайся принцип «максимально расчлененной подачи словника» и выявлялись болео «¡мелкие» изоглоссы, вычленяющие более узкие межъязыковые ^ связи Çcrbkati > ... — *brykaU, 'dadjtbogb > ... — *da*bogbf * 'gromaditi > ... — 'gromasditi, *tisajb > ... — *llSa и т.п.). . Подобное расширение корпуса лексических изоглосс, по* .видимому, позволило представить различия между славянскими языками статистически несколько более выпуклыми (впрочем, разделением .материала таких статей мы не злоупотребляли).
После изъятия из рассмотрения, нескольких сотен статей с лексикой сомнительной дреяиостп, -лексика -книжной природы, а также некоторого расширения корпуса изолекс, образовался список из 7557 позиций (лексических изоглосс), который п был подвергнут статистической обработке.
Перечень идиомов, степень генетической близости , между которыми (попарно) выявляется в диссертации, естественно, совпадает с перечнем славянских языков, как они рассматриваются в ЭССЯ: старославянский (со), болгарский (бг), македонский (мк), сербохорватский. (сх), словенский (сн), чешский (чш), словацкий (сц), верхнелужицкий (вл), нижнелужицкий (пл), по-лабский (яб), польский (пл), кашубско-словинсшШ (кс), русский (вр), украинский (ук), белорусский (бр). Хронологические уточнения «древне-» и «старо-» («древнесловенский», «старобелорусский») в расчет не принимались. Исключение сделано, конечно, для ста . рославянского п древнерусского; последний, будучи
предком трех современных языков, выделен у нас в самостоятельную единицу (др). Относительно древнерусского следует тгкже сделать оговорку, что, строго говоря, вся лексика праславянского происхождения, наб-тюдаемая в современных восточнославянских языках, • наличествовала и в древнерусском, если последний понимать как их предшествующее состояние. Здесь же древнерусский трактуется только как язык письмеч-ных памятников, приуроченных к определенному времени и месту, что сблгокает его статус со статусом старославянского языка.
В ЭССЯ имеются пометы «дигл(ектное)», которыми в подавляющем большинство и ограничивается" локальная паспортизация региональной лексики всех языков, — но за исключением русского: данште слоьаря-источника дают возможность представить огромный великорусский этноязыковой континуум более детально, чем осталы. jie идиомы- В его составе мы выделяли "два наречия (ср и нр) и, условно, пояс срэднэрусских говоров (цр)
Состав идиомоч, подвергавшихся лексикостатистическому анализу, рассматривается в работе в четырех е^рсиях: 1) SLAV - наибольшей по количеству идиомов — с включением дре-нерусского и старославянского и дифференцированным представлением русского,» 2) CON — то же — с чскл'очъ-иием книжных древнерусского и старославянского, 3) RUS — с их включением, но представлением русского в виде цельного идиома, 4) MIN — то же — с исключением мертвых книжных. Расчеты делалчсь для каждой версии состава славянских идиомов отдельно.
Объемы праславянского лексического наследия в отдельных идиомах, по данным 1—15 выпусков ЭССЯ, составляют:
сс— 1124 лексемы, бг— 3262, мк— 2035, сх — 4568, cu — 3519, чш — 4264, сц ~ 2933, вл — 18S5, нл — 1574, лб — 452, ил — 3350, кс — 1683, др — 2681, вр — 4956 (ср — 4168, цр — 3334, хор — 3833), ук — 3905, бр — 3288 праславянских лексем.
Статистическая надежность привлекаемого лексического материала определялась при помощи расчета объема минимальной выборки для ясыка с наименьшим доступным реконструкции праславянским словником (полабского). Пробные проверки частоты ветре-
чаемости полабских слов л статьях ЭССЯ далп величины около 0,06. По формуле
(см.: Пиотровский — Беятаев — Пиотровская, 1977, с. 295), где N — объем выборки. I — частота (0,06) встречаемости Признака, относительно которого определяется N. р — заданная надежность (96%, для которой табличное значение квантиля гр 1,96), б — заданная отг носительная ошибка наблюдения (10%), установлено^ что наименьшая необходимая выборка в нашем случае составляет N„1,, « 6018 слов; иначе говоря, объем привлеченного к статистическому анализу- материала (7557 изолекс) превосходит минимальную требуемую селичи-; ну (у нас N 1,25Кт1П) и может считаться вполне надежным. . '
В глава 5 («Порядок ввода материала н ЭВМ и его машшиюи обработки») описываютсл этапы компьютерного обследования праславянской лексики согласно условиям нашего эксперимента. Работа выполнена на компьютере ЕС-1036 Института русского языка РАН. Серия программ, необходимых для этого, подготовлена ст. науч. сотр. канд. физ.-мат. наук М.В.Лом-ковской и составляет ее интеллектуальную собственность. , .
В г л а в я 6 («Из квантитативнотипологическшс наблюдений над лексикон славянских языков (прасла-ьяпское наследие)») показана необходимость типоло'ги^ ческих уточнений характеристик привлекаемых к анализу языков. Компаративист, занимающийся выяснением природы и силы связен в языковой семье, как правило, имеет дело с неполным п зачастую довольно разнородным материалом, что существенно осложняет прямое сопоставление массивов данных, относящихся к каждому из родственных языков яо отдельности. Непринятие во внимание типологических различий между языками (например, объемов их полных пра-славянскпх словников, книжной или устно-диалектной природы, степени изолироьаииоетн от контактов с родственными языками и т.д.) может приводить к неверно осуществляемым сличениям данных (особенно количественных), а отсюда — к смещенным или даже ошибочным выводам относительно их истории.
Обширный материал ЭССЯ ужо сейчас позволяет
сделать оценки величины лраславяиского лексического корпуса в целом и праязыковых словников отдельных славянских языков.
Определяя объем праславянского лексического корпуса, необходимо' иметь -в виду, что речь не идет о словарном «запасе» некоего цельного идиома: словарь праславянского языка, который никогда не был бездиалектньш монолитом, может реконструироваться только как теоретико-множественная сумма словарных составов, как объединение множеств праславянских «з1о№тс1\7» более поздних продолжений. Имеющиеся оценки этой величины либо совершенно устарели (Т.Лер-Сплавинский, Ф.Копеч-ный и др.), либр основаны на неполном учете особенностей материала, избранного з качестве теста, и. к тому же усугублены арифметическими ошибками-(Ф.П.Филии и др.). По нашим прикидкам, объем праславянского словаря может достигать 25000 лексем (распространенных крайне неравномерно и в значительной езоей массе представляющих праязыковые регионализм Ъ1).
Сведения об объемах праславянских словников отдельных славянских языков, пока гипотетические, несложно получить путем экстраполяции на тот или иной предполагаемый суммарный объем граелавчнскс^о словаря данных о предъявленное«! каждого языка (%) з списках конти-нуантов заголовочных праформ в уже опубликованной части ЭССЯ. Экстраполяция на суммарный объем з 25 тысяч лексем дает следующие показатели:
сс (14,87%)— 3,7 тыс. слов, бг (43,17%)— 10,8 тьхе., мк (26,93%)— 6,7 тыс., сх (60,45%)— 15,1 тыс., сн (46,57%)— 11,6 тыс., чш (56,42%)— 14,1 Тыс., сц (88,31%) — 9,7 тыс., вл (25,08%)— 6,3. тыс., нл (20,83%)— 5,2. тыс., лб (5,98%)— 1,5 тыс., пл (44,33%)— 11,1 тыс., кс (22,27%)— 5,6 тыс., др (35,48%) — 8,9 тыс., вр (65,58%) — 16,4 тыс., ср (55,15%)— 13,8 ?ыс., гор (50,72%) — 1?,7 тыс., ук (51,67%) — 12,9 тыс., бр (43,51%)-: 10,9 тыс. праславянских слов.
По доле праславянской лексики, сохраненной в каждом славянском языке, их можно условно разделить на группы: •
1) «крупные» языки — с охватом более 50% прасла>
пянского словаря: вр (оба наречия также относятся к крупным идиомам), сх, чш, ук;
2) «средние» — от 30% до 50%: сн, пл, бр, бг, сц, др;
3) «малые» — менее 30%: мк, пл, кс, 11л, сс;
4) «реликтоььш»: лб.
Просматривается положительная корреляция между долей праславянского лексикона, приходящейся на словарный состав данного языка, и объемом всего его лексикона в целом (оценки величин лексиконов отдельных идиомов см. в работах А.Е.Супруна по лексической типологии славянских языков). Наши данные сб объемах праславянских словников современных славянских языков существенно отличаются от соотношений, определенных другими исследователями.'
Выявление дифференциального слоя праславянской лексики в каждом языке дает возможность оцепить меру специфичности его праславянского лексического наследия. В 1—15 выпусках ЗССЯ отмечено (после указания абсолютного числа индивидуальных праславянских слов приводится, в процентах, их доля во всем массиве праславянской лексики, фиксируемой лишь в единичных языках, и их доля,'также в процентах, в праславянском словнике данного языка):
се — 28 (3,7; 2,49), бг — 35 (4,6; 1,07), мк — 0, сх — 111 (14,7; 2,43), ск - 45 (0,0; 1,28), чш — 125 (16,6; 2,93), сц — 17 (2,3; 0,58), вл — 30 (4,0; 1,58), ил — 13 (1,7; 0,83), лб — 5 (0,7; 1,11), пл — 46-(6Л;~ 1,37), кс - 19 (2,5; 1,13), др — 48 (6,4; 1,79), вр — 189 (25Д; 3,82), ср — 52 (0,9; 1,25), юр — 19 (2,5; 0;50), ук — 31 (4,1; 0,79), бр - 12 (1,2; 0,36).
Наибольшую лексическую специфичность по отношению к праславяискому фонду обнаруживает русский язык, наименьшую — македонский. Если список славянских идиомов упорядочить по убыванию доли дифференциальной лексики в праславянском словнике каждого.языка, то в нем можно усмотреть определенную тенденцию: к началу списка тяготеют идиомы, которые характеризуются достаточно ранним дналект-.ным обособлением, ранним осознанием себя носителями данного идиома как выделенной этнической общности, давней историко-культурной традицией, включая собственную письменность, и т.п. Напротив, к его концу сосредоточиваются лингвистические образования более позднего с историко-культурных позиций харак-
тера: словацкий, белорусский, македонский, великорусские наречия, не ставшие самостоятельными языками. Иными словами, ранняя историко-культурная специализация идиома с необходимостью предполагает высокую долю индивидуальной лексики а сохраняемом ' иа1 праязыковом наследии.
Индивидуальность целых славянских групп выражается такими показателями: 6,3% всего праславян-.ского лексикона составляет исключительно южнославянская лексика, 6,4% — исключительно западнославянская. 8,7% — исключительно восточнославянская.
В главе? («Картина родства славянских языков но денным ленсикостатнстнки'») приведены результаты статистического анализа праславянской лексики по предложенной нами формуле и их интерпретация.
Информативность абсолютных показа--т е л е й лексических связей между языками (количество общих для них изоглосс) невелика: они обнаруживают чрезвычайно высокую скоррелированность с величинами Н у обоих сравниваемых языкое. Весьма-наглядно зависимость абсолютных показателей лексических связей между языками от величин их праязыковых словников выступает при обращении к эксклюзивным параллелям — материалу, который чаще всего, привлекают для доказательства особых отношений' между данными идиомами в прошлом, как свидетель- ' ства их тесных контактов. Наибольшее количество слов праславянского происхождения, связывающих данный язык с каким-либо одним другим языком, — у русского (875 по 1—15 вып. ЗССЯ), величина Н которого самая высокая из всех славянских языков, далее идут сербохорватский (268 слов), чешский (235), словенский (135), украинский (125), т.е. наиболее «крупные»; замыкают список «малые» старославянский, македонский и «реликтовый» полабский. Неудивительно, что сильнейшие сепаратные связи в абсолютном численном выражении характеризуют именно русский и сербохорватский (74 лексемы из 7557, рассмотренных в нашем анализе), хотя они принадлежат и разным славянским группам. В то же время белорусский и укра-: инский, близкое родство которых сомнения не вызывает, на том же пространстве связываются всего 15-ю исключительными изолексами, а болгарский и македон-: ский — 14-ю. Из этого следует сделать вывод, что при
нестатистических оценках взаимной близости данных идиомов, при констатации их особых отношений в прошлом необходимо учитывать их квантитативнотнпо-логические особенности: большое количество словарных схождений между языками не непременно указывает на' наличие ь их истории интенсивного эксклюзивного взаимодействия. В подобных случая постулирование особо тесных взаимоотношений языков нуждается в дополнительных аргументах, находимых в исследовании лексики неквантитативными методами.
Не слишком информативным является и относительное, в процентах к величине праславянского лексического наследия данного языка, выражение его лексических связей с другими идиомами. Тем не менее и по этим дан, ным можно сделать некоторые наблюдения, касающиеся исторических взаимоотношений между языками. Так, обнаруженная нашими наблюдениями закономерность, согласно которой в связях с третьим языком участвует больший процент праславянского словника того из двух данных ближайшеродственных языков, который характеризуется меньшим объемом словника, выдерживается очень последовательно, но имеет одно исключение. Оно касается украинского и белорусского языков в их отношениях к южнославянским и чешскому. При равновесном распределении сил связей ожидался бы более высокий процент лексики, участвующей в связях с языками южнославянской группы, у белорусского, объем праславянского лексического наследия Н которого меньшо, чем Н украинского языка. Однако закономерность на-• рушена «в пользу» украинского. Это может свидетельствовать о более тесных исторических взаимоотношениях между протоукраинским компонентом праславянского языка и праславянскими диалектами, легшими в основу южнославянской ветви и чешского языка.
Главный массив численных данных, полученных в диссертации и на которые опираются ее основные выводы, — индекс генетической близости (G). Этот индекс, как отмечалось, рассчитывался для четырех версий состава славянских идиомов. Результаты расчетов в разных версиях различаются между собою в некоторых деталях, однако в общем оказываются весьма сходными. Здесь приводятся значения индекса G для версии SLAV (с максимальным состаном, т.е. представляющей русский язык в виде трен идиомов):
se
старославянский & бг 1,0912, мхе 1,1878, сх 1,0189, си 1,0433; чш 0,8262, сц 0,8035, ел 0,8673, ил 0,9189, лб 1,0748, пл 0.8863, кс 0,7982; лр 1,4990, ср 0,8512, цр 0,8438, юр 0,8360, ук и,7981, бр 0,7011;
болгарский & r.:xt 1,7274, es 1,2674, сн 1,2023; чш 0,9952, сц 0,9807, вл 0,8968, ия 0,5228, лб 0,7347, пл . 0,9318, кс 0,84öl; др 0,9707, с » 0,9344, цр 0,3308, юр 0,9204, ух« 0,9672, бр 0,8941;
македонский & сх 1,2619, сн 1,2480; чш 0,9821, сц 0,9884, вл 0,9105, 'ил 0,8644, лб 0,8786, пл 0,8653, кс 0,8846; др 0,9682, ср 0,8759, цр 0,8791, хор 0,8602, ук 0,9103, бр 0,8342;,
сербохорватский & си 1,2^63; «ш 1.С355, сц 0,9765, ел 0,8788, ил 0,8039, лб 0,6643, пл 0,9"47, see 0,8605, др 0,9741, ср 0,9580, цр 0,9466, хор 0,9334, ук 0,9604, бр 0,8904;
сло12иский & чш 1,0770, сц 1,0581, вл 1,0064, пл' 0,9334, «5 0,80^1, пл 0,9546, кс 0,8865; др 0,9609, ср 0,9360. цр 0,9225, юп 0,0071, yie 0,9873, бр 0,8949;
чешский & сц 1,3622, сл 1,1001, ил 1,0291, лб 0,7375, пл 1,1629, ;сс 0,9931; др 0,8978, ср 0,908?, цр 0,9091, хор 0,9285, ук 1,0278, бр 0,9595;
словацкий & пл 1,1847, пл 1,1693, лб 0,8282, пл 1,1994, кс 1,1493; др 0,8551, ср 0,8875, цр 0,9016, юр 0,9278, ук 1,0841, бр 1,0290;
перхнелуяшщшй & ня 1,9349, лб 1,1545, пл 1,1232, кс 1,2744; др 0,8287, ср 0,8205, цр 0,8109, юр 0,8556, ук 0,С459, бр 0,9401;
шшнелужицкий & лб 1,8477, пл 1,1383, кс 1,8829; . др 0,8681, ср 0,8021, цр 0,8048, хор 0,8428, ук 0,9090, бр 0,9146;
полабский & пл 0,8972, кс 1,2961; др 0,8209, ср ., 0,6593, цр 0,6893, юу 0,6975, 0,6909, бр 0,6900; . иольский & кс 1,3826; др 0,9968, ср 0,9608, цр 0,9825, юр 1,0262, ук 1,1219, bp 1,1137;
кашубско-словннекий & др 0,8782, ср 0Г8245, цр 0,8475, хор 0,8741, ук 0,9553, бр 0,9907;
древнерусский & ср 1,1661, цр 1,1715, юр 1,1682, ук 1,0553, бр 1,0929;
сеЕврновелшюруссхшй & цр 1,5265, хор 1,4265, "ук 1,1639, бр 1,2254;
ереднэруссхшо говоры & юр 1,5448, ух; 1,2055, бр 1,2839;
гожновелш«оруссхадй & ук 1,2691, бр 1,3744; украшхехшй & бр 1,3745.
Графическую интерпретацию статистических связей между славянскими идиомами см. на прилагаемой к автореферату схеме I.
Южнославянская группа.
. Высокие значения О для старославянского в его связях с древнерусским должны объясняться не столько лексическим влиянием одного языка на другой, сколько сравнительно низкими у них значениями Н и связанной с этим невысокой индивидуализированностью праславянского лексического наследия как в одном, так и в другом. Вероятно, той же природы неожиданно сравни* тельно высокий индекс лексикостатистического сходства старославянского с полабскик языком: в скромном праславянском словнике последнэго в долевом отношении преобладает общеславянская лексика.
Сравнение лексикостатистических связей болгарско' го и македонского с третьими языками демонстрирует большую яркость восгочносласянских связей первого и западнославянских связей — второго. Сравнение в том же плане сербохорватского и словенского обнаруживает устойчиво более сильные связи последнего с языками западнославянской зетви, у сербохорватского же — с русским (но не украинским и белорусским).
В целом южнославянская группа на обследованном участке словника ЭССЯ имеет 5591 лекпему (74,0% всего праславянского лексического корпуса). Из этого числа общеслазянскими или находящими соответствия по крайней мере в одном из языков западной и восточной групп являются 91,6% всей южнославянской лексики праславянского возраста, что отличается, например, от оценок Л.В.Куркиной (70—80%). Общими для < Зеих южнославянских подгрупп являются 58,0% юж 'славянской лексики, 8,4% встречаются в болгарско-македонской, но не отмечены в сербохорватско-словепской подгруппе, 33,7% известны сербохорватско-словенской, но отсутствуют з болгарском и македонском. Западнославянская группа.
Чешский и словацкий языки, характеризуясь значительной лексической близостью на праславянском уровне, ведут себя по-разному в отношениях с остальными славянскими языками. Южнославянские статистические связи чешского (за исключением македонских) несколько сильнее, чем у словацкого; то же можно сказать и об их связях с древнерусским и велико-
русским. Что же касается других западнославянских языков, украинского и белорусского, то к ним обнаруживает большую близость словацкий. Из южнославянских к чешскому и словацкому ближе прочих словенский, из восточнославянских — украинский.
Оерболужицкие языки отличает наибольшая теснота лексикостатистических связей среди всех возможных пар славянских идиомов. Однако не следует, на наш взгляд, приписывать эту близость их генетическому единству (выводимости из общего языка-предка), которое нередко оспаривается. Отношения с третьими языками у лужицких. складываются несходно: верхнелужицкий делонстрирует более высокие показатели' связи с чешским и словацким, в то время как нижнелужицкий сильно тяготеет к лехитским языкам. Внеза-паднославянские связи верхнелужицкого выглядят го- ■■ . раздо более выпуклыми, чем у нижнелужицкого, ко'то-' более плотна вписан в западнославянскую группу по сравнению с верхнелужицким.
• Ситуация с лехптскимн языками (высокие связи ка- , щубгко-словинского и с польским и с полабским при существенно более скромном показателе лексикостатистической близости между двумя последними языками) наталкивает на мысль о генетическом неединстве этой подгруппы. Неодинаково складываются отношения ле- • хитских языков с иными языки^ыми группировками. В рамках западнославянской группы кашубский и по-лабский сильнее тяготеют к лужицким языкам, польский — к чешскому и словацкому. Если польский и кашубско-словинский во внезападнославянских связях сильнее тяготеют к восточнославянским языкам, то у полабского над восточнославянскими преобладают южнославянские статистьческие связи (хотя их показате--ли очень низкие возбше). При этом полабгкнй сильнее связывается с. болгарско-македонской подгруппой, чем с сербохорватско-словенской, тогда как южнославянские тяготеаия полького и кашубского дают обратную картину.
Восточнославянская группа.
Из сог ременных восточнославянских языков со своим предком, древнерусским, слабее остальных связан украинский, теснее всех — русский (при представлении же его а аиде трех идиомов — северновеликорус-ское наречие).
Дрз наречия русского языка связаны между собою менее мощной связью, чем, например, болгарский с македонским или два лужидкпх языка. Оба они лексически ближе к белорусскому, чем к украинскому языку. За пределами восточнославянской группы у с^верновелико-русгжого наречия самые сильные лексикостатистические связи — с сербохорватским языком, у южновеликорусского — с праслапянской лексикой польского языка. Как целое русский язык испытывает большее тяготение к южнославянской группе, а внутрл нее — к западной (сербохорватско-словенской) подгруппе.
Взаимная лексикостатистическая близость украинского и белорусского языков, выражается более высокими цифрами, чем в парах польский — кашубеко-сло-винский, чешский — словацкий и тем более сербохорватский — словенский. ВнутриЕосточиославянские связи у белорусского статистически более значимы, чем для украинского. У украинского языка внешние (юлс-иославянские и западнославянские) связи приблизительно сбалансированы, у белорусского преобладают западнославянские. Почти все вневосточх'ославяиские связи украинского выражаются более крупными числами, "чем у русского языка. Сравнение его с поведением белорусского и русского во сневосто^нославянских тяготениях также демонстрирует «экстравертность» украинского языка в противоположность более «автохтонному» (восточнославянскому) лексическому облику ближайших соседей. • .
Ближайшеродственные идиомы, входящие в одну языковою- подгруппу, нередко обнаруживают, кап можно было замет!.гь, различия в ♦предпочтениях», отдаваемых во внешних лексикостатистических связях тем или иным языкам или их группировкам, находящимся е сравнительно отдаленном родстве. Достаточно показательными в зтом отношении являются статистические сведения о лексических связях данного языка, в которых не принимают участия другие языки той же группы. В целом эти сведения подтверждают суждения, сделанные на основе наблюдений над индексом С. У сербохорватского языка в лексических связях, в которых не участвуют другие южнославянские языки, восточнославянская «ориентация» (197 лексем в первых пятнадцати выпусках ЭССЯ) преобладают над западнославянской (141 лексема). Внешние «ориентации» болгарского и словенского языков {фпблизитель-
но сбалансированы. О македонском судмть трудно в силу статистической недостаточности такого материала. Чешский и верхнелужицкий языки в своих внезапад-нослапянских свялях явно склоняются к южнославянской группе (169 лексем против 126 у первого, 22 про- ^ ,тив 13 у второго), польский и нижнелужицкий, напро- * тив, — к восточнославянской (116 против 43 и 16 против 8 соответственно). «Склонности» словацкого и ка-шубско-словинского выражены неярко. Древнерусский и геликорусский языки обнаруживают большее тяготение к южнославянским языкам, чем к западнославянским (65 против 37 у древнерусского, 227 прочив 140 у великорусского). У украинского южнославянские параллели, в которы:: не участвуют другие восточнославянские языки, почти уравновешиваются западнославянскими (79 и 76), белорусский же больше схож в праславяиском лексиконе с западнославянской группой (33 лексемы прогив 22 белорусско-южнославянских лексических параллелей).
В г л 1 в е 8 (<«0 возможности лексикостатистического оЭнаружеаия язлецид языковой конвергенции?) содержится попытка решить проблему, имеющую весьма существе шое значение, поскольку феномен конвергенции как мощный фактор возникновения материальной и структурной близости между язмками отвлеченно признается, пожалуй, всеми языковедами-диахро-кистами, в том числе и применяющими квантитативные методы исследования, однако в специальных лингг востатистических работах почти не обсуждаэтся. Более того, почти всегда цифры, полученные с помощью статистического анализа изоглосс, безоговорочно объявляются данными, отражающими ситуацию, которая сложилась в результате неуклонных дивергентных процессов, и тем самым являющимися прямым мерилом родства. В особенности это характерно для работ в рамках глоттохронологического направления: согласно концепции глоттохронологии, чем выше численное выражение сходства между языками, тем позже они разошлись и тем теснее их изначальное родство. Сама постановка вопроса о конвергенции как факторе родптва уязвляет самое сущность диахронических построений, базирующихся в конечном счете на концепте родословного древа и последовательного распада праязыковых единств.
Возможность лексикостатистического обнаружения-роли конвергентных процессов в истории данных языков или группиропок, на наш взгляд, имеется ч конф-ронтационнон статистике разнонаправленных изоглос-сных связей языков, отмеченных высоким значением индекса рбдства (С),
Сравним две пары славянских языков, составляющие которых (пар) связаны между собою высокими показателями родства: болгарский & македонский и польский & кашубско-словинашй. Для каждой из этих пар выясним число общих для них праславяиских . слов (У(А,В)), число слов, встречающихся л одном, но неизвестных другому (У(А,--В)), и число слов, известных второму, но отсутствующих в перлом (У(—А,В)), причем будем различать эти изоглоссные связи по числу всех охватываемых ими идиомов, а нв только двух данных (ш, от 2 до произвольно назначенной, но невысокой, мощности, например, до 7 идиомов): бг & мк пл & кс
га У<А, П) У(А,—В) У<—А,Е) У<Л,3) У(Л,—В) У<—Л,П)
2 * 14. 13Т 8 и 138 51
3 74 233 33 34 315 83
4 163 433 52 64 499 112 ■
5 262 583 72 ПО 69!» 152
6 364 728 99 !67 888 169
7 494 газ 11« 240 1083 •• 191
Количественное' соотношение изоглосс, охватывающих оба данных языка, и изоглосс, в которых онн участвуют порознь, можно представить в виде формулы: Ч - У(А,В) / ш у1/(А,-Б)7У(-А,В)~ Различия в численных значениях условной величины ч для разных пар могут быть интеопретнрованы как различия в степени изначальной генетической близости языков: чем выше значение ч п строке с данным значением ш, тем вероятнее исконная близость между языками этой пары; чем q ниже, тем вероятнее роль конвергенции в их эволюции. Последовательность значений ч для блшкойшеродствениой пары бг & мк при значениях ш от 2 до 7 выглядит следующим образом:
0,211 - 0,265 — 0,270 — 0,256 - 0,206 — С,220; для папы пл & кс:
0,089 — 0,070 — 0,068 — 0,067 — 0,072 — 0,075.
Легко увидеть несходство ьтих числовых последовательностей. Из прочих пар, составляэмых ближайше-родствепными славянскими языками (сх & чш & сц, ил & нл, вр & ук, вр & бр, ук ft бр) низкие значения q, сходные с тем, что наблюдается в отношениях •польского и кашубско-словинского, характерны для пары сербслужидких языков; высокие значения q — для остальных. Языки, заведомо не составляющие бли-исайшеродственных пар (с низкими значениями индекса G), дают значения q, сходные с теми, которые наблюдаются у пар вл & ид и пл & кс, или еще более низкие. Разумно предположить, что лексическая близость пары серболужицких языков и пары польский — кашубский вызвана вторичным сближением, в то время как у остальных ближайшеродственных пар высокие, значения G обуслоглены главным образом гсконной теснотой их связзй (происхождением из одного, промежуточного, прая&ыка).
Изложенная методика может считаться эффективной только при условии, что опирается на конкретные изоглоссы, описываемые достаточно большими числами. Практически это означает, что она применима, глаэным образом (а может только) к лексическо-
му материалу. Следовательно, косвенный результат наблюдений р этой области состоит в том, что статистика фонетических и грамматических изоглосс более или менее глубокой древности — инструмент довольно грубый: от мелких и частных процессов постоянного диа-лектообразования мощные волны последующих грандиозных фонетических и морфологических катастроф оставляют слишком мало следов. Лексика же, будучи рыхлой системой, не подверженной тотальному нивелированию, способна дольше хранить память о прежних дъплгктиых размежеваниях и единствах, хотя поспешно абсолютизировать преимущества лексики как объекта статистического анализа глоттогенетической направленности и не следует.
В главе 9 («Проблемадревноновгородскогодиалекта sub specie лексикостатнстики») методика, разрабатываемая в диссертации, применена к решению вопроса, в последнее время обострившегося в связи с лингвистичее-
ким исследованием А.А.Зализняком новгородской бересты. По мнению А.А.Зализняка, будучи связанным в се-вернокривичском своем компоненте с севером западнославянской зоны многими общими явлениями в области фонетики, грамматики, словообразования и лексики, а
• также -г- в, другом своем компоненте, ильменско-словен-ском,— обнаруживая, как ц остальные восточнославянские пдьомы, много общего с голснославянской зоной, прежде всего сербохорватско-словенской, древне: новгородский диалект, отраженный берестяными грамотами, разрушает устойчивые представления о моногенезе восточнославянской языковой группы.
Сравнение данных Словоуказателя к новгородским берестяным грамотам с лексическими материалами изданной части ЭССЯ выявило различные пласты ирпсла-вяиской лексики в словнике древиеновгород'ского диалекта. Среди них — слова, связывающие древненовго-родский с западно- и южнославянскими языками, но не встречающиеся в других восточнославянских идиомах ('dobrovifb, 'dorgobgdz, 'Jaromirz, 'hleSíb *лещ\ '1;гдрг(]ь), *hysete>(jb)...), не отмеченные в живых восточнославянских языках ("о tí, 'ЬеЬгь, *bari$lav%, '¿$db...), вместе .с соответствиями в других восточнославянских идиомах — корреспонденции с южнославянскими, но не с западнославянскими ("Ьа^апъ, *blqdb, 'bl'ustl, 'сьгтъп1 са, 'gostbba, *dorb, 'hakovz(jb), 'konbüati,'hozevbniki...), с западнославянскими, но не южнославянскими (*begi'l, *ЬъПъ, 'galgzaf'gatgzb, 'gorislaub, 'gostgta, *jbsti>b-bka, *jbz-vétatl, 'korbbka, *laditl (sg), Iggatl (sq) II...), только в во6
• точнославянских (*bersto, *¿,etubrgb, tdeSem(jb), 'doma-zirn, 'godjbjb, 'gblbh-г 'hol(о)Ъъ, 'koporyje, 'kor§ha, 'has-cbjb, 'kritt, "НгИгкъ..,).
. Однако в беоестяных грамотах отмечено всего лишь около 5% праславянских слов, заключенных в диапазоне обследованных нами выпусков ЭССЯ. Индексы родства (G) древненовгородского диалекта в парах с другими славянскими идиомами, вычисленные на этой
' статистической основе, не могут считаться достаточно надежными, так же как и коэффициенты Q и Ф.
Можно попытаться извлечь из этих результатов более определенную информацию. Отнеся величины индекса G для древненовгородского диалекта с невосточнославянскими языками к их средней величине G и проделав ту же операцию с данными индекса G, характеризующих остальные восточнославянские идиомы,
вычислим меру сходства между составляющими восточнославянской группы в их поведении по отношению 1С невосточнославянским языкам с помощью коэффициента корреляции.
Древнерусский язык, три главных диалектных единицы великорусского и украинский язык коррелируют менаду собою по указанному . .ригнаку положительно, достигая максимума (г ® 4-0,975) в паре северновелико-русский & среднерусские говоры; белорусский положительно коррелирует с украинским, южновеликорусским наррчием и среднерусскими говорами, отрицательно — с северновеликорусским наречием и древнерусским ':еыком; древненовгородский диалект со всеми восточнославянскими идиомами коррелирует по указанному признаку отрицательно.
Таким образом, восточнославянская группа в задан? ном н"ми составе идиомов изображается довольно компактным единством, лишь древненовгородский диалект выглядит инородным телом (см. схеку II). Конечно, обособленность древненовгородского диалекта в результатах этого спыта сильно заострена принятием во внимание лишь внешних •«ориентации», но это и было целью описанной процедуоы.
Допустимо думать, ч^о различия между «стандартным» (Зализняк) древнерусским языком и его потомка* ми. с одной стороны, и древреноьгородским диалектом, с другой, выявляемые лексикостатистическими процедурами, отражают негомогенность восточнославянской языковой группы. Просматривающиеся связи древненовгородского диалекта с языками других славянских групп, прежде всего западной, могут трактоваться как свидетельство особой архаичности севернокривичс.;их говоров, легших в его основу.. Для суждений же о «западнославянском» генезисе древненовгородского диалекта (а тем самым — отчасти — и северновеликорусского наречия) ввиду заметного количества лексических перекличек с южнославянскими языками, серьезных оснований не имеется.
В главе 10 («Сопоставление с результатами глоттохронологии») картина славянского языкового родства, полученная на осчовании лексикостатистического анализа праславянского словаря, сравнивается с аналогичной картиной, восстановленной М.Чейкой и А.Дампрехтом (1953) в рамках, глоттохронологических
процедур, v.e. с опорой на стословный диагностический список М.Сводеша.
Наблюдаемые сходства результатов глоттохронологического и нашего моделирования системы родства славянских языков довольно банальны.
Интереснее расхождения. У Чейки — Лампрехта математическое расстояние между чешским и словацким языками принадлежи* к наименьшим, является равным расстоянию между двумя лужицкими языками, тогда как я нашей модели связи чешского и словацкого выглядят гораздо более слабыми. Близость чешско-словацкой подгруппы к серболужицкой в глоттохронологической модели столь велика, что указанные четыре языка образуют единство, превосходящее своей спаянностью любые парные, а тем паче более крупные по числу компонентов объединения языков, кроме пары украинский— белорусский. Это сообщает западнославянской группе высокую степень компактности (правда, уступающую компактности восточнославянской rpynnti). Однако у Чейки — Лампрехта не учитывались полабский и кашубско-словинский языки. Будь последние включены в анализ, возможно, мера единства западнославянской группы была бы ближе к тому, что получено нами. В противоположность нашим результатам, южнославянская группа рисуется глоттохронологическими измерениями весьма чеплотным образованием — ввиду очень слабой связи между словенским и болгарским (шестнадцать парных связей между языками, принадлежащими разным группам, оказываются у Чейки — Лампрехта сильнее, чем статистическая свлзь двух этих языков, входящих в одну и ту же группу).
Усреднение коэффициентов показывает, что в глоттохронологической картине наиболее тесно связаны между собою западнославянская и восточнославянская группы (среднее расстояние d =» 12,4), самая слабая связь — между южнославянской и восточнославянской (среднее Н=» 14,3), южная и западная ветви характеризуются средним расстоянием d =» 12,8. В наших данных наибольшая близость отличает южнославянскую и восточнославянскую группы (среднее G 0.9338), далее следует связь западнославянской и восточнославянской групп (среднее G — 0,9195), слабейшая.— связь между южной и западной группами (среднее G — 0,8958). Близость результатов Чейки — Лампрехта концепциям Ф.Мареша и А.Фурдаля с ^констатацией
особого сесерлославяиского единства, противосюящего раннему праславянскому диалекту, легшему в основу южнославянских языков («горизонтальное» членение), возможно, объясняется отсутствием в глоттохронологической модели чехословацких ученглх двух лехит-ских языков — нолабского и г.ашубсгсо-словинского: их включение в анализ могло привести к сложению отличных результатов. Эта причини, а также недостатки методологического характера, рассмотренные при критическом анализе глоттохронологической концепции в гл. 2, заставляют относиться к итогам работы Чей-ки — Дампрехта с, большой осторожностью.
В главе 11 («Сопоставление с результатами статистического определения родства на материале сравнительной фогетнки») ставится вопрос о мере согласованности лексической и фонетической эволюции славянских языков и способах ее выявления. Из имеющихся статистических моделей славянского языкового родства, построенных на материале сравнительной фонетики, наиболее подходящей для сопоставления с лексикостатистическими данными, полученными нами, представляется модель В.Н.Чекмана — О.С.Широкова (1962).
По составу обследуемых идиомов фоностатистическая моцель Чекмана — Широкова достаточно близка нашей * (более детализованно, чем у ьас, рассматриваются сербо-хорватско-слоъенская подгруппа и болгарский язык). В основу статистики положен список из 38 изоглосс, оа разивших славянские фонетические процессы «с I в. по ХГУ в.» (от палатализации ко, gu > cv, dzv и упрощения tl, dl > I до прояснения редуцированных во флексиях прилагательного и стабилизации акцента). Квантитативная обработка материала осуществлена применением коэффициента сопряжрнности Ф (у авторов он обозначен как коэффициент корреляции R).
Фонистатистическая модель Чекмана— Широкова представляет славянские чзыки отчетливо разделенными на группы и подгруппы с очень высокими показателями связей внутри подгрупп и очень слабыми показателями связей между идиомами, входящими в разные гпуппы. Резко выраженная «островная* структура системы славянского языкового родства, с сильным обособлением одних группировок идиомов от других, отличается от лексикостатистической картины родства, рисую-
едай отношения славянских языков гораздо более «вязкими*. Перепад между средней внутригрупиовых индексов родства м езедкей межподгрупповыч индексов в фоностатисткчтсой модели составляет 0,505, тогда «юс аналогичный переппд в лексикостатистической модели ' (численные данпью нормированы таким же способом) описывается величиной 0,342, т.е. в полтора раза меньшей: членение? па группы п модели Ченмапа — Широкова является намного более рельефным.
Причины указанного различия следует искать но столько в системах описания фактов и их квантитативного прекарнреташш (расхождения в набора идиомов» устройство фермуд эсолкчсственного анализа, несовпадение шкап зшдекепцнп, частзгчэзов дублирование фо-иотячасшп? ягоглосе — учет некоторых дополнительно распределенных лротивопоставлопзшх рефлоксаций -и т.д.), сколыш в ептлом материале — в несходство мемеду лексикой л фоп&ппюй и различных механизмах их-эволюции (о чем писалось в гл. J). Лексикон, огромный в сравнении с другими языковыми уровнями по числу составляющих элементов, нежесткий п своей организации и эволюционирующий на осново кумулятивного 'принципа, может отражать последствия весьма древних междиалектных взаимодействий, консервируя словарные корреспонденции в относительно далеких идиомах. Отсюда — пестрота лексических связей праязыкового характера, столь многочисленных, что ото приводит к отмеченной «вязкости» схемы, отображаю-; щей эти связи. В противоположность тому компакт-пая, с жестким сцеплением относительно малочисленных элементов, фонетическая система подвержена лавинным самореорганизациям, радикально меняющим ее облик, стирающим следы разнообразных диалектных вариаций и результаты «мелsuis» диалектообразу-ющих процессов. Относительная немногочисленность фонетических корреспонденции между языками и их тотальность делают такую же схему очень стройной н четко вычленяющей объекты сравнения — (но-здне)пралзыкевыо диалекты и формирующиеся на их основе Самостоятельные языки. Статистическая интерпретация фонетических корреспоиденцнй между родственными идиомами приводит к сложению весьма сходкой дискретной картины, что и обнаруживается в фоноста^истической модели Чекмана — Широкова.
Из важных сходств в результатах фоно- и лекенкоо-
татнстического моделирования необходимо отметить низкие показатели внутренней связанности западнославянской языковой группы по сравнению с двумя другими, а внутри нее — языков, образующих лехит-счую подгруппу. Квантитативные оценки и фонетического и лексического родства заставляют констатировать ярко выраженную негомогенность западнославянской группы 0« одном уровне) и лехитской подгруппы (на другом).
Сравнение данных обеих моделей, возможное при их сведении к однотипным шкалам, показывает, что идиомы, демонстр.ир! ющие значительную близость по данным статистикп фонети"ескнх изоглосс, вовсе не непременно будут характеризоваться высокими показателями лексикостатистического сходства, и наоборот. Из этого следует вывод о том, что лексическая и фонетическая эволюции пр&славянсккх диалектов, приводящие к образованию самостоятельных языков, протекают несогласованно. В отношениях болгарского языка с лехитской подгруппой, словенского — с восточнославянской, словацкого — с сербохорватско-словенской, польского — с болгарско-македонской, северно- и юж-новеликорусско^о — с лужицкой, белорусского — с сер-бохорватско-слоьенской и лужицкой более значимо статистическое фонетическое сходство. Лексикостатистическое сходство выражено сильнее фоностатистического в отношениях болгарского — с чешско-словацкой подгруппой, словацкого — с лехитской, польского — с чешско-словацкой, сеьерновеликорусского — с болгар-скс-македонской, украинского и белорусского языков — с чешско-словацкой и лехитской подгруппами.
Усреднение фоностачистических индексов, очерчивающих внешние связи отдельных языков, показывает большую близость между восточнославянской и южнославянской группами (среднее Н =» + 0,095), чем между составляющими двух других пар (зап.-слав. & вост.-слаз.: среднее К - + 0,028; юж.-слав. & зап.-слаь.: среднее Ё = — 0,190). Это совпадает с результатами аналогичных измерений на лексикостатистической базе. Однако в целом такая картина еще не дает чесомых оснований судить о наличии в начале диалектного «раскола» прасчавянского языка единого восточного диалекта, разделившегося впоследствии на восточнославянскую и южнославянскую ветви и противопоставленного западному. Ири.-шаишо монолитности или хо-
тя бы выделепиостн раш:его «восточного диалекта» праславянского языка препятс1вует неравновесность южнославянских статистических связей восточнославянских языков. Связи последних с болгарским и македонским существенно слабее связей с сербохорватско-• словенской, зоной (и уступают также чешско-словацким, а фоностатистически — и лужпцгсим связям).
Представления о первоначальном западно-восточном — «вертикальном» — расчленении праславянского. языка (как, впрочем, и о «горизонтальном» — северно-южном) должны уступить место другим, более слозк-ным, многомерным, но вместе с тем и более адекватным исторической реальности. *
В заключительной главе 12 («К реконструкции диалектного членения поздиепраславянского языка») попытка представит?, целостную картину взаимоотношений мзжду протондпомами современных славянских языков (в граница« позднепраславянского состояния) предпринимается на иных, по српвпешпо с лингвистической традицией, основаниях.
Оперирование исключительно праславянскими словниками современных языков позволяет представить отношения взаимной близости между ними как непосредственное продолжение системы отношений между диалектами праславянского языка, сложившейся к началу его «распада» (осторожно говоря, 2-я пол. I тыс. по Р.Х.), — время, на которое преимущественно ориентирован основной источник работы — ЭССЯ. Однако линейный принцип соответствия между современными "идиомами (группами и подгруппами языков, языками, крупными диалектными массивами типа русских наречий) и протоструктурами в праславянском, когда современному украинскому языку в праславянском соответствует некий относительно цельный «протоукра-инскпй • компонент, современному словацкому — «протословацкий» и т.д., не вполне точно отражает реальность и должен быть заменен качественно иными представлениями.
Если классификации языков п картины диалектного членения обычно ставят своей целью создание иерархии непересекающихся таксонов (которая легко переписывается в древовидную схему с последовательным ветвлением), то при опоре на статистические данные о связях менаду языками становится возможным построение схем
родства с отказом от непременной ориентации на дендроидную структуру, т.е. с частичным' наложением различных образующихся идиомов (« квазидиалектов » праязыка) друг на друга. Упомянутые * квазидиалекты » вычленяются не с опорой wc перечисление диалектообра-зующих изоглосс (хотя какое-то, кач правило небольшое, количество изолекс и может быть приписано данной «квазидиалектной» единице) или на их сгущения (пучки), а на основании учета сил взаимного статистического притяжения входящих ю данный круг поздних родственных идиомов.
В традиционных классификациях попарные отношения между идиомами, находящимися на одной и той же ступени-последовательного членения, но принадлежащими разным ветвям классификационного древа (например, полабско -македонские или нижнелу-жицко-белорусскиз), как бы молчаливо уравниваются друг с друго.«, что, как кажется, не адекватно реальной картине связей внутри славянского языковогр мира. Системе родственных идиомов искусственно навязывается не сказать априорная, но все же очень негибкая и неудобная иерархия таксономических единиц: ♦ первый уровень членения» (языковые группы), «второй уровень членения» (подгруппы), «третий» (отдельные языки), »четвертый» (наречия, диалектные груп-пь:), «пятый» и т.д.
Предлагаемый же вариант схемы славянского языкового родства, который, строго говоря, не относится к классификациям, может показать статистическую значимость специальных «далеких» межславянских коррсспонденций, несовпадающие силы этих связей для идиомов, занимающих одни и те же ступени в традиционной иеквантитативной ие: рархической схеме. Одиь и тот же язык в предлагаемом варианте схемы одновременно включается в группировки разного состава и разной компактности (которая измеряется силой минимальной статистической связи в конкретной группировке), см. схему III. Количество таких вхождений не задается априорной иерархией, а определяется заданной «подробностью» шкалы минимальных сил связей: чем меньше перепад между соседними ступенями шкалы, тем больше возможных группировок и тем сложнее и дифференцированнее конечная картина. Так, например, словацкий язык при установленном пороге образования группировки язы-
ков в в к 1,30 объединяется только с чешским языком; при иопоге О = 1,15 он одновременно входит в группировки «сц + чш + пл», «сц + вл»; с понижением порога вхождения доО я 1,90 словацкий включается уже а пять группировок с одинакозой мерой компактности (минимальной силой связи внутри них): «сц + чш +■ вл 4- ил + пл», «сц вл + чл + пл +■ КС», «сц + ЧШ + СП», «сц + чш + пл + ук» у «сц + пл + ук + бр». Таким образом, особенностью получаемой таксономической картины является ее не дискретный, аконтннуаль-н ы й характер.
С понижением порога образования группировок («квазидиалектов* праславянского языка при диахронической реинтерпретации) оНи разрастаются по количеству членов (позднлх идиомов, от которых 'ведется отсчет) и постепенно утрачивают отчетливость противопоставления друг другу, отличаясь между собою од-иим-двумя составляющими. Принятие в качестве такого порога самой слабой связи в списке всех возможных пер идиомов выделяет в с го совокупность рассматриваемых родственных идиомов и делает допустимой трактовку этой совокупности как цельного идиома (цельного, однако, только при ограничении лишь виут-рислШшнскимн связями: чем дальше п глубь славянской языковой истории, чем слабее при зтом углубл( нии рисуются свлзи между постулированными, или отобранными к анализу поздними идиомами, тем более значимыми с глазах диахрониста должны становиться связи внешние — балтийские, германские, итп-лийские, иранские и т.д., опять-таки неравномощмые для разных поздних славянских идиомов, что, как нам представляется, уже само по себе должно снимать проблему диалектной монолитности праславянского; последняя тема, впрочем, по понятным причинам в диссертации совершенно не затрагивается).
Разумеется, как и всякая схема, эта картина является лишь аппроксимацией реального положения вещей: чем сильнее статистические связи между идиомами, тем вероятнее их группировки как протоздинства, реконструируемые для поздних периодов развития праславянского языка (с оговорками относительно выявленных случаев конвергенции типа единства сербо-лужицкой подгруппы), чем они слабее, тем большей условностью становятся получаемые «квазидиалекты», относимые к более ранним периодам. Одцько на этом
этапе лексикостатистических исследований дмахрони ческого плана существенным представляется не столько достижение высокой степени соответствия между глот'»огенетнческой конструкцией и исторической реальностью, сколько уточнение самих механизмов дивергенции. Эволюция праславянского языка по данным лексики рисуется иной, чем ее представляют данные сравнительной фонетики: не резкое диалектное размежевание с четкими линиями разломов, а постепенное и медленное «расползание» в стороны с долгим сохранением следов прежней близости.
Излишне, однако, говорить, что лексикостатистическая картина родства не «отменяет», но только дополняет представления, сложившиеся на основании анализа иных языковых уровней, главным образом фонетического.
Схема I. Сила генетических связей (G) между идиомами славянской семьи по данным лексикосгатистики (версия SLAV)
G G G
1,7500 «—» 1,4500 --1 1,1500
1,6500 Е533 1,3500 ----- 1,0500 -
1,5500 «=» 1,2500 ....... 0,9500
Схема II. Коррелятивные связи (г) между восточнославянскими идиомами во вневосточнославянских тяготениях (к проблеме древненовгородского диалекта)
г<>)
+0,850 г—
+0,676 +0,600 +0,325 +0,150 -0,025
Схема III. Апирокгимативняя схема диалектных объединений в гюздиепраглпвянском но данным лгксикостптистнкк (версия SLAV, с исключением древнерусского языка)
/ N
V
■зв
ПРИЛОЖЕНИЕ К ДИССЕРТАЦИИ:
АФ.Л(ураалев. К уточнению представлений о славянских изоглоссах. Дополнения и лексическим материалам «Этимологического словаря слашшошх язьа-ков». Чч. I, II. М., 1990, се. 1—76, 1—70.
ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ:
Лексикостатистическая оценка генетической близости славянских языков. // ВЯ, 1988, JvS 4, сс. 87—51 <1,4 л.).
К критике некоторых методов определения дргвне-славяискнх племенных ареалов. // «Закономерности языковой эволюции«. Всесоюзная научная конференция, г. Рига, апрель 1990 г. Тезисы докладоп. Pará, 1990, сс. 103—105 (0,11 л.).
Поморский («протокашубскословинский») в кругу позднепраславянских диалектов (по данным лексикос-татистики). // «Поморсьш слов'гнн». Терношльсш сла-взстичш юторнко-фйюлогсчш читання. 1?ík П. Теза конфереицц до 120-р1ччд з дна вародженпя М.В.Бреч-кевичс. 25—26 ясовтня 1090 р. 'Герношль, 1990, сс. 34—87 (0,17 л.).
К уточнению представления о славянских изоглоссах. Дополнения к лексическим материалам «Этимологического словаря славянских языков». Часть I. М., 1990 (76 с.) (4,75 л.).
То же. Часть И. М., 1990 (70 с.) (4,25 л.).
К проблеме расселения древних славян (о так называемом «графоаналитическом методе»). И ВЯ, 1991, № 2, сс. 54—64 (0,92 л.).
О способе измерения относительной генетической автономности родственных языков. // «Соотношение синхронии и диахронии в языковой эволюции». Тезисы докладов Всесоюзной научной конференции (Ужгород, 23—25 октября 1Э91 г.). М. — Ужгород, 1991, сс. 10—11 (0,06 л.).
Из квгштитативнотипологнчсских наблюдений над лексикой славянских языков (нраславянское наследие). //ВЯ, 1992. № 2 (1,38 л.).
Заметки на полях «Этимологического словаря славянских .языков*. /! «Этимология. 1988—1990». М., 1992 (0,87 л.).
Украинский и белорусский языки в свете прасла-влнской лексикостатигтики. (0,2 л.; в печати).
Праславянский словник древненовгородского диалекта с точки зрения лексикостатистикн. (1,13 л.; в печати).
О возможности лексикостатистического обнаружения явления языковой конвергенции. (0,83 л.; а печати).