автореферат диссертации по филологии, специальность ВАК РФ 10.02.06
диссертация на тему: Проблемы и методы квантитативно-типологического измерения близости тюркских языков (На материалах каракалпакского, казахского и узбекского языков)
Полный текст автореферата диссертации по теме "Проблемы и методы квантитативно-типологического измерения близости тюркских языков (На материалах каракалпакского, казахского и узбекского языков)"
АКАДЕМИЯ НАУК РЕСПУБЛИКИ УЗБЕКИСТАН Институт рукописей \м. X.Сулейманова
на правах рукописи УДК 809.43 '
АЙЫМБЕТОВ Максет Каллыевич
ПРОБЛЕМЫ И МЕТОДЫ КВАНТИТАТИВНО - ТИПОЛОГИЧЕСКОГО ИЗМЕРЕНИЯ БЛИЗОСТИ ТЮРКСКИХ ЯЗЫКОВ.
(На материалах каракалпакского, казахского я узбекского языков)
Специальность 10.02.06 - тюркские языки
АВТОРЕФЕРАТ-ДИССЕРТАЦИИ
на соискание ученой степени доктора филологических наук.
Ташкент - 1957
Работа выполнена в Нукусском государственном педагогическом институте 'им. Азшмшза 'Министерства народного образования Республики Узбекистан.
Официальные оппоненты: Член корр. АН РУэ, доктор филологических наук А. Хадзиев, доктор филологических наук, проф. М. Миртадянев, доктор'филологических наук, проф. Т. Садыков. Ведугцая организация - Самаркандский государственный университет им. Алмвара Навои.
,■ Защита состоится У 3597 г. в______
часов на заседании специализированного совета Д. 015.93.01 по защите'диссертации на соискание ученой степени доктора наук при институте Рукописей ии. X. Сулеймашва АН РУз. ( 700011, г, Ташкент. Навои-Ь9)
С диссертацией юано ознакомиться в фундаментальной библиотеке АН РУз (700170, г. Ташкент, ул. акад. И. Муминова, 13)
Автореферат разослан СКУПЯ^гЛ 1997 г.
доктор филологических наук
К. Сэдыков
ОВШАЯ ХАРАКТЕРИСТИКА РАБОТЫ
1. Актуальность проблеми.
Проблею ккассяфикацпп агыксв мира гее еще остается одной из центральных и трудноразрешимых вопросов об'двго языкознания.
Основнал причина нереашяссти, этой пройжйа сваээяз с неразработанностью единой систе-ш признаков а распределении уже известных и пзученяыу языков. С другой стороны сама сценка численности языков мира весьма разнообразна. Если обратиться к справочникам, то эта оценки колеблются от 1,5 тыс. до 6,5 тыс. языков "(Исаев). Енеете с- там языки шрз крайне нс-е-кодкы и различны по своей природе {Климов, Ярцевз). Зги трудности классификации относятся и к тюркски» языкам. Несмотря на многочисленные попытки полу нть единую класскфикащэд тюркских лзнкое, до сих пор се создать не удалось. Основной причиной отсутствия универсальной классификации ткркских языков является применение для этих целей единичных и рээроэнешш критериев, т.е. также критериев, котсрыз схватывают небольшой' шличестЕо фанатических, .лексических и' морфологических явлений (при зтен часто не связанных маеду. собой),- н* обусловленных семиотической и синергетнческой он-ттфикой тюркских языков.
Задачей тюркологии на рубеже XXI б. является выработке» единой системы глубияяс-структурнык, ссиютзчдоэк к син&рге-тичееких клэгафшацшнних критериев. У?а грандиозна-? • ?зда\»
мом'ет '¡ль рекелл толгко пйсодлг.»т* ;.х«ашц со:дзссодшшдо успгидми (¡ш.'ГИ;: сл-.л^вителей.
II. Цель и яадачн исследования.
•Основной цекю настоящей работы является выработка на базе трех ткрк^кгос языков (каракалпакский, казахский, узбеке-кии) .некоторый , статистических классификационных принципов, которые охгатывали бы С-ольшие массивы лексического и грамыа-пда~кога .."материала сопоставляемых' яэыкок и позволяли бы в дальнейшем проводить их сравнение но чертам 1И глубинным структуры семиотики к синергетики. Для достижения этой оОщей цели здесь решаются следующие задачи:
1. Определение семиотической природы каракалпакской лексики. •
2. Квантитативное моделирование каракалпакских текстов'рзз-лйЧных литературных яанрав'.
3. Ранговое сравнение частотности больших массивов лексических единиц между :различншк жанрами-к-подъязыками в начале зоны ЧС (1:300). 4. Определение'степени-близости лекскод эпоса относительно стилей (подьязьиов) поэзии, романа, газеты н журнала. 5. Определение -расхождения степени настроенности на детерминанту . экономии аффиксов-между каракалпакским,-казанский-и узбекским-языками.-6. Определение степени лексика-грамматической близости карзкалпакского языка относительно казахского к узбекского языков, а также узбекского языка относитесь «о -каракалпакского и ¡сазачсюго языков. 7. Типологическое сопоставление полученных■ результатов относительно других ,ура-; л0-£дтзйск!1к н индоевропейских языков с цадьв дальнейшей ,ра-
; - ' ' ■ - ' ' 'Г
рагкпго^р.жнитедвно-соиоставителькш критериев для построений единой классификации, язжов-однса'и^мьи^^^ 1П. Катерная и методика работы.
• Неравным лингвист и'ческнм материалом в работе послу»иди
слгдующиэ литературные. тексты:
1) устно«? народное творчео.'зо (зкосы "Адпамыс", "Кирк газ", Шарькр"); '
2) поэзия классиков каракалпакской литературы (Б-рдзха, Ажшшяза, Кунходши, Смерз, Отеиз), а также современная поэзия - (произведения народного поэта Каракаштакстака и Узбекистана К.Юсупова);
3) трилогия ромаиз Т. Каипбгргеяова "Мамай бий эпсаизсы" "Сказание о Маман бие", часть! (удостоенного государственной премии бывш. СССР); • •
4) современная публицистика {газеты и дурналы).
Обдай обье'м вышеуказанных материалов составляет еныв-е полумиллиона словоупотреблений.
В результате льксико-и мсрфсяо^о-статиетичесшй обработки этих текстов на ЕС ЭВМ под', 1ено три вида словников словоформ (с/ф):
а) алфавитно-чзстоткый словник (АЧС),
б) обратно-частотный словник, (ОЧС), 'а) рангово-частотный словник ГРЧО,
Эти словники послужили материалом для далькйяиего лииг« вистичеекого анализа, который осуществлялся с помокло статкс-тиш-шфорнзционного,скстемто-с€миотичаскога и типешаго - сопоставительного методов.
Помимо этого использоззкй статистические данные по дру» гим тюркским языкам: по кззалекему-рочзки м. Ауезова "АО-а-й колы", "Оскен оркек", детская литература (Бакта-зг и др.), газетные тексты (Ахнбз-га); по узбек*»»:*- языку •- газетный текст« (Мукамедоз).. детская лтгёрзтура ^Ркз^а.Ксугинз.} (Касс?»)
по турецкому языку - газетные тексты (Бабзнароа), по киргизскому - газетные тексты (Жетешков).
IV. Основные теоретические ноловшия, вшшсшые на защиту.
1. Описание строя конкретного языка к его сопсстэЕление с родотввнныш И НврОДСТБвННЫЫВ _ ЙЗЫКЗШ должно, во-первы.', учитывать знаковую, природу языка, во-вторых, опираться ка трехзвеыную сяему описания речевой деятельности (система язы-ка-скстеиа речи-текст).
2. Статистико-информащюнное моделирование дает возможность провести детальное сравнение лексико-грамматических сходств и различий ме»ду исследуемыми тюркскими языками с учетом их знаковой природы на уровна системы речи. Это позео-
ео - первых, определять сходства и различия в означаемых и оэначащик лексических единицах в системах сопоставляемых языков (каракалпакский, казахский, узбекский)!
во-вторых, наблюдать схождения речевой употребительности этих слов в указанных языках; . , "
-в третьих, решать некоторые дискуссионный -вопросы тюркологии ■ относительно которых ранее имелись серьезные расхождения среди тюркологов.
3. Применительно к отдельно взятому языку (каракалпакскому) применение квантитативной методики позволяет определить степень лексической' и морфологической близости между различными яанпзш йаЬакаплакскбго литературного языка.
А. Применение сисгемно-статистичесгагс датода-в-тирколо^
дяет:
V. Иоикака райаш.-
гии дозволяет ойреде.яять меру, близости и отдаленности ыедду
тюргагкши языками.
B. С поиощш эталонных изиеренг'й меры близости ыежду тремя тюркскими языками, при помощи ранговой корреляции по Спкрмену удалось сделать первый шаг по созданию классификации тюркских языков, опиравшейся на шфоризцшкно-статистическда характеристики Сол£и:н:с' массивов лексики в морфологии современных ТЮрКСКИХ языков.
C. В результате обработке на 5ЕМ белый« массивов современного каракалпакского текста достигнуты следующие новые результаты: •
1. Получены .частотные словники произведений Еердаха, Ажиняяэа, Кунхсджя и других классиков карзкавпакской литературы. Эти словники получены каждый по отдельности, а также объединение. Они могут условно рассматриваться-в качества моделей вероятностного распределения'лексики поэтических текстов каракалпакского литературного языка.
2. В качестве моделей вероятностного распределения каракалпакской лексики такие послужили 40, полученные и? теистов. других жанров каракалпакского литературного языка. При помощи этих словников удается определить некоторые квантитативные данные, отражающие лексические особенности .каждого из зтйх жанров (стшюй/подгчгыков). ..
"л
VI. Теоретическое и практическое значение рябати Состоит:
1) в подборе критериев дял разработка универсальной скс- 1 тепы классификации капчзмгких, а затем тюркских языков,
2) в разработке вопросов системно-статистического исследования лексикологии и морфологии соьреиенных тюркских язы- » кое ,
- в -
3) в разработке новой технологии кяассяфя • ацш тюркских языков,
4) в создании основ машинного фонда каракалпакского языка,
, . 6) з соэдачий лексикографической базы для составления различных;учеСнах словарей по кзракаллакскому языку,
6) в создании лексикографической базы даиных дла изучении сткякстикл каракалпакского языка.
VII. Апробация работы и публикации. Результаты исследования докладывались на следующих научных конференциях и семинарах:
' -на Y-й всесоюзной тюркологической конференции (Фрунзе, 1988),
-на международной конференции "Кипчакские языки" (Нукус, 1990), • ;
-на всесоюзной конференции "Статистическая оптимизация преподавания языков и компьютеризация обучения"
\ ■ (Чимкент-Минск, 1990),,
-на республиканской конференции "Инженерная лингвистика и оптимизация преподавания 'языков" (Самарканд,1392), •
-нз м-глр^счтубликанской научно-теоретической конференции "Тиллердич аз-ара катнасыэдзры магдакында хезкрги каракалпак, тилинин терминологиясын твртипдестири^ меселелери" (Нукус, 19*2),
■ -на научно-теоретических конференциях ьпрофессорско-препо-дэвательекого состава НГШ (Нукус, 1993,1996),
-нэ П-и^ук^^ноз^ауччо^ли^йрвнцйн "Инженерная лингвистика и ксш1»тери?ащт • обучения языков". • посвященной— 660-лет!« Д.ц|фа Темура ■ ЧС-амзрканд, 1995).
VIII. Построение работа и содержаний* глав. '
Содержание.райоты изложена н-'- £32 страшщзх тенета, работа включает также 33 таблиц и SZ рисунка. Диссертация состоит из »ведения, в котором излагаются исходные положения и задачи исследования, пяти глав и заключения. Е первой главе излагается семиотические осковы исследования. Во второй глав? описываются квантитативные и инженерно-лингвистические приемы исследования, построение частотных словников, также трактуются информационно--статистшескпе согбенности лексики каракалпакских литературных текстов. Третья глава посвящена исследованию лексической близости меяду различными жанрами каракалпакских литературных текстов. В четвертой главе рассматриваются вопросы адаптации исследованных языков к тюркской детерминанте. Пятая глава посвящека проблеме классификации тюркских языков. В заключении г здводятся итоги всему исследованию.
г л а в а 1. таштмчешш я (пйпмю - статистические основы исояедовдшщ КАРМшпдгажоп) лнтераш'шго дашд.
Каракалпакский язык является одиш из младописъме'нныу языков народов Средней,Азии. Письменная традиция, дошедшая до наших дней, ограничивается лишь памлтнр-делаььш записями XV111-XIX веков, выполненными на основе арабской графики (Ха-мидов).
Произведения классиков ■. каракалпакской литературы XVШ-XIX веков, которые могли бы стать ценным материалом для изучения строя каракалпакского литературного яэыкз как й изданном, так и в рукописном виде, до й» дошли. Ил ирсиэаг- ■ денпя стали, гзес-стны нам лишь из уст талантливы:« нзродаик.
сказителей каракалпакского народа.
. Целенаправленное изучение каракалпакского языка и литературы начинается в'первые годы XX века. Оно в основном ограничивалось сборой устных образцов и письменных материалов каракалпакского языка к литература. В ато времл публиковали« с переводом на русский язык такие произведения каракалпакского народа, как "Алпамые батыр","Коблан", "Родословная каракалпаков" , "Придание о Чингиз кане", "Едиге" (Дяваев, Насыров).
Первые лингвистические работы па каракалпакскому языку появились'в ЗО-е и 40-е годы (Матов,Поливанов,Меп£ез). Начало целеустремленной научной разработки фонетики и лексико-грам-матического строя этого языка относится к 60-м годам (Баскаков ). ' • '
Дальнейшее развитие и расширение фронта изучения каракалпакского языка следует отнести к 60-м и 70-и годам, когда предметом систематического исследования стали его различные аспекты. В .эти годы были опубликованы работы, определившие становление и окончательное формирование каракалпакского языкознания (Бердиыуратов, Насыров).
Применение современных методов ыоделирования, ' позволяюсь проникнуть вглубь лингвистических объектов и явлений и вскрывать в них прямо не наблюдаемые свойства в каракалпакском языкознании, начинается с 80-х годов (Бектаев, Насыров, АЙымбетов). '""';• .
C«^ffi^-пpймвнeнш_BJ<apвкaлn^ведбнии .таких современных приемов моделирования как опет*ьшо-сешот;?4*екш7—инженер^ ¡но-лиагвкетачеекм, квантитативные и теоре г икл-информационные «втоды ограничивались лиса материмом публицистических
toe. Естественна, что такой ограниченный подход к исследуемому нечеткому объекту не mow? отрази«» строй современного литературного языка, Поэтому, расширяя фронт исследований, наа ■ модельный эксперимент должен быть применен к саадл разнообразным лзнрам этого язьаса.
Ксслед овазяе каракалпакского языка современными метод и,и; позволяет расширить диапазон сравнительного изучения тюркских языков и юс сопоставления с другими семьями.
Для этого, приступая к системно-статистическому спвсэшш различных стилей каракалпакского я?ыиа, мы должны определить, с одной стороны, , современные методологические и теоретико-лингвистические постулат«, из которые опирается наше исследование, а с другой - описать те методы, с помошью которых будут реализовываться эти постулаты.
В этой главе рассмотрены структур« знаков естественного (каракалпакского) языка и искусственного (математического) языка. Это дает нам возможность использовать искусственный язык для моделирования каракалпакского текста ве только вручную, но и с помощью компьютера, языком которого, как. известно, является я>ь.гк математики.
г Я а в a íi. юштггатия!ая моде«. тюркского лити^атуилго
текста. *
Проблема яиигео-математического моделирования все еще остается одним из центральных вопросов современной квантитативной и инженерной лингвистики, которая,с одной стороны,свя-зеяа с противопоставлением континуальной аморфности лиигеис-тич^скик обьект;-'В я четкой дискретности'иоделирувдего их мз-
--
тематического аппарата, а с другой, с несоответствием между сшсловым богатствам знака ЕЯ si сравнительной семэяпгческой бедностью математического знака (Лесохин, Лукъаненков, Шют-
роескей) .
В настоящее- время для всестороннего изучения и решения этой проблемы в качестве лингвистического обьекта используют не только флективные и флективяо-карневые индоевропейские языки, но также такие языки, которые отличаются от выше^азанных языков более прозрачной и регулярной структурой. Дело в том, что во-первых, эти языки гораздо лучше поддаются анализу с помощью современной кибернетики (Мухамедо'в, Пиотровский), . вб-Еторых, в новой геополитической обстановка языковое строительство а моаодкк государствах, которые возникли на террито-рпи' бывшего Советского 0шза; предусматривает расширение сфер функционирования национальных языков, которое невозможно ре-шть без ломс/ци вычислительяой .техники. В-третьих, судьба самостоятельной гнеине-экокашческш и культурной политики молодых государств тесно связана с использованием систем двуязычного машинного перевода и реферирования. Поэтому,'опираясь . на трядщшгаятшштний опыт создания таких систем относительно русского.и западноевропейских языков,возникает задача построит! современные системы двуязычного машинного перевода и реферирования {Келер, Нахимовский, Нушаров, Пиотровский, дйым-6&тог). ' ' «
' г
Тр1ичйт;»лят:глеткин опыт инженерной лингвистики относительно русского языка показал, что современные системы двуязычного- малинного перевода, автоматического индексирования, .^нстировааия к реферирования не могут'быть реализовали без
- гз -г
применения «етодов квантитативной лингвистики, ц тааде создания единой информационной базы с и их языков-. !
Поэтому ки вынуждены применить метод моделей для системы каракашзкскш речи (точнее-ее лексического и грамматического аспекта), поскольку невозможно с помощью прямого. наблюдения вскрыть такие внутренние свойства каракалпакского языка, которые дают возможность сопоставлять его с другими кып-чакгкимя яьпкамп. Этим моделированием является, в частности, статистическое описание лексики и грамматичи кипчакских языков. •
Как известно, в языке кет ничего, чего бы не была перед этим s речи ("niliil est in lingua guod non prius fuerit in orstione" (Бенвенист)). Поэтому современное изучение и описание языка необходимо начинать с исследования произведенные этой системой текстов. Одним -з действенных средств, глоСадь-, ного исследовательского охвата текстов данного языка является построение, а затем и анализ квантитативных и информационных моделей. Исходной операцией в квантитативно-инфориздианном моделировании является изучение с помощью ЭВМ достаточных, о тачки зрения достоверности, массивов текста и'составление частотных словарей словоформ (или слов, словосочетаний, грамматических форм и т.п.). Эти словари служат первичным материалом для дальнейшего модельного анализа и системы речи, а затем и системы языка. .
Получаемые в результате кештитзтивяого зкспэриыацта опытные частоты отдельных словоформ являются случайными величинами., Это значит, что конкретны- значения этих величин га-вис ят от комплекс а т»л случайных факторен и с.щтуЛ (наяда»
№р, стилевая.манера автора, тематика отрывков, вошедших в .выборку и т.л.), в условиях которых создавалась и реализовалась данная частная ЕЫборка текстов и сам квантитативный зкс--периыэат. Поэтому получаемые лингвостатистшеские величины (частоты с/ф) не являются "кстишыш" величинами (точнее, ма тематическими ожиданиями, вероятностями), присущими соответствующим словоформам. Эти опытные частоты являются лишь приблизительными оценками "истинных" частот, йотод интервальных оценок.
Для доверительных границ вероятности словоформ характерно, что они достаточно узки в верхней части ЧС, где расположены ПЕ с большими частотами,' и значительно расширяются с уменьшением частот ЛЕ. Такш образом, значения вероятностей наиболее частых ДЕ'в генеральной совокупности могут лишь незначительно отклоняться от значений опытных частот.. Значения же вероятностей малочастотных JT. могут иметь в генеоадьной совокупности значительные отклонения от значений эмпирических частот. Диапазон изменения доверительных,интервалов вероятности елсво<£орм в тюркских литературных текстах существенных различий по отноагешт к индоевропейским литературным текстам не дает. Отметим также, что диапазон изменения доверительных интервалов вероятности ЧС словоформ мемду различными яанраыи (стшими/подъязыками) существенных различий также не имеет. Такое свойство характерно также и для других агглюти--нативкык языков. ■
Средняя повторяемость слоио^орй в коз'Мициант синтетизма.
При.дол^шш обш,его обьама выборки N нз общее.количество 'гшнах иди словарей L полученная величина
л. А/
ь
будет характеризовать то количество текстовых словоупотреблений, -которое в среднем приходится на одну словарную лексическую единицу. Чем выше значение Г,тем меньше разных словоформ в исследуемом тексте; чем меньше Р, тем больше словоформ или разнообразнее словарь текста.. ' ' : .
Для того,чтобы показатель Р можно Рыло бы использовать в нашей работе .2 качестве квантитативно-типологического критерии, были выполнены следующие условия: '
/
во-первых, должны сравниваться выборки примгрно одинакового объема;
во-вторых, в сравниваемых различных ' языках должны, ис-.' пользоваться одинаковые жаярово-стшшстические разновидности»
В качестве квантитативного цитологического критерия можно использовать.
во-первых, сравнение величин Р по сопоставляемым языкам;
л»- .
во-вторых, сравнение величин Г между различными жанрами'
■ ■ ' 1
литературного языка; •
л»
в-третьих,показатель темпа роста Р э_зависимости от увеличения обьема выборки (а нашем случае исходная .выборка составляла 50 тысяч словоформ). , • "' > .
При обьеме выборки 100 тыс. словоупотреблений в каракалпакском литературном языке при сопоставлении испытуемых" различных жанров средняя повторяемость каждой словоформы находится в интервале (3,5.8 - 5,24). ■ ■
• • •»
Значение степени коэффициента синтетичности манго . подучить по формуле:
В зависимости от рассматриваемых жанров значение степени коэффициента синтетичности в каракалпакских литературных текстах ■ показывает разнообразные значения. При этом выполняется следующее неравенство:
< 5иг£ < < $СпЬ < (О
м эпиь роман л^гмае пощих
Как видно из этого неравенства, наиболее высокую степень синтетичности имеют поэт'цческие тексты, а самую низкую показывают тексты эпоеов. .
Это свидетельствует'о том, что поэтический 'жанр обладает Д01.0шрутадиы статистическим весом с точки зрения разнообразия лексем и их грамматических форм-по отношению к другим жанрам литературного языка.
По показателям Р и 21пЬ для агглютинативных языков, в частности, для каракашакского и казахского языков высокую среднюю повторяемость и довольно.низкий коэффициент синтетичности среди исследованных жанроЕ (стилей/подъязыкое) занимают народно-фольклорные тексты (эпос). Зто значит, что народно- фольклорные тексты имеют более низкое разнообразие грамматически». форм по-отношении к другим исслед&ванным дазновид--ксстям-лк^ера^урного язька.
В гц-глотинатишйгх^та^ .шскям, у?С>в»хюм, киргтосвсм, 'туреик•>:;•, р пубпяшттени:'.
часках и. флективко-зяалитичеегсих публицистически^ т'екстах 'индоевропейских языков. (
Увеличение объема выборки д^я каракалпакского текста'не дает того быстрого эффекта поеьшшия средней повторяемссти отдельных словоформ и роста устойчивости частот, которые ш взблюдаеы ьо флективно-аналитяческих языках, например, в английском, рушнскш я других западноевропейских языках. . -Для получения достоверных частот достаточно большого массива лексических единиц в каракалпакском языке,, как, впрочем,, к в других тюркских языках, нужно формарсвать, очевидно;гораздо более обширные выборки, чем это обьмно делаетсл в индоевропейской лингвостатисчике. . ! Покрываемость наугад взятого текста разними участками ЧС.
С динамикой роста средней частоты Р тесш связаны закономерности покрывземости различными учасками частотного • словаря определенных долей текста. Для того, чтобы проследить эту закономерность в каракалпакских литературных текстах, разобьем построенный нами словарь на пять гон так, что первач зона - будет вклгочзть первые 50, вторая - первые 100, третья -первые 500, четвертая "- первые юоо» пятая - первые £000 ааи-более частых словоформ. Соотнося наю,ч1левнуй'частоту Р* последнего слова каждой зоны- с обща.1 объемом выборки N. ыы получаем числовое значение относительно накопленной частота:
1— ИР
Л ' Р
3
н
В процентном измерении £ * йцекил^тся величиной Отпоскте^и;.,; яйк&плеинзя ча>"?07* укз-ь:«.;?-¡¡.м ту даю
- IB -
f
460
ata
440
0,2<¡
o, so-
aso -
ato
HZO
-1-1-h-
4t% /
1 2 } 4 Г " 1 i 3 4 S
Рис. f. Арий/ероала маюастм&с- Puc.2. KpuBs/e. рос/ла а»а/пир~ jcaüjf*} локрыВаемчя/яу слй&грерм *} прохри&атости
кссракаллакскогь (i) и лазахсмгс ¿ле&рлрм кара/арглохсхого(г) (2) язшоЯ. i v узДеКскопз (2) языкоЗ.
0,29
1 г
о.еа
3,10
i ь-
e9¿
f—t-J * J~ . * i 3 4 s
Рис .3. Кривые ptxme c/na/nucrnts - Рис. 4. Кривые роста: cmamvc-
wcxojú ff пщсыраенясти c.togv- тичесхяй (f) ц ЦИфяр.чациомной
<рорм «аракгишаксхапе (rj и ryp?4- (2)/юкри&хелес/пи
te aro (2) ftsi/KcS. Царешамяхсксго язших.
текста, которую в среднем покрывает заключенный в данной, зоне массив наиболее частых словоформ.
.Дадим лингвистический комментарий относительно динамики роста средней покрньаемсотк текста различными эонаот частотного словаря. Здесь следует отметить:
во-первых, расхождение между разновидностями ;тлнрсв каракалпакского литературного языка;
во-вторых, различия в гюкрываемости, которые обнаруживаются между различными жанрами в тюркских языках. -.
й - треть их, расхождения с флективными индоевропейскими
языкзми.
Наиболее медленный рост величины, роста статистической покрываемости наблюдается в поэзии. Медленный'рост этой величины свидетельствует о разнообразии формообразования рассматриваемого текста. В наших' испытуемых глнрак таким тентом является поэтический текст. .
Заполияемоста текста упатрчбптедаинмк словами я словоформами.
При решении ряда теоретических и'прикладных задач необг, ходимо выделить ту лексику, которая с достаточно большой вероятностью будет встречаться а наугад взятых текстах данного
языка, стиля или подъязыка. Иными словами, спираясь, на данную
■ ■ V
выборку текста, следует отделить редга» словоформы и^слова от лексических единиц, имеющих среднюю и шео!<ую употребительность , а затем определить, какой процент текста иокрываят эти средне-и высокоупотребительные слова и словоформы. Обе эти задачи русжтся следущш образом: 1. Определяется граница между редкими и употребительными
лексическиш едкшцайк. Исходя кг опыта предшественников, эту границу можно провести перед•лексическими единицами, употребленными один и ДЕа раза (при этой двух - и одноразовые словоформы « сяоза будут расыатриваться в качестве редких, а остальные в качестве нередких, употребительных словоформ и слов). - . " , •
2. О помощью выражения
£
где N - -'объем вйбаркя». п (1,2) - число двух - к однократных словоформ и, слов в данной выборке (Калинин), определяется коэффшкеат заполнения текста употребительными лексическими единицами. ,,'
.'■'■■.. Таблица 1.
Статистические оценки синтетизма и коэффициента .заполнения в различных.жанрах каракалпакского языка.
-^---,-----р—!----
л/
.Разновидности.жанров | ' ? .1
каракалпакского языка] (при Н«100тыс.)(
эпос. '," —1— ------ | 5,24 .......—г""...............г' ! . 19,0? ! * 86,7
роман Г 4,28 . . I 23,46 | 82.2 >
газета - " 1 ' 4,07 ' ! • %4,5Э | 81,2
. журнал ! 3,88' | 25,75 Г 80,3
соззкл. -8^-16— ,1 ........,'........... . .'. .л....... ,. ■ ' — 74,8
Сопоставляя значения коэффициента. заполнения
между
рассматриваемыми жанрами каракалпакских литературных текстов, полученных при помощи ЧС слоьофспи в примерно одинаковых выборках (100 тыс. словоупотреблений), мы видем, что здесь выполняется следующее неравенство:
< ? < f < í < Í ' <»
Это неравенство является показателем различия в разнообразии словоформ сопоставляемых жанров каракалпакских литературных текстов. . . •'
Таким образом, чем шгае значения- коэффициента залолненш ^ , тем лексически разнообразнее является рассматриваемый жанр. В нашем случае таким жанром является поэзия.
Между прочил, в рассматриваемом неравенстве (2) значения коэффициентов заполнения в народно-фольклорных текстах 'показывают самое большое значение, которое свидетельствует о бедности словаря этих текстов по отношению с другими жанрами литературных текстов агглютинативных языков.
'Анализ этих оценок позволяет сделать следующие заключения : " •
во-первых, коэффициент заполнения употребительными словами текста е литературном каракалпакском языке, как, впрочем, и в других агглютинирующих тюркских языках, заметно вше ■этого коэффициента во флективных кндоееponeйских языках;
во -' вторых. при увеличении выборки N запояняемасть текста достоверными лексическими единицами возрастает.
• Естественно, что с ростом заюлняемости текста в и«« уменьшается доял редких словоформ.
- ш ~
В конце главы дается информационные оценки каракалпакской словоформы и каракалпакского текста.
Применение информационной меры позволяет оценить числом типологические расхождения между каракалпакским и другими тюркскими и индоевропейскими языками. Такой числовой оценкой является среднее 'гаагачествс синтаксической информации,падающей на словоформу (в каракалпакской, как и в других тюркских языках, эта величина составляет Солее 12 дв.ед., в индоевропейских языках ока равна 9-10,5 дв.ед.). ■
Г Л * В А III. ЛЕКСИЧЕСКАЯ РХАТИСЩКА КАРАКАЛПАКСКОГО ЛИГЕРАТУРШГО ЯЗЫКА
Полученные в предыдущих разделах данные показали, что по общим лексико-статистичвским и информационным показателям, рассматриваемые жанры каракалпакского языка заметно отличаются-между собой. . Однако использованные нала методы не дали возможности провести детальнее сравнение квантитативных сходств и различи"! между жанрами каракалпакского литературного языка. Эти методы еще не обладает такой разрешающей способностью, которая необходима для вскрытия глубинных и тонких 'особенностей рассматриваемых жанров литературного языка. Для решения этой задачи.ыы должны применить такой исследовательский аппарат, который позволил бы нам фиксировать сходства и различия в означаемых и , означающих. лексических единица:. в системах сопоставляемых «аиров, а также наблюдать схождения и расхсща»шя~рбчеаойтпотр8йиг'сланс«ти^тиклж>вуфорц в ука-. зэдкых жанрах* Для выполнения этих задач-ш воспользуемся сравщгеелькс>-квантитативной методикой. Задача этой главы сос-
тоет в той, чтобы численно оценить степень квантитативно-лексической близости -эпоса относительно романа, поэзии,журнала и Газеты и определить место рассматриваемых манров в каракалпакском литературном языке.
Решая эту задачу, мы подвергнем квантитативному- анализу первые ЗОО словоформ, которые покрывают примерно 4",55* наугад взятого каракалпакского литературного текста.
Как де оценить соотношение этих ситуаций в целом, относительно выделенного нами массива наиболее употребительных словоформ?
Для решения этак задачи мы применим метод попарного сравнения рангов (порядковых номере? в ЧС)- эпос-роман, эпос-поэзия, эпос-журнал, эигос-газета,. роман-поэзия, роман-журнал', роман-газета, поэзия-журнал, поэзия-газета, а- такяе журнал-газета. Результаты этого сравнения оцениваются с по-
мощью коэффициента корреляции Спирмена, который реализуется
3 =
п. ,
выражением ^ ^ ■ .
•пфч)
Здесь - коэффициент ранговой корреляция по Сиирмену, 7/^ - разность райгов словоформы в эпосе и соответствующей ей лексической единицы в поэзии (или в романе), п- ксЗЬтчестсо учтенных э эксперименте.единиц т. обоих сравниваемых .частотных словниках.. При этом. в. обок* словниках- происходит компрессия рангов таким образом, чтобы а каидсм из словников последовательность рангов лексических единиц представляла бы последовательность натуральных целых чисел от 1 по п.
Метод ранговой корреляции применяется на:.-и для выявления .содержательной близости между литературными жанра,ш каракалпакского языка. Сравниваются ранги словоформ т<еющпе одно и то ие означаемое и означающее.
Сопоставление рангов в зоне (.1 - 300) наиболее употребительных лексических единиц в' 40 словоформ, каракалпакских литературных текстах вскрывает следующие особенности:
1. В рассматриваемой зоне среди лексических единиц в различных жанрах литературных текстов активно включаются глаголы.
2. В зтой зоне отсутствует соответствие лексических единиц чзстей речм, междометий,, звукоподражаний, антропонимов.
3. Колитество соответствий лексических единиц между жанрами "эпос.-гаэета"' низкое. Помимо этого в рассматриваемой зоне отсутствует статистическое соответствие употребления прилагательных, числительных, а также модальных слов.
. 4. Относительно близкое-значение коэффициентов корреляции имеется , между жанрами . "эпос-роман","эпос-поэзия" и "эпос-журнал", которые существенно отличаются от пары "эпос-газета". Это свидетельствует о том, Что лексика жанров эпоса,поэзии, а также журналов, составляет своеобразный пласт литературного языка.
5. Результаты лингва-статистических экспериментов _испытуемых жанров каракаяйакских литературных текстов, покз-зал, что наиболее близкое схождение употребительности с/ф дают пары "роман-журнал", - в .которых значение коэффициента корреляции составляет 0,62, а наиболее большие расхождения наблюдаем между карами "эпос-газета" и "роман-газета" (табл.2).
- ЗУ -
седа, групп; а) северо-росточнув, 2} хакасскую, 3) алтайскую, 4)западко~сиСкрскуи, б)псвслжско-приуральскую, 6) среднеазиатскую, »го-западную (Еогородицкпи).
A.К, Сачойдович и своей классификационной схеме ткркских языков выделил шчсть групп: 1) буггарскук, 2)уйгурскую, 3} кыпчакекуп, 4) чагатайскую, 6) .гшячаксго-туркмедскую, 6) иго-западную (Самойдович).
В классификационной схеме И.Бенцкнга и К.Менгеса тюркские языки разделяются на пять групп: 1) бунтарская, 2) огузс-кая, '3) западная, 4) восточна« иди уйгурская, 5) северная (Еепзшг.Мгпеел).
Радлов выделяет четыре группы' тюркских языков: 1) восточную, , 2} западную, 3} средаеаэиатскуи, 4) южную
В классификации Н.А.Баскакова все тюркские языки делятся на>две большие ветви - западнохуннску» и восточяохуннскув.Затем. эти вгтзи подразделяются на более мелкие группы и подгруппы (Баскаков).
• Одновременно высказывались весле разные мнения по неводу близости каракалпакского языка по отношению к другим тюркским языкам.*
Например, И.Х.Аделукг отмечает близость каракалпакского языка с языками оренбургской'группы татар.
B.Д.Падънблад•сближает каракалпакский язык с нагане-' ккм, карачаево-балкарский, кумшедкш, бьжкреюа* и киргизским заиками.
Г.'Еамбзр» сбл'.га'ьт. кзракзлиакекли яэыи. и .¡ояжеким языком, и кгыгим ьо&ют,- тнрюг.
словоизменительные , аффиксы . и их коыбинироЕаяше 'варианты в, эту ко1лг/никащш к© включаются. Такие'словоизыевитг.йьни8 аффиксы и их комбинированные варианты будут составлять множество сэкономленных служебных элементов. В нашей лингвостатиетк-ческом эксперименте .экономия словоизменительных аффиксов в каракалпакских газетных текстах составляет в казахс-
ких 64,64?, а в узбекских всего лишь 6,157,. ' <
Это свидетельствует о том, что между .узбекским и каракалпакским, а также узбекский ' и казахским языками пшатся расхождения по степени настроенности по детерминанте экономии служебных элементов. Каракалпакский и казахский яэыкат показывает более высокий уровень адаптации относительно узбекского языка. Эти расхождения объясняются,в первую очередь,различием фазы на пути настройки на общетюркскую детерминанту. Таким образок, структурные изменения тюркских- языков можно" рассматривать , как в плане развития, так и в плаке нарушения природы экологии этих языков. . -
Современное состояние лингвистической экологии," на наш взгляд, должен быть специальным'объектом научного изучения не только тюркских, но и флективных, и фл'октивно-корневых издиав-ропейских языков. '..''■ . •
ГЛАВА V. КВАНТИТАТИВНО ТШОДОГИЧЕОЮШ КЛАШШША-'.-.'. 1Щ ТЮРКСКИХ 1ШКОВ.
■ I
В многочисленных классификациях тюркские языки группируется по признакам генетического родства. • .
, Например, £. А. Богородицкнй разделял все г*ркски-э к:-ь;ки Щ
-лар-ым-дз, -лер-им-де, -лар-ьш-дз, -лер-ин-де. -лар-ьщыэ-да, -лер-шщэ-де, • -дар-нм-нпн, -лер-им-нен, -лар-ьщ-нан, -лер-ид-нен, -лер-щиз-ден. :
Структура Р-К-Т-В: -лар-ш-сац, -лер-им-сец. Структура'Р-К-Б-К; -ляр-сац-лар, -лер-сец-дер. Структура Р-7-Б-К: ' -м-Сац-лзр, -м-сец-лер, -м~сыз-лар, -м-сиз-лер.
Структура Р-К-Т-Б-К: -лар-ым-сац-лар. -лар-ыи-сыз-лар, -Лбр-ш-скз-дер.
Перечисленные аффиксы а каракалпакских газет»« текстах, . т присоединяются к существительным. С позицией системной лингвистики эти аффиксы, а.также их комбинированные варианты целесообразно называть сэкономленными служебными элементами..
■' Несмотря нз ■ возможности системы строить, очень длинные ..„епочки присоединяемых к основе словоизменительных аффиксов, з каракалпакских, казахских и узбекских текстах применяются в
основйом словоформы, состоящие из одной основы или образован''' *
ньга из основы плйс один аффикс. Двух-и'трехаффиксальние словоформы встречаются реже, а'четырех-, пятизффикеные. словофор- .• -мы, не говаря уже о более сложных построениях, в каракалпаке-ких и.казахских текстах- практически не используются. Однако в узбекски?: . газетных текстах встречается четырехаффикскые
словсфорш схемы ' Р-К-1-Са-Л (ОВАБЕ): лар-и-га-гика ,(Р«7),
*
лар-и-да-гина (Р«2), лзр-и-ни-пиа- (Р-2) ¿Мухамедов)^ которые ни в каракалпакских, ни в казахских текстах не употребляются.
Статистический эксперимент показал, что из 317 карасал-пакскик словоизменительных аффиксов и 1« комбинированных вариантов з коммуникацию включаются всего лишь 176. Остальные
Здесь устраняются следущяе структуры:
Структура Р-Т: -низ.
•Структура Р-Е;- -мен,-пан,-бал,-без,-пиз,-сед, -сыз,-еиз.
Структура Р-К-Т: -.лзр-кя, -лер-вд.'
Структура Р-К-Е: -лер-ипз, -дер-сиз.
Структура Р-г-Оа: -ы-яик, • -ц-выч, • -чыз-дап*,
-диз-дин, -м-ма, -ц-й, -нкз-га, -ыныз-рз,- -ы-ды, -м-ди, -д-ды, -даз-ди, -н-де, -ц~да,' -н-де, -низ-де, -к-ная, -ц-нан, -н~нен. -ыч-нан, -ныз-дан, -циэ-ден.
Структура ' Р-Т-Е: -д-ман; -};-мев, -кч-Шй, -ид-мен, -сы-шз, -си-миз, -¡¿-сан, -м-сыэ, -¿«"-сен, -м-сяз, -ым-сыэ, -им-сед, -им-сиз, -ы-Сач, -к-саз, -и-сиэ/'
Структура Р-Т-Л: -ыы-ай, -си-ай.
Структура Р-Т-К.: -а-пар, -к-дер. .
Структура ' Р-'Са-Й! -.-даи-мав, -деи-мев, -дан-сыз", -яея-сяз, -дз-сыз, -та-сыз, , -те-смз. >да-ман,
-де-мен, '-да-мыз, -де-миз..
Структура Р-Б-К: -сан-лар, -се^лвр, -сыз-дар, -сиз-лер.
Структура Р-Л-Б: -мы-сан;, .-ия-свц, -'Сы-еац, -би-сен, -ш-сыз, ш-скз. -пы-сач, -пи-сеч, -бы-ош, -Сй-сиз, --ш-шг* -пи-сиг.
Структура Р-т-Са-Б! гыи-да-ман, -вм-де-мея, -кн-да-ман, -ин-де-ыен, -ы-нан-ман, -а-нен-бен,■-ы-нан-быз. и-кв1-5из.
Структура Р-Т-Л-Б: -м-бы-сац» -м-бы-скз., -м-бк-сиэ, -м-би-сен.. •
Структура Р-К-Т-Са: -лар-ыд-нкя;, -лер-кц-наи, -лзр-ым-а, -аер-иниз-ге, -лзр-ын-ды, . . -дгр-кч-ди, -лер-иниз-ди.
Ризз-Кули-Мирэа сСлгагает каракалпакский язык с диалектом туркменского языка, отмечая сильные расхождения с казахским
РЯНКСМ. '
A. И.Беляев сближает каракалпакский язык с казахским языкам. I '.-...'
Л. Синор,сравнивая .каракалпакский язык с казахским я уз-; бекскпм языками, приходит к выгоду, что . каракалпакский язык блияе к казахскому, чем узбекский. •
B.К.Мэтьюо сближает каракалпакский язык с-ногайским и казанским языками.
Таким образом даются разные оценки близости каракалпакского языка к другим тюркским языкам. *).
К. Менгес в . своей каракалпакской грамматике, отмечая большую близость между каракалпакским и казахским языками, идет дальне, утверждая, что'каракалпакский язык не является самостоятельным языком,, а является всего пгль диалектом" казахского языка. Подобные рассуждения можно встретить .также у других ученых (Rasanen, Cabain, Poppe, Warm).
Все эти несовпадения, как уже говорилось, связаны с разнобоем и Htстрогостью я выборе классификационных признаков (Гаджиева).
Вышеназванные виды классификации. тюркских языков, кэк и оценка позиции в них каракалпакского языка, и основной опирались на-метопы прямогм нг-.Гдадеяпя. Что кззэтся «овреиакных
*) См. об г том в г'Лоте: НаснроЕ Д. с. Станейленче юэра-каяпагезтого сОчуялг-лл^го языка а *-v диалектаая система. кус-Казани Ьяс •(лгп^стак. tve, с. Г;--»3'!.
методов моделирования, ■.позвояяювщ проникнуть I глубь Л1шг-вистических объектов и явлений и вскрывать в них прямо не ■ .наблюдаемые строевые и синерг-зтические свойства тюркских языков, то эти приемы практически не применялись. Поэтому,приступая к системно-квантитативному описании меры близости исследуемых языков, 1&: должны определить, с одной стороны, современные мет одолог ИЧ9 с кие и теоретико-лингвистические постулаты, на которые опирается наше исследование, а с другой -описать те методы, с помоеыо которых будут реализовываться эти постулаты.
Чрезвычайная близость граммзт ич е с ко г о строя и словарно-
• гС состава тюркских языков обеспечивает всем носителям этих , языков ( кроме- чувашского и якутского языков ) возможность
• понимать друг друга на всей территории их распространения (Ьаокаков). Человек, владеющий тюркскими, языками, да.*е не будучи языковедом,интуитивно ощущает, что каракалпакский язык блст.е -к казахскому чем к турецкому, а уйгурский язык ближе к узбекскому чем к крымско-татарскому.
Однако.интуитивное определение близости тюркских языков, ир всегда отражает истинное положение дед, Например, если спросить человека, владеющего соответствующим языками, дахе если он специалист-тюрколог, к какому языку ближе узбекский -к каракалпакскому или к казахскому, то на этот вопрос ответик. ему будет непросто ' "»
Каракалпакский и казахский языки обычна относят к кып-чанско-ногайской подгруппе, а узбекский* включа&т в карлукекую группу гападкохуннских языков (Ёаскаков). Однако наблюдаемые эв последние годы значительные сходдения в лексика каракаа-
пакского и узбекского языков делают эти положения далеко не бесспорны»«!. . -
Для преодоления этих трудностей надо найти икаш измерения близости и отдаленности испытуешх языков. Эти шкалы мы будем искать в эвристической модели, которая,'с одно)"), стороны, могла бы измерить степень формальной близости, а о другой- семантическую близость этих языков. При этом следует применять такой исследовательский аппарат,который позволил бы фиксировать сходства и различил в означа^чьсс и озиачаовдх, лексически единицах (словах) в системах сопоставляемых языков, а также наблюдать схождения и расхождения употребительности этих слов в системе речи указанных языке». Для выполнения этих задач мы воспользовались квантитативна-сопоставительной методикой. •' -Наша первая задача состой, в том, чтобы 'численно оценить степень квантитативно-лексической близости систем указанных языкав (точнее, публицистических подъязыков) и определить место современной газетной лексики каракалпакского языка по отношению к лексике двух соседствующих с ним языков. Это позволит н-з! i рассматривать важную для тюркских языки общетеоретическую проблему о соотношении первичного родства и вторичных контактов, основанных на культурно-хозяйственных связях, между родственными языками.Еторая задача заключается в том, . чтобы оценить лексическую и грамматическую близость каракал- ■ пакского языка к казахскому и узбекскому языкам на уровне системы речи, учитывая при этой рссбвнчости реализации oCsw. тюркской детерминанты, о которой мы говорили вдаэ.
Решая гервуя гад-чу, мы подЕерг^м кьаатитатквкоиу 8й£-
- з'б -
лиэу первые 2С0 слов нашего частотного, словаря (они покриесят примерно 45.16Х наугад взятого каракалпакского публицистично -кого текста) с эквивалентами в частотных словарях казанского (Ахабаев) и узбекского (Мухамедов). Еое ыа словари получены путем переработки . частотных списков , словоформ, получевнгл указанными авторами, а также автором настоящей ргзботы. •' При преобразовании частотных словарей словоформ в ЧС слов и при их объединении в таблицы применялись аледущке правила: ' '
I) .гее именные формы, относящиеся к определенной основе, обьедиршдась в одно множество, представителем которого выступала исходная (словарная) форма имени - форма единственного числа,' именительного падежа:
. ' ккадп. ш <жыл, жылдыд, пиша, шада ... и т.д. ,3-; '•.'■' 2) в ячестве глагольной словарной формы использовалась основа, совпадающая с формой Я лица, единственного числа, настоящего времени:
. ккаш. ал ■■-((алдьм, алдыц,. алды,... шшу... и т.д.)>. Если обратиться к изучению соотношений в* употребительности каракалпакских слов и их казахских или узбекских эквивалентов ' в текста, то здесь выделяется три типовых ситуации: а) каракалпакское слово и его казэлсшш и узбекский эквиваленты имеют примерно одинаковую употребительность, которая 'оценивается разностью ракгсв этих слов, не превышающую 10 - ср. ккаш. буд С1-5), каз. бул-гд-З), узб. бу '(1-2) 'это';
■ б) каракалпакское слово н его эквиваленты имеют среднее расхождение употребительности, одевиваювегс-са разностью рангов каракалпакского слова и его эквивалента, находящейся в преде-
Л£Х 10-60, ср,- ккалп. жпе (1»35), каз. не (1*Б) "и.
в) каракалпакское слово и его эквиваленты имев! большое расхождение з употребительности, которое оценивается разностью рангов, пр^нытвЕщей 61, - ер.ккалп.яаяэ (Ь2<3)узб.яна (1-134) 'и', 'еще'. . '
Как же оценить ооотиолеяие этих ситуаций в ца^ом относительно выделенного нами йзссива наиболее употребительных слов? . ■ ' '
Для радения этой задачи ш применим ' метод попарного сравнения рангов (порядковых номеров в ЧС) каракалпакской и казахской,а также каракалпакской и узбекской лексики., Результаты этого сравнения опениваотся с помощью коэффициента корреляции Спирмена. '.
Метод ранговой корреляции применяется Нами в двух- лингвистических аспектах: ' ' . -
во - первь^, для гыятант содержательной близости кара-.. калпакского литературного теиста и аналогичных текстов, казах-1 ского и узбекского языков; . •' - , , . ' -
ео - вторых, для определения материальной близости этих текстов; ?
в - третьяк, для определения грачматичвскай близости этих1
языков. . . '
В первом случае сравниваются ранги эквивалентный по зна-чеш® каракалпакских г, казахских,а также каракалпакских и уз-беюсглх лексических- единиц независимо от того, выражены ли они в сопоставляемых языках одилзкоеыми словами и словами, восходящей к обкушу тюркском-/ корни, иди они передайте я: формзшц совершенно различного проиохоядеяш.
- -
Во втором случае учитываются только те олова, которые имеют савпадзяаднё. по форме гквивзленты (ср. ккалп. ракета, клз. узб.рэкета 'ракета') или эквиваленты, восходяшие к единому тюркскому корне (ср. ккалп, ушын, каз. ушш, узб. учун '¡ради, для').
Отмет.гел, что и в том,и в другом случае учитываются только те слова,которые имеют в еояостзвляемык языках точно определенные ранги в интервалах 1 1-300.
Численные значения коэ^ицкентов ранговой корреляции относительно пар каракалпакский - казахский и каракалпакекик-узбекский язык:-! показаны в табл.З. Там же для сравнения представлены керы семантического и формального схождения наиболее частой лексики казахского и узбекского языков.
Сопоставление значений величин у , характеризующие речевые схождения каракалпакской лексики с казахской и узбекской лексикой,с одной стороны, с язцковьши соотношениями лексических систем указанных языков обнаруживает несколько неожиданные результаты. Если расхождение лексических систем каракалпакского и казахского языков прйшрно б полтора рага ниже, чем расхождение кзезкзлначской и узбекской лексических систем, то на уровне речи коэффициенты ранговой корреляции, характеризуйте близость семантического и формального распределения лексюся в указанных парах языков, дают незначительные расхождения, особенно на семанткческш уровне. Близость каракалпакской и казахской лексики на семзнтическом уровне текста только на 6Х вьеве с/хаденил каракалпакской и узбекской йекстоск. На форнй-тшном *е уровне каракалпакская .лексика блше к к^зглскс-й на 1ЕЛ, чем к узбекской. •
Нздт статистический эксперимент подтверждает выводы Д. Си-нора, что каракалпакский на уривке лексической систеш речи ближе г. казахскому, чем узбекскому. Подтверждаются также выводы В.К.Метлися о большой близости каракалпакского ззыка с ногайским и казахским нз основе общих и отличительных черт фокс-тики и морфология этих языков. Наши результаты яе противоречат также схеме Н.А.Баскакова, согласно которой эти языки относятся к' кыпчакско-ногайской подгруппе кьшчакокшс языков, входящих в западную ветяь тюркских языков причем каракалпакский язык, обладая • признаками, характернэущиш всю кипчакскую группу тюркских языков, имеет также признаки; выделяющие из кыпчакской группы кыпчак.ско-ногайскую подгруппу,з такие и еще более специфические признаки,отличзюз^е каракалпаке иш язык вместе с ногайским от казахского внутри кылчзке-ко-ногайской подгруппы (Васк.а>.-Ш).
Теперь мы можем ответить на вопрос о степени близости узбекского языка, принадлежащего к первой группе, по отношению к каракалпаке¡0)1(5' и казахскому языкам, принадлежащим, ко Еторой группе.
В приведено« таблице £ в сопоставляемых парзх значение узбекско-кзракалпакское лексическое ■ схождение нз семантическом уровне выше ка 0,03.?;, а в формальном на 0,07%, а в грамматическом на 0,34* относительно узбека®-казахского лексического схождения.
Таким образом, узбекский язык ионного бл'.^е к каракалпакскому, чем казахскому. Еместе с теи.сгедугт помнить о той, что по настроенности на древи*тюркск\ъ детериккангу зкснсмал служебных элеиеитоЕ, узбекский яэьк етка'дошм
Таблица 3. . Значение коэффициента ранговой корреляции наиболее частых словоформ в публицястическгл '' текстах каракалпаююто, казахского и узбекского языков
---------1-------•------—----
Садютцческие уров-| Значение для пар языков
ми пары языков !-1—;—■-г-----1--■--
(планы) I каракалпак-1 каракалпакский;-1 казахский -
¡ский-казак-1 узбекский ¡узбекский
Iский | | -.---—|------■' -
1 '' I 2 | 3 | 4
_:_____1............I—:--1__
алан содержания
(семантика) 0,62 0,67 0,49
план выражения -
(форма) 0,62 0,6?. ' 0,45
грамматика 0,62 0,17 -0.1?
и от казахского а от каракалпакского языков.
Сближение каракалпакского и узбекского языков органичес-№ связано со следувщи)ш ситуациями) .
.во-первых, уже начиная с 1536 года Каракалпакская республика -ведала » состав Республики Узбекистан. 1'акпе политические |жл;иы, естественно,сильно подошн на стаяопденле и развитие
- а -
тесных народно-хозяйственных и культурных контактов между двумя народами, которые длятся уже около 50 лет.
Ео-вторых, сблетекк? каракалпакского и узбекского языков связано с географическим расположением этих двух республик. Дело в тем, что Республика Каракалпакстан имеет свои границы' одновременно с тремя областями Узбекистана. Это Хорезмская, Бухарская и Навоийская области.
Помимо этого Республика Каракалпакстан имеет также /свои границы с Ташаузсксй областью Туркменистана, в которой подавляющее большинство составляет узбекскоязычное население.
В-третьих, в Каракаппакстане живут представители многих национальностей нашей ' страны: русские,.узбеки, казахи, более менее многочисленные из них туркмены и др., общей численностью населения 121220?' человек. На них караяаяяакя составляют 32,06% узбеки - 32,7М, казаки - 26,23?;, русские -1,647., туркмены - 4,97% к представители других национальное-, •гей составляют 2,27£. • -
Вышеуказанные статистические данныз национальностей яро-жизаицих в этой республике, показывают,, что большинством из них яелжся каракалпаки и узбеки, при этем они составляют почти одинаковое процентное соотношение, которое теле в какой то степени способствует сближении каракалпакского и,узбекского языков. ^
Таким образок, нам удалось при пшоця коэффициента ранговой корреляции определить реальную степень близости лексики каракалпакского, казахского п узбекского языков. ■•
Такой статистический. подход игы-зреиия схездения и расхождения языков №*ег послужить шкалой при эталонно» гзуере-
нки степени близости и, отдаленности между различными тюркски-т языками, а возможно и келду языками других семей.
ЗАКЛЮЧЕНИЕ
Путем, применения современной лингЕссгатистической мето-.дики проведено обследование больших массивов разножанровых текстов современного каракалпакского языка. В результате этого эксперимента вперьые получены количественные и системные данные . о функционировании лексики и агглютинативной морфологии в системах каракалпакской речи и языка. ■ ' Указанные лингео-статистические сведения сопоставлены с аналогичными -данными других тюркских языков (в первую очередь-казахского и узбекского). Это сопоставление, осуществленное с помощью современных объективных приемов (ранговая корреляция, статистическое сопоставление) показывает, что за последние десятилетия в системе отмечается сближение узбекской и каракалпакской лексики. В тс же время древняя общетюрк-скзл ешергетическая детерминанта,' противопоставляющая казахский и каракалпакский языки узбекскому, остается практически незатронутой.
Таким образом, полученные результаты могут представлять не только тюркологический интерес, - они в определенной, степени иллюстрируют механизмы вторичного схождения между рсдст-
с
веивыми нзыкэмп, которое наблюдается не только в тюркской, но к в индогсропеГюкой,• фшшсз-угорскои,' "кавказской и семитской я?ыковых семаях.
Основный положения диссертации отраиеии в следуякднх работах: - )
А. Книги.
1. Опш: лингЕостатистпчеекого анализа лексики и морфологии каракалпакского публицистического текста,. Кукус: л&шуы", 1Э91-128 с.
й. Русс!:а-кл[.окалпаге.:щм словарь математических терминов (Математика тершшлэриш-щ русаа-^аракдпп'акиа сезлиги). -Нукус: "Билим", 1992-4:34 с. (п соавторстве с К. Еектаевьаа и Д. Насыровым). ' .
3. Краткий русско-каракалпакский терминолопиесгащ словарь по иыфсрматике и вычислительной технике (Информатика хем есапла? техникаоы бойынша кыскзша руста-каракалпака терыин-лер сезлиги).- Нукус: "Билим", 1992-37с.(в соавторстве С.Пнр-назаровым).
4. Алфавитно частотный словарь избранных произведений Еердаха (Бердах танрхамалы шрармазарынын, алфавитли-лийилик сезлиги). -Нукус:"Каракагоакстан", 1993-128 с. (б соавторстве с Д. НаеыроЕым).
В. Статьи и тезисы , 'К
5. V - симпозиум по лингвистически!') проблемам искусственного интеллекта,- Нукус: "Вестник каракалпакского филиала АН УзССР", 1988, N3, с.88-90.
6. О механизмах образования именных словоформ в кйр&каа-пакском языке. -В кн: тезисы' доклад-;» к сообщений У-»сес:д>9-ной тюркологической конференции. фрунье: Кэд-ао. 'Шим", 1*38,с.
7. Внести определенность (Ашидахтр кирг :ЗД'-2-:и<<). - Нукус:
"Совет г^аракалпакртаны", 1989, с.4.
■ 8. Квантитативное и информационное моделирование кзра-калпакского .текста. - Нукус: "Еестник каракалпакского филиала АН УзССР", 198Э, N2, с.69-74.
9. ЛингЕостатистические ^следования лексической близости каракалпакского, казахского и .узбекского подъязыков публицистики. В кк: Статистика казахского текста", выпуск П. Алма-Ата: Изд-во "Тылым", 1990, с. 76-89.
Ю. Становление лингвоотатисттаеокогб метода в каракалпакском языкознании. В кн: Сериалы семинара' "Статистическая . оптимизация преподавания языков к компьютеризация обучения". Чимкент-Минск: ЧШ, 1990, с.247-243 (б соавторстве с Д. Насы-гобым)
11. Сопоставительное'изучение тюркских языков с помощью ликгвостатпстических методов -В кн: материалы семинара "Статистическая оптимизация преподавания языков и компьютеризация обучения". Чимкент-Минск:' ЧПИ, 1990, с.235.
12. О международной конференции "Статистическая опгими- -зацил.преподавания языков и компьютеризация обучения" (хроника) -Вестник каракалпакского филиала АН УзССР,' 1991,. •(•!-!, с.137-139.
13. Некоторые вопросы становления п развития кзрзкзлизк-ской терминологии - "Вестник каракалпакского филиала АН УзССР", 1991, Н4, с.66-92. (в-соавторстве с Д. Насировым).
14. Многоязычие в Каракалпакятане.-Б кн: Инженерная лингвистика и оптимизация преподавания языков". Республиканская конференция 28-Ю кая 1992. -Самарканд: Оа/у;г, 1935, с.45.
15. К проблеме многоязычия в Каракалпакстане. Б кн: Тези-
- 'ÍL> -
еы научно-теоретической конференции "Задачи упорядочения„терминов современного каракалпакского языка в условиях взаимодействия языков ".Нукус: ЬТШ,':1992, с.63-84 (Тиллерд1щ еэ-ара катнасыклгры яагдяйкяда з?езирги кяраг^амкщ тшшнин термииоло-гиясын тэртипдестириу месчлелери).
16. К проблеме классификации тюркских языков-"Вестник каракалпакского отделения АН .Республики Узбекистан", 1996, N-1, С. 117-119,
17. К проблеме язык или диалект в условиях младописьменных языков. - ''Вестник каракалпакского отделения АН Республики Узбекистан". 1S95, U-'З. а. -108 -111.
18. Адаптация'тюркских языков с позиции экономии аффиксов. - "Вестник каракалпакскогЬ отделения ' АН Республики Узбекистан", 1995. N-2, с. '135-142.
19. Квантитативное моделирование тюркских языков (Гуркий тиллерде квантитагиЕлик иодадлестиряу методлары). -■ Нукус: "Кара^ализкстан мугаллими", 1996, 3-4, с.26-30.
20. Вопрос о создании квантитативно-типологической.классификации тюркских ' языксв (Туркий тшиердич квактптатвд--лик-тшоло! лялыр; классификация™.'! келиплесткркУ мэселеси). -Нукус: "Каракалпакегзл мугаллпмп", 1596, '3-4, с.
21. Синтетизм в квантитативной типологии тюркского текста. -Нукус: "Вестник каракалпакского отделения АН Республики Узбекистан", 1997, И1, С. 12S-133. •
22. Теореэттсклй коэффициент заполнения в квантитативной типологии тюркского 'Текста. -Нукус; "Еестник кэракалпакс-ксго отделения АН Республики Узбекистан", 1097, N1,-с.133-136.
РЕЗЮМЕ
^сэирги ззмон ликгво- статистик уоулларя ердамида каттз хзлмдаги масс ив да корзк,алпск, тшишвнг мегвдарв мзтеризллари-нинг хар хил жанрлари буйича (эпос, журнал, газета, поззпя, реши) тадки^от ишларп олиб Сг^илдк. Утказклган зкеперппеьт-лар натикаеида биринчи марта беш. ш жанрдагк керзкалпок ти-лининг лексик ва мерфелогик статнстнкаси ургакилди. Олиигак маълумотлар Ьою^з туркий тшшзри билзн к.пес ланд и (зсосак узбек ва !чОЗС1^ тнллэря ' билан) • By киеслаилар хозлрги зодон лингвоста'тистикзсидзги янги усуллари булгая Сппрыеншшг ранг-лн корреляцияен ва- Г. П.Медьникавнинг детерминантлэрлки фейда-ланиб, ^/ракаяпок, ^о?ок, ва узбек тиллари орасидаги лкдилик парачалари анщланди. Албатта бунда)! лингвистик' сбъектлар орасидаги • Я|«шеик' даракааарши аииадайдиган усудпар ёрдашда туркшуносликдаги энг долзарб ва ь;инин булган туркий тиллари-шшг тэсшщий муаммосини кап кллш имкониятларини яратзди.
Еу усулларни HaiaigaT туркип тилларпда, г/ бйван бирга хшд-еврспа, фин-угор, кавказ ва семит тилларида к,уллансз бу-лади.,
problenies and techuigue of guantitative-typologis measurement of the relationship bol.we'jn Xurkik langiiados Suinniaiy
■ The' goal of the research eiiSJribcd sbavi 15 tu investig-ate 'the applicability oi. lin'juc-statistical .arid computational technigue to the descripteon of Кагзкз1рак texts, arid to the relationship cf Turkik la'^i-^s.
Using .the • linguistic engineering tec!;nigae з -larg*
oariipls of Karakalpak texis has been tested. The information resulting from th?ss tests has been correlated with the similar data obtained by the precursors from l/sbek and Kazakh tents.
Giving а stannary of the earlier research (Sektaev, Bsbsnarov, Haktaidov, Mukhamedov ets ab.), usinsr (the thesis of "Turki tktermínant" of G.Melnlkqv and nti idea of speech structure (Arsikuiov), as well as applying' the rank correlation coefficient arid other statistical technique to his arm experimental data the author show that Karakslpsk basic word stock approaches gradually to the Uzbek lexicon moving av/зу from the Kazakh lexical norm.
P.S. Автор глуби® признателен за ценные критические замечания заслуженному деятелю наука Р3>, члену Академия кибернетики 'одоблея" (Италия-Румыния)' и Академик российских вемцеаг доктору филологических наук, профессору Пиотровскому Р.Г.
О '
Подписано к печати 21. X, 97г. Заказ У- 104 Тирах 100 экз. Оьвы 2, 5 я/я.
Отпечатана на ротапринте £Б АН Республика Узбекистан г.Ташкент