автореферат диссертации по филологии, специальность ВАК РФ 10.02.02
диссертация на тему: Квантитативная характеристика татарского слова
Полный текст автореферата диссертации по теме "Квантитативная характеристика татарского слова"
о*
На правах рукописи
РИЗВАНОВА Лениза Миннехалафовна
КВАНТИТАТИВНАЯ ХАРАКТЕРИСТИКА
ТАТАРСКОГО СЛОВА
(на материале отдельных функциональных стилей татарского языка)
10.02.02. - Языки народов
Российской Федерации (татарский язык)
Автореферат диссертации на соискание ученой степени кандидата филологических наук
КАЗАНЬ — 1996
Работа выполнена на кафедре "Татарский язык в иноязычной аудитории" факультета татарской филологии, истории и восточных языков Казанского государственного университета.
Научный руководитель
- кандидат филологических наук доцент Ф.С. САФИУЛЛИНА
Научный консультант
кандидат технических наук доцент Д.Ш. СУЛЕЙМАНОВ
Официальные оппоненты
член-корреспондент Академии* наук РТ доктор филологических наук профессор ГАНИЕВ Ф.А.
кандидат филологических каук доцент САЛИМОВ Х.Х.
Ведущая организация Казанский государственный
педагогический университет
Защита диссертации состоится ^декабря 1996 года в 9.00 час. на заседании диссертационного совета К 003.39.01 по присуждению ученой степени кандидата филологических наук по специальности 10.02.02. - Языки народов Российской Федерации (татарский язык) в Институте'языка, литературы и искусства имени Г.Ибрагимова Академии наук Республики Татарстан по адресу: 420503, г.Казань,, ул. Лобачевского, 2/31
С диссертацией можно ознакомиться в Научной библиотеке Казанского научного центра Еоесийской АН (г.Казань, ул. Лобачевского, 2/31).
Автореферат разослан " " ноября 1§96 г.
Ученый секретарь диссертационного Совета ^^ХЗ^ З.З.Рамеев
кандидат филологических наук "
I. ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность проблемы. Необходимость применения количественных методов"при изучении языковых явлений диктуется с&мой природой языка,- так как любому языку присущи количественные характеристики: в языке ограниченное количество букв, ■ фонем, типов слогов, грамматических и лексических морфей, синтаксических конструкций, каждый из.которых встречается с определенной частотой и обладает индивидуальными способностями сочетаться с другими единицами. Во многих случаях количественные характеристики могут служить сигналом, направляющим внимание исследователя на некоторые скрытые от "простого наблюдения качественные особенности и закономерности языко-^вых явлений. Следует 'отметить, что в зарубежном и .отечественном языкознании накоплен большой опыт применения*количественных методов в исследовании языковых явлений. Эти исследования получили статус отдельной науки под разванием '"квантитативная лингвистика", основной задачей^которой является применение количественных методов для раскрытия законо- • мерностей функционирования единиц языка в речи, а также,установление закономерностей построения текста. По мере развития квантитативной лингвистики как отдельной науки, вероятностно-статистические методы математики стали' использоваться для характеристики функциональных стилей различных языков.
До сих пор в татарском языкознании исследования в области стилистики проводились на базе традиционного 'анализа языкового состава отдельных функциональных стилей. Это,- работы X.Р.Курбатова/1/, В.X.Хакова/2/, Ф.С.Сафиуллиной/З/,'
1. Курбатов Х.Р. Татар теленец синтаксис Ьэм стилистика' мэсьэлэлэре. - Казан: Тат. кит. нэшрияты, 1956. - 176 б. Курбатов Х.Р. Хэзерге татар эдэби теленец стилистик система-сы. - Казан: Тат. кит. нэшрияты, 1971. - 192 б.
2: Хаков В.Х. Татар теле стилистикасына кереш. - Казан: Казан'ун-ты нэшрияты, 1963. - 168 б. Хаков В.Х Матур эдэбйят тел стиле. - Казан: Казан ун-ты.нэшрияты, 1967. - 53 с.
3. Сафиуллина Ф.С. Синтаксис татарской разговорной речи. - Казань: Изд-во Казан, ун-та, 1978. - 254 с.
И.Башировой/1/, И.Низамова/2/, И.Абдуллина/3/, в которых определяется^ арсенал изобразительных средств, характерных для того или иного стиля татарского языка. Известно, что функциональные стили языйа отличаются друг от друга прежде всего ■устойчивыми -частотами лексических и . грамматических единиц/4/. Исходя из этого, в данном исследовании к истолкованию языковых стилей татарского языка мы подходим с позиций количественных представлений и характеристик.
Актуальность изучения данной проблемы определяется современным статусом татарского языка, как государственного. В рамках реализации "Закона о языках народов Республики Татарстан" существует необходимость в расширении учебно-методической базы татарского языка, которое предполагает создание словарей-минимумов татарского языка, составление школьных и вузовских учебников, , учебных словарей и методических пособий по татарскому языку с учетом припципа частотного распределения лексических и грамматических единиц языка. Данное исследование является в.определенной степени научной базой Частотного словаря татарского языка.
О потребности в таких разработках можно судить по интересу, проявленному к данному исследозанию во время апробации его фрагментов на презентации программной продукции совместной научно-исследовательской лаборатории АНТ и КГУ "Проблемы искусственного интеллекта" в' АН Татарстана в декабре 1994 года, на международном симпозиуме "Компьютерный фонд терминов тюркских языков" в г.Шымкенте (Казахстан) в ноябре 1995 года. • ' '
- Цель исследования заключается в'выявлении дифференциальных и интегральных признаков отдельных функциональных стилей татарского языка методами лингвистической статистики.
1. Баширова И.Б. Суз белэн сурат ясау. - Казан: Тат. кит. нэшрияты, 1974. - 176 б.
2. Низамов И.М. Уем - тел очында. •- Казан: Тат. китап нэшр., 1995. - 287 б.
-3. Абдуллин И.А. Г.Камал драмаларынын теле. - Казан: Татарстан китап нэшрияты, 1968. - 198 -б.
4. Головин Б.Н. Язык и статистика. - М.: Просвещение, 1971. - с.121.
Поставленная цель определяет следующие конкретные задачи. которые решаются в работе:
- анализ работ, посвященных проблемам квантитативно-системного исследования языковых явлений;
- уточнение круга понятий и единиц анализа, которыми оперирует современная квантитативная лингвистика;
- определение объема репрезентативной выборки, необходимой для квантитативного исследования татарского языка;
- изучение возможностей автоматизации процессов, связанных с обработкой татарских"текстов, с помощью компьютерных программ;
- исследование статистической структуры татарского языка: выявление таких статистических характеристик текста, как средняя частота словоформы (СФ), покрываемость Текста, доля высокочастотных и низкочастотных СФ.-в тексте, длина СФ в буквах и слогах;
- изучение поведения данных статистических характеристик в отдельных функциональных стилях татарского языка;
- сравнительный лингвостатистический анализ лексики отдельных жанров стиля художественной литературы (проза и поэзия) и информационного жанра газеты на базе полученных частотных словарей;- '
- изучение общеупотребительной лексики, характерной для всех исследуемых жанров языка;
' - выявлёние лингвостатистических закономерностей употребляемости отдельных грамматических категорий имен существительных и глаголов в зависимости от функционального стиля.
Объектом исследованик стали татарские тексты общим объемом в 500 тысяч словоупотреблений, представляющие собой одинаковые выборки из художественных произведений 36 татарских писателей, 58 поэтов и информационных сообщений трех ведущих'республиканских газет: "Ватаным Татарстан", "Татарстан хэбэрлэре", "ШэИри Казан", периода 1993-1995 годов.
»
Степень изученности проблемы. Мысль об использовании количественных методов при изучении стилистического варьирования языка была высказане задолго до начала развития кванти-
- О -
тативной лингвистики/1/.
- Одним из первых осноеы вероятно зтно-статистйческого подхода к пониманию стилей языка заложил Б.Н, Головин. С этих позиций он дал "обновленное" определение.понятию функционального стиля языка: "Функциональные стили языка - это' типы его функционирования, соответствующие различиям социальной практики коллектива и отличающиеся друг от другё существенными различиями вероятностей языковых единиц и их категорий, достаточными для их совокупного качественного опознавания людьми на интуитивном уровне восприятия речи"/2/.
Начиная с 60-х годов, статистические методы все шире применялись в решении сложнейших проблем языковых и речевых стилей. В работах Б.Н.Головина/2/, Н.Д.АндрееЕ.а/3/, Г.Г.Бе-лоногова/4/, Р.М.Фрумкиной/5/, украинского коллектива под руководством В.И.Перебейнос/6/ и других исследователей собраны статистические данные, раскрывающие особенности функциональных и индивидуальных стилей различных языков. Возникшее
1. Виноградов"В.В. Современный русский язык. -_М., 1938.
— вып 1. - с. 155-156.
1. Головин Б.Н. Язык и статистика. - M ; : Просвещение, 1971. - fc.121. ' .
2. Андреев Н.Д. Статистико-комбинаторные методы в теоретическом и прикладном языковедении:- JL: Наука, 1967,- 403 с
3. Белоногов Г.Г. Автоматизированная , обработка научно-технической информации. - М., 1984. - 315 е.*
4. Фрумкина P.M. Роль статистических методов в лингвистических исследованиях. - М. : Изд-во Моск.. ин-та иностр. яз., 1982. - Вып.15. - с.Фрумкина P.M. Автоматизация исследовательских работ в лексикографии //•■■-ВЯ,- 1964.- N2.- с. 114.
5. Перебейнос В.И. li"'06 установлении статистических пара-
метров авторских•стилей // Частотные словари автоматическая
переработка лингвистических текстов.- Минск, 1968,- с.
84-91. Перебейнос B.C. Опыт и принципы составления частотно-
го словаря современного украинского языка // Статистическое '
и информационное изучение тюркских языков. - Алма-Ата, 1969.
- с. 7-10.
на стыке лингвистической науки и литературоведения, с Одной стороны, •и математической статистики, с другой, это направление впоследствии получило статус самостоятельной дисциплины под названием "стилеметрия" /1/.
Научная новизна данного исследования заключается в том, что в татарском языкознании.это - первая попытка применения статистических методов к изучению функциональных стилей языка. В исследовании:
- разработаны конкретные подходы и методы лингвостатис-тического анализа татарских текстов;
■ — определены и обоснованы критерии отбора текстов для лингвостатистического анализа татарского языка;
- определены возможности автоматизг.ции многих процессов, связанных с обработкой татарских текстов;
- выработаны принципы • лингвостатистического анализа лексических у: грамматических единиц татарского языка на базе •частотных словарей.
■Теоретическая и практическая значимость диссертации состоит в том, что результаты, полученные в процессе исследования, могут быть использованы при сопоставлении большого статистического.материала, накопленного по индоевропейским языкам флективно-аналитического строя, с новым статистическим материалом по языкам агглютинативного строя, при сравнительно-сопоставительном изучении дистрибутивных характеристик самих тюркских языков (например,' татарского, башкирского ,. казахского, узбекского и т.д.). Данное исследование позволит решить такие теоретические.проблемы, как например, выявление статистической структуры татарского текста, определение словарного состава татарского языка, описание некоторых общелингвистических особенностей стилей языка, выделяющих ее в ряде других стилей. В связи,с этим, возможно, иное освещение получили бы -важные проблемы общей лексикологии:
1. Алексеев П.М., Лудин Д.М. Опыт количественного исследования в Афганистике // Статистическое изучение стилей языка и стилей речи /Тезисы докладов и сообщений к республиканской научной конференции/. - Горький, 1970. - с.5.
проблема современной языковой нормы, функциональных стилей, индивидуального•стиля отдельных авторов. Статистические результаты диссертации могут быть использованы при решении проблем построения формальной модели татарского языка, а также при построении лингвопроцессора на основе выявленных количественных показателей татарского языка.
Наши результаты могут найти практическое применение при усовершенствовании лексикографических методов составления различных частотных словарей, словарей-минимумов татарского Языка, при составлении учебников и учебных словарей, при разработке систем! машинного перевода и различного•рода информационных языков и систем.машинного поиска, при создании Машинного фонда татарского языка.
Апробация результатов исследования. Материалы диссертации представлены на: итоговых научных конференциях Казанского государственного университета в 1993-1996 г.г.; Всероссийской научной конференции "Проблемы двуязычия в современных условиях" (КГПУ, ,1994 г.), международном семинаре "Компьютерная лингвистика и ее приложения"(Казань, 1995 г.), международном симпозиуме "Компьютерный фонд терминов тюркских языков" (г.Шымкент, 1995 г.), Всероссийской конференции, посвященной проблемам развития и преподавания-современной татарской литературы (АНТ, 1995 г.), научно-практической конференции "Проблемы обучения татарскому языку учащихся старших классов школ, средних специальных и высших учебных заведений" (КТУ, 1996 г.), международной конференции -'Тукай и духовная культура XX века" (АНТ, май 1996 г.), научном
семинаре "Формально-логические и компьютерные модели языков",
/
проходившем в рамках российской конференции по искусственному интеллекту "КИИ-96" (АНТ, октябрь 1996 г.).
Диссертация обсуждена и одобрена на заседании кафедры "Татарский язык в. иноязычной аудитории"
Структура диссертации. Работа состоит из введения, основной части, содержащей четыре главы,- заключения,' списка • использованных источников и литературы, приложения, где представлены таблицы, частотные словари исследуемых жанров.
II. ОСНОВНОЕ СОДЕРЖАНИЕ ДИССЕРТАЦИИ
Во введении формулируется цель и определяются задачи исследования, обосновываются актуальность и новизна работы, определяется ее теоретическая и практическая значимость.
Первая глава "Общие вопросы квантитативного исследования языка" состоит из четырех параграфов. В ней опреде'ляется круг понятий, которыми оперирует квантитативная лингвистика, выделяются единицы квантитативного анализа языка, рассматриваются типы частотных словарей, раскрываются возможности и основные характеристики компьютерных программ: ТАТКОР, АРМ лингвиста, АРМ К8ЛИМЭ, использованных для статистической, об--работки татарских текстов.
На основе обзора литературы по_ теме исследования прос-' леживается история возникновения •и. развития зарубежной и отечественной лингвостатистики, выделяются основные сферы применения статистических методов в языкознании, анализируются работы, посвященные применению количественных методов в тюркологии /1,2,3,4,5/.
1. Бектаев К.Б. Статистико-информационная типология тюркского текста. - Алма-Ата, 1978. - 182с..
2,. Ахабаев A.A. Статистический анализ лексико-морфологи-ческой структуры-казахской публицистики.- Алма-Ата, 1971.-24 с.
3. Ризаев С.А. Статолингвистический анализ структуры слова в современном узбекском языке // Материалы семинара "Статистическая оптимизация преподавания языков и инженерная лингвистика". - Алма-Ата, 1980. - с.180-182.
4. Байрамова Л.К. Вопросы машинного перевода. - Казань: Изд-во Казанского ун-та, 1973. - 96 с. Байрамова JI.K., Хали-това H.A. Изучение татарского языка методами прикладной лингвистики // Вспр. тат. яз-ия. - Казань, 1971.
с. 164-170.
5. Ибрагимов Т.И. Изучение слогов и структуры их сочетаний в татарском литературном языке. - Казань-, 1970.
В задачу исследования входило выявление количественных И- качественных критериев отбора текстов для статистического изучения татарского языка. При определении достаточного объема выборки для лингвостатистического исследования татарских текстов мы придерживались методики, выработанной Р.Г-Пиотровским и К.Б.Бектаевым/1/.
По. этой . методике ."объем выборки'определяется исходя из требований к покрываемое™ наугад взятого текста наиболее
частыми единицами составляемого списка"/!/ и вычисляется по г ,
формуле:
Н= —
V -
где N - объем текста;
Тр- постоянная, значение которой берется по заданному значению доверительной вероятности (надежности);
'^г относительная частота лексической единицы (ЛЕ), значение которой равно значению нижней границы достоверных частот Г;
g - относительная (допустимая) ошибка. Используя данную формулу и постоянные величины, которые выработаны в современной лингвостатистике, мы определили необходимый объем выборки для статистического исследования татарского языка. С этой целью был составлен частотный слойарь татарской прозы.' Оказалось, что 70%-ное покрытие татарского текста дает начальная Зона ЧС, включающая 3000 словоформ, при этом нижним порогом этого массива является £ =0,00006. Тогда: .
1,96 X (1-0,00006) Жтатарск. )=-----------------------. ~ 600 000.
0,33 х 0,00006 Таким образом, было выяснено, что для составления ЧС' татарского языка достаточна выборка объемом в 600 тыс. СУ.
Вследствие того,' что наше . иерледование предполагало статистическое изучение не всех функциональных стилей, та-
1. Пиотровский Р.Г., Бектаев К.Б., Пиотровская A.A. Математическая лингвистика. - М.:Высшая школа, 1972. - с.48.
тарского язкка, а лишь сравнительно-сопоставительный анализ отдельных жанров языка художественной литературы и публицистики (проза, поэзия и информационный жанр газеты), решено было ограничиться -выборкой объемом в 500 тыс. СУ. В частности, жанр прозы представлен текстами общим объемом в 200 тыс. СУ, жанр поэзии - в 100 тыс. СУ, информационный жанр газеты - в 200 тыс. СУ. С целью получения более достоверных результатов тексты жанра прозы и информационного жанра газеты' были разбиты на малые выборки одинакового размера (по 100 тыс. СУ каждая) и на микровыборки по отдельным авторам. '
Во второй главе "Статистическая структура отдельных стилей татарского языка" проводится математическое описание и обоснование статистических характеристик, получаемых в результате количественного исследования отдельных стилей татарского языка. Были изучены такие статистические характеристики татарского текста, как средняя частота (повторяемость СФ),. покрываемость,текста высокочастотными и низкочастотными СФ, срздняя длина СФ б буквах и слогах, распределение СФ по длине в разных жанрах языка. В результате количественного анализа установлено, что:
- показатели средней частоты слова (N/V) и разнообразия лексики (V/N) нё могут служить в качестве дифференцирующего' признака при сравнении жанров прозы, поэзии и газеты, так как эти. значения одинаковы во всех исследованных жанрах языка (N/V = 4, V/N = 0,2). В сбою очередь, данные показатели зависят от типа языка: в агглютинативном татарском и казахском языках 'средняя частота слова равна 4, а во флективном русском языке одно й то же слово в среднем повторяется 6 раз. Возможно, это связано с тем,"что агглютинативные языки характеризуются более богатыми возможностями формообразования, чем флективные языки..
- статистическую структуру отдельных жанров татарского, языка более детально раскрывают показатели- покрываемости текста высокочастотными и низкочастотными словоформами. Установлено, что доля высокочастотных СФ з газетных текстах
больше, чем в текстах прозы и поэзии, соответственно, количество редкоупотребляемых СФ больше в жанрах художественной
литературы. Так, например, в жанрах прозы и поэзии словоформы, употребляющиеся лишь один раз, покрывают 14,7% и 15,0% текста, а в информационном жанре газеты СФ с частотой 1 покрывают лишь 12,8% текста. Это связано с тем, что язык информационного жанра газеты характеризуется частым повторением одних и тех же лексических-единиц, основную часть которых составляют общественно-политические термины, названия государственных учреждений и организаций.
■ - в целом, словоформы, встречающиеся во,всех трех жанрах ,один и два раза, составляют 70% от общего числа СФ. Это говорит о том, что словарное богатство татарского языка заключается в объеме редкоупотребляемых слов. Однако в результате сравнительного анализа русского и татарского языкрв выяснилось, что в татарском.языке доля редкоупотребляемых слов несколько выше, чем'в русском языке. По данным словаря Л.Н.Засориной^в тексте объемом 120 тыс. СУ словоформы с частотой 1 и 2 покрывают .лишь 63% ЧС/1/ , тогда как в татарском языке доля редкоупотребляемых слов в частотном словаре, составленном, на. базе текстов' такого же. объема, составляет .76,3%. •
- о^ним-из эффективных • .стилеразличительных критериев, позволяющим дифференцировать отдельные жанры татарского языка, может служить длина слова, измеряемая как в буквах, так и в слогах. Так, например, установлено, что: а) средняя длина слова в газетном жанре равна шести буквам,- а в жанрах прозы и поэзии СФ в среднем состоит из пяти букв, б) доля длинных словоформ (десятибуквенных и'более) в текстах прозы и поэзии составляет лишь 6,9 и 6,5%, в то время как в жанре газеты их доля больше почти на 10%. и достигаот 16,2%, в) самая длинная СФ в текстах прозы состоит из 27 букв (хвлсез-лэнгвнндн-хэлсезлднде), в информационном жанре - 30 букв (санаторий-профилакторийларында), в поэтических же текстах -самое длинное слово состоит лишь из 23 букв{кактырмыйча-сук-тырмыйча), г) в газетных .текстах максимальной длиной облада--
1. Частотный словарь русского языка /под редакцией Л.Н.Засориной/. - М.: Русский язык, 1977, - 935с.
ет словоформа, состоящая из 14 слогов, а в текстах прозы и поэзии максимальная величина длины 'СФ в слоговом выражении равна лишь 9.
Общим показателем для всех жанров является то, что во всех жанрах-татарского языка распределение словоформ в тексте имеет регулярную, одновершинную форму с пиком на пятибук-венных СФ. Это значит, что татарском языке во всех исследуемых жанрах (в поэзии, прозе и газете) чаще всего употребляются пятибуквенные конструкции. Общим для всех жанров является и то, что наибольшую покрываемость татарского текста во всех жанрах дают двусложные конструкции..В целом, для-татарского языка характерны одно, двух,'трех .и четырехсложные конструкции, которые составляют 95,4 % текста: ' .
- существенные расхождения в распределении длин СФ наблюдаются при сравнительном анализе языков различного типологического строя. Во флективно-аналитических языках очень высока доля односложных слов: в английском художественном тексте односложные СФ составляют 66,8%, в русском языке односложные словоформы покрывают 33,9% художественного текста, в эстонской художественной прозе односложные СФ, покрывают 28,8% текста /1/. В агглютинативных языках односложные СФ занимают очечь небольшой процент: в турецком художественном тексте -1^,8%, в татарском тексте такого же стиля - 16%. Эти расхождения, видимо", объясняются тем, что флективные языки, особенно языки, в которых преобладают аналитические построения, используют гораздо большее число коротких служебных слов, чем агглютинирующие языки. Поэтому по мере усиления синтетизма доля, односложных' слов в тексте начинает, убывать.
Третья глава "Стилеобразующие лексические единицы татарского языка" посвящена лингвостатистическому изучению наиболее частотной лексики жанров художественной прозы, поэзии и информационного жанра газеты. С этой целью бь:ли исследованы лексические единицы, общие для всех жанров языка, и специфичная лексика. характерная для каждого жанра в отдельности.
1.Тулдава Ю. Проблемы и методы квантитативно-системного исследования лексики. - Таллин: "Валгус", 1987. - с.113.
В результате лингвостатистического.анализа обшей лексики, характерной для ведущих жанров стиля художественной ли' тературы (проза и поэзия) и"информационного жанра газеты установлено , что:_
- в состав общей лексики татарского' языка' входят собственно татарские слова и отдельные заимствования, которые составляют основной лексический фонд татарского языка. Эти единицы характеризуются наибольшей повторяемостью и покрывают 55,9% татарских текстов, что, в'основном, связано с их полифункциональностъю и многозначностью..
- самую активную часть общей лексики составляют служебные части речи: частицы (13,2%), послелоги и послеложчые слова (6,8%) и союзы (4,8%). Причина, их активности заключается в том, что: а)служебные слова являются основным звеном в речевой цепи, осуществляющим связь между словами (предложениями) и выражающим отношение говорящего к действительности, б) в отличие от знаменательных частей речи; служебные слова количественно исчислимы, то есть их число ограничено, в) служебные слова'имеют ограниченное количество форм словоизменения и синонимических вариантов.
- наиболее частотную зону словаря общей Лексики занима-' ют указательные, личные и определительные местоиме-
» ния(1б.6%), что связано с их анафорическими функциями.
- в зоне наиболее употребительной локсики находятся глаголы (7,2%). Среди них в десятку самых активных1 входят:' вспомогательный глагол иде(1958). глаголы булды(519). ди-де(498). килэ(430), була(351). булса(335). тора(390). ба-
• да(263), китте(253)/1/. которые помимо своей оснрвной функции (быть глаголом с самостоятельным лексическим значением) выполняют вспомогательные функции (словообразовательные, модифицирующие, модальные) в составе аналитических конструкций.
- имена сушестзит-ельные в татарском языке характеризуются меньшей повторяемостью и занимают зону среднечастотной лексики(6,4%), что вполне объяснимо. Во-первых, имена существительные принадлежат к той части лексики, которая неук-
1/ в скобках указана частота словоформы
лонко пополняется новыми словами. Во-вторых, имена существительные отличаются многообразием-синонимических вариантов. В-третьих, имена существительные отличаются богатством всевозможных словообразовательных и словоизменительных аффиксов. В-четвертых, эти части речи выражают более конкретные значения, чем, например, служебные части речи. В десятку самых активных существительных входят следующие .слова: ке-ше(543). куз(341). Казан(ЗЗЗ), халык(312), денья(369). дэу-лэт(298). кен(297). авыл(282). эш(260)).
. - имена прилагательные (1,7%) и наречия (2,5%) характеризуются наименьшей степенью повторяемости, что, возможно, объясняется двумя основными причинами. Во-первых, как части речи прилагательные и наречия ка уровне словаря трудно, различимы. Во-вторых, эти часта речи, как и существительные, располагают большим арсеналом синонимических вариантов, что позволяет избегать ненужных повторений. В десятку наиболее активных прилагательных входят слова яна(492). зур(378). ак(290),.сонгы(281), терлз(212). югары(188) матур(137), из-ге(136). беек(136). олы(121"). Среди частоупотребляемах наречий татарского языка оказались следующие: ' бик(675), тат-гын(401). хазер(527). буген(-347). Ьаман(314). гел(197). куп-тэн(188). элек(128). бергэ(194).' кинэт(139).
В результате лексикостатистического анализа были выявлены специфичные лексические единицы, характеризующие тот или иной жанр языка. Установлено, что: - ;
- информационный жанр газеты характеризуется активным употреблением слов', отражающих экономическую и политическую жизнь общества, проблемы государственного устройства, новые методы управления, различные фин'акЪовые вопросы: Татарстан ('476) . Россия(248) район(171). Республикасы(156) сум(149), шэЬэр(141). акча(138). республика(136). хез-мэт(135). рейсе(.134). мэдэният( 127). Президенты( 122). исе-мендэге(с:8). хэл(95) балалар(94). советы(94). урынбаса-ры(93).
- в отличие от других жанров ^ языка в информационном жанре имена' существительные занимают наибольший процент (3,9%).
- лексический состав жанра поэзии существенно отличается от лексики газеты. В данном жанре представлены слова, обладающие огромным, количеством прямых и переносных значений, отличающиеся метафоричностью, образностью, олицетворяющие различные стороны жизни. Многие из них выступают в составе фразеологических .оборотов. Это та лексика, которая составляет основной лейтмотив, основную тематику жанра поэзии: ко-яш(185). ~гомер(130). жан(117). ' жир(117). кунел(112). йе-рэк(109). жирдэ(108).
- в отличие от информационного жанра газеты в поэзии имена.существительные характеризуются меньшей повторяемостью и докрывают лишь 1,76% поэтических текстов, что свидетельствует об активном употреблении в данном жанре синонимов.
- наименьшей повторяемостью имена существительные характеризуются в художественной прозе. Здесь они покрывают лишь 0,79% текста, что, возможно, объясняется, во-первых, явным преобладанием в.жанре прозы местоимений (6,16%), которые заменяют имена существительные и помогают' избегать ненужных повторений. Во-вторых, художественная проза отличается разнообразием'сюжетов, разносторонней тематикой, отражающей разные явления жизни, что, в свою очередь, способствует качественному разнообразию лексических единиц- и, соответственно, уменьшению повторяемости одних и тех же словоформ. В-третьих, в художественных произведениях ведущее место занимают, не факты (как, например, в газете), а' действия, поступки, поведение персонажей. Наиболее активными существительными, характеризующими данный жанр являются следующие' существительные: суз(114). и'р(11'0). кыз(102).
- существенные -различия между жанрами раскрываются при анализе местоимений. Во-первых, наблюдается количественное различие, местоимений в разных жанрах та.тарского языка. Наибольшей повторяемостью они обладают в жанре поэзии*и прозы, в газете же степень повторяемости одних и техже местоимений примерно в два раза меньше. Во-вторых, наблюдается качественное разнообразие местоимений в разных ¡канрах татарского языка. Так, в информационном жанре газеты, который характеризуется отсутствием личностного начала, существенную роль
играют указательные и личные местоимения 3 лица. Жанр поэзии в отличие от всех других жанров носит личностный характер, здесь оценка происходящим событиям, явлениям дается от лица автора, поэтому самым активным местоимением в данном жанре является местоимение мин(755). Местоимения 1 и 2 лица покрывают 3,37% всех поэтических текстов. 0,7% текста покрывают здесь вопросительные местоимения, что связано с активностью эмоционально-экспрессивных предложений,' обилием в данном жанре форм риторического вопроса, а также стилистических приемов повтора. В художественной же прозе повествование может идти как от первого, так и от третьего лица, монолог сочетается с диалогом. Поэтому в этом жанре местоимения 1,2,3 лица распределяются примерно одинаково.
Четвертая глава "Стилеобразующие грамматические единицы татарского языка" посвящена изучению падежной системы имен существительных, исследованию временных форм и отдельных категорий татарских глаголов, выделению основных грамматичест ких показателей, характерных для" того или иного стиля языка.
В результате лингвостатистическрго анализа грамматических категорий'имен существительных в разных жанрах языка установлено, что:
- наиболее распространенной формой падежа в татарском языке является основной падеж (18,9%).
- - вторым по активности падежом в информационном жанре газеты является местно-временной падеж (5,4%). Причину его активности следует искать в специфике данного жанра: информационные сообщения строятся в форме ответов на традиционные вопросы: 'когда?' 'где?' л 'что?'. В отличие от жанра информации в жанрах художественной литературы вторым по активности падежом является направительный падеж (7,6%), что, видимо, _ связано с полифункциональностью данной цадежной формы. Следует отметить, что имена существительные, употребленные в Направительном падеже, имеют разную семантику в зависимости от жанра. Если в жанре поэзии аффиксы направительного падежа присоединяются к словам абстрактного характера то в прозе -к словам, обозначающим конкретные предметы или объекты.
-информационный жанр газеты отличается активностью притяжательного падежа (3,1), что, видимо, является следствием активного употребления в газете изафетных конструкций III типа. Активность изафетных конструкций III типа в жанре информации подтверждается также внсокочастотностью употреб--ления имен существительных в форме 3-лица единственного числа принадлежности В основном, эти конструкции состоят из' слов с конкретно-номинативным значением: названия-государственных учреждений и организаций, различные объекты и слова, указывающие на место и время проведения событий: республика-сы(156). рэисе(134). президенты(122). советы(94). урынбаса-ры(93). ■ башлыгы(90). хакимияте(90). директоры(75). райо-ны(71). идаросе(бЗ),' жэмгыяте(62). хужалыгы(59). министры (57) .
- формы винительного падежа имеют одинаковую частоту употребления во ' вс.ех исследуемых жанрах языка (3,3%). Нес-
'мотря на это, в жанре прозы он является третьим по активности падежом, в поэзии - четвертым, а в информационном жанре -лишь пятым. ' '
- Исходный падеж является одним из редкоупотребляемых падежей-во всех исследуемых жанрах (1,6%-). Однако по сравнению с двумя другими жанрами, в жанре поэзии данный падеж проявляет определенную активность(1240 СФ).
- информационный жанр газеты характеризуется пассивным употреблением имен существительных с аффиксами I и II -лица принадлежности. Выявлено лишь '66 слов с аффиксами принадлежности 1 и 2 лица единственного числа.
- наиболее частотны аффиксы I, II лица в поэзии (3 700 СФ). В этом жанре достаточно активно употребляются следующие существительные 1 лица единственного числа: жаным(65). хал-кым(58). илем(32). йэрэгем(29). телем(27). " кунёлем(25). улым(18). чагым(18). жырым(18). башым(17). В.прозе же аффиксы 1 лица присоединяются, в основном, к существительным, выражающим родственные отношения или же к словам религиозного характера: кызым(22). етием(22). ■Тенрем(21), энием(13). улым(12). Жаным(Ю)Ходаем(9)ярым(9) , балам(8), абыем(б).
- в отличие от жанров художественной литературы, в информационных сообщениях активность проявляют существительные .1 ' лица множественного числа с окончаниями -быз/-без. -ыбыз/-ебез: миллэттешлэребез(15). республикабызда(12). рес-публикабызнын(12). рсспубликабыз(11). халкыбызнын(11). жем-Ьуриятебезда(9). . жемЬуриятебезнен(8). башкалабызнын(8). те-лебезне(8).
В результате статистического анализа таких граммати-. ческих категорий глагола. как время, наклонение и неспрягаемые формы установлено, что;
- все -эти категории могут служить в качестве стилераз-личительнэго критерия при дифференциации отдельных функциональных стилей татарского языка.
- в количественном отношении временные формы наибольшее .распространение получили в жанрах художественной литературы (в прозе й поэзии 17,1 и 16,2%, в газете - лишь 10%). Причем, в жанре прозы наибольшей повторяемостью обладают глаголы прошедшего категорического времени (7,1%), а в поэзии - глаголы настоящего времени (6,7%). В информативном жанре газеты глаголы прошедшего результативного, настоящего и прошедшего категорического времени употребляются примерно в одинаковом количестве (3,6%).
- в отличие от жанров художественной литературы, в газетных- текстах активность проявляют глаголы страдательного .1
залога: ачылды(41). ителдё(40). бирелде(31).. алынган(31), уткэрелгэн(29). ителэ(29). кетелэ(29). уткэрелэ(28). алын-ды(26). тикшерелде(25). каралды(22), бирелгэн(23). куел-ган(23). биреле(21).
' -в жанре информации во всех трех временных формах употребляются глаголы: ит. кил, бул. ал, ди. чык. Причина их активности, видимо, связано с тем, что все эти глаголы участвуют в образовании сложных глаголов, выполняя при этом роль словообразующих (ит, кил',■■ бул), модифицирующих (ал, кил, чык) и модальных (ал, бул, кил) глаголов.
- в отличие "от жанров прозы и поэзии, в информационном жанре газеты активно употребляется форма настоящего времени глаголов яшэ. эшлэ._форма прошедшего категорического времени
глагола катнаш и форма прошедшего результативного времени глаголов уз. багышла.
- в жанре прозы наибольшую активность проявляют глаголы: ди,. бул. кил, ал. чык. которые представлены во всех трех временных формах (прошедшем категорическом, прошедшем результативном и настоящем). Глаголы китте. чыкты. калды одинаково активны и как самостоятельные, . и как модифицирующие глаголы, выражающие различные способы действия, а глаголы -бятляли. .алды. куйды чаще всего употребляются в функции вспомогательных глаголов.. Выполняя роль вспомогательных глаголов в составе аналитических конструкций, эти глаголы выражают различные значения, многие из которых, как выяснилось, зависят от семантики основного глагола. Так,.например, глагол чык с глаголами действия, движения чаще всего реализует значение исчерпанности действия, с глаголами чувственного восприятия, мышления и отношения-- значение^ раздробленности действия по объектам. Глагол куйды. употребляясь с глаголами звучания, состояния, выражает значение, однократного стремительного, действия,-а, сочетаясь с глаголами действия, данный глагол чаще всего выражает значение результативного действия .
- формы будущего неопределенного времени активнее употребляются в жанрах художественной литературы (1,9%' - в поэзии, 1,3% - в прозе, лишь 0,2% - в газете). Возможно, это связано с переносными значениями формы на -р, на которые указывают отдельные исследователи.
- редкое употребление будущего категорического времени свойственно для всех жанров (0,2%). Возможно, данное явление связано с тем, что в татарском языке достаточно много случаев, когда вместо будущего времени глагола нередко употребляется настоящее время. Глаголы будущего категорического времени 'реже всего встречаются в поэзии (0,05%). Редкое употребление форм будущего времени характерно и для других языков. Отдельные исследователи объясняют это явление психологическими причинами, связанными с тем, что изначально буду-
цее время внушает чувство неопределенности и страха/1/.
- в отличие от жанров художественной литературы, -в информационном жанре газеты встречаются лишь единичные случаи /потребления глаголов I и II лица (0,2%). Активнее всего глаголы I и II лица употребляются в жанре поэзии, в котором повествование чаще всего идет от лица автора (4%). В отличие от других жанров в.поэзии распространена форма I лица настоящего времени с окончаниями -мын/-мен (56 СФ). В художественной прозе формы I и II лица занимают лишь 1,8%. Возможно, это явление связано с тем, что в этом жанре глаголы I и II лица чаще всего употребляются в диалогической речи-, а монологическая речь, в основном, ведется от III лица.
- формы повелительного, условного и желательного наклонений проявляют наибольшую активность в жанре поэзии (3,2%), в котором как ни в одном из двух жанров, выражаются различные модальные отношения.
- в результате статистического изучения неспрягаемых Ьорм глагола установлено, что в информационном жанре газеты активны формы имени действия (3,4%), в жанрах художественной литературы - инфинитивные формы (1,1%). Более того, в прозе и поэзии имеют место инфинитивные формы с формантом на -мак/-мэк. который по мнению отдельных исследователей явля-этся уже давно "отжившей" огузской формой/2/.
- среди деепричастий во всех исследуемых жанрах наибольшую активность проявляют деепричастия на -п (4,9%), часть которых выступает в составе аналитических конструкций.
- остальные формы деепричастий достаточно пассивны в татарском языке. Особенно редко встречается форма на -ган-чы(0,04).
- среди причастий в информационном жанре газеты преобладают причастия настоящего времени на -учы/-уче (0,7%), а в чанрах художественной литературы форма прошедшего времери на -ган/-гэн. -кан/-кэн (0,7%)-.
1. Гальперин И.Р. Текст как объект лингвистического «следования. - М.: Наука, 1981.. - 139 с.
2. Татарская грамматика в 3-х томах. - Казань: Тат. <ниж. изд-во, 1993, II т, с.232.
Заключение содержит основные результаты и краткие выводы исследования:
1. Использование количественных методов при изучении интегральных и дифференциальных признаков функциональных стилей татарского языка, а также при сравнении языков различного типологического строя позволяет получить эффективные и достоверные результаты.
2. В результате статистического анализа установлено, что значение средней частоты словоформы является интегральным (общим) признаком для всех исследованных жанров татарского языка.
3. Существенные различия между исследованными жанрами проявляются в показателях покрываемости текста высокочастот-ними и низкочастотными словоформами.
4. Одним из эффективных стилеразличительных критериев, позволяющим различать жанры прозы, поэзии и информационный жанр газеты, является средняя и максимальная длина словоформы. измеряемая как в буквах, так и в слогах. При этом общим показателем является то, что во всех жанрах татарского языка распределение словоформ имеет регулярную, одновершинную форму с пиком на пятибуквенных СФ.
5. Существенные различия между жанрами раскрываются при сравнительном анализе стилеобразуюших лексических единиц языка. Установлено, что" жанры прозы, поэзии и информационный жанр газеты отличаются особенностями употребления отдельных частей речи:, в информационном жанре наибольшую активность проявляют имена существительные, в прозе - местоимения и глаголы, в поэзии - местоимения I и II лица.
6. В результате лингвостатистического анализа общей лексики. характерной для всех исследованных жанров, выяснилось, что в ее состав входят собственно татарские слова и отдельные заимствования из'восточных.и русского языков. Наиболее частотную зону словаря общей лексики составляют служебные части' речи (частицы, послелоги и союзы), местоимения и , глаголы. В зону среднечастотной лексики входят имена существительные. Наименьшей повторяемостью обладают прилагательные и наречия.
7. Анализ .стилеобрззуюших грамматических единиц выявил значительные различия между жанрами в употреблении падежных форм имен существительных, в выражении принадлежности, в использовании временных форм и наклонений глаголов, в употреблении неспрягаемых форм глагола. Так, информационный жанр газеты характеризуется активностью местно-временного падежа,-а в жанрах художественной литературы активны имена существительные направительного падежа. В жанре прозы активность 4 проявляют глаголы прошедшего категорического времени, в поэзии - глаголы настоящего времени. В информационном жанре эти временные формы распределяются примерно одинаково. Формы условного, повелительного и желательного наклонений наиболее Активны в жанре поэзии. Общим для. всех исследованных жанров является то, что среди неспряцаемых форм глагола наибольшую активность проявляют деепричастия на - п.
8. В результате количественного изучения глагольных форм выяснилось, что в татарском языке по сравнению с синтетическими формами' активнее употребляются аналитические формы глагола. Контекстный анализ аналитических глаголов показал, что их семантика зависит нё только от значения основного глагола, но и от семантики и временной характеристики вспомогательного глагола..
9. Результаты компьютерных исследований о частотности и . активности употребления лексических и грамматических., единиц
в тексте подтверждают, в целом, предположения, имеющие место в татарских грамматиках.
10. Полученные статистические данные и их интерпретация •имеют важное теоретическое и практическое значение для дальнейших исследований по лексикологии, грамматике текста, составления практических, учебных, вузовских к школьных грамматик татарского языка.
Исследования в этом направлении могут быть продолжены в плане: 1) построения формальной модели татарского языка; 2) составления различных словарей (частотных, инверсионных, словарей морфем и т.д.); 3) более детального изучения лексической и грамматической сущности низкочастотных словоформ татарского языка, 4) компьютерного исследования наиболее
употребительных'аналитических конструкций глагола, -3) сравнительного лингвостатистического изучения лексики и грамматики разговорного стиля и драматургии, "а также других функ-
Ло теме диссертации опубликованы следующие работы:
1. Ризванова Л.М. Решение лингвистических задач в компьютерных системах // Материалы Всероссийской научной конференции "Проблемы двуязычий в современных условиях". -Казань: Изд-во КГПУ, 1994. - с.69-70.
2. Ризванова Л.М. Статистические методы в решении проблемы стандартизации . терминологической системы татарского-языка // Материалы Международной конференции "Компьютерный фонд терминов тюркских языков".- Турк1стан--Шымкент, 1995. -с.131-133. '
3. Сафиуллина Ф.С., Ризванова Л.М'. Квантитативная характеристика татарского - слова (на- материале' функциональных стилей татарского языка) // Исследования в лингвистике. Казань: Изд-во "Фэн", 1996, с.121-134.
4. Ризванова Л.М. Статистический анализ татарских текстов// там же. - с. 135-146.
5. РизЁанова Л.М., Якушев P.C., Хадиев P.M. Использование АРМ "Калима" в лингвистических исследованиях татарского текста. - Казань: Изд-во "Фэн", - 1996. - с.88-94.
Сцано в набор 31.10.96. Подписано в,печать 4.11. 96. Форм. бум. 60x84 1/16. Печ. п. 1, 5. Тираж 100. 3. 302.
циональпых стилей татарского языка.
i
Лаборатория оперативной полиграфии КГУ 420008 Казань, Ленина, 4/5