автореферат диссертации по филологии, специальность ВАК РФ 10.02.01
диссертация на тему:
Лингвистическое обеспечение и информационный потенциал компьютерного словообразовательно-морфемного справочника русского языка

  • Год: 1999
  • Автор научной работы: Сабаева, Эльвира Кутдусовна
  • Ученая cтепень: кандидата филологических наук
  • Место защиты диссертации: Казань
  • Код cпециальности ВАК: 10.02.01
Диссертация по филологии на тему 'Лингвистическое обеспечение и информационный потенциал компьютерного словообразовательно-морфемного справочника русского языка'

Текст диссертации на тему "Лингвистическое обеспечение и информационный потенциал компьютерного словообразовательно-морфемного справочника русского языка"

КАЗАНСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

На правах рукописи

САБАЕВА Эльвира Кутдусовна

ЛИНГВИСТИЧЕСКОЕ ОБЩПЕЧЕНИЕ И ИНФОРМАЦИОННЫЙ ПОТЕНЦИАЛ КОМПЬЮТЕРНОГО СЛОВООБРАЗОВАТЕЛЬНО-МОРФЕМНОГО СПРАВОЧНИКА

РУССКОГО ЯЗЫКА

10.02.01 - русский язык

ДИССЕРТАЦИЯ на соискание ученой степени кандидата филологических наук

Научный руководитель кандидат филологических наук, доцент К.Р.Галиуллин

Казань -1999

ОГЛАВЛЕНИЕ

1. ВВЕДЕНИЕ............................................ 4

1.1. Цели и задачи работы........................... 4

1.2. Обоснование темы. Актуальность работы.......... 5

1.3. Новизна работы................................. 9

1.4. Практическая значимость....................... 13

1.5. Терминология, используемая в работе........... 15

1.6. Краткое описание источников»!".. . ../>.......... 19

1.7. Краткий обзор литературы по"теме работы....... 22

1.8. Методы исследования........................... 23

1.9. Апробация работы.............................. 24

1.10. Структура работы............................. 24

2. ОСНОВНАЯ ЧАСТЬ..................................... 26

2.1. Словообразование и морфемика в современной лингвистике и лингводидактике...................... 26

2.2. Словообразование и морфемика в современной лингвографии....................................... 48

2.2.0. Вводные замечания........................... 48

2.2.1. Словообразовательные и морфемные словари.... 49

2.2.2. Словари русского языка: Словообразовательная характеристика лексики...................... 79

2.2.3. Словари русского языка: Морфемная характеристика лексики...................... 92

2.3. Компьютерно-лингвографическое описание

словообразования и морфемики русского языка..............119

2.3.0. Вводные замечания....................................................119

2.3.1. Принципы формирования компьютерного словообразовательно-морфемного справочника

русского языка........................................................................120

2.3.2. Информационные возможности компьютерного словообразовательно-морфемного справочника................135

3. ЗАКЛЮЧЕНИЕ................................................................................154

4. БИБЛИОГРАФИЯ..............................................................................161

4.1. Источники............................................................................161

4.2. Использованная литература............................................164

5. ПРИЛОЖЕНИЕ................................................................................179

1. ВВЕДЕНИЕ

1.1. Цели и задачи работы

Целью диссертационного исследования является обоснование и разработка лингвистического обеспечения и анализ информационного потенциала компьютерного словообразовательно-морфемного справочника, построенного на материале наиболее употребительной лексики русского языка.

Для достижения этой цели были поставлены следующие задачи, которые решались в ходе работы:

- анализ роли и места морфемики и словообразования в лингвистике и лингводидактике;

- отбор источников для описания словообразовательно-морфемных характеристик базовых лексем;

- анализ имеющихся морфемных и словообразовательных словарей, а также неспециальных словарей, статьи которых содержат соответствующую информацию;

- выявление особенностей компьютерного описания словообразовательно-морфемных данных;

- выбор стратегии компьютерного описания;

- разработка архитектуры автоматизированного справочника;

- формирование метаязыка словаря;

- создание первичной компьютерной версии словаря, на базе которой будет происходить дальнейшее развитие справочника;

- сбор и обработка лингвистического материала, обеспечивающего функционирование той части словаря, которая пред-

назначена для отбора лексем по предложенным признакам;

- определение круга возможных запросов;

- формирование системы "помощи";

- анализ корреляции ряда словообразовательно-морфемных характеристик между собой и с другими характеристиками языковых единиц;

- квантитативное (количественное) описание словообразовательно-морфемных данных, содержащихся в справочнике;

- анализ информационных возможностей справочника.

В процессе решения этих основных задач возникали и находили свое решение задачи более частного характера, как-то:

- выяснение характера отражения базовой лексики в существующих словарях;

- описание и классифицирование возникших различий в членении лексем, представленных разными лингвистическими источниками ;

- выявление словообразовательных отношений между производящими и производными словами базовой лексики для формирования деривационного гнезда, включающего употребительные лексемы;

- включение в словообразовательный компонент сведений о семантике словообразующих аффиксов как носителей деривационного значения слов;

- ввод и компьютерная обработка собранных материалов по морфемному членению базового словника и др.

1.2. Обоснование темы. Актуальность работы

В последние годы стал актуальным вопрос внедрения

компьютерных технологий в практику новейших лингвографичес-ких разработок, связанных с формированием нетрадиционных способов накопления и хранения лингвистических данных. В этом плане эффективным считается применение компьютеров в лингвографии и лингводидактике: это могут быть различные справочные системы, создаваемые для обработки информации, используемой в дальнейшем для корректировки существующих и издания новых справочников как общелингвистической, так и дидактической направленности, а также различные типы автоматизированных обучающих курсов.

В разрабатываемой Федеральной целевой программе "Русс-

и «■ О 4«

кии язык в качестве одной из важных задач указывается создание комплексных автоматизированных систем и банков данных по различным направлениям русистики". Поэтому организацию банка словообразовательно-морфемных данных можно назвать одной из актуальных проблем, решаемых компьютерной лингвистикой в настоящее время.

Перспективным направлением является также "создание компьютерной сети словарных картотек, исключающей длительный поиск нужного слова. Компьютерный массив информации может стать союзником и в планировании организационной работы над словарем, поскольку помогает не откладывать сроков реализации проекта" [Морковкин В.В., 1987, с.34].

Наличие современной, обширной и редактируемой лингвог-рафической базы позволяет быстро и своевременно формировать блок информации такого объема и наполнения, который требуется в данный рабочий момент. Оперативность и возможность информационного маневрирования является наиболее ценным и

перспективным качеством лингвистической компьютеризации, поскольку современные кибернетические технологии позволяют заменить устаревающую информацию новой, более актуальной и перспективной, не разрушая уже созданной структуры словаря. Доступность заложенной в нем информации большинству пользователей (например, благодаря компьютерным сетям), а также высокая точность выдаваемой информации и скорость ее получения делают компьютер базовым инструментом в такой развивающейся области науки, как компьютерная лингвография, связанная с компьютерными языковыми справочниками (словарями).

Именно эти положительные свойства кибернетического интеллекта, а также возможность, при необходимости, дидактической интерпретации материала, послужили отправной точкой соединения потенциала ЭВМ со словообразовательно-морфемной базой, которая является одним из основных компонентов, включенных в состав компьютерного лингвистического справочника, создаваемого в Казанском университете (см. подробнее [Компьютерная лингвография 1995]).

Морфемика и словообразование являются одними из важных лингвистических и лингводидактических областей, описываемые объекты которых отличаются особой сложностью и большой вариативностью в интерпретации вокабул.

Как известно, одним из ведущих принципов русской орфографии является морфологический (морфемный) принцип, который основан на одинаковом написании морфем, как наименьших значимых частей слова, независимо от их неодинакового произношения. Поэтому "для прочного усвоения правил правописания необходимо основательное знание состава слова, его словооб-

разовательной структуры" [Тихонов А.Н., 1995, с.4], информацию о которых можно почерпнуть из нашего справочника.

Формирование у каждого индивидуума (объекта обучения) навыков морфемного членения слова - важнейшая задача преподавателя (субъекта обучения). Подсчитано, что каждое девятое слово из десяти в русском языке является мотивированным, производным [Тихонов А.Н., 1978, с.4], они во многом определяют богатство русской лексики, поэтому так важна возможность получения достоверной и обширной деривативно-морфемной информации о словах.

Словообразование - способ пополнения лексического состава языка и знание деривационных особенностей слов во многом способствует повышению языковой культуры индивидуума. И в этом плане морфемология и дериватология как области линг-вографирования не потеряют своей актуальности никогда.

Достоинства компьютера неоспоримы в современной линг-вографии. Усиленное внедрение компьютеров в сферу ранее чисто лингвистическую, не обремененную техническими новшествами, на нынешнем этапе положения дел позволяет говорить о зарождении новых областей знания, таких как компьютерная линг-вография [см. Компьютерная лингвография 1995] и компьютерная лингводидактика, причем последняя развивается интенсивнее. Одна из основных задач, решаемых в рамках данного исследования - создание комплексного словообразовательно-морфемного справочника, данные которого при желании могут быть использованы не только в процессе обучения языку, но и, как уже не раз говорилось, в других областях лингвистики.

1.3. Новизна работы

Научная новизна нашей работы заключается в том, что это первый опыт создания комплексного компьютерного словообразовательно-морфемного справочника на базе употребительной лексики русского языка. Работы в этой области ведутся и другими научными коллективами страны, однако эти разработки отличаются узкоспециальной направленностью и не имеют такого комплексного характера, который пытаемся реализовать мы.

Так, например, в Луцком государственном педагогическом институте была разработана автоматизированная система сетевого семантического анализа лексики. В числе параметров, характеризующих отдельную лексему, представлен также и словообразовательный, который являет собой деривационные цепочки, либо начинающиеся, либо оканчивающиеся, либо включающие в себя подвергаемое анализу слово [Подпольный Д.Ф., 1990, с.27].

Группой прикладной семантики филологического факультета МГУ при разработке терминологического словаря была включена зона с морфемным структурированием машиностроительных терминов [Убин И.И., 1988, с.251]. Филологический факультет Санкт-Петербургского университета создал машиночитаемую версию известного словаря морфем А.И.Кузнецовой, Т.Ф.Ефремовой, при этом дополнительная информация, насколько нам известно, не привлекалась. Созданный нами автоматизированный справочник объединяет данные морфемики и словообразования и дополняет их более подробным анализом состава и структуры лексем, а также включает семантическую характеристику словообразующих морфов.

Дидактическая целесообразность такого объединения подчеркивается многими исследователями: "Иностранец [в данном случае это может быть важно и для носителя русского языка -Э.С.] должен овладеть единой лексико-словообразовательной системой языка. Иностранного учащегося не может полностью удовлетворить как чисто словообразовательный словарь русского языка, не дающий толкования значений слов, так и традиционный толковый словарь, предназначенный для носителей русского языка. Особую актуальность приобретает вопрос о целесообразности создания специального учебного толково-словообразовательного словаря, в котором толкование смысла "мотивированных" слов должно обязательно включать в свой состав слова мотивирующие. <. . . > Словообразовательная семантизация должна стать основным способом объяснения значения производных слов" [Буре H.A., 1987, с . 161] .

С нашей точки зрения, все вышесказанное может быть отнесено не только к иноязычной, но и к русскоязычной аудитории, ибо овладение лексико-словообразовательной системой языка необходимо также и нашим учащимся. Важной стороной создаваемого справочника является его построение на базовой лексике русского языка. Большинство рассмотренных словарей, формируя свой словник, привлекали низкочастотную лексику языка, в результате чего многие из проанализированных изданий не способны были дать информации относительно словообразовательно-морфемной характеристики интересующих нас базовых слов, так как часть из них отсутствовала в словниках большинства изданий (исключение составляют "Словообразовательный словарь русского языка" в двух томах А.Н.Тихонова (1990) и

"Морфемно-орфографический словарь" этого же автора (1996), а также "Морфемы русского языка" Зд.Ф.Оливериуса (1976) и "Лексическая основа русского языка" под редакцией В.В.Морковкина (1984)).

В предлагаемом нами компьютерном справочнике слово рассматривается с точки зрения его словообразовательных связей и отношений, возникающих в деривационной парадигме, описывается его морфемная членимость и раскрывается семантика словообразующих морфов. К тому же словарь отражает вариативность в структурном описании слов. Компоновка и фиксирование такого рода расхождений впервые применяется в лингвографи-ческой практике, такую масштабную работу целесообразно осуществлять только с помощью компьютера. Кроме того, в базе данных описывается тип морфем. Из привлеченных нами источников попытку зафиксировать тип морфем предприняли только авторы словаря "Лексическая основа русского языка" (1984) и Зд.Ф.Оливериус в "Морфемах русского языка" (1976). Но в первом словаре особым образом выделяется только окончание (причем суффиксы инфинитива выделяются аналогично окончаниям имен существительных и прилагательных круглыми скобками), в другом же предлагаемая типизация морфем является слишком сложной для восприятия и базируется, в основном, на формальных принципах.

Разработанная нами своеобразная архитектурная модель словаря включает обширную морфемную и словообразовательную характеристику каждого вошедшего в базу слова. К тому же, справочник может также функционировать в качестве словаря морфем. При желании компьютер может предоставить список фор-

мантов со сведениями о дистрибуции морфем, что также является преимуществом нашей разработки.

Использование компьютера в лингвографии дает возможность получить статистические данные для различных морфем, то есть выявить информацию по употребительности морфем, выявить частотность по частям речи, по употребительности морфем (например, как часто встречается данная морфема в составе базовых слов), по продуктивности морфем и словообразовательных моделей. На базе сходноморфемных слов можно получить информацию по словообразовательной омонимии.

Кроме того, как уже говорилось выше, фиксирование семантики морфемы не только информативно обогащает структуру словаря, но и расширяет имеющиеся у справочника дидактические функции, так как знание семантики морфем дает возможность активного овладения законами русского словообразования, что в свою очередь способствует совершенствованию уровня устной и письменной речи учащегося.

В нашем справочнике предпринята попытка отобразить слова со всеми его связями в словообразовательной и морфемной системе современного русского языка. Компьютерная форма изложения дает возможность быстро отыскать необходимые словарные сведения и позволяет легко ориентироваться в большом массиве информации.

В исследовании также дано методическое обоснование целесообразности построения компьютерного справочника, включающего широкий круг характеристик. При этом учитывалась и возможная лингвометодическая направленность создаваемого справочника, поскольку нами предполагалось также функциони-

рование его в качестве источника дидактического и справочного материала, необходимого как в процессе подготовки к занятиям, так и непосредственно на уроках.

При создании справочника принимался во внимание и небольшой объем словников существующих учебных словарей, что является, как говорилось выше, одним из выявленных недостатков, поскольку словарь не мог в достаточной мере способствовать расширению словарного запаса школьников, ведь "учебный словарь - средство формирования языковой компетенции учащихся" [Морковкин В.В., 1988, с.180], следовательно, минимизированный учебный словник и информативная недостаточность реализуемых параметров, косвенным образом, ведут к ограничению приобретаемых знаний.

Стремление создать словарь, отвечающий требованиям современной научной и, в том числе, учебной лингвографии, послужило толчком к формированию комплексного компьютерного лингвистического справочника на материале базовой лексики русского лит