автореферат диссертации по филологии, специальность ВАК РФ 10.02.21
диссертация на тему:
Семантико-синтаксическая актуализация глагольных омографов в условиях типового контекста

  • Год: 1998
  • Автор научной работы: Шульга, Александра Федоровна
  • Ученая cтепень: кандидата филологических наук
  • Место защиты диссертации: Санкт-Петербург
  • Код cпециальности ВАК: 10.02.21
Диссертация по филологии на тему 'Семантико-синтаксическая актуализация глагольных омографов в условиях типового контекста'

Текст диссертации на тему "Семантико-синтаксическая актуализация глагольных омографов в условиях типового контекста"

САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

На правах рукописи

Диссертационный совет К 063.57.52 Зашита состоялась 26 марта 1999г.

ШУЛЬГА Александра Федоровна

СЕМАНТИКО-СИНТАКСИЧЕСКАЯ АКТУАЛИЗАЦИЯ ГЛАГОЛЬНЫХ ОМОГРАФОВ В УСЛОВИЯХ ТИПОВОГО

КОНТЕКСТА (на материале политических статей французской прессы)

Том I

Специальность 10.02.21 - Структурная, прикладная и

математическая лингвистика

Диссертация на соискание ученой степени кандидата филологических наук

Санкт-Петербург 1998

ОГЛАВЛЕНИЕ

I том

Список сокращений........................................................................6

Введение......................................................................................8

Глава I. Принципы семиотического моделирования..............................15

1.0 Вводные замечания...........................................................15

1.1 Общая характеристика омографичного знака............................15

1.2. Семиотическая модель омографичного знака.........................20

1.2.1 Компонентный состав омографичного знака......................21

1.2.2 Отношение "знак - референт"........................................25

1.2.3 Отношение "знак - участники коммуникации"..................26

1.2.4 Отношение знака к другим знакам в парадигматике............27

1.2.5 Отношение знака к другим знакам в синтагматике..............30

1.3 Определение понятия "типовой контекст"..............................32

1.3.1 Схемы построения типового контекста............................35

1.3.2 Актуализация глагольных омографов в типовых контекстах.41 Выводы...........................................................................47

Глава II. Семантико-синтаксическая актуализация глагольных омографов

в рамках типовых контекстов.............................................48

2.0 Вводные замечания.........................................................48

2.1 Отбор глагольных омографов в подъязыке публицистики.........48

2.2 Типология глагольной омографии.......................................51

2.3 Выделение границ типового контекста.................................58

2.4 Характеристика типовых контекстов...................................60

2.5 Организация алгоритмов МП в системе MULTIS....................66

2.6 Актуализация глагольных омографов на уровне перевода лексических единиц ...............................................................67

2.6.1 Семантический фильтр словаря оборотов..................67

2.6.2 Именные машинные обороты.................................69

2.6.3 Машинные обороты предложений...........................70

2.6.4 Аналитический предлог.......................................71

2.6.5 Аналитическое наречие........................................73

2.6.6 Аналитический союз............................................74

2.6.7 Аналитическое прилагательное..............................75

2.6.8 Аналитический глагол..........................................76

2.6.9 Омография аналитических единиц...........................79

2.7 Актуализация глагольных омографов на уровне перевода функциональных сегментов...............................................79

2.7.1 Функциональный сегмент сказуемого........................80

2.7.2 Функциональный сегмент подлежащего......................94

2.7.3 Функциональный сегмент прямого дополнения..........96

2.8 Актуализация глагольных омографов на уровне перевода предложения................................................................100

2.8.1 Функциональный сегмент сказуемого........................101

2.8.2 Функциональный сегмент подлежащего....................104

2.8.3 Функциональный сегмент косвенного дополнения........107

2.8.4 Актуализация прилагательного и причастия прошедшего времени..............................................................110

2.8.5 Актуализация прилагательного..................................113

2.8.6 Актуализация причастия прошедшего времени..............117

2.8.7 Актуализация предлога..........................................121

2.8.8 Актуализация наречия.............................................128

2.8.9 Актуализация союза...............................................129

Выводы.........................................................................131

Глава III. Машинная реализация воспроизводящей инженерно-лингвистической модели устранения глагольной омографии................132

3.0 Вводные замечания..........................................................132

3.1 Принципы построения СлСт в двуязычном словаре..................132

3.2 Выбор единицы входного описания....................................134

3.3 Лингвистическая информация в структуре СлСт....................137

3.4 Структура СлСт глагольного омографа................................139

3.5 Процедура актуализации глагольных омографов на разных уровнях перевода ..........................................................158

3.6 Классификация и анализ ошибок машинной актуализации глагольных омографов.....................................................162

3.7 Заключительные замечания...............................................170

Заключение...............................................................................171

Литература................................................................................173

II том - Приложения................................................................П-1

Приложение I. Список глагольных омографов, функционирующих

во французских публицистических текстах..........П-2

Приложение 1-1 Список глагольных омографов типа V/P.........П-2

Приложение 1-2 Список глагольных омографов типа V/N.........П-2

Приложение 1-3 Список глагольных омографов типа V/A.........П-4

Приложение 1-4 Список глагольных омографов типа V/C..........П-4

Приложение 1-5 Список глагольных омографов типа V/E..........П-5

Приложение 1-6 Список глагольных омографов типа V/V..........П-44

Приложение 1-7 Список глагольных омографов типа V/N/E........П-44

Приложение 1-8 Список глагольных омографов типа V/A/E.......П-53

Приложение 1-9 Список глагольных омографов типа V/P/E........П-59

Приложение 1-10 Список глагольных омографов типа V/N/A......П-59

Приложение 1-11 Список глагольных омографов типа V/A/D......П-59

Приложение 1-12 Список глагольных омографов типа V/N/A/E.. .П-60 Приложение 1-13 Список глагольных омографов типа

V/N/A/D/E...............................................П-65

Приложение 1-14 Список глагольных омографов типа

V/N/A/P/E...............................................П-66

Приложение II. Список глагольных омографов, функционирующих

в машинных оборотах и аналитических словах.......П-67

Приложение II-1. Список машинных именных оборотов........П-67

Приложение П-2. Список машинных оборотов предложений.. .П-78

Приложение П-З. Список аналитических прилагательных.......П-79

Приложение П-4. Список аналитических союзов...................П-80

Приложение П-5. Список аналитических наречий..................П-81

Приложение П-6. Список аналитических предлогов................П-90

Приложение П-7. Список аналитических глаголов..................П-97

Приложение П-8. Список омографичных аналитических единиц,

включающих глагольный омограф.............П-10 8

Приложение III..................................................................П-111

Приложение III-1. Список глаголов, модифицирующих значение в безличной конструкции..................П-111

Приложение Ш-2. Список глаголов, модифицирующих значение в связочной функции.....................чП-112

Приложение Ш-З. Список глаголов, модифицирующих значение в сложном глагольном сказуемом.....П-113

Приложение Ш-4. Список глаголов, модифицирующих значение в возвратной форме......................П-115

Приложение IV. Список слов с управлением на а.......................П-124

Приложение IV-1. Список существительных с управлением

на а............................................. .П-124

Приложение Г/-2. Список прилагательных с управлением

на а.............................................,П-127

Приложение А/-3. Список глаголов с управлением на а... П-131 Приложение V. Результат машинного эксперимента.................П-146

СПИСОК СОКРАЩЕНИЙ

АПТ - автоматическая переработка текстов АС - автоматический словарь АСА - автоматический синтаксический анализ ACO - автоматический словарь оборотов

ВИЛМ - воспроизводящая инженерно-лингвистическая модель

ЕЯ - естественный язык

ИЛ - инженерная лингвистика

ЛА - лингвистический автомат

ЛГК - лексико-грамматический код

ЛЕ - лексическая единица

ЛИБ - лингвистическая информационная база

ЛЭС - лингвистический энциклопедический словарь

МО - машинная основа

МП - машинный перевод

МФ - машинная флексия

СлСт - словарная статья

с/с - словосочетание

с/у - словоупотребление

с/ф - словоформа

ТП - типовая парадигма

ФС - функциональный сегмент

ФРФС - французско-русский лингвистический словарь ЯЗ - языковой знак а - сигнальный референт Сп - коннотат

Dn - денотат Ds - десигнат

Dsg - грамматический десигнат

Ds' - лексический десигнат

J - имя

LF - Le Figaro

LH - L'Humanité

LM - Le Monde

r - референт

R - отношения между компонентами знака TLF - Trésor de la langue française. Dictionnaire XV - глагольный омограф ®g - грамматический тезаурус 01 " лексический тезаурус

ВВЕДЕНИЕ

Актуальность проблемы. Современный этап научно-технической революции сопровождается колоссальным ростом объема политической, технологической и других видов информации. На первый план выдвигается задача оперативной переработки текстов, написанных на естественном языке, с помощью современных средств вычислительной техники.

Однако успешное выполнение этой задачи немыслимо без решения одной из главных проблем автоматической переработки текстов (АПТ) вообще и машинного перевода (МП) в частности - проблемы омографии /Апресян и др. 1989, 53-60; Малаховский 1990; Cotrell 1989; New directions in machine translation 1989/.

Необходимость устранения этой проблемы определяет актуальность исследования возможностей разрешения глагольной омографии в условиях типовых контекстов через построение воспроизводящей инженерно-лингвистической модели (ВИЛМ) переработки омографов.

При этом, с одной стороны, проблема омографии глагола приобретает особую важность, поскольку автоматический синтаксический анализ (АСА) текстов опирается на вербоцентрический синтаксис Л.Теньера, согласно которому ядром высказывания в единице речевой коммуникации -предложении - является предикат. С другой стороны, с психолингвистической точки зрения аппарат понимания предложения человеком либо процессором включает в себя лексическую и морфологическую информацию, построение синтаксической структуры предложения и, наконец, его семантическую интерпретацию/Секерина 1996, 100/. Известно, что только с момента

получения глагола-сказуемого слушающий владеет синтаксической структурой высказывания/Норман 1978, 132/.

Кроме того, использование функционального подхода к анализу языковых явлений стимулирует изучение процессов варьирования языковых средств при их актуализации.

Вместе с тем неуточненными являются теоретические аспекты проблемы омографии в части определения омографов, их типологии, актуализации омографов в их речевые корреляты в конкретном речевом акте. Эти проблемы до сих пор не рассматривались в плане знаковой концепции языка.

Следовательно, актуальность исследования омографии как одного из наиболее ярких проявлений нечеткости лингвистических объектов и асимметрии знака обусловлена не только прикладными целями, но и необходимостью дальнейшего теоретического изучения омографов.

В соответствии с этой проблематикой определяется цель диссертационной работы, которая заключается в исследовании механизма семантико-синтаксической актуализации глагольных омографов в условиях типовых контекстов, а также в развитии теории омографии с учетом знаковой концепции языка.

Поставленная в работе цель реализована в ходе решения следующих

задач:

- Исследование семиотической природы омографичных знаков с целью обнаружения лингвистических признаков, диагностирующих однозначность омографов в речи.

- Анализ типов омографии и разработка типологии глагольной омографии.

- Установление набора типичных дистрибуций для каждого вида глагольного омографа и на этой основе составление классификации типовых контекстов.

- Построение ВИЛМ разрешения глагольной омографии.

- Разработка словарной статьи (СлСт) омографа в автоматическом словаре (АС).

- Проверка адекватности модели, включающая анализ типичных ошибок и коррекцию действующей ВИЛМ с целью ее дальнейшего совершенствования.

Объект и материал исследования. Объектом исследования являются глагольные омографы, функционирующие во французском тексте. Базой практической реализации теоретических положений является практическая система МП SILOD-MULTIS, разработанная в лаборатории машинного перевода РГПУ им. А.И.Герцена. Ориентация этой системы на перевод информационных сообщений определила специфику настоящего исследования, которая состоит в том, что в используемой в системе МП машинной орфографии снята диакритика. Этот факт создал наряду с присущей французскому языку омографией целый слой искусственной омографии (см. 2.2). Кроме того, проблема снятия омографии решается в рамках указанной выше системы, в которой переводные эквиваленты настроены на специфику публицистических текстов французской прессы (см.2.1).

Материалом исследования послужили политические статьи и информационные сообщения французских газет "Le Monde", "Le Figaro", "L'Humanité" за период с 1987 по 1993 гг. Общая выборка составила приблизительно 800000 словоупотреблений (с/у).

В работе используется методика семиотического моделирования, элементы дистрибутивного, валентно-дефиниционного и компонентного анализа, инженерно-лингвистическое моделирование на ЭВМ.

Научная новизна работы определяется комплексностью исследования глагольных омографов, впервые проведенного с использованием инженерно-лингвистического моделирования, методов дистрибутивного, валентно-дефиниционного и компонентного анализа. Существенно новыми являются следующие аспекты работы:

- построение семиотической модели омографичного знака;

- составление словаря глагольных омографов, характерных для газетного стиля;

- установление набора типовых контекстов, актуализирующих омографы;

- разработка процедур анализа глагольных омографов в системах АПТ;

- компьютерная реализация разработанных алгоритмов распознавания омографов.

В этом плане лично автором получены следующие результаты:

1. Разработана семиотическая модель омографа.

2. Составлен словарь французских омографов, функционирующих в публицистических текстах.

3. На основе словаря описана типология глагольной омографии.

4. Проведена систематизация типовых контекстов, актуализирующих омографы.

5. Составлен словарь машинных оборотов, включающих в свой состав омографы.

6. Построена ВИЛМ семантико-синтаксической актуализации омографов в речевом построении.

7. Проведена систематизация ошибок в машинной реализации ВИЛМ.

Основные теоретические положения, выносимые на защиту

1. Омограф рассматривается как сложный знак, имеющий идентичное означающее (в графической форме) и два или более означаемых, каждое из которых обладает собственным десигнатом, денотатом и коннотатом и характеризуется собственными значимостями и валентностями.

2. Актуализация глагольных омографов происходит в типовых контекстах, представляющих совокупность типовых формально фиксированных условий, разрешающих омографию. Типовые формально фиксированные условия представляют собой потенциальные валентностные характеристики омографа.

3. Эффективность работы построенной воспроизводящей инженерно-лингвистической модели актуализации глагольных омографов предопределена лингвистической информацией, заложенной в словарную статью омографа.

Практическая ценность исследования состоит в разработке методики устранения омографии в системе 81ЬОО-М1Л_/П8. Реализация программ и алгоритмов на ПЭВМ осуществлена программистами П.В.Клочковым и Т.А.Каничевой. Результаты работы могут быть использованы в курсе теоретической и практической грамматики французского языка, в разделе "малого" синтаксиса и в соответствующих разделах лексикологии и семантики в дидактических целях.

Апробация результатов исследования. Основные положения работы обсуждались на IV симпозиуме по лингвистическим проблемам искусственного интеллекта в г. Санкт-Петербурге (апрель 1990), на Всесоюзной научно-методической конференции "Использование ЭВМ в научной и учебной ра-

боте гуманитарных вузов" в г. Минске (июнь 1990), на республиканских научно-технических конференциях Кишиневского технического университета (апрель 1989, июнь 1994), на научно-дидактических конференциях Международного Свободного университета Молдовы (март 1997, май 1998).

Объем и структура работы. Диссертация состоит из введения, трех глав, заключения, списка литературы, включающего 107 названий на русском и 39 названий на иностранных языках, содержит 184 страницы машинописного текста, 3 рисунка и 57 таблиц. Приложения включают:

1. Словарь глагольных омографов, насчитывающий 1168 единиц.

2. Словарь машинных оборотов, в состав которых входят глагольные омографы (815 оборотов).

3. Словарь омографичных машинных оборотов с глагольными омографами (26 единиц).

4. Списки омографичных глаголов, которые модифицируют значение в безличной конструкции, в сложном глагольном сказуемом, в возвратной форме, в связочной функции (всего 114 глаголов).

5. Список слов с управлением на предлог а - одного из самых распространенных глагольных омографов (всего 435 единиц).

6. Результаты машинного эксперимента.

Во введении обосновывается актуальность выбранной темы исследования, формулируются цели и задачи работы, определяется объект исследования, показана научная новизна, практическая и теоретическая значимость полученных результатов, описывается материал и методика его исследования, приводятся основные положения, выносимые на защиту.

В первой главе разрабатывается семиотическая модель омографично-го знака, рассматривается его место по отношению к дру