автореферат диссертации по филологии, специальность ВАК РФ 10.02.21
диссертация на тему:
Проблемы неоднозначности синтаксического анализа

  • Год: 2005
  • Автор научной работы: Митренина, Ольга Владимировна
  • Ученая cтепень: кандидата филологических наук
  • Место защиты диссертации: Санкт-Петербург
  • Код cпециальности ВАК: 10.02.21
450 руб.
Диссертация по филологии на тему 'Проблемы неоднозначности синтаксического анализа'

Полный текст автореферата диссертации по теме "Проблемы неоднозначности синтаксического анализа"

САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

МИТРЕНИНА Ольга Владимировна

ПРОБЛЕМЫ НЕОДНОЗНАЧНОСТИ СИНТАКСИЧЕСКОГО АНАЛИЗА

Специальность 10.02.21— прикладная и математическая лингвистика

диссертации на соискание ученой степени кандидата филологических наут'

На правах рукописи

АВТОРЕФЕРАТ

Санкт-Петербург 2005

Диссертация выполнена на кафедре математической лингвистики Санкт-Петербургского государственного университета

Научный руководитель

кандидат филологических наук, доцент Панков Иван Павлович

Официальные оппоненты

доктор филологических наук, профессор Откупщикова Майя Ивановна кандидат филологических наук, доцент Волков Сергей Святославович

Ведущая организация

Российский государственный педагогический университет им. А.И.Герцена

Защита состоится 10 ноября 2005 г. в 16 часов на заседании диссертационного совета Д.212,232.23 по защите диссертаций на соискание ученой степени доктора филологических наук при Санкт-Петербургском государственном университете по адресу: 199034, Санкт-Петербург, Университетская набережная, д. 11.

С диссертацией можно ознакомиться в Научной библиотеке им. А.М.Горького Санкт-Петербургского государственного университета (199034, Санкт-Петербург, Университетская набережная, д. 7/11).

Автореферат разослан

Ученый секретарь диссертационного совета Д.212.232.23,

У/ л,

' у>

(С,,__Н.Д. Светозарова

2.2>ЧЪ±00

Общая характеристика работы

Неоднозначность синтаксического анализа упоминается во многих работах, посвященных описанию различных аспектов синтаксиса. Существует большое количество формально-грамматических описаний, регистрирующих синтаксическую неоднозначность, а также прикладных разработок, в которых неоднозначность учитывается при оценке качества действия систем автоматической обработки текста. Однако работ, посвященных системному исследованию проблем неоднозначности синтаксического анализа, практически не существует, а подходы отраженные в имеющихся грамматиках и лингвистических продуктах, отчасти выглядят как несопоставимые. Основная научная проблема, побудившая автора взяться за написание настоящей диссертации, состоит в отсутствии адекватного научного аппарата, с помощью которого можно было бы систематически исследовать и объяснить неоднозначности, возникающие при синтаксическом анализе естественноязыковых текстов.

Итак, актуальность исследования определяется необходимостью выработки единого подхода к проблемам неоднозначности синтаксического анализа, который мог бы стать базой для исследования причин неоднозначности, типов синтаксической омонимии и способов уменьшения ее уровня, а также обобщения существующих ныне и не всегда совместимых друг с другом способов анализа неоднозначных конструкций.

Научная новизна работы состоит в установлении взаимосвязей между различными аспектами неоднозначности синтаксического анализа, а также в выявлении определенного рода закономерностей при оценке неоднозначных конструкций с помощью коэффициента раннего распознавания. Проведенное исследование также устраняет пробелы в теории и практике автоматического синтаксического анализа, связанные с явлением синтаксической неоднозначности.

Целью настоящего исследования является системное описание различных аспектов проблемы неоднозначности синтаксического анализа (причин и свойств неоднозначных конструкций, а также способов дизамб)

гр*Циф: 'и

БИЬЛ.Чн ЬКА

РК

Эта цель предполагает решение конкретных задач:

• рассмотреть основные методы синтаксического анализа предложения и выявить существующие интерпретации синтаксической омонимии в рамках этих методов;

• описать природу причин, вызывающих синтаксическую неоднозначность;

• провести классификацию и исследование свойств потенциально возможных неоднозначных сочетаний русского языка;

• рассмотреть проблему дизамбигуации и разработать типологию способов, позволяющих уменьшить уровень синтаксической неоднозначности.

Теоретическая значимость работы заключается в системном анализе различных аспектов проблемы неоднозначности синтаксического анализа и обобщении знаний о синтаксической омонимии (с точки зрения причин ее возникновения, определения ее типов и методов разрешения), а также системном описании случаев синтаксической неоднозначности в русском языке.

Практическая значимость исследования состоит в выявлении закономерностей возникновения неоднозначных конструкций с учетом различных аспектов проблемы неоднозначности синтаксического анализа, оценки неоднозначных конструкций с помощью коэффициента раннего распознавания Дж. Хокинса и разработке метода разрешения синтаксической неоднозначности с помощью теории связывания.

Практическое применение результатов исследования в решении прикладных лингвистических задач может повысить эффективность действующих систем автоматического анализа, способствовать совершенствованию существующих и созданию новых лингвистических продуктов.

Структура работы. Диссертация состоит из введения, четырех глав, заключения и списка использованной литературы (124 наименований: из них 78 на русском языке, 46 — на иностранных языках).

Содержание и основные результаты исследования

Во введении обосновывается актуальность исследования, его научная новизна, формулируются его цели и задачи, определяется теоретическая и практическая значимость исследования.

В первой главе — "Метод синтаксического анализа и синтаксическая неоднозначность" — рассматривается, каким образом вопрос синтаксической неоднозначности возникал (или не возникал) в зависимости от метода синтаксического анализа и выбранной грамматики. Все основные методы анализа предложения мы разделили на следующие группы:

- Интуитивные методы анализа предложения. В эту группу можно отнести логико-синтаксический и психолого-синтаксический методы анализа языка. Оба метода основывались главным образом на интуиции исследователя и почти не использовали формальных критериев для анализа предложения. При таком подходе проблемы неоднозначности синтаксического анализа практически не возникало: "интуитивно" исследователь анализировал предложение только каким-то одним, наиболее убедительным для него способом.

— Формально-синтаксические методы, использующие формальный анализ грамматических явлений. Этот подход впервые серьезно поставил перед исследователями проблему синтаксической омонимии. Стоявший у истоков этого метода A.M. Пешковский ввел понятие сильного и слабого управления и указал, что слабоуправляемый член предложения не имеет прочной связи ни с каким определенным словом, поэтому часто может быть отнесен к тому или иному члену предложения, что вызывает синтаксическую неоднозначность (A.M. Пешковский использует термин "двусмысленность"). Он предложил некоторые способы разрешения синтаксической неоднозначности и выделил те случаи, где синтаксическая неоднозначность неразрешима.

— Структурный подход к анализу предложения, целью которого является описание элементов языка и связей между ними. Этот подход стал главным способом исследования предложения во второй половине XX в. Он включает в себя анализ

предложения с помощью структуры составляющих или с помощью структуры зависимостей. Оба способа рассматривают предложение как цепочку линейно упорядоченных словоформ, между которыми задаются структурные отношения.

Структурный подход подразумевает точное определение отношений между словоформами, что ведет к выявлению большого количества неоднозначных сочетаний. Именно этот способ анализа предложения открыл во всей полноте проблему синтаксической неоднозначности естественно-языковых текстов. Практически все дальнейшие исследования синтаксической неоднозначности русского языка велись в рамках анализа предложения с помощью структуры составляющих или структуры зависимостей.

— Современные синтаксические теории. В конце XX века на смену описательном теориям пришли теории объяснительные, которые можно разделить на два теоретических лагеря: формализм и функционализм.

Последователи формализма исходят из предположения о том, что в основе устройства языка лежит некоторый единый закон, а фундаментальные свойства языка не зависят от способов и условий его использования. Наиболее распространенным формальным направлением стал генеративизм. Генеративисты использовали неоднозначные предложения, пытаясь с помощью них доказать превосходство трансформационного подхода над анализом с помощью структуры составляющих. Поначалу они полагали, что причиной неоднозначности предложений типа They decorated the girl with the flowers является неоднозначность трансформации, с помощью которой образуется их поверхностная структура. Предпринимались попытки объяснить неоднозначность различным толкованием предложений на уровне глубинной структуры. Дальнейшие исследования показали, что явления, вызывающие неоднозначность, не являются синтаксическими по своей природе, а зависят от значения входящих в предложение слов и от их способности сочетаться.

Новый этап развития генеративной грамматики — теория принципов и параметров — выявил некоторые неявные аспекты устройства и функционирования языка в тех случаях, когда грамматическая информация не получает фонологического выражения на поверхностном уровне. Это позволило нам предложить описанный в

четвертой главе настоящего исследования метод разрешения синтаксической неоднозначности в некоторых предложениях, содержащих личные местоимения.

Представители функционализма в своих исследованиях исходят из предположения о том, что строение языка определяется его использованием. Функционализм исследует языковые явления, а не структуры. Однако знание языковых процессов иногда позволяет отдавать предпочтение той или иной структуре, что может приводить к разрешению синтаксической неоднозначности. Среди функциональных исследований языка наиболее целостными теориями являются системная функциональная грамматика М. Халлидея и теория порядка составляющих Дж. Хокинса.

Создатель системной функциональной грамматики М. Халлидей стремился связать функции языка с аппаратом их реализации в системе и структуре языка. В рамках этой грамматики М. Шатглворс исследовал синтаксические неоднозначности, возникающие при анализе связочных образований русского языка. Он показал, что, находя с помощью парадигматических средств в предложении единицу, выполняющую функцию знака, можно ассоциировать ее с подлежащим, разрешая синтаксическую неоднозначность. М. Шатглворс доказал вывод, интуитивно очевидный: использование контекста и просодики позволяет уменьшать уровень синтаксической неоднозначности.

Создатель теории порядка составляющих Дж. Хокинс исследовал способность человека воспринимать те или иные конструкции, он считал, что более удобные для восприятия конструкции являются в языке предпочтительными. Его теория может использоваться для уменьшения уровня синтаксической неоднозначности.

Во второй главе — "Анализ причин, вызывающих неоднбзначность синтаксического анализа" — рассматриваются причины, способствующие возникновению конструкций, которые могут быть проанализированы неоднозначно. Язык — это форма отражения окружающей человека действительности, устные и письменные речевые произведения (тексты) моделируют окружающую человека действительность (объективную или мысленную). Грамматику языка можно рассматривать как модель, описывающую те или иные аспекты языка, то есть как

модель модели окружающей человека действительности. Следовательно, синтаксическая омонимия в естественно-языковых текстах может быть вызвана явлениями различной природы. Однако синтаксическую неоднозначность мы воспринимаем сквозь призму какой-либо грамматической теории.

Можно указать следующие подгруппы причин, способствующих появлению синтаксической омонимии:

(1) неоднозначность определения входящих в предложение единиц;

(2) неоднозначность определения синтаксических связей между этими единицами;

(3) особенности самой синтаксической структуры.

Первую подгруппу причин, связанную с неопределенностью выбора той или иной языковой единицы при анализе предложения, мы назовем лексической многозначностью. Сюда можно отнести следующие явления:

— Омонимия и полисемия: Положи тетрадь в клетку. Чаще лексическая омонимия приводит к неоднозначности на уровне типа синтаксической связи; этот вид неоднозначности может возникать при анализе предложения с помощью грамматик, учитывающих типы синтаксических отношений: Он прислан к нам инспектором.

-Грамматическая конверсия; один из возможных способов интерпретации фразы в известном примере Раскапывайте погребенных в земле слепых исполинов связан с использованием слова погребенных в роли существительного: [Раскапывая погребенных] в [земле слепых исполинов].

- Частичная лексическая омонимия и грамматическая омонимия: Ответов на эти вопросы физики пока не могут дать.

- Неоднозначность интерпретации проформы: Доклад ученого, о котором я вам говорил. Сюда же можно отнести случаи неоднозначной интерпретации нулевых подлежащих нефинитных клауз: Он1 попросил щ, РКО,,} уходя. РЯО} выключить свет.

Мы не будем рассматривать в числе причин, вызывающих синтаксическую неоднозначность, омографию и омофонию, поскольку данные явления связаны не с организацией, а с распознаванием синтаксической структуры.

Вторую подгруппу причин, вызывающих синтаксическую неоднозначность, мы назовем валентной вариативностью. Сюда будут отнесены причины, связанные со способностью слова вступать те или иные в синтаксические связи с другими элементами. Можно описать следующие типы валентной вариативности:

- Факультативность сирконстантов. Сирконстанты не являются обязательными элементами, поэтому они достаточно легко могут находить в предложении потенциальных хозяев, вызывая синтаксическую неоднозначность: Доклад об ограблениях в институте социологии.

-Вариативность актантов, то есть способность слова заполнять валентности актантами разных типов, а также подчинять себе разные формы: Имеется возможность просьбы начальника избежать.

- Факультативность актантов, которая позволяет относить зависимый элемент как к одному, так и к другому потенциальному хозяину: Учитель пения не слышит.

Третья подгруппа причин, вызывающих синтаксическую неоднозначность, связана со свойствами самой синтаксической структуры. Сочетания элементов, провоцирующие возникновение неоднозначных структур, возникают при наличии однородных членов в одной или нескольких допустимых интерпретациях фразы (все остальные конструкции, как будет показано ниже, связаны с валентной вариативностью). Мы назовем эту подгруппу причин однородностью.

Мы рассмотрим описанные Ф.А. Дрейзиным неоднозначные конструкции с однородными членами и укажем, в каких случаях свойства самих конструкций вызывают синтаксическую неоднозначность. Возникновение синтаксической неоднозначности провоцируется следующими сочетаниями:

-Наличие зависимого элемента, который может быть отнесен к одному или нескольким однородным членам предложения:

Век атомной [энергетики, автоматизации]

Век [атомной энергетики], [автоматизации]

- Наличие элемента, который может быть однороден с другим элементом или его хозяином.

Не пришло к состоянию [утраты [инициативы, безразличия]]...

Не пришло к состоянию [[утраты инициативы], [безразличия]]...

-Наличие элемента, который может выступать хозяином по отношению к нескольким однородным членам предложения или только к одному из них, при этом не подчинившийся хозяину элемент не становится однородным с хозяином:

Доверять [дочери и отцу] запрещали (конструкция с однородными членами).

[Доверять дочери] [и отцу запрещали] (конструкция с усилительным и).

— Случаи перераспределения однородности во фразах типа: Мой брат или Петя и Миша останутся.

Как правило, каждый конкретный случай синтаксической неоднозначности вызван сочетанием нескольких причин разных типов. Необходимо также отметить причины, сами по себе не вызывающие синтаксическую неоднозначность, но содействующие ее возникновению. Их можно назвать сопутствующими. К сопутствующим причинам можно отнести:

- Эллипсис. Когда один из элементов предложения отсутствует по причине эллипсиса, на его место в структуре предложения может претендовать другой элемент, создавая неоднозначность: Купил яблоню и посадил во дворе соседа.

- Вводные элементы (вводные слова и предложения, причастные и деепричастные обороты), разделяющие зависимое и главное слово. Так, предложение Он шел, несмотря на мороз, в легкой куртке, по-видимому, чувствуя себя превосходно является синтаксически неоднозначным именно из-за наличия одновременно деепричастного оборота и вводного слова, которые замещают собой возможные знаки пунктуации, из-за чего структура предложения становится неясной.

- Порядок слов; благодаря относительно свободному порядку слов в русском языке возникает большое количество неоднозначных синтаксических структур: Затем он протянул ее безразлично предупредительному лакею.

В третьей главе — "Анализ неоднозначных синтаксических конструкций русского языка" — на материале русского языка разработана типология неоднозначных конструкций и рассмотрены свойства каждого типа неоднозначностей. Рассматривается распределение ролей в неоднозначных конструкциях и его влияние на свойства конкурирующих структур.

В этом разделе мы опираемся на результаты, полученные в 1960-х годах Л.Н. Иорданской и Ф.А. Дрейзиным — после этого системные исследования неоднозначных конструкций русского языка в отечественной лингвистике практически не проводились.

Л.Н. Иорданская составила для каждого класса слов русского языка список их потенциальных хозяев, а затем перечислила все случаи, когда в предложении встречаются два потенциально возможных хозяина какого-либо элемента. Таким образом она разработала для русского языка список всех потенциально возможных неоднозначных сочетаний классов слов с двумя их возможными хозяевами.

Ф.А. Дрейзин в своих исследованиях двигался в противоположном направлении. Он взял за исходную точку не теоретически возможные неоднозначные сочетания, а реально встречающиеся в текстах примеры синтаксической неоднозначности. Ф. А. Дрейзин вручную произвел синтаксических анализ всех предложений 34 статей II научно-популярного ежегодника "Наука и человечество" и исследовал возникающие при этом случаи синтаксической неоднозначности.

Анализируя список потенциально возможных неоднозначных сочетаний классов слов, можно видеть, что свойства конкурирующих структур зависят от состава и конфигурации омонимичных хозяев и слуг. Синтаксически неоднозначные предложения могут различаться по степени свободы входящих в них элементов. Большинство неоднозначных конструкций связано со слабыми хозяевами, которые не требуют присутствия в предложении большого количества омонимичных слуг.

Рассматривая конфигурацию омонимичных хозяев и слуг, входящих в ту или иную неоднозначную конструкцию, можно выделить одноместные конкуренции (сочетания, при которых конкурирующие конструкции различаются положением только одного узла), двухместные конкуренции (сочетания, при которых два узла выступают в роли омонимичных слуг) и многоместные конкуренции (сочетания, при которых число омонимичных слуг превышает два, как в примере Письма знакомой из Киева не заменят фотографии его любимой и милой дочери Марии, где в роли омонимичных слуг может выступать почти каждый элемент предложения).

Рассматривая свойства омонимичных хозяев и слуг, мы выделим следующие случаи:

А. Одноместная конкуренция:

1. Оба хозяина слабые, и омонимичный слуга может быть присоединен к любому из них. Мы назовем такое сочетание слабой одноместной конкуренцией: Роняет лес багряный свой убор.

2. Один из омонимичных хозяев — слабый, а второй — сильный. Такое сочетание мы будем называть средней одноместной конкуренцией: Все интересующиеся группами подходили к столу.

3. Оба омонимичных хозяина являются сильными. Это сочетание мы назовем сильной одноместной конкуренцией: Он попросил преподавателя подождать.

Анализ одноместной конкуренции, которая является базовым типом синтаксической омонимии, позволяет сделать следующие наблюдения:

1) При описании слабой одноместной конкуренции важно учитывать, связаны ли потенциальные хозяева отношением зависимости. Если один из хозяев подчиняется второму хозяину, вероятность возникновения синтаксической омонимии резко возрастает. Это верно как для тех отношений, которые учитывают порядок следования слуги и хозяина (например, предложная группа может находиться только после определяемого ею существительного: письмо в деревню), так и для тех отношений, которые этот порядок не учитывают (например, предложная группа может находиться как до, так и после определяемого ею глагола: на гвоздь наступил).

Если потенциальные хозяева не связаны отношением зависимости, синтаксическая неоднозначность возникает только в тех случаях, когда слуга находится между ними; Смерть всем живущим ныне суждено. Если слуга расположен слева или справа от своих потенциальных хозяев, которые не связаны отношением зависимости, синтаксической неоднозначности не возникает, так как слуга зависит от ближайшего хозяина: смерть всем ныне живущим суждено.

2) В тех случаях, когда потенциальные хозяева связаны отношением зависимости, один из хозяев является слугой по отношению к другому. При этом слабая одноместная конкуренция, как правило, возникает, когда слуга расположен

между двумя хозяевами (томит людей обман), либо когда из трех участников конструкции в середине находится хозяин, зависящий от второго хозяина (томит обман людей). Если же в середине находится хозяин, подчиняющий себе второго потенциального хозяина, синтаксической неоднозначности не возникает, потому что слуга подчиняется ближайшему и более сильному хозяину: людей томит обман. Это верно и для тех случаев, когда один из потенциальных хозяев зависит от другого не непосредственно, а через промежуточный узел, для которого он является актантом.

Если второй хозяин подчинен промежуточному узлу не в качестве актанта, а в качестве сирконстанта, сильной связи в промежуточной группе не возникает и сочетание ведет себя как набор несвязанных хозяев: неоднозначность возникает только если слуга находится между потенциальными хозяевами. Над скатертью двигались лавандой умытые руки англичанки.

3) Отдельного внимания заслуживают те случаи, когда порядок следования слуги и хозяина не является свободным, что накладывает ограничения на распределение ролей в неоднозначных конструкциях: неоднозначность возникает лишь в тех случаях, когда сохраняется указанный порядок следования элементов пары хозяин-слуга, что уменьшает количество возможных комбинаций.

4) Признаком слабой одноместной конкуренции можно назвать следующую особенность: омонимичного слугу с зависимыми от него словами можно удалить без всякого ущерба для структуры предложения: Роняет лес свой убор.

5) Средняя и сильная одноместные конкуренции ведут себя во многом так же, как и слабая одноместная конкуренция. Однако сильная связь позволяет достаточно свободно перемещать зависимый элемент. Поэтому при наличии в предложении сильной связи слуга может находиться не только между независимыми потенциальными хозяевами, но и слева или справа от них: Духотой спаленных губ не освежить.

6) Если конкурирующими хозяевами являются глаголы в личной форме или деепричастия, по правилам пунктуации в русском языке они должны быть разделены знаком препинания (при произношении передающимся интонацией), который разбивает предложение на синтагмы и не дает возникнуть синтаксической

неоднозначности. Если омонимичный слуга находится между конкурирующими хозяевами такого типа, неоднозначность возникает только если слуга отделен от каждого из них разделителем: Арестуют тех, кого вызывали, по-видимому, городские власти. В качестве разделителя может выступать не только пунктуационный маркер, но и однородный со слугой элемент, например, предложная группа: Он шел в легкой куртке, в резиновых сапогах, наверное, замерзал и сердился на всех.

В. Двухместная конкуренция

1. Если в предложении встречается два слуги, каждый из которых по отдельности мог бы образовывать слабую одноместную конкуренцию, возникает ситуация, которую мы назовем слабой двухместной конкуренцией: Он встретил ее на поляне [с цветами] [в красном горшке1.

2. Двухместная конкуренция может близка по своей структуре к средней или сильной одноместной конкуренции, если один из хозяев является сильным узлом, валентность которого заполнятся одним или вторым слугой, а свободный слуга заполняет какую-либо слабую валентность, при этом в предложении часто возникает три омонимичных хозяина; один сильный и два слабых для каждого из омонимичных слуг. Мы будем называть такие структуры средней двухместной конкуренцией: Все же он не вызвал на собрание гериогов и королей в каком-то немецком городе поэта Гердера.

3. Если в одной из конкурирующих конструкций оба омонимичных слуги подчиняются разным хозяевам, а в другой конструкции они подчиняются одному из хозяев как однородные элементы, мы будем говорить о двухместной однородной конкуренции: Доверять дочери и отт запрещали.

4. Если в предложении есть только один омонимичный хозяин и два слуги, которые в одной из конкурирующих конструкций являются однородными, а в другой — подчиняются этому хозяину независимо друг от друга, мы будем говорить о псевдодвухместной конкуренции: Он занимался самоусовершенствованием и этим способом.

Анализ двухместной конкуренции показывает, что она встречается в русском языке гораздо реже, чем одноместная конкуренция, поскольку в конструкции

принимает участие большее количество омонимичных хозяев и слуг, требующих установления связей. Исключение составляет слабая двухместная конкуренция, которая является объединением двух одноместных конкуренции и к которой применимо все то, что мы написали выше об одноместных конкуренциях.

С. Многоместная конкуренция

Если в предложении имеется больше двух омонимичных слуг, мы будем говорить о многоместной конкуренции. Ее можно рассматривать как пересечение одноместных и двухместных конкуренций: Имеется возможность просьбы начальника избежать.

Р. Однородная конкуренция

Этот вид конкуренции был подробно исследован Ф.А. Дрейзиным.

1. Если омонимичный слуга может бьггь отнесен к одному или нескольким однородным членам предложения, мы назовем такую конфигурацию псевдоодноместной однородной конкуренцией.

Век атомной [энергетики, автоматизации]

Век [атомной энергетики], [автоматизации]

2. Если омонимичный слуга может быть отнесен к одному или к другому однородному члену предложения, имеет смысл говорить об одноместной однородной конкуренцией. Эта ситуация возникает в тех конструкциях, где слово стоит между двумя однородными конкурирующими хозяевами и отделено от них запятой или сочинительным союзом: Брат пишет, правда очень редко, статьи, которые ему заказывают, читает и ... В этом примере слово статьи может зависеть как от слова пишет, так и от слова читает.

3. Ситуацию, в которой омонимичный слуга может быть однороден с другим элементом или его хозяином, мы назовем псевдодвухместной однородной конкуренцией. В этом случае равнооформлены должны быть все три участника неоднозначной структуры.

Не пришло к состоянию [утраты [инициативы, безразличия]]...

Не пришло к состоянию [утраты инициативы], [безразличия]...

Эта ситуация противоположна псевдоодноместной однородной конкуренции

и подразумевает наличие элемента, который может выступать хозяином по отношению к нескольким однородным членам предложения или только к одному из них (в этом случае не подчинившийся хозяину элемент становится однородным с хозяином).

Вас ждут [слепые и беспомощные] люди.

Вас ждут [слепые] и [беспомощные люди].

4. Ситуация, когда омонимичный слуга может выступать хозяином по отношению к нескольким однородным членам предложения или только к одному из них, при этом не подчинившийся хозяину элемент не становится однородным с хозяином. Этот случай был описан нами выше как двухместная однородная конкуренция. В этом случае во второй конкурирующей конструкции могут оставаться элементы, оформляющие однородность в первой конструкции, например, союз и. В таком случае во второй конструкции и выполняет, например, усилительной частицы:

Доверять [дочери и отцу] запрещали (конструкция с однородными членами).

[Доверять дочери] [и отцу запрещали] (конструкция с усилительным и).

Эта ситуация обратна псевдоодноместной однородной конкуренции, но не относится к псевдодвухместной однородной конкуренции.

5. Случаи перераспределения однородности во фразах типа: Мой брат или Петя и Миша останутся. Неоднозначность в такого типа предложениях возникает за счет неопределенности сферы действия союзов и и или. Мы назовем такие конструкции перераспределенной однородной конкуренцией.

Отдельного рассмотрения требует проблема окказиональной неоднозначности, возникающая из-за совпадения отдельных форм слова. Необходимо различать регулярную и нерегулярную окказиональную неоднозначность. Регулярная окказиональная неоднозначность связана с синформией. Так, совпадением форм именительного и родительного падежей существительных третьего склонения женского рода с основой на палатализованные согласные обусловлена неоднозначность в предложениях типа Мать любит дочь. Нерегулярная

окказиональная неоднозначность связана со случайным совпадением форм слов: Он видел га семью своими глазами (одно из толкований этого предложения подразумевает наличие у наблюдателя семи глаз).

Конструкции, связанные с регулярной окказиональной неоднозначностью, не должны представлять серьезной трудности — они могут быть заданы отдельным списком. Гораздо сложнее дело обстоит с нерегулярной окказиональной неоднозначностью. Число возможных неоднозначных предложений сильно возрастает из-за того, что в одном предложении могут сочетаться несколько случаев нерегулярной окказиональной неоднозначности.

В четвертой главе — "Способы уменьшения уровня синтаксической неоднозначности и ее полного снятия" — рассматривается проблема снятия синтаксической неоднозначности или уменьшения ее уровня. Разрешение синтаксической неоднозначности можно определить как выбор из конкурирующих структур данной фразы той струюуры, которая соответствует замыслу автора, то есть отражает те связи между словами предложения, которые подразумевал говорящий или пишущий. При этом необходимо учитывать, что далеко не во всех случаях требуется полное разрешение синтаксической неоднозначности. Имеет также смысл говорить об уменьшении уровня синтаксической неоднозначности. Полностью разрешить неоднозначность в предложениях типа Мать любит дочь не всегда представляется возможным, однако носителю языка интуитивно понятно, что в этом предложении в качестве подлежащего скорее всего выступает словоформа мать. Уменьшение уровня синтаксической неоднозначности можно определить как возможность задавать вероятность разрешения неоднозначной ситуации в ту или иную сторону.

Естественный язык хорошо приспособлен к тому, чтобы - избегать неоднозначных ситуаций, он содержит определенные "подсказки" различной природы, позволяющие однозначно интерпретировать ту или иную фразу. Задачей исследователя, сталкивающегося с проблемой синтаксической омонимии, является выявление этих "подсказок". В зависимости от методов и типа информации, которая используется при анализе конкурирующий структур, можно выделить следующие способы разрешения синтаксической неоднозначности:

а) Лексические способы, основывающиеся на описании семантических свойств и валентностных способностей слова. Эти способы учитывают семантическую и лексическую сочетаемость слов, а также валентные характеристики слова.

б) Конфигурационные способы, учитывающие свойства синтаксической структуры. Сюда можно отнести правило правого и минимального присоединения, свойство проективности, а также предложенные Л.Н. Иорданской запрещения пересечения и обрамления, пригодные не столько для борьбы с синтаксической неоднозначностью, сколько для определения правильности структуры, которая формально может быть приписана данному предложению.

в) Квантитативные способы, учитывающие частоту встречаемости словосочетаний. Сюда можно отнести использование статистических данных, использование фильтров и предложенный Ф.А. Дрейзиным вероятностный метод уменьшения синтаксической неоднозначности.

г) Просодические способы учитывающие просодическое оформление предложения, они годятся для разрешения синтаксической неоднозначности в устной речи. Сюда можно отнести использование просодических ключей и ритма.

д) Коммуникативяо-стилистическиие способы, учитывающие особенности линейной организации предложения. Порядок слов в русском языке является свободным лишь отчасти. В русском языке существуют нормы расположения слов, они обусловлены не только грамматическими, но также коммуникативными и стилистическими причинами.

е) Психолингвистические способы, оценивающие степень приемлемости конкурирующих конструкций для носителя языка. Наибольший интерес здесь представляют исследования функционалиста Дж. Хокинса. Они также позволяют уменьшать уровень синтаксической неоднозначности.

ж) Контекстные способы, использующие контекст в котором употреблено предложение. При этом необходимо различать эксплицитный контекст, выраженный явно вербальными и невербальными средствами, и имплицитный контекст,

и

представляющий из себя фоновые знания коммуникантов о ситуации или знание ими предшествующих текстов. Вербальный эксплицитный контекст может быть использован как источник информации при разрешении синтаксической омонимии с помощью лексических и квантитативных способов.

з) Генеративные способы, использующие скрытые закономерности языка, выявляемые генеративной грамматикой. Сюда можно отнести использование трансформаций и теории связывания. Разрешение синтаксической неоднозначности с использованием трансформаций появились задолго до возникновения генеративной грамматики; еще А. М. Пешковский описал способ разрешения синтаксической неоднозначности, близкий к тому, что на современном языке можно было бы назвать трансформационным анализом (сам А. М. Пешковский называл такой подход экспериментальным).

Мы предложили способ разрешения синтаксической омонимии, применимый для некоторых неоднозначных предложений, содержащих личные местоимения. Этот способ позволяет с помощью формальных методов разрешать окказиональную синтаксическую неоднозначность типа Ночь предвещает день. Составители углубленной грамматики русского языка для иностранцев А. Нахимовский и Р. Лид называют такой тип предложений "одним из самых ужасных в русском языке".

Однако в предложении типа Ночь предвещает день кандидаты на роль подлежащего и дополнения (ночь, день) различаются по роду. Это значит, в предложении хранится некоторая дополнительная информация, которая может помочь нам в разрешении синтаксической омонимии. Действительно, появление придаточного предложения снимает синтаксическую неоднозначность для носителя языка: Ночь предвещает день, не зная, что он принесет. Даже перестановка слов в главном предложении не делает его неоднозначным: День предвещает ночь, не зная, что он принесет. Носитель языка понимает, что в последнем примере подлежащим является слово ночь. Но как описать формально этот интуитивно понятный ответ, чтобы машина могла однозначно проанализировать предложения такого типа? Формальный однозначный анализ такого предложения можно провести с помощью

теории связывания, которая позволяет, используя формальные методы, определять референцию местоимений.

Теория связывания утверждает, что анафор (возвратное местоимение себя, самого себя, свой или взаимное местоимение друг друга) должен быть связан в пределах некоторой структурно определяемой области, в которую он входит, а прономинал (личное местоимение я, меня, тебе, нашего, их, ее и т.д.) должен быть свободен (не связан никаким антецедентом) в пределах минимальной категории, в которой он находится.

Главное предложение в рассмотренном выше примере — Ночь предвещает день — неоднозначно по причине морфологической омонимии, поскольку формы им. и вин. падежей у существительных день и ночь совпадают. Однако приведенную неоднозначность удается разрешить формальным способом при наличии придаточного предложения: Ночь предвещает день, не зная, что он принесет. Кореферентной с прономиналом он здесь может быть только существительное мужского рода день. Поэтому, чтобы не связывать прономинал, оно не может находиться в позиции подлежащего. Поэтому данное предложение формально допускает только одну конструкцию, в которой подлежащим является существительное день.

Предложенный нами способ формального разрешения синтаксической омонимии эффективен в тех случаях, когда грамматическая информация не получает фонологического выражения. Он использует свойство генеративной грамматики выявлять неявные аспекты устройства и функционирования языка.

В заключении обобщаются полученные результаты, намечаются возможности их практического применения.

Данное исследование, охватывающее различные аспекты проблемы неоднозначности синтаксического анализа, в целом носит теоретический характер, однако его результаты имеют значение для эмпирического лингвистического анализа и могут найти практическое применение в любых системах, осуществляющих автоматическую обработку текста.

Основные положения диссертации изложены в следующих публикациях:

1. Митренина О.В. Проблема неоднозначности синтаксических структур в генеративной грамматике // Материалы XXIX межвузовской научно-методической конференции преподавателей и аспирантов. СПб, 2000. С. 30— 313.

2. Митренина О.В. Типы синтаксической неоднозначности // Материалы XXX межвузовской научно-методической конференции преподавателей и аспирантов. СПб, 2001. С. 11—17.

3. Митренина О.В. Уменьшение уровня синтаксической неоднозначности с помощью коэффициента раннего распознавания // Материалы XXXII международной филологической конференции. СПб, 2003. С. 41— 43.

4. Митренина О.В. Причины, вызывающие синтаксическую неоднозначность // Материалы XXXIII международной филологической конференции. СПб, 2004. С. 49 — 51.

5. Митренина О.В. Анализ элементарных неоднозначных фрагментов русского языка средствами Теории управления и связывания // Ученые записки молодых филологов. Вып. 2, СПб, 2004 С. 230 — 237.

РНБ Русский фонд

2007-4 659

Получено 29 КОЯ 2005

 

Оглавление научной работы автор диссертации — кандидата филологических наук Митренина, Ольга Владимировна

ВВЕДЕНИЕ.

ГЛАВА 1. Метод синтаксического анализа и синтаксическая неоднозначность.

1.1. Общий обзор языковых неоднозначностей.

1.2. Интуитивные методы анализа предложения.

1.3. Начало формального этапа.

1.4. Структурный подход к анализу предложения.

1.5. Современные синтаксические теории.

1.6. Использование неоднозначных структур в современной исследовательской практике.

1.7. Эволюция проблемы синтаксической неоднозначности.

ГЛАВА 2. Анализ причин, вызывающих неоднозначность синтаксического анализа.

2.1. Вводные замечания.

2.2. Лексическая многозначность.

2.3. Валентная вариативность.

2.4. Однородность.

2.5. Сопутствующие причины возникновения синтаксической неоднозначности.

2.6. Природа языка и причины неоднозначности. fs ГЛЛВЛ 3. Анализ неоднозначных синтаксических конструкций русского языка.

3.1. Обзор исследований синтаксической неоднозначности на материале русского языка.

3.2. Термины и понятия, введенные для анализа неоднозначных конструкций.

3.3. Распределение ролей в неоднозначных конструкциях.

3.4. Одноместные конкуренции.

3.5. Двухместные конкуренции.

3.6. Многоместные конкуренции.

3.7. Однородные конкуренции.

3.8. Окказиональная неоднозначность.

3.9. Особенности неоднозначных синтаксических конструкций русского языка.

ГЛАВА 4. Способы уменьшения уровня синтаксической неоднозначности и ее полного снятия.

4.1. Некоторые предварителгшые замечания.

4.2. Понятие "разрешение синтаксической неоднозначности".

4.3. Лексические способы уменьшения уровня синтаксической неоднозначности.

4.4. Конфигурационшле способы.

4.5. Квантитативные способы.

4.6. Просодические способы.

4.7. Коммуникативно-стилистические способы.

4.8. Психолингвистические способы.

4.9. Контекстные способы.

4.10. Генеративные способы.

4.11. Интегральное описание языка.

 

Введение диссертации2005 год, автореферат по филологии, Митренина, Ольга Владимировна

Исследователь, изучающий естественный язык, в своей работе непременно сталкивается с неоднозначностью синтаксического анализа. Так, по наблюдению И. Л. Мельчука, в научно-технических текстах неоднозначность встречается в большинстве фраз, а одно предложение в первой статье Конституции США допускает 16 различных синтаксических структур [Мельчук, 1999, с. 32].

Полный формальный синтаксический анализ естественно-языковых текстов приводит к большой неоднозначности. Несмотря на существующий научный интерес к методам автоматического синтаксического анализа, степень научной разработанности проблемы неоднозначности синтаксических структур представляется недостаточной. Синтаксическая омонимия упоминается почти в во всех работах, посвященных описанию различных аспектов синтаксиса (см., например, [Nakhimovsky, Leed, 1987; Carnie, 2002; Adger, 20031]). Существует большое количество формально-грамматических описаний, регистрирующих синтаксическую неоднозначность, а также прикладных разработок, в которых неоднозначность учитывается при оценке качества действия систем автоматической обработки текста. Однако работ, посвященных системному исследованию проблем неоднозначности синтаксического анализа, практически не существует, а подходы отраженные в имеющихся грамматиках и лингвистических продуктах, отчасти выглядят как несопоставимые. Основная научная проблема, побудившая автора взяться за написание настоящей диссертации, состоит в отсутствии адекватного научного аппарата, с помощью которого можно было бы систематически исследовать и объяснить неоднозначности, возникающие при синтаксическом анализе естественно-языковых текстов.

Итак, актуальность исследования определяется необходимостью выработки единого подхода к проблемам неоднозначности синтаксического анализа, который мог бы стать базой для исследования причин неоднозначности, типов синтаксической омонимии и способов уменьшения ее уровня, а также обобщения существующих ныне и не всегда совместимых друг с другом способов анализа неоднозначных конструкций.

Научная новизна работы состоит в установлении взаимосвязей между различными аспектами неоднозначности синтаксического анализа, а также в выявлении определенного рода закономерностей при оценке неоднозначных конструкций с помощью коэффициента раннего распознавания. Проведенное исследование также устраняет пробелы в теории и практике автоматического синтаксического анализа, связанные с явлением синтаксической неоднозначности.

Цслыо настоящего исследования является системное описание различных аспектов проблемы неоднозначности синтаксического анализа (причин и свойств неоднозначных конструкций, а также способов дизамбигуации).

Эта цель предполагает решение конкретных задач:

• рассмотреть основные методы синтаксического анализа предложения и выявить существующие интерпретации синтаксической омонимии в рамках этих методов;

• описать природу причин, вызывающих синтаксическую неоднозначность;

• провести классификацию и исследование свойств потенциально возможных неоднозначных сочетаний русского языка;

• рассмотреть проблему дизамбигуации и разработать типологию способов, позволяющих уменьшить уровень синтаксической неоднозначности.

Теоретическая значимость работы заключается в системном анализе различных аспектов проблемы неоднозначности синтаксического анализа и обобщении знаний о синтаксической омонимии (с точки зрения причин ее возникновения, определения ее типов и методов разрешения), а также системном описании случаев синтаксической неоднозначности в русском языке.

Практическая значимость исследования состоит в выявлении закономерностей возникновения неоднозначных конструкций с учетом различных аспектов проблемы неоднозначности синтаксического анализа, оценки неоднозначных конструкций с помощью коэффициента раннего распознавания Дж. Хокинса и разработке метода разрешения синтаксической неоднозначности с помощью теории связывания.

Практическое применение результатов исследования в решении прикладных лингвистических задач может повысить эффективность действующих систем автоматического анализа, способствовать совершенствованию существующих и созданию новых лингвистических продуктов.

Автор выражает глубокую признательность д.ф.н., проф. Л.С. Герду и к.ф.н. О.Л. Митрофановой за постоянную поддержку исследования, а также д.ф.н, проф. Я.Г. Тестельцу и к.ф.н. И.В. Азаровой за ряд ценных наблюдений и замечаний, использованных в данной работе. * *

Структура диссертации

В композиционном плане диссертационное исследование состоит из введения, четырех глав, заключения и списка литературы.

 

Заключение научной работыдиссертация на тему "Проблемы неоднозначности синтаксического анализа"

Заключение

Данная работа посвящена комплексному описанию синтаксической неоднозначности в русском языке — лингвистического явления, с которым сталкивается практически каждый исследователь, использующий формальные методы при анализе естественноязыкового материала.

Наиболее значимым итогом проведенной работы можно считать создание научного описания синтаксической неоднозначности, объяснения его природы, систематизации различных аспектов данного явления. В ходе исследования удалось выявить зависимость степени выявляемое™ синтаксической неоднозначности от применяемого метода синтаксического анализа предложения; в связи с этим были рассмотрены интуитивные методы анализа предложения (логико-синтаксический и психолого-синтаксический), формально-синтаксические методы, структурный подход к анализу предложения и современные синтаксические теории формального и функционального направлений.

Мы осуществили системное изучение причин синтаксической омонимии и показали, что эти причины могут быть вызваны гетерогенными языковыми явлениями.

В процессе решения исследовательских проблем был проведен анализ неоднозначных синтаксических конструкций русского языка и выявлены базовые типы распределения ролей элементов в омонимичных конструкциях, описаны различные типы конкуренций (одноместная, двухместная, многоместная и однородная), рассмотрены свойства конкуренций и выяснено, при сочетании каких элементов они могут возникать.

В поиске путей устранения омонимии на уровне текста мы исследовали понятие разрешения синтаксической неоднозначности и разработали типологию возможных способов разрешения синтаксической неоднозначности в зависимости от информации, которая исполЕ>зуется при анализе конкурирующих структур. Указанная типология охватывает лексические, конфигурационные, квантитативные, просодические, исихолингвистические и другие способы разрешения синтаксической неоднозначности. Также нами был предложен способ, позволяющий формально разрешать неоднозначность в некоторых типах предложений средствами одного из модулей современной генеративной грамматики — теории связывания.

Данное исследование, охватывающее различные аспекты проблемы синтаксической неоднозначности, в целом носит теоретический характер, однако его результаты имеют значение для эмпирического лингвистического анализа и могут найти практическое применение в системах, осуществляющих автоматическую обработку текста.

Основные положения диссертации и результаты исследования обсуждались на XXIX и XXX межвузовских научно-методических конференциях преподавателей и аспирантов филологического факультета СПбГУ (13-18 марта 2000 г. и 1-17 марта 2001 г.), а также на XXXII международной филологической конференции СПбГУ (11-14 марта 2003 г.), изложены в пяти публикациях.

 

Список научной литературыМитренина, Ольга Владимировна, диссертация по теме "Прикладная и математическая лингвистика"

1. Арутюнова Н. Д. Синтаксис. // Общее языкознание: Внутренняя структура языка. М., 1972, С. 254—342.

2. Апресян Ю. Д. Идеи и методы современной структурной лингвистики (краткий очерк). М., 1966.

3. Апресян Ю.Д. Об одном правиле сложения лексических значений // Проблемы структурной лингвистики 1971. М., 1972.

4. Апресян Ю. Д. Избранные труды. Т. 1. Лексическая семантика: Синонимические средства языка. М., 1995.

5. Ахо, А., Ульман, Дж. Теория Синтаксического анализа, перевода и компиляции. М., 1978.

6. Балли Ш. Общая лингвистика и вопросы французского языка. М., 1955.

7. Бейлнн Дж. Краткая история генеративной грамматики / Современная американская лингвистика: фундаментальные направления. М. 2002.

8. Белошапкова, В. А. Современный русский язык. Синтаксис. М., 1977.

9. Белошапкова, В. А., Шмелева Т. В. Деривационная парадигма предложения. // Вестник МГУ, сер. "Филология", 1981, № 2, с.50.

10. Ю.Беивенист, Э. Уровни лингвистического анализа. // Бенвенист, Э. Общая лингвистика. М., 1974.

11. Богуславский И. М. Сфера действия лексических единиц. М., 1996.

12. Буслаев Ф. И. Историческая грамматика русского языка. М., 1959.

13. Буторов В. Д. Моделирование синтаксиса естественного языка. / Прикладное языкознание. СПб, 1996.

14. Бэбби Л. О нестандартных стратегиях приписывания падежа. // Вопросы языкознания, № 2, 1994 . С. 43—74.

15. Виноград, Т. Программа, понимающая естественный язык. М., 1976.ш 16. Виноград, Т. Работа с естественными языками. // Современныйкомпьютер. М. 1986. С. 90—107.

16. П.Виноградов В. В. Из истории изучения русского синтаксиса. М., 1958.

17. Виноградов В. В. Избранные труды. Исследования по русской грамматике. М., 1975.

18. Гак В.Г. К проблеме семантической синтагматики // Проблемы структурной лингвистики 1971. М., 1972.

19. Гак В.Г. Сопоставительная лексикология. М., 1977.

20. Гладкий, А. В. Формальные грамматики и языки. М., 1973.

21. Гладкий, А. В. Синтаксические структуры естественного языка в автоматизированных системах общения. М., 1985.

22. Глисон Г. Введение в дескриптивную лингвистику. М., 1959.

23. Голуб И. Б. Стилистика русского языка. М., 1997.

24. Грайс Г. Логика и речевое общение // Новое в зарубежной лингвистике. Вып. 16. Лингвистическая прагматика. М., 1985.

25. Долинина И. Б. Системный анализ предложения. М., 1977.

26. Дрейзин Ф. А. Зависимые слова и группы слов при однородных существительных с точки зрения автоматического синтаксического анализа// Научно-техническая информация, 1966(a), № 7, С. 42—45.

27. Дрейзин Ф. А. Синтаксическая омонимия (к постановке вопроса). // Машинный перевод и прикладная лингвистика, выи. 9, 1966(6), С. 38—43.

28. Дрейзин Ф. А. Синтаксическая омонимия в русском языке с точки зрения автоматического анализа: Автореф. дис: канд. филол. наук. М., 1966(b)

29. Дрейзин Ф. А. Частота появления основных видов синтаксической омонимии в русских текстах// Научно-техническая информация,щ 1966(г),№ 12, С. 55—59.

30. Зализняк Л. Л. Грамматический словарь русского языка. Словоизменение. М., 1977.32.3олотова Г. Л. Очерк функционального синтаксиса русского языка. М., 1973.

31. ЗЗ.Золотова Г. А. Синтаксический словарь. Репертуар элементарных единиц русского синтаксиса. М. 2001.

32. Иорданская JI. Н. Свойства правильной синтаксической структуры и алгоритм ее обнаружения // Проблемы кибернетики, вып. 11, 1964, 215-245.

33. Иорданская Jl. Н. Синтаксическая омонимия в русском языке. // Научно-техническая информация, сср. 2, № 5, 1967, С. 9—17.

34. Казенин К. И. Современные формальные теории синтаксиса: сопоставление трактовок грамматической анафоры / Современная американская лингвистика: фундаментальные направления. М. 2002.

35. Казенин К. И., Тестелец Я.Г. Исследование синтаксических ограничений в генеративной грамматике / Современная американская лингвистика: фундаментальные направления. М. 2002.

36. Кацнельсои С. Д., О Грамматической категории // Вестник ЛГУ, 1948, сер. 2.

37. Кацнельсон С. Д., Типология языка и речевое мышление. М., 1971.

38. Ковтунова И. И., Поэтический синтаксис. М., 1986.

39. Копотев М.В., Неоднозначность и пути ее разрешения в хельсинкском аннотированном корпусе «ХАНКО» // Труды международной конференции "Корпусная лингвистика-2004". СПб, 2004. С. 165—175.

40. Костыркин А. В., К описанию синтаксической неоднозначности в японском (на примере частицы НО) // Московский лингвистический журнал, Т. 5, № 2, 2001. С. 85—98.

41. Куно С., Эттингер Л. Синтаксическая структура фраз и синтаксическаянеоднозначность в английском языке. / Автоматический перевод., ред. О. С. Кулагина и И. А. Мельчук. М., 1971, С. 121-181.

42. Курилович Е., Основные структуры языка. / Курилович Е., Очерки по лингвистике. М., 1962.

43. Лекомцев, Ю. К. Введение в формальный язык лингвистики. М., 1983.

44. Лингвистическое обеспечение системы ЭТАП-2 / Ю. Д. Апресян, И. М. Богуславский, Л. Л. Иомдин и др. М., 1989.

45. Ломтев Т. П. Основы синтаксиса современного русского языка. М.,1958.

46. Мельчук, И. А. Опыт теории лингвистических моделей "Смысл<-УГекст". М., 1999.

47. Мухин А. М. Структура предложений и их модели. Л., 1968.

48. Откупщикова М. И. Общяя парадигматика в морфологии СПб, 1995.

49. Откупщикова М. И. Моделирование языка. / Прикладное языкознание. СПб, 1996. С. 100—112.

50. Падучева Е. В. О способах представления синтаксической структуры предложения. // Вопросы языкознания, № 2, 1964 . С. 99—113.

51. Петерсон М. П. Очерк синтаксиса русского языка. М., Пг., 1923.

52. Пешковский А. М. Русский синтаксис в научном освещении. М., 1956 (переизд. 2001).

53. Пешковский А. М. Как вести занятия по спнтакспчу и стилистике в школе взрослых // Пешковский А. М. Избранные труды. М., 1959.

54. Пешковский А. М. Существует ли в русском языке сочинение и подчинение предложений. // Пешковский А. М. Избранные труды. М.,1959.

55. Прикладное языкознание. СПб, 1996.j* 58.Потебня, А. А. Из записок по русской грамматике. Т. 1—2. Харьков,1889.

56. Распопов, И. П. Методология и методика лингвистических исследований (методы синхронного изучения языка). Воронеж, 1976.

57. Розенталь Д.Э. Практическая стилистика русского языка. М., 1977.

58. Севбо, И. П. Графическое представление синтаксических структур и стилистическая диагностика. Киев, 1981.

59. Секерина, 1997,/ Современная американская лингвистика: фундаментальные направления. М. 2002.

60. Сироткина, О. Б. Порядок слов в русском языке. М. 2003.

61. Современный русский язык. Синтаксис: проблемы и методы исследования. / В. И. Чернов, Т. В. Шмелев. М., 1987.

62. Сухотин Б. В. Оптимизационные методы исследования языка. М., 1976.

63. Тарланов, 3. К. Методы и принципы лингвистического анализа. Петрозаводск, 1995.

64. Теньер, JT., Основы структурного синтаксиса. М., 1988.

65. Тестелец, Я. Г. Введение в общий синтаксис. М., 2001.

66. Тыоринг, А. Может ли машина мыслить? М., 1960. (Turing A.M. Computing machinary and intelligence / Mind, 59, 1950, p.433—460).

67. Уфимцева A.A. Лексическое значение. Принцип семиологического описания лексики. М., 1986.

68. Фитиалов, С. Я. О Синтаксическом анализе. / Доклады третьей всесоюзной конференции по созданию машинного фонда русского языка. М., 1990.

69. Фитиалов С. Я. Синонимия и осмысленность текстов. // Синонимия в языке и речи. (Доклады конференции 15-17 декабря 1969 г.). Новосибирск, 1970, стр.36—50.

70. Фитиалов С. Я. Формальные грамматики. Л., 1984.

71. Хомский I I. Синтаксические структуры // Новое в лингвистике. Вып. II. М., 1962 (Chomsky N. Syntactic Structures. The Hague, 1957).

72. Цейтин Г. С. Алгоритм для упрощенного синтаксического анализа. // Проблемы кибернетики, 1971, вып. 24, с. 227—242

73. Шахматов А. Л. Синтаксис русского языка. М., 2001.

74. Шмелев Л. Д. Типы "невыраженных валентностей" // Семиотика и информатика. Сборник научных статей. Вып. 36. М., 1998. с. 167-17678.1Церба JI. В. Языковая система и речевая деятельность. Д., 1974.

75. Adger, David, Core Syntax: A Minimalist Approach. Oxford, 2003.

76. Antal, Laszlo. The Role of Transformations in the Analysis of Syntactic Ambiguity // Word, 1989, 40, 3, Dec, 349-367

77. Bailyn, John, A configurational approach to Russian "free" word order/ Ph.D. Dissertation, Cornell University, 1995.

78. Bod, Laurens, Enriching Linguistics with Statistics. Performance Models of Natural Language. Diss. Amsterdam, 1995.

79. Brill, Eric and Resnik, Philip, A rule-based approach to prepositionM phrase attachment disambiguation. // Proc. of 15th International Conference on Computational Linguistics, Kyoto, Japan, 1994, p. 1198-1204.

80. Carnie, Andrew. Syntax. Oxford, 2002.

81. Chiang, TungHui and Su, Keh-Yih. Statistical Models for Deep-structure Disambiguation. // Proceedings of the 4th Workshop on Very Large Corpora, 1996, p. 113—124.

82. Channell, Joanna. Vague Language. Oxford, 1994.

83. Chomsky, Noam, Conditions on Transformations / A Festschrift for Morris Halle, ed. Anderson, Kiparski, 1973.

84. Chomsky, Noam, Lectures on Government and Binding, Dorgrecht, 1981.

85. Chomsky, Noam, The Minimalist Program. Cambridge, 1995.

86. Chomsky, Noam, Language and Mind. Cambridge, 2000.

87. Clifton, Charles, Jr; Ferreira, Fernanda. Ambiguity in Context // Language and Cognitive Processes, 1989, 4, 3-4, 77-103.

88. Collins, Michacl and Brooks, James. Prepositional phrase attachmentthrough a backcd-off model. // Proc. of the 3rd Workshop on Very Large Corpora, 27-38, Boston, 1995.

89. Gibson, Edward; Schutze, Carson T; Salomon, Ariel. The Relationship between the Frequency and the Processing Complexity of Linguistic Structure // Journal of Psycholinguistic Research, 1996, 25, 1, Jan, 59-92.

90. Haegeman, Liliane, Introduction to Government and Binding Theory. Oxford UK, Cambridge USA, 1994.

91. IIalliday Mickle. An introduction to functional grammar. London, 1985.p971 lankamer, Jorge, Unacceptable Ambiguity. // Linguistic Inquiry, Vol. 4, # 1, 1973, p. 17-68.

92. Hawkins John. A performance Theory of order and constituency. Cambridge, 1994.

93. Hawkins, John. A parsing theory of word order universals. // Linguistic Inquiry, Vol. 21, #2, 1990.

94. Kay, Paul and Fillmor, Charles. Grammatical Constructions and Linguistic Generalizations: the What's Xdoing Y? Construction. Berkeley, 1996.

95. Liebermann, Philip. The biology and evolution of language. Cambridge, * 1984.ф. 104. Manning, Christopher D; Schutze, Hinrich. Foundations of Statistical

96. Natural Language Processing. Cambridge, 1999.

97. Nakhimovsky, Alexander and Leed, Richard. Advanced Russian. Columbus, 1987.

98. Newmeyer, Frederic, Grammatical theory. Chicago, 1983.

99. Newmeyer, Frederic, Linguistic Theory in America, Orlando, 1986.

100. Nicol, Janet. What Can Prosody Tell a Parser? // Journal of Psycholinguistic Research, 1996, 25, 2, Mar, 179-192

101. Pearlmutter, Neal; MacDonald, Maryellen. Individual Differences and Probabilistic Constraints in Syntactic Ambiguity Resolution // Journal of Memory and Language, 1995, 34, 4, Aug, 521-542.

102. Petkevic, Vladimir. Rule-Based Part-of-Speech and Morphological Disambiguation of the Czech National Corpus // Труды международной конференции "Корпусная лингвистика-2004". СПб, 2004. С. 271—285.

103. Pickering, Martin, Traxler, Matthew and Crocker, Matthew. Ambiguity resolution in Sentence Processing: Evidence against Frequency-Based Accounts // Journal of Memory and Language, 43, 2000, 447—475.

104. Quirk, Randolph et al. A Comprehensive Grammar English Language. Longman, 1985

105. Radford, Andrew. Syntactic theory and the structure of English. Cambridge, 1997(a).

106. Radford, Andrew. Syntax: A Minimalist Introduction. Cambridge, 1997(b).

107. Sag, Ivan; Wasow, Thomas. Syntactic Theory: A Formal Introduction. Stanford, 1999.

108. Shuttleworth, Mark. New Perspectives on Old Problems: A Ilallidayan Approach to Copulative Constructions in Russian // Leeds Working Papersч in Linguistics and Phonetics, 1999, 7, 188-205.

109. Spivcy, Michael; Tanenhaus, Michael. Syntactic Ambiguity Resolution in Discourse: Modeling the Effects of Referential Context and Lexical Frequency // Journal of Experimental Psychology: Learning, Memory, and Cognition, 1998,24, 6, Nov, 1521-1543

110. Stranakova, Marketa. Ambiguity of Prepositional Groups and the Possibility of its Automatic Processing. Summary of Doctoral Thesis. Prague, 2001.

111. Sturt, Patrick; Scheepers, Christoph; Pickering, Martin. Syntactic Ambiguity Resolution after Initial Misanalysis: The Role of Recency. Journal of Memory and Language, 2002, 46, 2, Feb, 371-390

112. Tanenhaus, Michael; Carlson, Greg; Trueswell, John. The Role of Thematic Structures in Interpretation and Parsing // Language and Cognitive Processes, 1989,4, 3-4, 211-234.

113. Trueswell, John. The Role of Lexical Frequency in Syntactic Ambiguity Resolution // Journal of Memory and Language, 1996, 35, 4, Aug, 566-585

114. Trueswell, John; Tanenhaus, Michael. Tense, Temporal Context and Syntactic Ambiguity Resolution // Language and Cognitive Processes, 1991, 6, 4, Nov, 303-338

115. Ullmann, Stephen. Semantics. N.Y., 1962.

116. Wcinreich, Uriel. Exploration in Semantic theory. / Sebeok, T. (ed). Current Trends in Linguistics. The Hague, 1966.1. Словари и энциклопедии

117. ЛЭС — Лингвистический энциклопедический словарь. М., 1990.

118. РГ — Русская грамматика. М., 1980.

119. СЭС — Стилистический энциклопедический словарь русского языка. М., 2003.