автореферат диссертации по филологии, специальность ВАК РФ 10.02.21
диссертация на тему:
Принципы построения синтаксического представления корейского предложения

  • Год: 2009
  • Автор научной работы: Бречалова, Евгения Владимировна
  • Ученая cтепень: кандидата филологических наук
  • Место защиты диссертации: Москва
  • Код cпециальности ВАК: 10.02.21
450 руб.
Диссертация по филологии на тему 'Принципы построения синтаксического представления корейского предложения'

Полный текст автореферата диссертации по теме "Принципы построения синтаксического представления корейского предложения"

На правах рукописи

Бречалова Евгения Владимировна

ПРИНЦИПЫ ПОСТРОЕНИЯ СИНТАКСИЧЕСКОГО ПРЕДСТАВЛЕНИЯ КОРЕЙСКОГО ПРЕДЛОЖЕНИЯ

Специальности:

10.02.21 — «Прикладная и математическая лингвистика» и

10.02.22 — «Языки народов зарубежных стран Европы, Азии, Африки, аборигенов Америки и Австралии (корейский язык)»

Автореферат диссертации на соискание ученой степени кандидата филологических наук

003464339

Москва, 2009

003464339

Работа выполнена в отделе урало-алтайских языков Учреждения Российской академии наук Института языкознания РАН

Научный руководитель:

Научный консультант: Официальные оппоненты:

доктор филологических наук, чл.-корр. РАН Дыбо Анна Владимировна

кандидат филологических наук, Поливанова Анна Константиновна

доктор филологических наук, Разлогова Елена Эмильевна

кандидат филологических наук, Рудницкая Елена Леонидовна

Ведущая организация: ГОУ ВПО «Московский государственный

лингвистический университет»

Защита диссертации состоится . на заседании

диссертационного совета Д 002.006.03 претУчреждении Российской академии наук — Институте языкознания РАН по адресу: 125009, Москва, Б. Кисловский пер., 1/12.

С диссертацией можно ознакомиться в библиотеке Учреждения Российской академии наук Института языкознания РАН

Автореферат разослан«¿.7:.

2009 г.

Ученый секретарь диссертационного совета кандидат филологических наук

А. В. Сидельцев

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Диссертация посвящена исследованию грамматики корейского языка, а именно его морфологии, синтаксису и семантике. В работе предпринята попытка построить для корейского языка грамматическую конструкцию, обеспечивающую представление грамматики в виде системы переходов, подобных тем, которые строятся в моделях типа «СмыслоТекст» (далее МСТ).

Разумеется, во всем объеме такая задача не может быть решена в рамках диссертационной работы, поэтому речь идет о построении грамматической конструкции, которая подобна конструкции типа «СмыслоТекст» по своей организации, но охватывает морфологию, синтаксис и семантику корейского языка не в полном объеме, а лишь частично. Такая конструкция названа в работе скелетальной конструкцией МСТ (термин заимствован из категорного анализа)1.

Прежде всего, рассматриваемые в работе представления смысла отражают не все содержание предложения, а только его актантно-предикатную структуру. Оказалось, что при таком сужении задачи и морфологическое строение предложения можно рассматривать не во всем объеме: достаточно учитывать лишь некоторые (названные в работе ключевыми) показатели. В работе разрабатываются определенные представления предложения и правила, обеспечивающие переход от одних представлений к другим; а именно: морфологическое представление, линейная струюура, синтаксическая структура и акгантно-предикатная структура. Предлагаются независимые системы правил: с одной стороны, правила, обеспечивающие переход от исходного представления текста к его линейной структуре и от линейной структуры к синтаксической; а с другой стороны, правила, обеспечивающие вывод синтаксической структуры из актантно-предикагной структуры данного текста.

Актуальность исследования

Несмотря на достаточно длительную традицию изучения грамматики корейского языка, многие синтаксические проблемы корейского языка остаются не только недостаточно детально изученными, но в известных случаях даже недостаточно подробно описанными. Известно, что для агглютинативных языков многие традиционные синтаксические понятия, сформированные на базе флективных языков, требуют определенных переосмыслений и уточнений, а подчас оказываются и вовсе неприменимы. В настоящее время крайне актуальна задача поиска новых моделей грамматических описаний, адекватных для языков агглютинативного строя и удовлетворяющих требованию межъязыковой сопоставимости. Представленная диссертация могла бы способствовать построению таких грамматик современного корейского языка, ориентированных под разные конечные цели: от типологии до систем автоматической обработки корейского текста.

Цели и задачи диссертации

В теоретическом плане основная цель диссертации — исследовать проблемы, возникающие при построении для корейского языка модели «СмыслоТекст» и построить конкретную скелетальную конструкцию типа МСТ. С

' См., например, Голдблат Р. Топосы. М.: Мир, 1983; Гельфанд С. И., Манин Ю. И. Методы гомологической алгебры. Том I. Введение в теорию когомологий и производные категории. М., 1988.

точки зрения проблем математической и прикладной лингвистики основная цель диссертации — выяснить формально-логические свойства промежуточных представлений предложения (уровней, в терминах МСТ) и правил межуровневых переходов в корейском языке; в частности, показать возможность полной алгоритмизации некоторых блоков конструкции.

Для достижения названных целей в диссертации ставятся и решаются следующие задачи:

А. Разработка и изучение представлений текста

Задачи Важнейшие результаты Структура работы

1. Отработать стандарт скелетальной морфологической структуры предложения Списки ключевых показателей и их грамматическая интерпретация Глава 2, §2.6—25, стр. 71—89

2. Отработать стандарт скелетальных линейных характеристик предложения: МР-разметка словоформ и разбиение предложения на фрагменты Правила перехода от морфологической разметки предложения к его линейной Глава 2, §2.26—43, стр. 90—111

3. Отработать стандарт финального морфологического представления («Линейная структура предложения») структуре

4. Отработать стандарт синтаксического представления предложения (8уп1-Д) Правила перехода от линейной структуры предложения к дереву зависимостей (синтаксической структуре, БуШ-Д) Глава 3, стр. 112—126

Б. Разработка и изучение представлений содержания

Задачи Важнейшие результаты

5. Отработать стандарт скелетальных представлений смысла (актантно-предикатная структура) Описание формальнологического языка акгантно-предикатных структур Глава 4, §4.1—13, стр. 127—142

6. Найти и описать соотношение между синтаксическими структурами и актантными структурами данного предложения Исчисление линейных композиций (преобразований актантно-предикатных структур) и построение выводов из актантно-предикатной структуры синтаксического представления Глава 4, §4.14—41, стр. 143—197

Объект исследования в диссертации — это предложения современного корейского письменного текста.

Предмет исследования — грамматическая и логико-семантическая организация предложений современного корейского текста.

Материал исследования, достоверность результатов

Материал исследования составили тексты на современном корейском языке различных жанров: научная проза, художественная и журнальная литература, сказки; частично привлекался иллюстративный материал из грамматик А. А. Холодовича, Ю. Н. Мазура, С. Мартина, X. Сона и других.2

Новизна исследования

Научная новизна исследования состоит в том, что для корейского языка грамматические описания в идеологии моделей «СмыслоТекст» ранее не предлагались. При этом важно отметить, что в построенном в диссертации описании синтаксический анализ предложения осуществляется независимо от анализа семантического; более того, все используемые синтаксические правила работают без обращения к какого бы то ни было сорта словарям, в частности, без обращения к словарю моделей управления предикатов. Прикладная новизна исследования состоит в том, что разработан принципиально новый подход к построению алгоритмов морфологического и синтаксического анализа корейского предложения. Хотя этот подход учитывает в первую очередь особенности корейского языка, тем не менее он является достаточно общим и может применяться и при разработке грамматик других языков.

Теоретическая и прикладная значимость исследования, практическая ценность результатов

Исследование синтаксиса и формальное моделирование синтаксического анализа отдельного языка принадлежат к проблемам, важным для языкознания в целом. В этом отношении проведенное исследование имеет общетеоретическое значение.

Конкретно-лингвистическая значимость данного исследования заключается, прежде всего, в разработке принципиально нового алгоритма синтаксического анализа. Построенный алгоритм может быть применен с некоторыми поправками к другим алтайским языкам. Грамматические конструкции, аналогичные построенной в работе для корейского языка, могут быть построены и для других алтайских языков. Выявленные при этом данные могут представлять ценность для синтаксической типологии алтайских языков, поскольку для того чтобы сделать предметом типологического рассмотрения более обширные системные явления, необходимы описания соответствующих участков языковой системы для отдельных языков или пар языков.

1 См. Холодович А. А. Очерк грамматики корейского языка. М., 1954; Мазур Ю. Н. Грамматика корейского языка. (Морфология. Словообразование). (Издание подготовлено Л. Р. Концевичем при участии Мун Хесук). М.: Издательский дом «Муравей-Гайд», 2001; Martin, S. Е. А reference grammar of Korean. Charles E. Tuttle Company, Rutland, Vermont and Tokyo, Japan, 1992; Sohn, Ho-Min. The Korean Language. Cambridge University Press: Cambridge (Mass.), 1999.

Результаты предлагаемого синтаксического описания представляют значимость и для прикладной лингвистики: сформулированные правила синтаксического разбора корейского предложения могут быть использованы в практике преподавания корейского языка, а разработанные алгоритмы могут быть использованы в различных системах автоматической обработки корейского текста.

Основные результаты исследования, выносимые на защиту

1. Для обнаружения отношений синтаксической доминации и актантно-предикатных связей, имеющих место в обрабатываемом предложении, достаточно располагать следующей информацией: 1) каков грамматический класс (N или Р) каждой словоформы, входящей в предложение, 2) какие синтаксически значимые показатели входят в словоформу, 3) какова обобщенная грамматическая характеристика словоформы. Указанную информацию манифестируют 48 показателей-ключей, список которых представлен в настоящей работе.

2. Сперва строится линейная структура предложения, представляющая собой его лексемную запись, в которой при каждой лексеме указана только синтаксически значимая морфологическая информация. Линейная структура строится лингвистически обоснованной и алгоритмически эффективной системой морфологического анализа (алгоритм 1), которая выделяет ключевые показатели в словоформах предложения и в соответствии сними приписывает каждой словоформе эту информацию.

3. Построенная система синтаксического анализа (алгоритм 2) позволяет строить скелетальное синтаксическое представление предложения, то есть дерево, в котором отражены отношения непосредственной доминации. Алгоритм (2), обеспечивающий переход от линейной структуры к синтаксическому представлению, расставляет в линейной структуре скобки на основании предложенного списка допустимых конфигураций «слуга-хозяин» (см. табл. 4); расстановка скобок предполагает циклическое использование списка допустимых конфигураций. Скобочная запись автоматически переводится в дерево.

4. Предложенный в работе формально-логический язык для записи актантно-предикатного представления предложения использует в качестве атомарных единиц объекты, практически копирующие лексемы корейского языка.

5. В работе предъявляются 6 правил «линейных композиций», а именно: «Лдъективизация», «Р-внедрение», «Врезка Ч'-узла», «Copul-введение», «Сочинительное сокращение», «Понижение глубины формулы и/или валентности невершинного узла». Последовательность применения этих правил к акгантно-предикат-ной структуре строит вывод из нее синтаксического представления предложения.

6. Классификация корейских предложений, содержащих две предикации, оценивает механизм связывания двух клауз: по адъекгивизации, по Р-внедрению, по сочинительному сокращению, по Copul-введению.

Апробация и внедрение результатов

Основные положения диссертации были представлены на конференции Korean Studies Graduate Students Convention (KSGSC) (Прага, 2006), на конференции «Корейский язык и литература в XXI веке. К 100-летию со дня рождения А. А. Холодовича» (Санкт-Петербург, СПбГУ, 2006), на конференции в Институте востоковедения РАН «Востоковедные чтения 2008» (Москва, 2008), на

семинарах «Некоторые применения математических методов в языкознании» (под руководством В. А. Успенского и М. Р. Пентуса) (Москва, МГУ им. Ломоносова, 2006—2007). По теме диссертации опубликованы четыре статьи (см. список публикаций). Работа была обсуждена в центре компаративистики Института восточных культур и античности РГГУ. По теме диссертации был прочитан спецкурс «Теоретическая грамматика корейского языка» (2007/2008 учебный год) в Институте восточных культур и античности (специализация — история и филология Кореи) РГТУ; правила синтаксического анализа, рассматриваемые в работе, используются на практических занятиях по корейскому языку со студентами той же специализации в течение четырех лет (с 2005/2006 учебного года).

Структура диссертации

Диссертация состоит из введения, включающего краткий обзор литературы, пяти глав и трех приложений.

Глава 1 «Изучаемые представления предложения. Образцы» посвящена первоначальному рассмотрению структуры изучаемых представлений.

Глава 2 «Линейные структуры» посвящена изучению линейных струюур; там же приводятся полные правила их построения (алгоритм 1).

Глава 3 «Синтаксические структуры» посвящена изучению синтаксических представлений; там же приводятся полные правила их построения (алгоритм 2).

Глава 4 «Актантно-предикатные структуры» посвящена изучению акгантно-предикатных структур; там же приводится исчисление, обеспечивающее переход от актантно-предикатной структуры к синтаксической структуре предложения.

В главе 5 «Основные выводы» кратко формулируются важнейшие выводы работы.

Приложение 1 представляет собой словарь-индекс к контрольному корпусу текстов, Приложение 2 — сам контрольный корпус текстов, снабженных всеми разработанными представлениями. В Приложении 3 приводится компьютерная программа, позволяющая автоматически строить разработанные синтаксические представления.

ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ

Введение и Глава первая («Изучаемые представления предложения. Образцы») посвящены постановке задачи и описанию формата ее решения. Задача работы — разработать систему представлений корейского предложения, удовлетворяющую следующим условиям:

(1) среди этих представлений есть два краевых представления: одно отвечает означающему («исходный текст»), другое — означаемому («исходный смысл») обрабатываемого предложения;

(2) соотношение между краевыми представлениями определяется системой промежуточных представлений, связанных с краевыми представлениями и между собою правилами формальных преобразований.

Сформулированная задача может осмысляться как построение «малого аналога» модели типа «СмыслоТекст» для корейского языка. Основное отличие от классической модели «СмыслоТекст» состоит в том, что смысл представлен здесь не полными смысловыми представлениями, а специальными представлениями, отражающими актантно-предикатные связи и только их.

Решение названной задачи представлено конструкцией следующего вида:3

«текст» ПРЕДЛОЖЕНИЕ «смысл» о-о

Материал исследования и контрольный корпус предложений. Материал исследования составляют тексты различных жанров: сказки (обработано 15 сказок в современном переложении), научная проза (4 статьи из журнала 8а!епзи 01сеу) и художественная литература.4 Предъявляемый в работе контрольный корпус представляет приблизительно 20% от всего обработанного массива текстов; в него вошли: сплошной текст одной сказки («Жаба»), и одной научной статьи («Космос»), общей длиной 69 предложений.

Полный разбор предложений из контрольного корпуса (с указанием всех четырех представлений и выводов синтаксической структуры из актантно-предикатной) приводится в приложении.

Исходное представление означающего (текст). Исходное представление означающего — это расчлененная запись, то есть запись в транслитерации с отделенными показателями. Выбор этого вида представления в качестве исходного объясняется тем, что соответствующий компонент сегментной грамматики корейского языка, т. е. обеспечивающий переход от орфографии к расчлененной записи, может быть четко отделен от компонентов, представляющих основной объект изучения в диссертации.

Исходное представление означаемого (смысл). Исходное представление означаемого — это актантно-предикатная структура предложения. Выбор этого вида представления в качестве исходного объясняется тем, что наша

3 Здесь и далее синтаксическая структура обозначается «Synt-Д» (символ треугольник), актантно-предикатная структура обозначается «Р-О» (символ квадратик).

4 См. Cang Kiswuk (пересказ). Khwulkhwul.iwa ppwungppangi. (Серия «101 сказка, которые рассказывает нам папа»), Сеул: Изд. Хёнминсисытхем, 2001; Saiensu Olcey: Scientific American Hankwukphan — Журнал «Scientific American», корейская редакция; Kim Yucong, Tongpayk.kkoch. (Ким Ючжон. Цветок камелии) (Избранные корейские рассказы нового времени). М.: Международный центр корееведения МГУ, 2003. С. 223—234.

основная цель — изучить нетривиальные соотношения межлексемных связей, имеющих место, с одной стороны, в тексте, а с другой стороны, в смысле. Важнейшие межлексемные связи в тексте — это отношения непосредственной синтаксической доминации; важнейшие межлексемные связи в смысле — это актантно-предикатные связи. Предполагается, что все прочие элементы смысла, содержащиеся в полном смысловом представлении предложения, представимы в виде результатов насыщения и преобразования актантно-предикатной структуры.

Принцип скелетальности. Разрабатываемые представления чрезвычайно бедны. Если исходное представление текста показывает изучаемое предложение, грубо говоря, как оно есть, то во всех других представлениях отражаются лишь некоторые черты морфологической, синтаксической и смысловой организации изучаемого предложения. Наша цель — не отразить всё наблюдаемое в предложении, а отразить лишь некоторые наблюдаемые черты грамматического устройства изучаемого предложения, а именно, только те, которые оказываются необходимыми для формулировки правил, описывающих соотношения между разными представлениями. Такие неполные, редуцированные представления названы в работе скелетальными. Соответственно и вся конструкция скелетальна. Построенная скелетальная конструкция может затем по мере необходимости подвергаться многократным обогащениям.

Вопрос о том, какие черты строения предложения должны быть признаны существенными и войти в скелетальные представления, а какие — нет, не может иметь формально обоснованного ответа. Выбор тех или иных характеристик в качестве существенных решается в значительной степени в условном порядке.

О правилах, задающих соотношения между представлениями. Правила, задающие соотношения между двумя видами представлений одного и того же предложения, могут различаться, во-первых, по направлению, во-вторых, по своей формальной организации. А именно, они могут задаваться в логике «правил пересчета» (так, что применение системы правил приводит к единственному конечному представлению для каждого исходного выражения) или в логике «исчислений» (так, что применение системы правил приводит хотя бы к одному допустимому конечному представлению для каждого исходного выражения).

В диссертации правила перехода вида «МрЬ—»иг^г» и правила перехода вида «Ьт51г—»ЭупЬЛ» задаются в формате правил пересчета, а правила перехода вида «Р-й->8упЬД» — в формате исчислений; в последнем случае говорят о выводе выражения ЗупЬД из выражения Р-П. Таким образом, правила перехода вида «Текст—»Смысл» (анализ) задаются правилами пересчета, а правила перехода вида «Смысл—»Текст» (синтез) — исчислением.

Важнейшие особенности предложенной конструкции. Укажем основные отличия конструкции, разработанной в представленной диссертации, от классической версии грамматик вида «Смысл<=>Текст»:

1) все представления — скелетальны;

2) правила перехода направлены в разные стороны: от текста к синтаксическому представлению, от смыслового представления к синтаксическому представлению;

3) правила перехода не используют словарей с богатой приписанной информацией, а обходятся в случае необходимости относительно короткими списками;

4) узлы смысловых представлений заполнены естественно-языковыми лексемами.

Образцы представлений. Приведем пример одного корейского предложения и его четырех представлений:

Исходное предложение:

давным-давно некоторый деревня_большой переполох_случаться_

Давным-давно в одной деревне случился большой переполох

Его первичное морфологическое представление: уеувпа! епи таи1=еу к1ш=п sotong=i ¡1.епа=а53=е=уо

Его линейная структура:

yeysnal enu maul khu[| sotong il.ena||

N N N P|l N Pll

0 0 Dat Part|| Nom InfFin||

Его синтаксическая струиура (ЗупЬД):

'(теуеу8па1)4 5(епи)5)3 6(таи1)6)2 ШМ' '"О^Т "(п.епа)")7)'

il.ena случаться

/

maul деревня

\

sotong переполох

кИи большой

епи некоторый

yeysnal давно

Его актантно-предикатная структура (Р-картинка, P-D):

п

1сл>

¡1.епа случаться

50[0П§

переполох

кЬи большой

вОКИЩ переполох

В главе 2 («Линейные структуры») изучаются линейные представления корейских предложений.

Содержательная характеристика линейных структур. Линейные структуры строятся так, что: (1) они содержат все данные, необходимые для построения синтаксических структур; (2) переход от исходного представления к линейным структурам обеспечивается автоматическими правилами, причем правила должны быть свободными (бесконтекстными) и не использовать словарных данных, за исключением, быть может, коротких списков; (3) они максимально скелетальны, то есть не содержат никаких лишних морфологических данных.

Линейная структура задает лексемный словарь обрабатываемого предложения, порядок следования лексем в тексте и некоторые грамматические характеристики соответствующих лексем. В ходе исследования выяснилось, что из грамматических характеристик необходимы, во-первых, сведения о принадлежности лексемы к одному из двух грамматических классов (Р или К), а во-вторых, некоторый набор специальных грамматических меток.

Грамматические классы. Деление всех лексем на два грамматических класса Р и N можно рассматривать как определенное укрупнение традиционной частеречной классификации: в класс Р попадают глаголы, адъективы и некоторые служебные слова; все прочие лексемы попадают в тот же класс, что и обычные субстантивы.

Приведем несколько примеров:

Лексема Класс (Р или >1) Перевод Часть речи

са е1уер ки1еЬ

^ауЬа

ЧауЬа

\viha

иуЬа сИат

БОИ

ЬапсЬат ¡И кеиу ки!ет

Р Р Р

Р

N

Р

Р N N N N N N

спать

трудный

но

(1) относиться к

(2) предлог о, об креветка

(1) служить (кому-нб., чему-нб.)

(2) с целью, чтобы

зависеть от, с помощью чего-лб.

действительно

рука

некоторое время

сюда

почти

ну, тогда

глагол

прилагательное союз

(1) глагол

(2) послелог существительное

(1) глагол

(2) послелог послелог наречие

существительное

наречие

наречие

наречие

междометие

Грамматические метки. Грамматические метки — это результат определенного пересчета служебных показателей. Однако пересчет не прямой: во-первых, учитываются не все показатели, а только некоторые, так называемые ключевые; во-вторых, в общем случае одна грамматическая метка соответствует нескольким разным показателям. Всего разных грамматических меток — 10:

Ы-метки Р-метки

Ай Тор Сот 05 СопУ РаП & М Ытпг Аёу

О метке «0» см. ниже в табл. 1 Ш-ключи и их метки».

11

Ключевые показатели. Всего выделено 48 ключевых показателей (или ключей). К неключевым отнесены показатели, отмечающие разного рода семантические модификаторы, как, например, «число», «вежливость» и др. Приведем пример корейского предложения с ключевыми показателями, выделенными жирным шрифтом:

kuleh=e=se unswuce=Iul ilh=e peli=n maul salam=tul=un choncang=nim=ul

chac.aka=ass=ci=yo (Поэтому деревенские жители, потерявшие серебряные столовые приборы, пришли к старосте).

В подавляющем большинстве случаев по ключевому показателю однозначно определяется грамматический класс соответствующей лексемы, однако это не всегда так. Соответственно, все ключи делятся на Р-ключи (возможны только при Р-лексемах), N-ключи (возможны только при N-лексемах)6 и Х-ключи (возможны как при Р-лексемах, так и при N-лексемах). Так, в приведенном примере е, n, ci — Р-ключи, lui — N-ключ, a un, ill — Х-ключи.

Классы ключей. Разбиение ключей на указанные три класса, а также соответствие «ключи-»метки» показывают следующие таблицы:

Таблица 1. N-ключи и их метки Прочие N-словоформы*

Ключи i lui ey lo ulo kwa wa

Метки Act** Com 0

(Nom) (Acc) (Dat) (Instr)

•Все вхождения К-лекссм, не сопровождаемые никакими ключами, получают метку 0.

"Собственно грамматической меткой является только символ Act, однако для удобства читателей иногда символ Act заменяется символом соответствующего падежного показателя.

Таблица 2. Р-ключи и их метки

са ulye 0 ko a ci key

ketun myen so la e ki

kwun umyen tay ula m

Ключи kwuna па ♦1= *l mye um

le una tolok *n= *n_ umye

ule ni tus ta

lye uni tus.i

Метки ConV Part & Inf Nmnz Adv

»1= и *п= — непоследнее вхождение в цепочке показателей; *1_ и *n — последнее вхождение в

цепочке показателей

6 Приведенная формулировка несколько упрощена: в действительности, в некоторых специальных случаях, включи могут сочетаться с Р-ключами в составе оформления одной Р-словоформы. Однако в силу обязательности Р-ключей при Р-словоформах эти случаи не мешают использованию Р- и Ы-ключей для определения грамматического класса вхождения той или иной лексемы.

Таблица 3. Х-ключи и их метки

Формативы Грамматические метки (у)

Х-ключ у-метка при N-словоформе у-метка при Р-словоформе

Последний Непоследний в словоформе в словоформе

ka Act (Nom) ConV

пеу 0

nun, un Тор Part ConV

ul Act (Асс)

Фрагменты. Предложение представимо в виде цепочки фрагментов — линейных единиц, ранг которых старше ранга лексемы, но младше ранга предложения. Границы фрагментов проходят по Р-лексемам. Фрагмент, в отличие от словосочетания или клаузы, — это ранговая единица текста, поэтому фрагменты не могут пересекаться. Границы фрагментов отмечаются в линейной структуре (знаком ||), поскольку ссылки на границы фрагментов и структуры фрагментов содержатся в некоторых алгоритмах анализа, хотя и играют там сугубо техническую роль.

Границы между фрагментами в корейском тексте определяются тривиально: каждый фрагмент оканчивается Р-словоформой и никакой фрагмент не может содержать более одной Р-словоформы. Приведем два примера:

Пример (1)

sey mali yewunun kkingkkingkel¡mye|| wunpanhataka || camsi swiessta ||

три голова лиса пыхтеть тащить недолго отдохнуть

Три лисицы, пыхтя, тащили (рыбу), а потом остановились немного отдохнуть.

Пример (2)

yewu han malika hanun || mali mwulul masiko || kasie || лиса один голова делать слово вода пить идти

Одна лисица сказала: «Давайте выпьем воды и пойдем (дальше)».

Линейные структуры: обсуждение. Как уже отмечалось, выбор тех или иных показателей в качестве ключевых и ряд принятых решений по работе правил носит эмпирический характер; при расширении эмпирической базы правила могут определенным образом модифицироваться. Существенное достоинство предлагаемых правил, состоящее в том, что правила эти не обращаются к словарю лексем, не зависит от эмпирической базы.

Глава 3 («Синтаксические структуры») посвящена изучению синтаксических представлений.

Формальная организация синтаксического представления. Синтаксическое представление — это дерево, в узлах которого расположены лексемы соответствующего предложения, а ребра соответствуют отношениям непосредственной синтаксической доминации. В дереве, соответствующем некоторому предложению, узлов столько, сколько в этом предложении имеется слово-

форм, причем разным вхождениям одной и той же лексемы соответствуют разные узлы. Так, например, предложению

(1) saca-ka saca=lulpo=n=ta (лев видит льва)

соответствует такое синтаксическое дерево:

ГрГЛ

^идеть,

/ \

saca saca

лев лев

Подчеркнем, что отдельным служебным словам (послелогам, союзам, служебным предикатам и т. п.) в дереве соответствуют отдельные узлы. Так, например, предложению

(2) elma hwu ka=lye=ko ha=ass=ul ttay kapcaki pay=ka aphu=ass=ta (Через некоторое время, когда (лисы) уже собирались отправиться, у них вдруг разболелись животы)

соответствует такое синтаксическое дерево:

kapcaki вдруг

I

ttay когда

hwu после

I

elma некоторе время

Из одного узла может выходить в общем случае неограниченное число ребер, иначе говоря, валентность узлов не ограничена. При этом, разумеется, из узла, соответствующего некоторой лексеме Ь, в одном дереве может выходить одно ребро, в другом — два, и т. д.

Так, например, предложению

(3) кират=еу=пип пау=ка см>1=1и1 ссоск=пип яаса=1и1 карсаИро =а$$=1а (той ночью я вдруг увидел льва, преследовавшего мышку)

соответствует такое синтаксическое дерево:

kapcaki вдруг

Хотя ребра не помечены, порядок расположения ребер — существенен. Так, например, два следующих рисунка изображают разные деревья.

(а)

G

ccoch преследовать^

(Ь)

ccoch 4 ^преследовать,

/ \ / \

na saca saca na

я лев лев я

Синтаксическому дереву (а) соответствует такое предложение: па=пип saca=lul ccoch=nun=ta (я преследую льва), а синтаксическому дереву (б) соответствует предложение: saca=nun na=lul ccoch=nun=ta (лев преследует меня).

Однако задача отождествления синтаксических отношений не ставится. Так, например, предложению: twukkepi=ka malangaеу ttwieka=n=ta (во дворе прыгает > соответствует следующее синтаксическое дерево:

( ttwieka" ^прыгать

/ \

Шиккер! matang жаба двор

Предложению №иккер1=ка рИаН=Ы тек=е$$=1а (жаба съела муху) соответствует следующее синтаксическое дерево:

' тек ^ съесть}

/ \

tvmkke.pl рИаИ

жаба муха

Приведенный пример показывает, что синтаксическая структура не различает актантных и сирконстантных синтаксических связей.

Правила перехода вида «Ь1 пЯIгБуШ-Д». Правила построения синтаксической структуры данного предложения по его линейной структуре работают так: сперва строится искомая расстановка скобок, затем по полученной

расстановке скобок строится дерево синтаксических зависимостей. Основная часть правил (расстановка скобок) опирается на список допустимых конфигураций скобок — выражений, являющихся схемным обобщением элементарных (двухком-понентных) составляющих.

Приведем список допустимых конфигураций скобок:

Таблица 4. Допустимые конфигурации скобок

Конфигурации первого блока

1 N0 + N*

2 Р& + PPart

Конфигурации второго блока

N + N

3 NCom + NTop

4 NCom + NAct

N + P

5 NTop + V*# /PConv

6 NAct + P (#PPart, *PAdv)

7 N0 + P*

P + N

8 PPart+ N*

Р + Р

9 P(*PPart) + P*#/PConV

10 P& / PNmnz + PInf

11 PInf + PPart

12 PAdv + P*

N1* и Р* — N (или Р), с любой меткой; Р*# — Р с любой меткой, если

это последнее вхождение Р-лексемы в предложение. Символ (УРРаг!)

читай: метка Р - — любая Р-форма, отличная от Paît.

Циклы и переименование скобок. Правила работают следующим образом: линейная структура обрабатывается с начала к концу, причем в первую очередь отыскиваются все конфигурации первого блока (конфигурации 1, 2), затем — второго (конфигурации 3—12). Как только найдена первая допустимая скобка, соответствующее выражение обрамляется открывающей и закрывающей скобкой и кзакрывающей скобке приписывается метка последнего в скобке выражения. После чего полученное выражение вновь обрабатывается правилами первого блока. И так до тех пор, пока в обрабатываемом выражении не останется ни одного подвыражения, которое можно было бы заключить в скобки по правилам первого блока.

Только по достижении указанного состояния правила переходят к обработке полученного выражения операциями второго блока.

Синтаксические структуры: обсуждение. Полученные синтаксические структуры в значительном числе случаев не отражают наблюдаемых в предложении семантических связей. Этот результат отвечает поставленной цели: отделить синтаксический анализ от смыслового. Рассмотрим один пример:

ai=ka panana (han) pakwuni=lul mek=ess=ta (Ребенок съел корзину бананов)

Синтаксическая и актантно-предикатная структуры этого предложения:

Синтаксическая структура

/

тек кушать

ai

ребенок

\

pakwuni корзина

Актантно-предикатная структура

тек кушать

X

ai

ребенок

panana банан

panana

банан , - .

pakwuni panana

корзина банан

Наблюдаемое несоответствие между синтаксическими связями (ср. кушать (ребенок, корзина)) и семантическими связями (ср. кушать (ребенок, банан)) преодолевается на этапе перехода от актантно-предикатной структуры к синтаксической соответствующими правилами линейных преобразований.

Глава 4 («Акгантно-предикатные структуры») посвящена изучению акгантно-предикатных представлений.

Формальная организация актантно-предикатной структуры. Актантно-предикатная структура или, коротко, Р-картинка — это неупорядоченная совокупность атомарных Р-формул. Поскольку атомарные Р-формулы — это деревья, можно было бы говорить о лесе. Необходимо специально подчеркнуть, что в одной Р-картинке может быть несколько одинаковых Р-формул.

Так, например, приведенные ниже рисунки — это разные Р-картинки:7

Р-картинка (а)

sicangha голодный

saca лев

са спать

saca лев

sicangha ^ голодный

i

Р-картинка (Ь) Г

saca лев

са спать

saca лев

sicangha голодный )

saca лев

са спать

saca лев

Замечание о содержании Р-картинок. Поскольку Р-картинки отражают актантно-предикатные связи и только акгантно-предикатные связи, постольку разным предложениям могут соответствовать одинаковые Р-картинки. Приведем два примера.

В Р-картинках не отражаются сирконстанты, поэтому такие пары предложений, как например (а) и (а1), имеют одинаковые Р-картинки:

7 Вторая Р-картинка может быть Р-картинкой такого предложения: есеу=ро1а /е í^cдиgЛíг=/7 $ася=£л сат=11и1=ез!Ча (сегодня лев заснул еще более голодным, чем вчера).

(а) ххсапфа^п яаса^ка са=п=1а (а') sicangha=n Баса=ка таи1=еу са=п^а (Голодный лев спит) (Голодный лев спит в деревне)

Р-П

í sicangha ^голодный

са спать

saca лев

saca лев

В Р-картинках не отражаются межпредикатные связи, поэтому такие пары предложений, как например (Ь) и (Ь1), имеют одинаковые Р-картинки:8

(Ь) т=каpokswunga=lul тек=ко (Ь1) Ы=ка яз^ЫреИ-корокяки^а=1и1

реН=еа=1а тек=е$$=Ш

(Ребенок съел персик и выбросил косточку) (Ребенок выбросил косточку и съел персик)

Р-П

тек есть

а1 роквлушща

ребенок персик

' peli ' ^бросать ,,

/ \.

ai ssi

ребенок косточка

Язык Р-картинок. Язык Р-картинок — это особый формальный язык, построенный специально для записи актантно-предикатных структур предложения. Отметим основные особенности описываемого языка.

1) Алфавит атомарных символов — это естественные корейские лексемы; точнее — их аналоги. Несколько огрубляя, можно сказать, что реальные корейские лексемы и их аналоги в Р-картинках находятся во взаимно-однозначном соответствии. Для наглядности корейские лексемы в Буп^А набираются курсивом, а их аналоги в Р-картинках — корпусом.

По постановке задачи главная цель — сопоставить Р-картинки и 5уп1-Д одного и того же предложения, а в БупЬД в узлах стоят реальные корейские лексемы; поэтому чем элементарнее будет соответствие, устанавливаемое на узлах Р-картинки и БуШ-Д, тем яснее будут выступать интересующие нас отличия этих двух видов представлений.

Среди атомарных символов различаются предикаты (иначе — предикатные буквы) и термы (а именно, только индивидные константы). Атомарные Р-формулы строятся из предикатов и термов по обычным правилам.

2) В языке Р-картинок нет ни переменных, ни кванторов, ни связок. В

актантно-предикатных структурах фиксируются только атомарные предикаты. Если

Ср. пример: разделся и окунулся и окунулся и разделся (Мельчук И. А. Опыт теории лингвистических моделей «Смысл-текст». М.: Наука, 1974. стр. 145).

сравнивать с классическим исчислением предикатов, — только предикатные буквы, замкнутые подстановкой на место переменных допустимых индивидных констант.

В Р-картинках используются, во-первых, символы метапеременных, а во-вторых, один специальный вспомогательный символ — s. Содержательно вспомогательный символ s употребляется для обозначения того факта, что в рассматриваемом предложении тот или иной актант замещен предикатом. Однако формально это замещение производится за пределами Р-картинки, то есть при построении вывода. При этом соответствующие преобразования можно применять, только если такая подстановка предусмотрена соответствующей предикатной буквой; то есть, если формула вида Р(А, s) содержится в исходной Р-картинке. Предикаты, допускающие символ s, в других своих вхождениях могут на том же месте допускать и обычную переменную (терм, t). Приведем для примера несколько предикатных букв, допускающих подстановку символа s:

Предикат Пример s-подстановки Пример t-подстановки

_Р(Х, s)_P(X,Y)_

elyep (kwahakca, sayngkak.ha) elyep (na, mwuncey) трудный (я, трудный (ученый, думать) проблема)

thamkwuha (salam, pwukpyengha thamkwuha (senpi, yukyo) (wucwu)) исследовать (ученый, исследовать (классик, неизменный (космос)) конфуцианство)

kkwu (kwahakca, kvvulkok.ha .. , . . . , .

, 4 .. kkwu (hankwuk.in, kohyang) (wucwu)) видеть-сон (ученый, , ,

7 ,, видеть-сон (кореец, родина) искривляться (космос))

Расширение словаря предикатных букв и термов. Во-первых, некоторые предикатные буквы словаря Р-картинок соответствуют не Р, a N-лексемам естественного корейского языка, формируя предикаты особого статуса, так называемые «^-предикаты». Этот их особый статус проявляется в правилах перехода вида «P-D—>Synt-A» (см. ниже). Таковы, например, се (тот), certchey (весь). (В работе приводится список по контрольному корпусу в 17 единиц).

Во-вторых, некоторые предикатные буквы и термы словаря Р-картинок в некотором смысле вовсе не имеют аналогов в среде естественных корейских лексем. Таковы:

(1) фиктивные предикаты и термы, соответствующие в разных своих вхождениях разным корейским лексемам, — таков, например, предикат Copul (корейские эквиваленты: i, toy и др.), терм Fact (корейские эквиваленты: kes, il и др.);

(2) фиктивные предикаты, вовсе не имеющие в корейском тексте лексического соответствия, — таковы фиктивные предикаты BELONG (в Р-картинках символ «е», инцидентность), CONT (в Р-картинках символ «Cont», состав);

(3) предикатные буквы, которым в корейском тексте никогда не соответствует отдельная лексема, поскольку соответствующий смысл всегда передается с помощью лексических функций, — таков, например, фиктивный предикат *P(wiem) (достойный).

elyep (A, s) thamkwuha (А,

s)

kkwu (A, s)

Исчисление А: правила линейных композиций

Линейная композиция «Адъективизация»

(а) М (Р)

о'""

I I

Су)

р<»>

''' I4

^ 1 (а) М (Р)

I

I ♦

(У)

(а)9, (Р) могут быть пустыми; соответственно, в Р<п> п > 1, (у) * 0; соответственно, в С}<т) т > 1

Х2. Линейная композиция «Р-внедрение» р<"> д<»> р<„+1)

' 4 1 У . V

,< 4 • :

<») ® '-() (О) У (1!)

I

I ^

(У)

(сх)и(|5)*0;вР(п)п>1 (у)^0;вд<т)т>1

Х3. Линейная композиция «Врезка У-узла»

Р(

/ I \

о

' I 4

ч \

/ Ч

(а) М (Р) (У) (5)

£ (а)

(Р)

(У)

(6)

(а), (Р) могут быть пустыми; в Р(п) п > 1

М

(у)и(5)*0; вЛг 1

9 Здесь и далее греческие буквы в скобках ((а), (Р) и подобные) обозначают пучок ковалентных стрелок, т. е. стрелок, выходящих из одного узла.

Я4. Линейная композиция «Copul-введение» р<п) Copul Copul

/|\ I I

|/ \ 4 или I

с«) м (Р) /:[ рр

/ I \ I

(«) М (Р) Р(п>

' i 4 '' 4

¿ J, ^ (а) М (Р)

(а), (р) могут быть пустыми; в P(n) n > 1

Я5. Линейная композиция «Сочинительное сокращение»

р(п> р(ч) р(п)

/ \ . / \ — / \

А М В М А М

I

В

А.6. Линейная композиция «Понижение глубины формулы и/или валентности невершинного узла»

р(»>

11 (а)

(у)

po + i:

(Р)

(б)

к.' (а)

М

(Р)

(У) (5)

М

(а), (р), (у), (5) — все могут быть пустыми; п > 1, т > 1 если т = 1, то С2 обращается в нульместный узел

Техника построения выводов

Общее. Построению вывода может предшествовать нулевой цикл — определенное преобразование входной Р-картинки; конечное выражение может быть подвергнуто финальной обработке, состоящей в удалении некоторых повторяющихся поддеревьев; и, наконец, очищенный результат вывода сопоставляется с заданной синтаксической структурой — Эуги-Д. Нулевой цикл может содержать связывание, переворот, а также преобразования, вызванные введением лексических функций или операторов.

Нулевой цикл: связывание. Если в Р-картинке присутствует атомарная формула с символом э, вида Р(з), то необходимо определить, предполагается ли в данном выводе подстановка на место б какой-нибудь атомарной формулы из числа представленных в данной Р-картинке. Если да, то необходимо произвести сперва «назначение», а затем подстановку, и полученное выражение внести в число начальных выражений; так строится преобразованная Р-картинка, обозначаемая <Р0>.

Рассмотрим Р-картинку некоторого предложения:

sayngkak.ha думать .

С

/ \

кдуаЬакса

ктеизегщЬа образовывать

/ \

ученые

ипЬа галактика

wucwu космос

(сепсЬеу^ весь .

космос

Одна из Р-формул этой Р-картинки содержит символ э. Назначим в качестве в Р-формулу кткегщЬа (ипЬа, у/исли). Произведем подстановку на место б этой Р-формулы. Производное выражение, результат подстановки, имеет вид:

заугщкак.Иа думать

/ \

к\уаЬакса ученые

^образовывать) / \

ипЬа \vucwu галактика космос Нулевой цикл: переворот. Если в заданной Буг^-Д какие-то Р-лексемы содержат специальное предупреждение об имевшей место мене диатез, необходимо осуществить «переворот» соответствующих поддеревьев и внести полученное производное выражение в число начальных выражений; так строится преобразованная Р-картинка, обозначаемая <Ро>.

Рассмотрим Р-картинку некоторого предложения:

С сЬек.Иа ^ (^притворяться;

гл / \

' ро ! бояться

пот тварь

погп тварь

twukkepi жаба

ш\\'и1 укусить

/

пот тварь

пеЬ класть

/ \

пот тварь

БОП

рука

(Сори1 ]

Предикат тч>и1 (кусать) в ЗупЬД этого предложения помечен звездочкой (символ мены диатез). Поэтому в нулевом цикле вывода для этого предложения соответствующая Р-формула Р-картинки будет «перевернута»:

Г~П\\'ир ^ укусить^

/ \ ~~ / \

1\\иккср1 пот пот 1\уиккер1

жаба тварь тварь жаба

Нулевой цикл: лексические функции. Если между лексикой Р-картинки и лексикой заданной ЭупЬД наблюдается «зазор» (отсутствует одно-однозначное соответствие), который в данном выводе предполагается преодолевать с помощью лексических функций, необходимо произвести все преобразования и полученные производные выражения внести в число начальных выражений; так строится преобразованная Р-картинка, обозначаемая <Ро>.

Рассмотрим в качестве примера БугЦ-Д и Р-картинку следующего предложения: ки1е!г=п=1еу рет.т=и1 сар=и1 ши ¡¡$=и1=кка? (Но как вы думаете, возможно ли поймать преступника?)

Буг^-Д Р-картинка

mwul* ^укусить

kuleh

„ но J

r*p(swuy cap

^ мочь J (ловить

swu возможность

7\ /\

X (7) X ре

преступник

pem.in преступник

(~cäp~\

ловить j

Легко видеть, что в Synt-Д этого предложения в узлах расположены лексемы iss (иметь) и swu (возможность), которые отсутствуют в узлах Р-картинки. *P(iwu), не существующую в корейском лексему, представляющую собой склеенный Орег от swu, то есть //Oper {swu), заменяем на расклеенный Oper (swu), то есть iss; получаем:

*P(swu) . мочь .

/ \

х СЮ

Oper (swu) / \

swu

i

iss \ < иметь j

/ I

X swu возможность

I

Назначим в качестве s Р-формулу cap (X, pem.in). Результат подстановки имеет вид:

158 иметь

/ I

X swu возможность

сар

ловить /~\

X решлп

преступник

Нулевой цикл: операторы. Если в выводе предполагается использовать преобразования, вызванные операторами, то необходимо произвести «назначение», а затем по правилам преобразований данного оператора построить производное выражение и включить полученные производные выражения в число начальных выражений; так строится преобразованная Р-картинка, обозначаемая <Ро>. (См. также ниже).

Формально Р-картинки фиксируют актантно-предикатные связи и только актантно-предикатные связи. Однако в ряде случаев в диссертации все же рассматриваются и связи между предикатами, вводимые в предложение так называемыми операторами. Оператор — это как бы предикат старшего порядка: его операндами могут быть предикаты или производные выражения, содержащие предикаты. Каждому оператору соответствуют, с одной стороны, требования к операндам, с другой стороны, правила, позволяющие строить из одного (одноместный оператор) или нескольких (двух- или трехместный оператор) производных выражений новое производное выражение, которое затем может включаться в число исходных выражений, из которых строится вывод в исчислении П. Поскольку изучение операторов выходит далеко за рамки представленной диссертации, постольку они отражены в диссертации не только не полно, но и весьма упрощенно. Приведем один пример:

Оператор «WHEN» (TTAY). WHEN / \

Требования к операндам:

Б — событие «точка отсчета» на шкале

времени

Т—событие, которое помещается на шкалу времени

Примеры:

ркшиекк И=и1 Иа=1 Шу арИсМта=1и1 ¡р=ко Иа=р=т-1а (Когда я работаю на

S Т

ha (X, il) ip (X, aphchima)

делать (X, дело) надевать (X, фартук)

konghang=ey Ш1юк.1т=е$5=и1 Нау с!ппЫи= ка кИаИ=ко /,и=е55=/я (Когда я прибыл в аэропорт, меня там ждал друг)

tochak.ha (X, konghang) прибывать (X, аэропорт)

kitali (chinkwu, X) ждать (друг, X)

Правило преобразования (построение производного выражения):

Т

WHEN |

/ \ — т

S Т I

S

Финальная обработка. Конечное выражение — дерево; и оно не должно содержать повторяющихся поддеревьев. Из двух дублирующих друг друга поддеревьев обычно удаляется то поддерево, которое расположено на более низком этаже. Разумеется, удалению подвергается некоторый невершинный в данном поддереве узел со всеми своими зависимыми. Кроме того, из конечного выражения должны быть удалены все фиктивные предикаты.

Актантно-предикатные структуры: обсуждение. Построенные правила перехода от актантно-предикатных структур к синтаксическим структурам выявили разную природу действующих в этом блоке механизмов: с одной стороны, правила линейных композиций, с другой стороны, все те механизмы, которые были собраны в блок «начального цикла». А именно: связывание — обработка так называемых сентенциальных актантов, переворот — обработка мены диатез, лексические функции — обработка лексической сочетаемости, операторы — обработка логически нетривиальных служебных слов. Разделение этих механизмов позволяет не только лучше понять их природу, но и повысить качество их грамматического описания. При этом обнаружилось, что механизмы линейных преобразований — свободны, они применимы к любой Р-картинке независимо от ее лексического состава; тогда как механизмы второго рода — не свободны, но связаны определенной лексикой. Можно думать, что механизмы первого рода носят более универсальный характер, тогда как механизмы второго рода — более специфичны и существенно варьируют от языка к языку.

Естественно возникает вопрос об обратимости рассматриваемых правил. Ведь предложенные правила соответствуют как бы синтезу текста (переход от смысла к тексту), соответственно их обращение должно было бы отвечать анализу текста (переход от текста к смыслу). Легко видеть, что предложенные правила не допускают простой инверсии. Есть основания предполагать, что здесь правила анализа должны были бы строиться в логике «анализ через синтез».

В главе 5 («Основные выводы») формулируются основные выводы и рассматривается классификация корейских предложений, базирующаяся на семантико-синтаксических признаках, изученных в диссертации.

В результате исследования удалось построить конструкцию, отвечающую условиям поставленной задачи. Ее эмпирическая адекватность была проверена на небольшом объеме текстов из контрольного корпуса. Опыт применения той же конструкции без каких бы то ни было изменений к текстам, лежащим за пределами контрольного корпуса, показал следующее. В пределах текстов тех же жанров эмпирическая достоверность остается такой же, как на контрольном корпусе (другие сказки и другие статьи из журнала Saiensu Olcey (Scientific American)); на текстах художественной прозы эмпирическая достоверность падает: а именно, в значительном проценте случаев построить искомые выводы не удается. Содержательно это объясняется тем, что в художественных текстах много неполных предложений, разговорных конструкций и фразеологизмов, анализ которых требует специального инструмента. Однако речь идет не о принципиальной перестройке всей архитектуры конструкции, а лишь о некоторых дополнительных правилах, частью привязанных к лексике (специфические лексические функции).

Задуманная жесткость в различении формально-синтаксического и семантического представлений оправдала себя в том смысле, что благодаря этой жесткости удалось четко выявить различные механизмы перехода от актантно-предикатных структур к синтаксическим. В частности, определились случаи, в которых вывод синтаксической структуры невозможен без обращения к более мощному инструменту, каковой представлен кванторными словами (У-предикаты), лексическими функциями и операторами.

Список публикаций

По теме диссертации опубликованы следующие статьи:

(1) Бречалова Е. В. К проблеме автоматической фрагментации корейского текста // Искусство и образование. №11. М., 2008. Стр. 25—34 (0,5 п.л.);

(2) Бречалова Е. В. К проблеме оценки полноты грамматического описания (на примере грамматики А. А. Холодовича) // Альманах «Российское корееведение». Вып. 5. Москва, Восток-Запад, 2007. Стр. 246—252 (0,5 п.л.);

(3) Бречалова Е. В. Корейско-русский перевод: неоднозначность морфологического и синтаксического типов и принципы ее устранения // Весгник Московского Университета. Теория перевода. Серия 22. №3. 2008. Стр. 118—136 (1 пл.);

(4) Бречалова Е. В. Опыт преподавания корейского языка на кафедре Истории и филологии стран Дальнего Востока, ИВКА, РГТУ (в соавторстве с Е. Н. Кондратьевой) // Альманах «Российское корееведение». Спецвыпуск: материалы конференций в ИСАА (май 2007 г.) и РГГУ (январь 2008 г.). М., 2008. Стр. 155—165 (0,5 п.л.).

Подписано в печать 20.02.2009 г.

Печать трафаретная

Заказ № 1650 Тираж: 100 экз. Типография «11-й ФОРМАТ» ИНН 7726330900 115230, Москва, Варшавское ш., 36 (499) 788-78-56 www.autoreferat.ru

 

Оглавление научной работы автор диссертации — кандидата филологических наук Бречалова, Евгения Владимировна

ПРЕДИСЛОВИЕ

ВВЕДЕНИЕ.

Общее.

Представления предложения и правила перехода между ними

§0.1). Принцип минимальности

§0.2). Направление правил перехода

§0.3). О соотношении с моделями «См ы с л <=>Те кст»

§0.4). Редуцированный анализ при чтении корейского текста

§0.5).

Основные этапы изучения синтаксиса корейского языка (Обзор литературы).

Глава первая

ИЗУЧАЕМЫЕ ПРЕДСТАВЛЕНИЯ ПРЕДЛОЖЕНИЯ. ОБРАЗЦЫ.

Общее

§1.0). Образцы представлений

§1.1). Первичное морфологическое представление

§1.2). Линейная структура

§1.3). Фрагменты

§1.4). Замечание о скелетальности линейной структуры

§1.5). Разные предложения — одна линейная структура

§1.6). Получение линейных структур

§1.7). Синтаксическая структура

§1.8). Об интерпретации стрелок синтаксической зависимости

§1.9). Получение синтаксических структур

§1.10). Актантно-предикатная структура

§1.11). Разные предложения — одна актаптная структура

§1.12).

Глава вторая

ЛИНЕЙНЫЕ СТРУКТУРЫ.

Первичное морфологическое представление текста.

Общее

§2.1). Буквенные символы

§2.2). Разделители

§2.3). Вычленение показателей

§2.4). Инвентарь служебных формативов

§2.5)

Линейные структуры.

Общее

§2.6). Содержание линейных структур

§2.7).

Лексемная запись.

Словарь лексем

§2.8). Омонимия лексем

§2.9). Словообразовательные связи между лексемами

§2.10).

Грамматические классы.

Классы N (имена) и Р (предикаты)

§2.11). Класс предикатов

§2.12). Класс имен

§2.13). Особые случаи

§2.14). О словаре лексем

§2.15).

Грамматические метки и ключевые показатели.

Общее

§2.16). Служебные формативы и формативы-ключи

§2.17). Неключевые показатели

§2.18). Грамматические метки

§2.19). Соотношение «ключи—метки»

§2.20). Разрешение Х-ключей

§2.21). 1чГ-ключи

§2.22). Р-ключи

§2.23). Замечание о метке СопУ

§2.24). Х-ключи

§2.25).

Фрагменты.

Фрагменты в составе линейной структуры

§2.26). Синтагматическая характеристика фрагмента

§2.27).

Приведенная линейная структура.

Общее

§2.28). Сцепления

§2.29). Правило выделения сцеплений

§2.30). Передвижение границ фрагментов и запись сцеплений

§2.31). Пассивные формы

§2.32). О форме записи линейных структур при цитировании

§2.33).

Правила построения линейных структур.

Схема применения правил перехода вида «МрЬ(Ш)—>1Лп81г»

§2.34). Первый шаг первого блока

§2.35). Второй шаг первого блока

§2.36). Третий шаг первого блока

§2.37). Результат работы первого блока

§2.38). Правила второго блока — общее

§2.39). Правила разрешения Х-ов: формативы-катализаторы

§2.40). Правила разрешения Х-ов: лексемы-катализаторы

§2.41). Правила разрешения Х-ов: синтагматические характеристики фрагментов

§2.42). Итоговый пример построения линейной структуры

§2.43).

Глава третья

СИНТАКСИЧЕСКИЕ СТРУКТУРЫ.

Синтаксическое представление (Synt-A).

Формальная организация синтаксического представления

§3.1). Узлы

§3.2). Ребра

§3.3). Замечание о содержании синтаксических представлений

§3.4). О системе нотации

§3.5). О скобочной и древесной записи

§3.6).

Правила построения синтаксических структур.

Схема применения правил перехода вида «1лп81;г—>8уп1>Д»

§3.7). Допустимые конфигурации скобок

§3.8). Иллюстрации

§3.9). Циклы и переименование скобок

§3.10). Формальные правила расстановок скобок

§3.11). Пример построения скобочной записи

§3.12).

Правила перехода от скобочной записи к дереву Яугй-А.

Общие принципы работы правил

§3.13). Примеры

§3.14).

Глава четвертая

АКТАНТНО-ПРЕДИКАТНЫЕ СТРУКТУРЫ.

Актантно-предикатные структуры

Общие данные: Формальная организация актантно-предикатной структуры

§4.1). О каталоге предложений контрольного корпуса и словаре атомарных предикатов

§4.2). Замечание о содержании Р-картинок

§4.3).

Язык Р-картинок.

Предварительные замечания

§4.4). Предварительные примеры

§4.5).

Алфавит примитивных символов

Предикатные буквы

§4.6). Термы

§4.7).

Атомарные формулы

Правила построения атомарных формул из предикатных букв и индивидных констант

§4.8). Правила построения атомарных формул из предикатных букв, индивидных констант и вспомогательных символов

§4.9).

Атомарные формулы: специальные случаи

Расширение словаря предикатных букв: аналоги И-лексем

§4.10). Расширение словаря предикатных букв: фиктивные предикаты

§4.11). Расширение словаря атомарных символов Р-картинок: межпредикатные операторы

§4.12). Расширение словаря термов: фиктивные термы

§4.13).

Правила перехода вида «P-D—»Synt-A».

Общее

§4.14).

Исчисление Q: правила линейных композиций

Система обозначений

§4.15). Правила линейных композиций

§4.16).

Комментарии к правилам линейных композиций

Дополнение к правилу «Адъективизация»

§4.17). Дополнение к правилу «Врезка \|/-узла»

§4.18). Дополнение к правилу «Copul-введение»

§4.19). Дополнение к правилу «Понижение валентности.»

§4.20).

Техника построения выводов.

Общее

§4.21). Нулевой цикл: связывание

§4.22). Нулевой цикл: переворот

§4.23). Нулевой цикл: лексические функции

§4.24). Нулевой цикл: операторы

§4.25). Финальная обработка

§4.26). Замечание о порядке действий

§4.27). Сопоставление конечного выражения вывода с заданной Synt-A

§4.28). Первый пример вывода

§4.29).

Операторы

Общее

§4.30). Операторы и актантно-предикатные связи

§4.31). Оператор «COMPAR» (TE/TEWUK)

§4.32). Оператор «WHEN» (TTAY)

§4.33). Оператор «FOR» (WIHA)

§4.34). Оператор «ACCORDING» (TAY=LO)

§4.35). Оператор «NOT S, BUT T» (ANI=LA)

§4.36).

Лексические функции

Лексические функции и актантно-предикатные связи

§4.37). Лексические функции в построении вывода

§4.38). Словарь лексических функций

§4.39). Правила преобразований

§4.40). Сводные примеры

§4.41).

Глава пятая

 

Введение диссертации2009 год, автореферат по филологии, Бречалова, Евгения Владимировна

Диссертация посвящена исследованию грамматики корейского языка, а именно его морфологии, синтаксису и семантике. В работе предпринята попытка построить для корейского языка грамматическую конструкцию, обеспечивающую представление грамматики в виде системы переходов, подобных тем, которые строятся в моделях типа «Смысл<=>Текст» (далее МСТ).

Разумеется, во всем объеме такая задача не может быть решена в рамках диссертационной работы, поэтому речь идет о построении грамматической конструкции, которая подобна конструкции типа «Смысл<=>Текст» по своей организации, но охватывает морфологию, синтаксис и семантику корейского языка не в полном объеме, а лишь частично. Такая конструкция названа в работе скелетальной конструкцией МСТ (термин заимствован из категорного анализа)1.

Прежде всего, рассматриваемые в работе представления смысла отражают не все содержание предложения, а только его актантно-предикатную структуру. Оказалось, что при таком сужении задачи и морфологическое строение предложения можно рассматривать не во всем объеме: достаточно учитывать лишь некоторые (названные в работе ключевыми) показатели. В работе разрабатываются определенные представления предложения и правила, обеспечивающие переход от одних представлений к другим; а именно: морфологическое представление, линейная структура, синтаксическая структура и актантно-предикатная структура. Предлагаются независимые системы правил: с одной стороны, правила, обеспечивающие переход от исходного представления текста к его линейной структуре и от линейной структуры к синтаксической; а с другой стороны, правила, обеспечивающие

1 См., например, Голдблат Р. Топосы. М.: Мир, 1983; Гельфанд С. И., Манин Ю. И. Методы гомологической алгебры. Том I. Введение в теорию когомологий и производные категории. М., 1988. вывод синтаксической структуры из актантно-предикатной структуры данного текста.

Актуальность исследования

Несмотря на достаточно длительную традицию изучения грамматики корейского языка, многие синтаксические проблемы корейского языка остаются не только недостаточно детально изученными, но в известных случаях даже недостаточно подробно описанными. Известно, что для агглютинативных языков многие традиционные синтаксические понятия, сформированные на базе флективных языков, требуют определенных переосмыслений и уточнений, а подчас оказываются и вовсе неприменимы. В настоящее время крайне актуальна задача поиска новых форматов грамматических описаний, адекватных для языков агглютинативного строя и удовлетворяющих требованию межъязыковой сопоставимости. Настоящая работа могла бы способствовать построению таких грамматик современного корейского языка, ориентированных под разные конечные цели: от типологии до систем автоматической обработки корейского текста.

Цели и задачи диссертации

В теоретическом плане основная цель диссертации — исследовать проблемы, возникающие при построении для корейского языка модели «Смысл<=>Текст» и построить конкретную скелетальную конструкцию типа МСТ. С точки зрения проблем математической и прикладной лингвистики основная цель диссертации — выяснить формально-логические свойства промежуточных представлений предложения (уровней, в терминах МСТ) и правил межуровневых переходов в корейском языке; в частности, показать возможность полной алгоритмизации некоторых блоков конструкции.

Для достижения названных целей в диссертации ставятся и решаются следующие задачи:

А. Разработка и изучение представлений текста

Задачи Важнейшие результаты Структура работы

1. Отработать стандарт скелетальной морфологической структуры предложения Списки ключевых показателей и их грамматическая интерпретация Глава 2. §2.6-25, с. 71—89

2. Отработать стандарт скелетальньтх линейных характеристик предложения — М5-разметка словоформ и разбиение предложения на фрагменты Правила перехода от морфологической Глава 2. §2.26-43,

3. Отработать стандарт финального морфологического представления («Линейная структура предложения») разметки предложения к его линейной структуре с. 90—111

4. Отработать стандарт синтаксического представления предложения (8уп1А) Правила перехода от линейной структуры предложения к дереву зависимостей (синтаксической структуре, 8уп1А) Глава 3, с. 112—126

Б. Разработка и изучение представлений содержания

Задачи Важнейшие результаты

5. Отработать стандарт скелетальных представлений смысла (актантно-предикатная структура) Описание формальнологического языка актантно-предикатных структур Глава 4. §4.1-13, с. 127—142

6. Найти и описать соотношение между синтаксическими структурами и актантными структурами данного предложения Исчисление линейных композиций (преобразований актантно-предикатных структур) и построение выводов из актантно-предикатной структуры синтаксического представления Глава 4. §4.14-41, с. 143—197

Объект исследования в диссертации - это предложения современного корейского письменного текста.

Предмет исследования — грамматическая и логико-семантическая организация предложений современного корейского текста.

Материал исследования, достоверность результатов

Основной материал исследования — тексты на современном корейском языке различного жанра: научная проза, художественная и журнальная литература, сказки; частично привлекался иллюстративный материал из грамматик А. А. Холодовича, Ю. Н. Мазура, С. Мартина, X. Сона и других2.

Новизна исследования

Научная новизна исследования состоит в том, что для корейского языка грамматические описания в идеологии моделей «Смысл<=>Текст» ранее не предлагались. При этом важно отметить, что в построенном в диссертации описании синтаксический анализ предложения осуществляется независимо от анализа семантического, более того, все используемые синтаксические правила работают без обращения к какого бы то ни было сорта словарям, в частности, без обращения к словарю моделей управления предикатов. Прикладная новизна исследования состоит в том, что разработан принципиально новый подход к построению алгоритмов морфологического и синтаксического анализа корейского предложения. Хотя этот подход учитывает в первую очередь особенности корейского языка, тем не менее он является достаточно общим и может применяться и при разработке грамматик других языков.

2 См. Холодович А. А. Очерк грамматики корейского языка. М., 1954; Мазур Ю. Н. Грамматика корейского языка. (Морфология. Словообразование). (Издание подготовлено JI. Р. Концевичем при участии Мун Хесук). М.: Издательский дом «Муравей-Гайд», 2001; Martin,

S. Е. A reference grammar of Korean. Charles E. Tuttle Company, Rutland, Vermont and Tokyo, Japan, 1992; Sohn, Ho-Min. The Korean Language. Cambridge University Press: Cambridge (Mass.), 1999.

Теоретическая и прикладная значимость исследования, практическая ценность результатов

Исследование синтаксиса и формальное моделирование синтаксического анализа отдельного языка принадлежат к проблемам, важным для языкознания в целом. В этом отношении проведенное исследование имеет общетеоретическое значение.

Конкретно-лингвистическая значимость данного исследования заключается, прежде всего, в разработке принципиально нового алгоритма синтаксического анализа. Построенный алгоритм может быть применен с некоторыми поправками к другим алтайским языкам. Грамматические конструкции, аналогичные построенной в работе для корейского языка, могут быть построены и для других алтайских языков. Выявленные при этом данные могут представлять ценность для синтаксической типологии алтайских языков, поскольку для того чтобы сделать предметом типологического рассмотрения более обширные системные явления, необходимы описания соответствующих участков языковой системы для отдельных языков или пар языков.

Результаты предлагаемого синтаксического описания представляют значимость и для прикладной лингвистики: сформулированные правила синтаксического разбора корейского предложения могут быть использованы в практике преподавания корейского языка, а разработанные алгоритмы могут быть использованы в различных системах автоматической обработки корейского текста.

Основные результаты исследования, выносимые на защиту 1. Для обнаружения отношений синтаксической доминации и актантно-предикатных связей, имеющих место в обрабатываемом предложении, достаточно располагать следующей информацией: 1) каков грамматический класс (К или Р) каждой словоформы, входящей в предложение, 2) какие синтаксически значимые показатели входят в словоформу, 3) какова обобщенная грамматическая характеристика словоформы. Указанную информацию 9 манифестируют 48 показателей-ключей, список которых представлен в настоящей работе.

2. Сперва строится линейная структура предложения, представляющая собой его лексемную запись, в которой при каждой лексеме указана только синтаксически значимая морфологическая информация. Линейная структура строится лингвистически обоснованной и алгоритмически эффективной системой морфологического анализа (алгоритм 1), которая выделяет ключевые показатели в словоформах предложения и в соответствии с ними приписывает каждой словоформе эту информацию.

3. Построенная система синтаксического анализа (алгоритм 2) позволяет строить скелстальное синтаксическое представление предложения, то есть дерево, в котором отражены отношения непосредственной доминации. Алгоритм (2), обеспечивающий переход от линейной структуры к синтаксическому представлению, расставляет в линейной структуре скобки на основании предложенного списка допустимых конфигураций «слуга-хозяин» (см. табл. 4); расстановка скобок предполагает циклическое использование списка допустимых конфигураций. Скобочная запись автоматически переводится в дерево.

4. Предложенный в работе формально-логический язык для записи актантно-предикатного представления предложения использует в качестве атомарных единиц объекты, практически копирующие лексемы корейского языка.

5. В работе предъявляются 6 правил «линейных композиций», а именно: «Адъективизация», «Р-внедрение», «Врезка Ч^-узла», «Сори1-введение», «Сочинительное сокращение», «Понижение глубины формулы и/или валентности невершинного узла». Последовательность применения этих правил к актантно-предикатной структуре строит вывод из нее синтаксического представления предложения.

6. Классификация корейских предложений, содержащих две предикации, оценивает механизм связывания двух клауз: по адъективизации, по Р-внедрению, по сочинительному сокращению, по Copul-введению.

Апробация и внедрение результатов

По теме диссертации опубликованы четыре статьи. Многие положения диссертации были представлены в докладах на заседаниях Центра компаративистики РГГУ, на семинарах «Некоторые применения математических методов в языкознании» (под руководством В. А. Успенского и М. Р. Пентуса) в МГУ им. Ломоносова, на конференциях в Праге (Korean Studies Graduate Students Convention (KSGSC), Prague, 2006), в СПбГУ (Корейский язык и литература в XXI веке. К 100-летию со дня рождения А. А. Холодовича. 4-6 апреля 2006 г.) и Институте востоковедения РАН (Востоковедные чтения 2008. 8-10 октября 2008 г.). Работа была обсуждена в центре компаративистики Института восточных культур и античности РГГУ. По теме диссертации был прочитан спецкурс «Теоретическая грамматика корейского языка» в Институте Восточных культур и античности (специализация — корееведение) РГГУ; правила синтаксического анализа, рассматриваемые в работе, используются на практических занятиях корейским языком со студентами той же специализации в течение четырех лет (с 2005/2006 учебного года).

Структура диссертации

Диссертация состоит из введения, включающего краткий обзор литературы, пяти глав и трех приложений.

 

Список научной литературыБречалова, Евгения Владимировна, диссертация по теме "Прикладная и математическая лингвистика"

1. Аксаков К. С. О грамматике вообще (по поводу грамматики г. Белинского. 1838 (1) // К.С.Аксаков. Сочинения филологические, т. 1., часть I, Москва, 1875.

2. Алпатов В. М. Структура грамматических единиц в современном японском языке. М., 1979.

3. Алпатов В. М. Об уточнении понятий «флективный язык» и «агглютинативный язык» // И. Ф. Вардуль, В. М. Солнцев (ред.). Лингвистическая типология. М.: Наука, 1985. С. 92—101.

4. Алпатов В. М., Аркадьев П. М, Подлесская В. И. Теоретическая грамматика японского языка. Москва, 2008.

5. Au, 1999'. Ahn, Sang-Cheol & Jong-Bok Kim. 1999. An optimality-theoretic approach to morpho-lexical and syntactic nominalization. // Harvard Studies in Korean Linguistics. Vol. VIII, pp. 211—222.

6. Апресян Ю. Д. О языке для описания синтаксических свойств слова. // Проблемы структурной лингвистики 1972. М., 1973.

7. Апресян Ю. Д., Богуславский И. М., Иомдин JI. JL, Лазурский А. В., Перцов Н. В., Санников В. 3., Цинман Л. Л. Лингвистическое обеспечение системы ЭТАП-2. М., Наука, 1989.

8. Арутюнова Н. Д. Предложение и его смысл (логико-семантические проблемы). М., 1975.

9. Балли Ш. Общая лингвистика и вопросы французского языка. Изд. 2-е.М.: Эдиториал УРСС, 2001.

10. БелошапковаВ. А. Современный русский язык. Синтаксис. М., Высшая Школа, 1977.

11. Бенвенист Э. Общая лингвистика. Изд. 2-е. М.: Эдиториал УРСС, 2002.

12. БехертИ. Эргативность как исходный пункт изучения прагматической основы грамматических категорий // Новое в зарубежной лингвистике. Вып. 11. М.: Прогресс, 1982.

13. Блумфилд Л. Язык. Изд. 2-е. М.: Эдиториал УРСС, 2002.

14. Богуславский И. М. Исследования по синтаксической семантике: сферы действия логических слов. М.: Наука, 1985.

15. Вардуль И. Ф. О природе японских ганио II Понятие агглютинации и агглютинативного типа языков. Тезисы докладов на открытом расширенном заседании Института языкознания АН СССР. Л., 1961. С. 38—40.

16. Вардуль И. Ф. Очерки потенциального синтаксиса японского языка. М.: Наука, 1964.

17. Васильев А. Г. Об одном типе неэлементарных предложений в корейском языке // Исследования по филологии стран Азии и Африки. Л., 1966. С. 26—31.

18. Вежбицкая А. Семантические универсалии и описание языков. М.: Языки русской культуры, 1999.

19. Вейнрейх У. О семантической структуре языка // Новое в лингвистике. Вып. 5. М.: Прогресс, 1970.

20. Гельфанд С. И., Манин Ю. И. Методы гомологической алгебры. Том 1. Введение в теорию когомологий и производные категории. М., 1988.

21. Гладкий А. В. Синтаксические структуры естественного языка в автоматизированных системах общения. М.: Наука, 1985.

22. Гладкий А. В., Мельчук И. А. Элементы математической лингвистики. Москва, 1969.

23. Глисон Г. Введение в дескриптивную лингвистику. М.: Прогресс, 2002. 31 .Голдблат Р. Топосы. М.: Мир, 1983.

24. Гросс М., Лантен А. Теория формальных грамматик. (Пер. с фр. под ред. А. В. Гладкого). М., 1971.

25. Джонсон Д. Э. О реляционных ограничениях на грамматики // Новое в зарубежной лингвистике. Вып. 11. М.: Прогресс, 1982.

26. Елъмслев, 1950. Ельмслев JI. Метод структурного анализа в лингвистике // Звегинцев В. А., История языкознания XIX и XX веков в очерках и извлечениях. Ч. 2, М., 1960.

27. Есперсен О. Философия грамматики. М.: Издательство иностранной литературы, 1958.

28. Зализняк А. А. Русское именное словоизменение. М., 1967.

29. Зализняк А. А. От праславянской акцентуации к русской. М., Наука, 1985.39.3олотова Г. А. Коммуникативные аспекты русского синтаксиса. Изд. 2-е. М.: Эдиториал УРСС, 2001.

30. Кап, 1994: S.-S. Kang and Y.-T. Kim. Syllable-based model for Korean morphology. In Proceedings of the 15-th International Conference on Computational Linguistics. P. 221—226. 1994.

31. Карцевский С. О. Повторительный курс русского языка. М., 1928.

32. Квон, 1991: Н.-С. Kwen. Dictionary-based morphological analysis. In Proceedings of the Natural Language Processing Pacific Rim Symposium. P. 87—91. 1991.

33. Квон, 2006: Kwon, Soyoung. Korpar: a rule-based dependency parser for Korean implemented in Prolog. Ph.D. dissertation. Athens, University of Georgia, 2006.

34. Кибрик A. E. Константы и переменные языка. СПб., 2003.

35. Кибрик А. Е. Очерки по общим и прикладным вопросам языкознания (универсальное, типовое и специфичное в языке). 2-е изд. М.: Эдиториал УРСС, 2001.

36. Ким, 1984: Kim, N.-K. The grammar of Korean complementation. Occasional papers No.ll. Center for Korean Studies. University of Hawaii, Honolulu, Hawaii, 1984.

37. Ким, 1986: Kim, S.-J. A morphological analyzer for Korean language with tabular parsing method and connectivity information. Master's thesis, Dept. of Computer Science and Technology, Korea Advanced Institute of Science and Technology. 1986.

38. К им, 2004: Kim Yung-Hee, Jeyseon Lee. Readings in modern Korean literature (KLEAR textbooks in Korean language). University of Hawaii's Press, 2004.

39. Кинэн Э., Комри Б. Иерархия доступности именных групп и универсальная грамматика // Новое в зарубежной лингвистике. Вып.11. М.: Прогресс, 1989.

40. Клини С. Математическая логика. М.: Наука, 1973.

41. Кобозева И. М. «Теория речевых актов» как один из вариантов теории речевой деятельности // Новое в зарубежной лингвистике. Вып. 17. М.: Прогресс, 1986.

42. Кон А. Современная алгебра. М., 1989.

43. Концевич Л. Р. Особенности корейского алфавита в плане общей теории письма // Корея. Сборник статей к 80-летию со дня рождения профессора Михаила Николаевича Пака. М., 1998, с. 368—391.

44. Крейдлин Г. Е. Лексема ДАЖЕ // Семиотика и информатика. Вып. 6. 1975. С. 102—114.

45. Крейдлин Г. Е., Поливанова А. К. О лексикографическом описании служебных слов // В Я, 1987. №1. М., 1987.

46. Крылов С. А. Общелингвистическая концепция И. Ф. Вардуля // Актуальные вопросы японского и общего языкознания. Памяти И. Ф. Вардуля. М.: Восточная литература, 2005. С. 23—30.

47. Кузнецов П. В. Историческая грамматика русского языка. Морфология. 2-е изд. М., 2005.

48. Куно, 1972: Kuno S. Functional sentence perspective // Linguistic Inquiry. 1972. Vol. 3.

49. Ли Иксоп, Ли Санок, Чхэ Ван «Корейский язык: история и современное состояние». (1997) Пер. с кор. В. Аткнина. М.: Первое марта, 2005.

50. Ли, 1999: Lee, Ch. (1999). Contrastive topic: a locus of the interface -Evidence from Korean and English // K. Turner et al (eds) (1999). The Semantics/Pragmatics Interface from Different Points of View (CRiSPI 1), Elsevier Science.

51. Ли, 2004a: Lee, Yuncin. Hankwuk.e haksupcawa hankwuk.e kyosalul wihan hankwuk.e mwunhyeng phyohyen 100. (100 типовых образцов корейских предложений для преподавателей и студентов). Kenkwuk tayhak chwulphanpwu, 2004.

52. МазурЮ. H. Корейский язык. M.: Издательство восточной литературы, 1960.

53. Мазур Ю. Н. Контракция и контрактуры в современном корейском языке // Вестник Московского университета. Серия XIV. Востоковедение. № 1, 1975. С. 14—81.

54. МазурЮ. Н. Корейский язык // Языки мира. Монгольские языки. Тунгусо-маньчжурские языки. Японский язык. Корейский язык. М.: Индрик, 1997.

55. Мазур Ю. Н. Грамматика корейского языка. (Морфология. Словообразование). (Издание подготовлено JI. Р. Концевичем при участии Мун Хесук). М.: Издательский дом «Муравей-Гайд», 2001.

56. Маккарти, 1995: McCarthy, John & Alan Prince (1995). Faithfulness and reduplicative identity. University of Massachusetts Occasional Papers 18: Papers in Optimality Theory. 249—384.

57. Маккартни, 1997: McCarthy, John & Alan Prince (1997). Faithfulness and identity in prosodic morphology. Ms. ROA-216.

58. Мартин, 1992: Martin, S. E. A reference grammar of Korean. Charles E. Tuttle Company, Rutland, Vermont and Tokyo, Japan, 1992.

59. Мартине А. Структурные вариации в языке // Новое в лингвистике. Вып. 4. М.: Прогресс, 1965.

60. Мельчук И. А. Опыт теории лингвистических моделей «Смысл<=>Текст». М.: Наука, 1974. (Переиздано М.: Школа «Языки русской культуры», 1999).

61. Моравчик, 2006: A. Moravcsik. An introduction to sin tactic theory. Continuum. London-New York, 2006.

62. Нам, 1987: Nam, Kishim and Koh, Yenggun (1987). Phyocwun kwuk.e munpeplon Нормативная грамматика корейского языка. Thapchwulphansa.

63. Недялков, 1995: Nedjalkov, V. Some Typological Parameters of Converbs. In: Haspelmath M. / König E. (ed.) Converbs in cross-linguistic perspective. Berlin: Mouton de Gruyter. 1995.

64. Никольский Л. Б. Служебные слова в корейском языке. М.: Издательство восточной литературы, 1962.

65. Никольский Л. Б. Корейское словосочетание как типологическая единица // Лингвистическая типология и восточные языки. М., 1965.

66. Падучева E. В. О семантике синтаксиса (материалы к трансформационной грамматике русского языка). М.: «Наука», 1974.

67. Палмер, 2000: Chung-hye Han, Juntae Yoon, Nari Kim and Martha Palmer. A feature-based lexicalized tree adjoining grammar for Korean. Technical Report, IRCS-00-04 (2000).

68. Пауль Г. Принципы истории языка. М., 1960.

69. Перцов Н.В., Старостин С.А. О синтаксическом процессоре, работающем на ограниченном объеме лингвистических средств // Труды международной конференции Диалог 1999. Т. 2 Таруса: 1999. С. 224— 230.

70. Петерсон M. Н. Очерк синтаксиса русского языка. М.-Пг., 1923.

71. Пешковский А. М. Русский синтаксис в научном освещении. М., 2005.

72. Пешковский А. М. Русский синтаксис в научном освещении. Изд. 8-е, доп. М.: Языки славянской культуры, 2001.

73. Подлесская В. И. Вопросы лексической и синтаксической семантики. Анафора в современном японском языке. М.: Наука, 1990.

74. Подставин Г. В. Известия Восточного института. T. II. Приложение: Обозрение преподавания наук в Восточном институте на 1900/01 и 1901/02 академические годы. С. 255—258. Владивосток, 1901; T. IV, 1904; T. XVII, Приложение 2-ое, 1916.

75. Поливанов Е. Д. К вопросу о родственных отношениях корейского и «алтайских» языков // Известия Академии наук СССР. М., 1927.

76. Поливанова А. К. Что такое синтаксис? // Типология и теория языка: от описания к объяснению: К 60-летию А. Е. Кибрика. М., 1999. (Перепечатано в кн. Поливанова А. К. Избранные работы: Общее и русское языкознание. М.: РГГУ, 2008. С. 145—153).

77. Поливанова А. К. Принципы построения сегментной грамматики // Поливанова А. К. Избранные работы: Общее и русское языкознание. М.: РГГУ, 2008. С. 210—303.

78. Потебня А. А. Мысль и язык. Изд. 3-е. Харьков: Типография Мирный труд, Девичья улица, № 14-й, 1913.

79. Потебня А. А. Из записок по русской грамматике, тт. I—П. Изд. 2-е. Харьков, 1888.

80. Рамстедт, 1903: Ramstedt, G. J. Über die Konjugation des Khalkha-Mongolischen. Helsinki: Suomalais-Ugrilainen Seura, 1903.

81. Ревзин И. И., Розенцвейг В. Ю. Основы общего и машинного перевода. М., 1965.

82. Рис, 1894: Ries John. Was ist Syntax?. Marburg, 1894.

83. Росс, 1967: Ross J. R. Constrains on varriables in syntax. Ph.D. dissertation. MIT, 1967 Ross J.R. Infinite syntax! Ablex: Norwood, 1986.227

84. Рудницкая 1998: Rudnitskaya, Е. (1998). Syntactic properties of the Altaic Coordination construction in Korean. In: Sprachtypologie und Universalforschung 51 (2) (Language Typology and Universals), Germany, 179—198.

85. Рудницкая E. JI. Проблема подлежащего в корейском языке // Российское корееведение. Вып. 4. М., 2004.

86. СелфриджМ. Интегральная обработка обеспечивает надежное понимание // Новое в зарубежной лингвистике. Вып. 24. М.: Прогресс, 1989.

87. Скотт Д. Советы по модальной логике // Семантика модальных и интенсиональных логик. М., Наука, 1981. С. 280—317.

88. Сон, 1982: Seng Kiyel. Щ. ¡¡t® ИШ (Seng Kiyel. Hankwuk mintam.uy seykyey (Мир корейских народных рассказов)). Сеул: Изд. ун-та Инха, 1982.

89. Сон, 1995: Sohn, S.-O. (1995) Tense and Aspect in Korean, Honolulu, Center for Korean Studies, Monograph N. 18.

90. Сон, 1999: Sohn, Ho-Min (1999). The Korean Language. Cambridge University Press: Cambridge (Mass.).

91. Сонг, 2005: Song, Jae Jung. The Korean language: structure, use and context. Routledge, London and New York, 2005.

92. Соссюр Ф. де. Курс общей лингвистики. Екатеринбург: Издательство Уральского университета, 1999.

93. Стросон П. Грамматика и философия // Новое в зарубежной лингвистике. Вып. 18. М.: Прогресс, 1989.

94. Теньер Л. Основы структурного синтаксиса. М.,1988.

95. Тестелец Я. Г. Введение в общий синтаксис. М.: РГГУ, 2001.

96. Фиенго, 1977: Fiengo R. On Trace Theory 11 Linguistic Inquiry 8, 1977. P. 35—62.

97. Фортунатов Ф. Ф. Избранные труды. Москва: Гос. учебно-пед. изд. Мин. просвещения РСФСР, 1956.

98. Хан, 2001: Chung-hye Han, Na-Rae Han (2001). Part of speech tagging guidelines for Penn Korean treebank.

99. Хан, 2002: Chung-hye Han, Na-Rare Han, Eon-Suk Ко. Development and evaluation of a Korean Treebank and its Application to NLP. Proceedings of the 3rd International Conference on Language Resources and Evaluation (LREC-2002).

100. Хаспельмат, 1998: Haspelmath, M. Does grammaticalization need reanalysis? // Studies in language. 1998. Vol. 22 №2.

101. Xo, 2004: He, Unmi. He Unmi sensayngnim.uy isop iyaki. (Басни Эзопа в пересказе Хо Ынми). Samseng chwulphansa (Издательство Самсунг), 2004.

102. Хейз Ф. Дж., Гауптман А. Г., Карбонелл Дж., ТомитаМ. Семантико-синтаксический анализ устной речи: подход, основанный на семантических падежных фреймах // Новое в зарубежной лингвистике. Вып. 24. М.: Прогресс, 1989.

103. Холодович А. А. Очерк грамматики корейского языка. М., 1954

104. Хомский Н. Логические основы лингвистической теории // Новое в лингвистике. Вып. 4. М.: Прогресс, 1965.

105. Хомский, 1992: Chomsky, Noam (1992). A minimalist program for linguistic theory. MIT Occasional Papers in Linguistics, vol.1, Department of Linguistics and Philosophy, MIT, Cambridge, Mass.

106. Чанг, 1996: Chang, Suk-Jin. Korean. London Oriental and African language library. Vol. 4, 1996.

107. Чанг, 2001: Cang Kiswuk (пересказ). Khwulkhwul.iwa ppwungppangi. (серия «101 сказка, которые рассказывает нам папа»). Сеул: Изд. Хёнминсисытхем, 2001.

108. ЧеремисинаМ. И. Некоторые вопросы теории сложного предложения в языках разных систем. Новосибирск: Издательство НГУ, 1979.

109. Черемисина М. И. (ред.) Полипредикативные конструкции в языках разных систем. Новосибирск, 1985.

110. Черемисина М. И. (ред.) Структурные типы синтетических полипредикативных конструкций в языках разных систем. Новосибирск, 1986.

111. Черемисина М. И., Колосова Т. А. Очерки по теории сложного предложения. Новосибирск: СО АН СССР, 1987.

112. Чха, 1999: Cha, Jeongweon, and Lee, Geunbae. Structural disambiguation of morpho-syntactic categorial parsing for Korean. Pohang University of Science and Technology, (интернет-ресурс, см. также POSPAR: http://nlp.postech.ac.kr/DownLoad/kapi.html)/

113. Шаляпина 3. М. К проблеме коммуникативной организации текста и её отражения в семантической записи // Институт русского языка АН СССР. Проблемная группа по экспериментальной и прикладной лингвитике. Предварительные публикации. Вып. 79. М., 1976.

114. Шахматов А. А. Синтаксис русского языка. Изд. 3-е. М.: Эдиториал УРСС, 2001.

115. Экардт А. Практическая грамматика корейского языка. Гейдельберг, 1923.

116. Юн 1994: James Hye Suk Yoon (1994). Lexical integrity and the morphosyntax in Korean verbal coordination. In: MIT Working Papers in Linguistics, C. Philip & H. Harley eds., Department of Linguistics, MIT. P. 251—270.

117. Юн, 1996: James Hye Suk Yoon (1996). A syntactic account of category-changing phrasal morphology: nominalizations in Korean and English. // In Morphosyntax in Generative Grammar, Hee-don Ahn, et. al. eds., Hankuk Publishing Company, Seoul, pp. 63—86.

118. Юн, 2002: James Hye Suk Yoon (2002). What the Korean Copula reveals about the interaction between morphology and syntax. // Japanese-Korean Linguistics 11, edited by Pat Clancy, CSLI Publications, pp. 34—50.

119. Юн, 2005: Yoon, J. H.-S. and Lee, Wooseung. Conjunction reduction and its consequences for noun phrase morphosyntax in Korean. University of Illinois, Urbana-Champaign. Cascadilla Proceedings Project, 2005.

120. Якобсон P. О. Шифтеры, глагольные категории и русский глагол. Пер. на русск. // Принципы типологического анализа языков различного строя. М., 1972.