автореферат диссертации по филологии, специальность ВАК РФ 10.02.22
диссертация на тему:
Референциальная структура нарратива в японском языке

  • Год: 2006
  • Автор научной работы: Ефимова, Зоя Викторовна
  • Ученая cтепень: кандидата филологических наук
  • Место защиты диссертации: Москва
  • Код cпециальности ВАК: 10.02.22
Диссертация по филологии на тему 'Референциальная структура нарратива в японском языке'

Полный текст автореферата диссертации по теме "Референциальная структура нарратива в японском языке"

На правах рукописи

Ефимова Зоя Викторовна

Референциальная структура нарратива

в японском языке (в сопоставлении с русским)

Специальность 10.02.22 - Языки народов зарубежных стран Европы, Азии, Африки, аборигенов Америки и Австралии

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата филологических наук

Москва 2006

Работа выполнена в Учебно-научном центре лингвистической типологии Института лингвистики Российского государственного гуманитарного

университета

Научный руководитель

Официальные оппоненты:

доктор филологических наук В.И.Подлесская

кандидат филологических наук И.И.Басс

доктор филологических наук В.М.Алпатов

Ведущая организация:

Кафедра японской филологии Института стран Азии и Африки при МГУ им. М.В.Ломоносова, Москва

часов на заседании

Защита состоится 13 декабря 2006 года в

диссертационного совета Д.212.198.08 Российского государственного гуманитарного университета по адресу: Москва, Миусская пл., д.6.

С диссертацией можно ознакомиться в библиотеке Российского государственного гуманитарного университета (Москва, Миусская пл., д.6.)

Автореферат разослан « » ноября 2006г.

Ученый секретарь диссертационного совета, кандидат филологических наук

М.Б.Рукодельникова

В последние 20 лет лингвистика все чаще обращается к проблеме дискурсивной структуры, к изучению внутренней организации связного текста. Одним из наиболее важных признаков связности является наличие референциальной структуры текста — внутренне организованной сети упоминаний объектов реального мира в тексте.

Предметом нашего исследования стала референциальная структура японского нарратива. К референциальной структуре текста есть два подхода — с точки зрения говорящего и с точки зрения слушающего. Референциальная структура японского языка изучалась преимущественно с точки зрения слушающего (например, [Walker, Iida and Cote 1994]1, [Nariyama 2003]2) — в таких работах рассматривается процесс идентификации слушающим референтов в текущем дискурсе. Работ, исследующих референциальную структуру японского языка с точки зрения говорящего, довольно мало. В некоторых работах исследуются разрозненные дискурсивные факторы, на основании которых говорящий выбирает способ именования референта при порождении текста ([Hinds 1983]3, [Clancy 1980]4). Проблемы референциального выбора затрагивались также в связи с изучением эллипсиса в японском языке (см. например, [Басс 2004]5 и обзор японских исследований на эту тему там же). Тем не менее до сих пор не было проведено комплексного исследования факторов, определяющих это явление, а также не было предложено алгоритма, объясняющего или предсказывающего референциальный выбор в японском дискурсе.

Цель настоящей работы — применить комплексный подход к проблеме построения референциальной структуры в японском языке, выявить общие и лингвоспецифические свойства референциальной структуры японского нарратива.

Для достижения поставленной цели перед исследованием были поставлены следующие задачи.

• Провести анализ различных дискурсивных факторов и выделить среди них факторы, определяющие выбор референциальных средств в японском дискурсе.

• Предложить для японского языка алгоритм, предсказывающий референциальный выбор.

• Сравнить характеристики референциальной структуры японского языка с референциальной структурой русского языка как одного из представителей так называемых «языков средневропейского стандарта».

Научная новизна исследования. Настоящее исследование углубляет понимание механизмов референциального выбора в японском дискурсе в целом — впервые комплексно рассмотрены факторы, влияющие на референциальный выбор, и предложен предсказывающий алгоритм референциального выбора. Кроме того, в работе решен ряд сопутствующих задач: приняты решения о том, как анализировать референциальную структуру в разрывных единицах, какое место занимают в иерархической структуре текста топики, также было рассмотрено, как работает механизм референциального выбора при таких явлениях устной речи, как коррекция и уточнение референции.

В качестве материала исследования были использованы японские устные и письменные тексты нарративного жанра. Общий объем корпуса составляет примерно 120 тыс. знаков (около 4 тыс. предикаций). Первая часть корпуса состоит из 6 письменных нарративов на современном японском языке — рассказов и переложений японских сказок.

1 Walker, Marilyn A., Masayo Iida and Sharon Cote. 1994. Japanese discourse and the process of centering. // Computational Linguistics, 20/2, 193-232

2 Nariyama, Shigeko. 2003. Ellipsis and Reference Tracking in Japanese. Amsterdam: Benjamins.

3 Hinds, John. 1983. Topic continuity in Japanese. // Topic continuity in discourse: a quantitative cross-linguistic study (Typological studies in language, vol. 3). Amsterdam: Benjamins, 183-195

4 Clancy, Patricia M. 1980. Referential choice in English and Japanese narrative in W.Chafe (ed.) The pear stories: cognitive, cultural and linguistic aspects of narrative production. Norwood, NJ:Ablex, 127-202

5 Басс И.И. 2004. Проблемы современного японского языкознания: лингвистика текста. СПб: Санкт-Петербургский государственный университет культуры и искусств.

Вторая часть корпуса — нарративы на японском и русском языках, представляющие собой устные и письменные пересказы разными испытуемыми одного и того же мультфильма. Тексты собранного нами корпуса были переведены в электронный формат, японские тексты — транслитерированы, снабжены морфологическим подстрочником и переводом. Для представления устных японских текстов была использована транскрипционная система [Du Bois et al. 1993]6, для русских — система дискурсивной транскрипции, основанная на принципах, изложенных в ([Земская (ред.) 1983]7, [Подлесская и Кибрик 2003]8). При обработке текстов корпуса была проведена сегментация — разбиение на предикации и абзацы (эпизоды). Во всех текстах были проиндексированы ИГ, отсылающие к повторяющимся референтам и таким образом размечена референциальная структура текста. Для каждого текста строилась его риторическая структура (см. 1.4.2.).

Практическая ценность работы. Результаты исследования и обработанный корпус текстов можно использовать в практике преподавания японского и русского языков как иностранных: в частности, они уже успешно используются в курсе японского языка, который автор ведет в Институте лингвистики и в Институте восточных культур РГГУ. Собранные и аннотированные автором электронные корпуса текстов представляют самостоятельный интерес для специалистов по лингвистике текста, когнитивной лингвистике, автоматическим системам перевода.

Апробация работы. Результаты исследования были представлены на следующих международных конференциях: Международная конференция Диалог '2004, Верхневолжский, 2-7 июня 2004 г; Всемирный конгресс востоковедов, ICANAS-37 Orientalist Congress, Москва, 16-21 Август 2004; Четвертая типологическая школа: Международная школа по лингвистической типологии и антропологии, Ереван (Армения), 21-28 сентября 2005г. Промежуточные результаты также регулярно обсуждались на межвузовском семинаре по устному дискурсу (РГГУ/МГУ, рук. А.А.Кибрик и В.И.Подлесская).

Структура работы. Диссертация состоит из введения, четырех глав, заключения и приложений.

Первая глава является вводной. В ней даются определения основных понятий, используемых в работе, описывается корпус и методология работы с ним, рассматривается теоретическая база исследования, делается краткий обзор работ, на которые опирается данное исследование.

Во второй главе рассматриваются проблемы представления корпусов письменных текстов и некоторые проблемы анализа референциальной структуры в письменном нарративе, принимается ряд конвенций и решений. Далее методом корпусного исследования выделяются дискурсивные факторы, коррелирующие с референциальным выбором в японских письменных нарративах. Полученный список факторов сопоставляется с аналогичным списком для русского языка, предложенным в [Kibrik 1996]9, на основе этого сравнения делаются первые выводы об общих и специфичных свойствах референциальной структуры японского языка.

В третьей главе модель референциального выбора, разработанная и опробованная на русском и английском языках в работах А.А.Кибрика [Kibrik 1996], [Kibrik 1999]10

Du Bois, John W. Susanna Cunning, Stephan Shuetze-Coburn, Danae Paolino eds. 1992. Santa Barbara Papers in Linguistics vol.4: Discourse Transcription. Department of Linguistics, University of California, Santa Barbara.

7 Земская E.A. (ред.) 1983. Русская разговорная речь. Фонетика. Морфология. Лексика. Жест. Москва: Наука.

' Кибрик А.А., Подлесская В.И. 2003. К созданию корпусов устной русской речи: принципы транскрибирования. // Научно-техническая информация, серия 2, №10, 2003, 5-12

9 Kibrik, Andrei А. 1996. Anaphora in Russian narrative discourse: A cognitive calculative account. // Studies in Anaphora, ed. Barbara Fox. Amsterdam: Benjamins, 255-304

10 Kibrik, Andrei A. 1999. Cognitive inferences from discourse observations: Reference and working memory. // Discourse studies in cognitive linguistics. Proceedings of the 5,h International cognitive linguistic conference. Ed. Karen van Hoek, Andrei A. Kibrik, and Leo Nordman. AmsterdanrBenjamins, 29-52

применяется к материалу японского языка. Показывается, что в целом модель работает на рассматриваемом материале, а также выделяются и объясняются случаи, когда алгоритм неверно предсказывает выбор референциального класса. В конце третьей главы сравниваются результаты применения модели референциального выбора к японскому и русскому языкам. На основании этого делаются выводы о схожих и отличных свойствах референциальных структур японского и русского языков.

В четвертой главе сделанные в предыдущих главах наблюдения проверяются на устном материале. В этой главе подробно рассматриваются некоторые проблемы сегментации, а также отражения референциальной структуры устных текстов. Устные японские и русские нарративы анализируются на тех же основаниях, что и письменные тексты в предыдущих главах: выделяются факторы, значимые для референциального выбора, и проверяется возможность применения предсказывающей модели референциального выбора к устному материалу. На базе полученных результатов сравниваются свойства референциальных структур в японских устных и японских письменных нарративах, делается вывод о том, какие из свойств референциальной структуры присущи нарративному жанру в целом, а какие варьируются в зависимости от модуса нарратива. Сделанные выводы о разнице референциальных структур в устном и письменном модусах в японском языке подтверждаются при сравнении устных и письменных русских нарративов.

В заключении подводится итог полученных в ходе исследования результатов, и рассматриваются перспективы дальнейших исследований референциальной структуры японского языка.

Содержание работы

Глава 1. Основные понятия и постановка задачи

1.1. Постановка проблемы. В процессе порождения речи, говорящий решает множество задач — подбирает лексику, правильные грамматические формы слова, сегментирует дискурс и т.п. Одна из наиболее частых процедур, выполняемых говорящим — выбор выражения для обозначения некоторого объекта в тексте.

Для человека, говорящего по-японски, выбор чаще всего встает между полнозначным именем (например, hito 'человек', пеко 'кот') и референциальным нулем, то есть опущением именной группы, отсылающей к данному объекту. Рассмотрим пример из собранного нами корпуса - начало письменного пересказа мультфильма, в котором речь идет о постоянно враждующих между собой персонажах — коте Томе и мышонке Джерри. (1) JW-F5

1. юё© «t-plIbA # ÜHJbUTHS.

itsumonoyooni tomu, ga jeriij o oimawashi-te iru. как всегда Том SUBJ Джерри DO гонятся-INF быть

2. ÜHjWtliUAfc -Г С fcfc.

0,/[tomut ga] Oj/[jeriij o] oikake-hajime-ta sugu ato,

О/Гом SUBJ О/Джерри DO преследовать-начинать-PASTBCKope после

3. í;iV-ií я О ШШ <n T te

jeriij wa/[*0j] inu no zasshij no shita ni kakure, Джерри ТОР собака ATTR журнал ATTR низ LOC прятаться-INF

4. ÍTCDáíá oiSífS JÉ^l-Oj/[*jeriij ga] sonomama nigeru tochuuni 0^[*Джерр^ SUBJ] так бежать по дороге

5. & ¿.ъкътъ-г игз.

<У( ^еги] gaJ ка1<1ап о korogari-ochi-te вЫтаи.

0/[*Джерр^ SUBJ] лестницаОО катититься-падать-ЮТ заканчивать

Том как всегда гоняется за Джерри. Вскоре после того, как ¡Том] начал преследовать [Джерри], Джерри прячется под журнал про собак, и когда вот так [спрятавшись под журнал] бежит, скатывается с лестницы.

В первой строке вводятся главные герои, для этого они названы по именам, т.е. обозначены полными именными группами (ИГ). Во второй строке речь идет также о действиях главных героев — Том и Джерри, однако при этом действующие лица никак не названы — после того как начал преследовать, т.е. используются референциальные нули" (см. точное определение этого понятия ниже). В третьей строке действующее лицо обозначается с помощью полной ИГ. В четвертой и пятой предикации, так же как и во второй, нет эксплицитного указания на Джерри.

Для номинации главных героев иногда возможны альтернативы. Так, во второй строке можно употребить как полную ИГ, так и референциальный ноль.

Из приведенного выше примера видно, что выбор средств для обозначения действующих лиц и предметов, называемый также референциальным выбором, — процесс с одной стороны не случайный, с другой стороны — сферы употребления разных выражений иногда пересекаются (как, например, в строке 2).

Настоящая работа посвящена моделированию процесса референциального выбора в японском языке.

Очевидно, что в разных языках механизмы референциального выбора могут отличаться. Этот тезис иллюстрирует перевод примера (1) на русский язык — в русском эквиваленте второй предикации использование местоимения затруднено, а использование референциального нуля — невозможно, в то время как по-японски ноль возможен:

(2) Том( как всегда гоняется за Джерри^

Вскоре после того как ?он1/ *0г начал преследовать,

Джерр^ прячется под журнал.

В настоящей работе мы сравниваем референциальную структуру японского нарративного дискурса с референциальной структурой русского нарративного дискурса и выделяем общие и лингвоспецифические черты этих структур.

1.2. Основные понятия. Мы будем оперировать такими понятиями, как референт, референциальная цепочка, антецедент, референциальный класс.

В лингвистической традиции объекты действительности или их образы в сознании говорящего принято называть референтами. Все упоминания одного референта в тексте составляют референциальную цепочку. Для каждого повторного упоминания референта в тексте предыдущие упоминания называются антецедентами. Для процесса референциального выбора важным является понятие ближайшего антецедента - т.е. ближайшего, линейно или структурно, предыдущего упоминания референта, свойства которого во многом определяют активацию референта в следующей точке дискурса.

Проиллюстрируем эти понятия на примере (1). В этом фрагменте текста упоминаются референты 'Том', 'Джерри', 'собака', 'журнал', 'лестница'. Из них повторяются только референты 'Том' и 'Джерри'. Упоминания каждого референта составляют референциальную цепочку. Так, например, референт Джерри упоминается 5 раз и все его упоминания можно представить в виде следующей референциальной цепочки: 1. ЗеН^ ga, 2. 0j,3. jeriij \уа, 4. 0;, 5. 0Г

У всех упоминаний референта 'Джерри', кроме первого, есть антецеденты —

" Они в транскрипции обозначены с помощью нулей и проиндексированны с помощью латинских букв.

предыдущие элементы цепочки. Так, например, для референциального нуля, четвертого элемента цепочки, антецедентами являются предыдущие три упоминания Джерри - jeriij ga, Oj и jerii wa.

1.3. Референциальные классы. В тексте референт может обозначаться выражениями разных референциальных классов. Содержательно референциальные выражения разбиваются на два класса: полные ИГ и редуцированные ИГ. Полные ИГ включают в себя имена существительные, а редуцированные ИГ — местоимения и референциальные нули.

В японском языке есть все три класса референциальных выражений, однако в используемом нами материале — нарративах третьего лица — класс местоимений низкочастотен (местоимения составляют менее 3% от всех референциальных выражений для повторяющихся референтов в корпусе). Поэтому мы исключили из рассмотрения класс местоимений. С другой стороны, в связи с тем, что японский — язык с формально выраженной темой, в некоторых исследованиях (например, [Hinds 1983], [Nakamura 1993]12) выделяется два референциальных класса полных ИГ: полные ИГ с показателем темы WA и полные ИГ без показателя WA13. Мы будем следовать предложенному разбиению класса ИГ. Таким образом, мы рассматривали в японском языке три класса референциальных выражений: полные ИГ без показателя темы WA (далее — полные ИГ без WA), полные ИГ с показателем темы WA (далее — полные ИГ с WA) и референциальные нули.

В русском языке мы выделили три «стандартных» референциальных класса: полные ИГ, местоимения и нули.

1.4. Теоретическая база исследования

1.4.1. Объяснение референциального выбора. В исследовании механизма референциального выбора мы придерживаемся когнитивного подхода, т.е. мы понимаем референциальный выбор как процесс, встроенный в другие когнитивные процессы. Вслед за другими исследователями референциальной структуры дискурса ([Chafe 1994]14, [Gundel, Hedverg and Zacharsky 1993]15) мы связываем референциальный выбор с активацией референта в сознании говорящего. В соответствии с универсалией, предложенной в [Givon 1983] 16, чем больше активация референта, тем больше вероятность того, что он будет выражен более редуцированно. Большинство факторов, предлагаемых в исследованиях референциального выбора, представляют собой лингвистические корреляты когнитивного понятия «активация».

В разных исследованиях предлагались разные дискурсивные факторы. Одним из первых был предложен фактор линейного (референциального) расстояния, который измерялся в количествах границ предикаций между данным упоминанием референта и его ближайшим антецедентом [Givon 1983]. Одним из важнейших факторов, влияющих на выбор референциального выражения, является фактор риторического (иерархического) расстояния [Fox 1987]17. В литературе также отмечались другие факторы, связанные с взаимным расположением данного упоминания референта и

12 Nakamura, К. 1993. Referential structure in Japanese children's narratives: The acquisition of wa and ga. // S. Choi (Ed.), Japanese/Korean Linguistics 3 Stanford, CA: the Stanford Linguistics Association by the Center for the Study of Language and Information, 84-99

13 Выделение двух референциальных классов ИГ обоснованно в [Hinds 1983] тем, что референциальный класс тематических ИГ с WA статистически встречается чаще при более высокой степени активации, чем другие ИГ.

14 Chafe, Wallace. 1994. Discourse, consciousness, and time. The flow and displacement of conscious experience in speaking and writing. Chicago: University of Chicago Press.

15 Gundel, Jeanette K., Hedberg, Nancy, and Zacharsky, Ron. 1993. Cognitive status and the form of referring

expressions in discourse. Language, 69, 274-307

16 Givon, Talmy. 1983. Topic continuity in discourse: An Introduction. // Topic continuity in discourse: a quantitative

cross-linguistic study (Typological studies in language, vol. 3). Amsterdam: Benjamins.

17 Fox, Barbara. 1987. Discourse structure and anaphora. Cambridge: Cambridge University Press.

антецедента, а также свойствами антецедента: расстояние в предложениях, абзацах (эпизодах) до антецедента, синтаксическая и семантическая роль антецедента, референциальный статус антецедента и др. Также важными для референциального выбора оказываются свойства референта (одушевленность), его дискурсивный «вес» (является ли референт центральным для участников речевого акта), а также синтаксическая и семантическая роль выбираемого референциального выражения в предикации.

1.4.2. Теория риторических структур. Один из важнейших для референциального выбора факторов — риторическое расстояние — связан с иерархической структурой текста. Для представления структуры текста мы использовали формализм Теории риторических структур (ТРС) [Mann and Thompson 1988]18, с помощью которого можно описать иерархическое строение текста и более объективно подойти к оценке того, как влияет положение референта в структуре текста на референциальный выбор.

ТРС основывается в первую очередь на связности дискурса — любая единица текста связана хотя бы с одной другой единицей этого же текста посредством осмысленной связи. Смысловые связи между единицами текста называются риторическими отношениями. Одна из основных идей ТРС состоит в том, отношения между дискурсивными единицами, будь то элементарные дискурсивные единицы (ЭДЕ, как правило, совпадающие с предикацией), или более крупные единицы текста (несколько связанных между собой предложений, абзац и т.п.), можно описать с помощью единого инвентаря риторических отношений. Риторические отношения, подобно синтаксическим, бывают симметричными (аналог сочинения) и асимметричными (аналог подчинения), а фрагменты текста, связанные этими риторическими отношениями могут играть одну из двух ролей — ядра или сателлита. Единицы текста, связанные симметричными отношениями считаются ядрами. При ассиметричности отношений одна из единиц является главной — ядром, а другая зависимой — сателлитом. В ТРС риторическую структуру графически принято изображать с помощью семантического графа заданного вида. Риторическое расстояние между двумя узлами равно количеству переходов по риторической структуре от одного из них до другого. (Примеры подсчета риторических расстояний будут приведены в третьей главе).

1.4.3. Факторы активации в японском языке. Факторы активации исследовались на материале японского языка неоднократно ([Hinds 1983], [Clancy 1980], [Nariyama 2003]). В ходе этих исследований было выявлена релевантность следующих факторов: линейное расстояние ([Hinds 1983], [Clancy 1980]), границы предложений и эпизодов [Clancy 1980], одушевленность референтов [Hinds 1980], синтаксическая роль референта ([Nariyama 2003], [Clancy 1980]). В этих работах также сделан ряд важных наблюдений: исследованы механизмы введения новых референтов в нарратив, ограничения на употребление ИГ с WA, отмечено влияние переключения миров (например, переход к прямой речи) на способ номинации референтов и некоторые другие. В [Nakano 1991]" отмечается, что часто полные ИГ опускаются при бенефактивной конструкции типа —te itadaku.

Однако в исследованиях наших предшественников проверена на релевантность лишь часть дискурсивных факторов, потенциально важных для референциального выбора в японском языке. В частности, до сих пор не была проверена релевантность важнейшего активационного фактора - риторического расстояния20. Кроме того, референциальный выбор описывался преимущественно статистически, а взаимодействию

18 Mann, William, and Sandra A. Thompson. 1988. Rhetorical structure theory: toward a functional theory of text organization. // Text, 8, 243-281

19 Nakano, Hiroshi. 1991. '(te) itadaku'bun ni okeru shooryaku. // Keiryou Kokugogaku. vol.18, 2, 66-79

20 В [Hinds 1983] отмечается, что выбор референциального выражения зависит от того, в главном или придаточном предложении находится антецедент, однако эта идея не находит дальнешего развития.

факторов между собой не уделялось должного внимания.

В нашей работе мы постарались восполнить указанные выше пробелы.

1.4.4. Модели референциального выбора. Существует несколько моделей, объясняющих или предсказывающих выбор референциального средства. Большая часть из них концентрирует свое внимание только на одном факторе, который влияет на референциальный выбор. Таким фактором в большинстве исследований является риторическая структура текста (напр., [Fox 1987]). Тем не менее, очевидно, что нельзя объяснить референциальный выбор только одним фактором: либо фактор референциального выбора будет определяться слишком расплывчато и в итоге сводиться к самому понятию активации, либо одного фактора (вроде фактора риторического расстояния) будет недостаточно.

В качестве исходной модели референциального выбора мы использовали многофакторную модель, предложенную в [Kibrik 1996]. Данная модель предлагает вычислительный алгоритм, позволяющий учитывать взаимодействие различных дискурсивных факторов. Более подробно модель описана в главе 3, где мы адаптировали ее к материалу японского языка.

1.4.5. Референциальная структура устного и письменного языка. В своей работе мы ставим перед собой еще одну цель - рассмотреть особенности референциальных структур в разных языковых модусах — устном и письменном.

Устный язык обладает целым спектром отличий от письменного языка. В восьмидесятых годах вышло несколько общетеоретических дискурсивных работ, исследующих основные отличия устного и письменного модусов. Сравнение устной и письменной японской речи было проведено в работах [Maynard 1989]21, [Clancy 1982] и ряде других. Среди основных отличий в производстве устного и письменного дискурса называются вовлеченность/невовлеченность участников речевого акта, а также спонтанность/запланированность производимого текста. Эти внутренние различия устного и письменного дискурса выражаются в ряде свойств текстов этих модусов (количестве конструкций с инфинитными формами, дискурсивных маркеров, оценочных слов и т.п.) Безусловно, различия устной и письменной речи касаются и референциальной структуры. Так, в работе [Clancy 1982] показано, что при смене подлежащего в устном нарративе чаще используется референциальный ноль, чем в письменном нарративе. В [Hinds 1983] сравнивается среднее линейное расстояние для разных видов референциальных классов в устном диалогическом тексте и в письменном нарративе. В диалогическом тексте среднее линейное расстояние у референциальных нулей в несколько раз больше, чем у того же референциального класса в письменном нарративе, у полных ИГ как с WA, так и без WA среднее линейное расстояние в диалогах также больше, чем в письменных текстах. Референциальные нули более частотны в устном материале, чем в письменном, а полные ИГ (как с WA, так и без WA), напротив, более частотны в письменном материале.

В четвертой главе мы исследуем различия устного и письменного нарративов более последовательно и подвтерждаем идею о том, что правила референциального выбора в устном нарративе не такие жесткие, как в письменном нарративе. Кроме того, мы показываем на примере японского языка, что линейное расстояние более важный параметр, чем риторическое расстояние.

21 Maynard, S.K. 1989. The language of conversation. Japanese conversation: self-contextualization through structure and interactional management. Norwood: Ablex.

Глава 2. Комплексный анализ факторов, влияющих на референциальный выбор в японском языке в сопоставлении с русским

2.1. Факторы активации в японском языке. Все факторы условно разделены нами на три группы: (I) факторы, связанные с внутренними свойствами референта и его ролью в тексте, (2) факторы, связанные с текущим упоминанием референта (для которого определяется выбор референциального средства) и (3) факторы, связанные с антецедентом.

Факторы, связанные со свойствами референта и его ролью в тексте Протагонизм. Данный параметр имеет два значения: протагонист / не-протагонист. Протагонистами признаются все центральные герои повествования (см., напр., [С1уоп 1990]22).

Одушевленность. Одушевленность референта не отражает напрямую активацию референта, однако в ряде работ высказывается мнение, что одушевленные легче реактивируются, чем неодушевленные референты. Значения фактора: одушевленный /неодушевленный референт. Факторы, связанные с текущим упоминанием референта

Синтаксическая роль ИГ. Мы выделяем два значения синтаксической роли: подлежащее / не-подлежащее.

Семантическая роль референта в предикации. Референт может иметь семантическую роль агенса, пациенса, экспериенцера и т.д. В грамматиках есть понятие семантической гиперроли референта, объединяющей несколько семантических ролей. Как показано в [КПэпк 1996], для референциального выбора важно понятие гиперроли — актор, которым считается агенс (если он есть), а если его нет, то — экспериенцер или пациенс. В дальнейшем мы будем выделять две значимые семантические гиперроли референта — актор / не-актор, для простоты будем называть этот фактор «Семантической ролью референта».

Референциальная информативность глагола. Информация о референте не всегда находится в ИГ, к нему отсылающей, но может выражаться, в частности, в синтаксических конструкциях и в формах глагола, связанных с соответствующей ИГ в предикатно-аргументной структуре предложения. При анализе нашего корпуса текстов чаще всего референциально информативными оказывались бенефактивные конструкции, в частности, как было показано в [Холодович 1979, с.90-91]23, эта конструкция чувствительна к различению главного героя повествования (который является более "своим" для автора, чем прочие) и второстепенных героев. Факторы, связанные с антецедентом

Линейное расстояние — количество элементарных предикаций до ближайшего антецедента (значения 1 и больше 1).

Риторическое расстояние — минимальное расстояние до антецедента в риторической структуре (значения 1 и больше 1)

Расстояние в предложениях — количество предложений до ближайшего антецедента (О и больше 0).

Расстояние в абзацах — количество абзацев, разделяющих данное упоминание референта и его антецедент (значения 0 и больше 0).

Синтаксическая роль антецедента и Семантическая роль антецедента. Определения и множество значений этих факторов такие же, как и для соответствующих факторов для данного упоминания референта.

23 Givon, Т. 1990. Syntax: A functional typological introduction, vol.2 Amsterdam: Benjamins.

23 Холодович, A.A. 1979. Проблемы грамматической теории. Ленинград: Наука.

Референциальный статус антецедента. Для каждого употребления референта мы проверяем, выражен ли антецедент полной ИГ (с или без или редуцированной ИГ (референциальным нулем или местоимением).

Неполная кореферентность с антецедентом — это случаи неполного совпадения референта данной ИГ с референтом ее антецедента. Между референтом антецедента ИГ и ее собственным антецедентом могут быть отношения: «объект — родовое понятие», «действующее лицо — группа, в которую входит действующее лицо», и т.п. 2.2. Результаты. Корпус из шести письменных нарративов был размечен в соответствии с общей схемой. Далее для каждого упоминания референта, встречающегося в тексте более одного раза, записывались значения факторов, и то, к какому референциальному классу относится данное упоминание референта.

Всего в корпусе встретилось 35 повторяющихся референтов и 341 референциальное выражение, из которых 35 являются первым упоминанием, а остальные 306 — повторными. В результате мы получили Таблицу 1, в которой отражено, сколько референциальных выражений определенного класса встречается при определенном значении фактора. Так, например, из этой таблицы следует, что у 167 референциальных нулей одушевленные референты, а у 14 - неодушевленные, для полных ИГ эти цифры составляют 41 и 51 и т.д.

Таблица 1 состоит из трех частей в соответствии с проведенной в 2.1. группировкой факторов.

Таблица 1. Частота встречаемости референциальных классов с различными значениями факторов в японских письменных нарративах_

Параметры / классы референциальных выражений ■ Полная ИГ без XVА - Полная ИГ с \УА Референциаль-ный ноль

Количество в корпусе 91 25 181

Одушевленность + 51 24 167

_ 40 1 14

Протагонизм + 43 19 139

- 48 б 42

Синтаксическая роль ИГ подл. 37 25 150

не подл. 54 0 31

Семантическая роль референта актор 40 25 149

не актор 51 0 32

Референциальная информативность глагола + 2 0 12

- 79 25 169

Линейное расстояние 1 20 6 143

>1 71 19 38

Риторическое расстояние 1 17 2 147

>1 74 23 34

Расстояние в предложениях 0 8 _ 125

1 83 25 56

Расстояние в абзацах 0 31 7 8

1 50 18 173

Референциальный статус антецедента полная ИГ 54 10 69

редуц. ИГ 37 15 112

Таблица 2. Частота встречаемости референциальных классов с различными значениями факторов в японских письменных нарративах (продолжение)_

Параметры / классы референциальных выражений Полная ИГ без \УА Полная ИГ с \\'А Референциальный ноль :; ■

Синтаксическая роль антецедента подл. 44 13 154

не подл. 47 12 27

Семантическая роль антецедента актор 46 15 151

не актор 45 10 30

Неполная кореферентность с антецедентом + 38 4 5

- 53 21 186

2.3. Анализ результатов. Для выяснения корреляции между факторами активации и выбором референциального средства к полученным данным был применен статистический метод хи-квадрат. Этот метод может быть использован внутри одной достаточно большой выборки для определения наличия корреляции между значениями двух параметров. В нашем случае первый параметр — это один из активационных факторов, а другой — референциальный класс упоминания референта. Для каждого фактора мы вычисляли эмпирическое значение ХэмгЛ которое указывает на степень корреляции этого фактора с выбором референциального класса.

В Таблице 2 приведены значения Хэм„2 для всех активационных факторов.

Таблица 2. Факторы и соответствующие им значения Хэмп2

Название фактора Значение

Риторическое расстояние 121,45

Расстояние в предложениях 111,09

Линейное расстояние 92,35

Неполная кореферентность 69,13

Синтаксическая роль ИГ 63,77

Одушевленность 56,47

Семантическая роль референта 54,85

Синтаксическая роль антецедента 44,53

Расстояние в абзацах 43,93

Семантическая роль антецедента 33,77

Протагонизм 25,02

Референциальный статус антецедента 11,28

Референциальная информативность глагола 4,00

С помощью полученных значений мы сможем оценить, есть ли корреляция между определенным фактором и выбором референциального средства, а также, какие из факторов в наибольшей степени коррелируют с выбором референциального средства. Для этого необходимо сравнить полученное эмпирическое значение Хэмп2 с критическим значением Хкрит2 при данном числе степеней свободы и. Для всех факторов критическое значение критерия Хкрит2 = 9,21 (число степеней свободы и=2, уровень статистической значимости р<0,01). Если для некоторого дискурсивного фактора и выбора референциального средства Хэмп2 > Хкрит2» то с вероятностью 99% можно утверждать, что этот фактор коррелирует с выбором референциального класса. Для всех факторов (с и=2), кроме фактора «Референциальная информативность глагола» Хэмп2>9,21, следовательно, можно сделать вывод о том, что все эти факторы коррелируют с референциальным выбором. Метод хи-квадрат не выявил корреляции между фактором «Референциальная информативность глагола» и выбором референциального средства. Однако, возможно, такой результат связан с небольшим числом встретившихся бенефактивных конструкций

— 14 случаев. Специальный качественный анализ, приведенный в третьей главе, доказывает релевантность и этого фактора.

В Таблице 2 факторы расположены от наибольшей к наименьшей степени корреляции. Наиболее важными оказались факторы расстояния — риторическое расстояние, расстояние в предложениях и линейное расстояние. Далее можно выделить группу из четырех факторов: неполная кореферентность, синтаксическая роль ИГ, одушевленность и семантическая роль референта. В меньшей степени скоррелированы с референциальным выбором следующие факторы: синтаксическая роль антецедента, расстояние в абзацах, семантическая роль антецедента и протагонизм. Наименьшую достоверную корреляцию с выбором референциального средства показал фактор «Референциальный статус антецедента». Несмотря на имеющуюся корреляционную связь между этими двумя явлениями, на наш взгляд, нельзя говорить о глубинной зависимости одного от другого. Количественное распределение референциальных выражений относительно референциального статуса антецедентов следующее: у полных ИГ в качестве антецедентов чаще бывают полные ИГ, а у референциальных нулей — референциальные нули. Такая закономерность, скорее всего, связана с центральностью референтов в тексте: референциальные цепочки референтов-протагонистов преимущественно состоят из референциальных нулей, а при упоминании нецентральных референтов, упоминаемых несколько раз, используются полные ИГ.

Из полученных данных мы сделали следующие выводы о референциальном выборе в японском письменном нарративе.

❖ На материале письменного японского языка подтверждается идея о том, что в письменном нарративе референциальный выбор в большей степени связан со структурой текста, чем с линейным расстоянием.

❖ В письменном нарративе фактор расстояния в предложениях в большой степени коррелирует с референциальным выбором.

❖ Синтаксическая роль (как ИГ, так и антецедента) больше коррелирует с референциальным выбором, чем семантическая роль (референта и антецедента, соответственно). Следующий пример демонстрирует преимущество фактора синтаксической роли антецедента перед фактором семантической роли антецедента. В строке 1 вводится два референта — 'мышь' и 'кот'. Первый референт — подлежащее и неактор, а второй — не-подлежащее и актор. В строке 2 референциальный ноль однозначно интерпретируется как отсылающий к референту 'мышь', то есть в данном случае при прочих равных условиях референт 'мышь', имеющий антецедент-подлежащее, активирован в большей степени, чем референт 'кот', антецедент которого является актором.

(3) Л\¥-Г6

1. ЙЗМ <о (с ИЗ.

кита; Ьеуа по пака пегиш^ ga пеко, ш 01'каке-гаге-1е ¡ги.

темный комната АТТЯв мышь БиВЛ кот Ю преследовать-РАББ-ШР быть

В темной комнате кот преследует мышь (доел. В темной комнате мышь предследуема котом)

2. {с йк*г-с

0/*0, гаввЫ ш какиге-1е

журнал Ю прятаться-ЮТ

Мышь прячется за журнал

Привилегированная роль ИГ используется в японском языке для поддержания референции, а именно, если говорящему нужно оставить в фокусе внимания некоторый референт, то при появлении другого действующего лица, совершающего действия над центральным референтом, глагол ставится в пассивную форму, и центральный референт сохраняет при этом высокую активацию. Пример (4) демонстрирует описанную технику. В строках 113 и 119 референт 'старик' является актором и при этом занимает позицию

подлежащего. В строке 117 появляется неопределенно-личный актор, референт 'старик' играет семантическую роль «не-актор», но оформляется как подлежащее при пассивной форме глагола. Таким образом, референт 'старик' сохраняет высокую степень активации, что позволяет в строках 117 и 119 использовать референциальный ноль для упоминания данного референта. (4) [Yanagita 1983]

113.ЁСК 3S& <г> £ it ® К Мх.~С

suguni jijisama no sugataj ga minara ni mie-te ki-mashi-ta.

скоро старик ATTR фигура SUB J все IO быть.видным-INF приходить-ADDR-P AST Скоро фигура старика стала всем видна.

114. ГйШГ 11 It. • • • J 'ornae wa nanimono da. ...*

ты ТОР кто COP.PRS

«Кто ты?...»

117. t

to Oj 0m tazune-rare-mashi-ta. QUOT спрашивать-PASS-ADDR-PAST

спросили его. (доел, он был спрошен)

119. '"¿с й z.t £ Й6Г ISLT

Oj ima made no koto o nokorazu hanashi-te

сейчас до ATTR события DO полностью рассказать-INF и он полностью рассказал о том, что случилось до этого, ...

❖ Синтаксическая и семантическая показывают большую степень корреляции с выбором референциального класса в японском языке. Так, полные ИГ с WA, как и референциальные нули почти всегда употребляются в роли подлежащего и актора, в то время как полные ИГ без WA часто используются для обозначения нецентральных в предложении референтов.

❖ Важным для референциального выбора является фактор неполной кореферентности с антецедентом. Прагматически понятно, что при изменении референта, к которому идет отсылка, нужно выразить это изменение эксплицитно. Тем не менее, не всегда референциальное выражение, не полностью кореферентное своему антецеденту, — это полная ИГ. В проанализированном корпусе письменных нарративов в пяти из 47 случаев неполной кореферентности были употреблены референциальные нули. Во всех пяти случаях происходит пересечение референциальных цепочек двух или более референтов, когда герои встречаются и совершают какие-то действия вместе. При этом информация об изменении состава референта может выражаться лексически в других фрагментах дискурсивной единицы: в глаголах совместного действия tsuredatsu 'отправляться вместе', наречиях, таких как futari de 'вдвоем', issho ni 'вместе', реципрокной форме глагола на -аи. Так, следующем примере референты 'старик' и 'девушка' сначала упоминаются отдельно, а потом эти референты объединяются, совместность действия выражена лексически в глаголе tsuredatsu 'отправляться вместе'. (5) (Yanagita 1983]

66. ш (i <п oh\z шш ЖТ

jijij wa asa no uchi ni nohara ni ki-te старикТОРутроАТТЯв течение поле LOC прийти-INF Когда старик пришел утром на поле

67. Л*"** t Oj mi-masu to

CMOTpeTb-ADDR.PRS когда и посмотрел.

68. HLl^ ШТ

utsukushii musumem ga de-te красивый девушка SUBJ выходить-INF

красивая девушка появившись

69. Щ-эХ V^Lfc, Om Oj mat-te i-mashi-ta.

ждать-INF быть-ADDR-PST

ждала его там.

70. írtb^Pj iííbfco-C sorekara 0m+j tsuredat-te

тогда отправиться.вместе-INF

Тогда они отправились вместе

71. Щ (D Ш<П *t (С ЛоТ ÍTt^Lfco 0m+j no no tonarino mura ni hait-te iki-mashi-ta.

поле ATTR соседний деревня LOC входить-INF идти-ADDR-PST

и вошли в соседнюю деревню.

2.4. Сопоставление свойств референциальных классов и факторов активации в японском и русском языках. Для русского языка нам известно только одно корпусное исследование референциальной структуры письменного нарратива, [Kibrik 1996], где на текстовом материале была получена количественная оценка частотности двух референциальных классов — полных ИГ и местоимений — при действии различных дискурсивных факторов. В соответствии с полученными данными релевантными для выбора между полными ИГ и местоимениями в русском языке были признаны следующие дискурсивные факторы:

• риторическое расстояние

• расстояние в предложениях

• линейное расстояние

• синтаксическая и семантическая роли антецедента

• расстояние в абзацах

• неполная кореферентность

• одушевленность

• протагонист (=протагонизм, действует только при определенных условиях)

В соответствии с моделью референциального выбора, предложенной и опробованной в той же работе, для русского письменного нарратива решающую роль в выборе референциального средства играет риторическое расстояние. Линейное расстояние может значительно снижать активацию референта при значениях больше 2. Синтаксическая и семантическая роли антецедента, расстояние в абзацах, неполная кореферентность имеют примерно одинаковый вес, а протагонизм и одушевленность референта облегчают реактивацию референта (т.е. действуют только при больших расстояниях). Хотя по полученной А.А.Кибриком статистике фактор расстояния в предложениях коррелирует с выбором референциального средства, этот фактор не используется в предложенной им модели. Принятое решение в работе никак не прокомментировано, однако, как мы показали в четвертой главе, его можно обосновать: в устном нарративе роль этого фактора по равнению с письменным нарративом резко снижается.

Фактор референциальной информативности глагола для русского языка в [Kibrik 1996] не рассматривается. В русском глаголе, безусловно, есть вспомогательные средства, указывающие на свойства референта (род и число). Тем не менее, на практике эта информация редко является идентифицирующей для референта третьего лица, так как

чаще всего подлежащее третьего лица не опускается, т.е. значение рода и числа в глаголе лишь дублируется. Категории рода и числа являются не дублирующей информацией, только если референт выражен референциальным нулем. В собранном нами корпусе устных и письменных пересказов мультфильма на русском языке не встретилось ни одного примера, когда информация в глаголе облегчала бы использование референциальных нулей. Теоретически трудно, но возможно представить себе такой пример в устном варианте русского нарратива:

(6) Маша попросила Васю„ прийти настроить компьютер. 0В Пришел в тот же день.

Незначительность фактора референциального статуса для референциального выбора в русском нарративе совпадает с выводом, сделанным нами для японского языка.

Факторы синтаксической роли и семантической роли оказались нерелевантны для референциального выбора между полными ИГ и местоимениями. На материале пяти русских письменных пересказов мультфильма нами было показано, что если в рассмотрение включить референциальный класс нулей, то эти факторы оказываются значимыми и для русского нарратива. В рассмотренных текстах нули используются в 20% всех повторных упоминаний референтов (138 из 658). Синтаксические и семантические роли внутри класса нулей распределяются следующим образом: 87% (120) всех нулей занимают позицию подлежащего, 13% (18) — не подлежащего, причем 14 из них приходится на генитивные нули, 1,5% (2) — на прямые дополнения, 1,5% (2) — на косвенные дополнения. Так же распределяется в текстах семантическая роль: на 87% референциальных нулей приходится роль актора, и лишь у 13% нулей — референт занимает в семантической структуре предикации роль не-актор. Получается, что нули употребляются преимущественно в синтаксической роли подлежащего и семантической роли актора. В то же время в соответствии с результатами, полученными в [КПэпк 1996], полные ИГ и местоимения одинаково часто встречаются с каждым из значений рассматриваемых факторов. Из этих двух фактов можно сделать вывод, что факторы синтаксической и семантической ролей данного упоминания референта коррелируют с выбором референциального класса: в роли не-подлежащего и не-актора преимущественно используются полные ИГ и ненулевые местоимения.

Нами был также дополнительно рассмотрен фактор неполной кореферентности с антецедентом в русском письменном нарративе. На материале девяти письменных пересказов мультфильма на русском языке мы проверили идею о зависимости выбора референциального средства от типа неполной кореферентности с антецедентом. Во всех проанализированных текстах нам встретилось 37 случаев неполной кореферентности. В пяти случаях из 37 были употреблены местоимения. Так же, как и в японских нарративах, все эти случаи — пересечение референциальных цепочек двух референтов. См. пример

(7), где в строке 51 происходит пересечение референциальных цепочек двух референтов 'бульдог' и 'Том'. Для отсылки к группе этих референтов используется полная ИГ:

(7) К\У-Г9

47. Бульдогь сердится

48. и 0Ь летит на помощь своему хозяину,.

49. В результате онь вышибает дверь,

50. под которой оказывается Том(.

51. Какое-то время они^ переворачивают дверь

52. и в результате Том» оказывается на улице.

В остальных случаях, даже при высокой степени активации, употребление редуцированных ИГ оказалось невозможным. В приведенном выше примере при высокой степени активации референта 'Том' в строке 52, нельзя употребить местоимение он, так как в этом случае слушающий не сможет верно идентифицировать референт.

Безусловно, невозможно, говорить о жестком правиле употребления полной ИГ при неполной кореферентности любого другого типа, кроме пересечения референциальных цепочек. Так, можно сконструировать следующий пример (8), где

идентификация референта в третьей строке становится возможна, так как род референтов различается и это различие маркируется в местоимении 3-го лица он:

(8) Антон, приглашает Наташу на свидание.

Онин встречаются в парке.

Он, дарит ей цветы.

Тем не менее, мы показали, что нельзя рассматривать фактор неполной кореферентности как нечто однородное — при прочих равных условиях при пересечении референциальных цепочек использование редуцированных ИГ более вероятно, чем при других видах неполной кореферентности.

Итак, в главе 2 были сделаны следующие выводы:

С? Референциальный выбор в японском языке коррелирует с большим количеством дискурсивных факторов. Наибольшую степень корреляции с выбором референциального средства показывают факторы расстояния, важнейшим из которых является фактор риторического расстояния. О Факторы синтаксической роли текущего упоминания референта и синтаксической роли антецедента, по-видимому, играют более важную роль при построении референциальной структуры японского нарратива, нежели факторы семантической роли текущего упоминания и семантической роли антецедента. Это проявляется, в частности, в тенденции к пассивизации глагола во избежание переключения референции.

<2 Роль (как синтаксическая, так и семантическая) данного упоминания референцта

коррелирует с референциальным выбором как в японском, так и в русском языке. <3? Разные виды неполной кореферентности с антецедентом по-разному влияют на референциальный выбор в японском языке. При пересечении референциальных цепочек, более вероятно употребление редуцированных ИГ, чем при других видах неполной кореферентности. При использовании референциального нуля идея совместности действия может выражаться в других частях предикации: в предикате (реципрокные формы), наречиях. Аналогичная неоднородность типов неполной кореферентности была отмечена и на материале русских письменных нарративов. <3? Сопоставление действия дискурсивных факторов в русском и японском языках позволило сделать важный вывод о том, что, несмотря на различный состав референциальных классов, используемых в русском и японском нарративах, наборы дискурсивных факторов, коррелирующих с референциальным выбором в обоих языках, в целом совпадают. Больше всего на референциальный выбор в письменных японских и русских нарративах влияет взаимное расположение текущего упоминания референта и его антецедента в структуре текста, в В японском языке можно выделить лингвоспецифический фактор: «референциальная информативность глагола», в который действует, в частности, при использовании бенефактивных форм. Несмотря на то, что эти конструкции встречаются в нашем корпусе недостаточно часто для достоверной статистической оценки, мы предполагаем, что этот фактор релевантен для референциального выбора в японском языке. В проанализированном нами русском корпусе устных и письменных нарративов, несмотря на наличие согласования сказуемого по роду и числу с подлежащим, нам не встретилось примеров, где бы это согласование играло решающую роль в выборе референциального средства. С другой стороны, в русском языке род и число местоимений 3-го лица в принципе, могут выполнять указанную выше функцию.

Глава 3. Модель референциального выбора и результаты ее применения к письменному японскому дискурсу в сопоставлении с русским

Выбор референциального средства в каждой точке коррелирует с целым рядом дискурсивных факторов. В предыдущей главе был определен список и иерархия этих факторов. В данной главе мы исследовали, как эти факторы действуют в комплексе в каждой точке референциального выбора. Мы попытались ответить на вопрос, можно ли построить модель, предсказывающую возможный выбор референциального класса по значениям активационных факторов.

В качестве исходной была использована одна из наиболее удачных, на наш взгляд, моделей референциального выбора — упомянутая выше модель А.А.Кибрика. [КлЬпк 1996, 1999]. В данной модели, как уже было сказано, для текущего упоминания определяется набор значений факторов, каждому значению фактора активации присваивается свой вес - числовой показатель активации. Эти показатели в сумме дают коэффициент активации референта в данной точке, который, в свою очередь, и определяет референциальный выбор.

Для каждого референциального класса в языке определяется промежуток, в котором это референциальное средство допустимо. Предложенная модель была опробована на материале русских [КлЬпк 1996], [Кибрик 2003] и английских [КлЬпк 1999] письменных нарративных текстов. В результате, для каждого языка были получены промежутки активации и соответствие между ними и используемыми референциальными средствами в этом языке. В соответствии с моделью значимые помежутки активации находятся на отрезке 0 до 1. Для русского языка были получены следующие промежутки активации. При минимальной активации референта — промежуток от 0 до 0,3 — возможны только полные ИГ, при максимальной активации 1 возможны только местоимения и нули. В промежутке от 0,4 до 0,6 употребление полной ИГ наиболее вероятно, а в промежутке от 0,7 до 0,9 возможно использовать как полную, так и редуцированную ИГ.

В Таблице 3 приведены соответствия значений факторов активации и численных показателей активации, предложенных в используемой нами модели в соответствии с [Кибрик 2003:55].

Таблица 3. Значения факторов и приписываемые им показатели активации

значение фактора показатель активации

Риторическое расстояние 1 0.7

2 0.4

3 0

> -0.3

Синтаксическая и семантическая роль антецедента Ближайший линейный антецедент является: подлежащим и актором, и при этом: риторический антецедент является подлежащим и актором риторический антецедент не является подлежащим и актором или подлежащим, или актором не подлежащим и не актором 0.4

0.3

0.2

0

Протагонизм Референт — протагонист, и при этом: первое упоминание референта в серии24 второе упоминание референта в серии третье упоминание референта в серии 0.3

0.1

0

Референт - не протагонист 0

24 Серией называется последовательность единиц, упоминающих данный референт, перед которой по крайней мере три дискурсивные единицы его не упоминают.

Таблица 3. Значения факторов и приписываемые им показатели активации (продолжение) __

значение фактора показатель активации

Одушевленность Референт — человек, и при этом: риторическое расстояние равно: 3 или более 0.2

2 0.1

1 0

Референт - неодушевленный 0

Линейное расстояние 1 0

2 -0.1

3 -0.2

4 -0.3

>4 -0.5

Расстояние в абзацах 0 0

1 -0.2

>1 -0.3

Неполная кореферентность с антецедентом нет 0

да -0.2

Наиболее существенным активационным фактором было выбрано риторическое расстояние до антецедента. Далее идет комбинированный параметр, включающий в себя синтаксическую и семантическую роли ближайшего, линейно и структурно, антецедента. Фактор одушевленности и статус протагониста повышают степень активации референта в случае реактивации, то есть когда референт не упоминался какое-то время (большое расстояние до антецедента). Большое линейное расстояние и наличие границы абзаца снижает активацию референта. Последний фактор — неполная кореферентность с антецедентом — также осложняет интерпретацию местоимений.

Факторы, предлагаемые в модели [Kibrik 1996, 2003] можно считать универсальными и применимыми к другим языкам. В предыдущей главе мы показали, что в русском и японском набор факторов, коррелирующих с референциальным выбором, в целом, совпадает. Поэтому было решено применить эту модель к японскому языку и проверить, будет ли она адекватна для языка, типологически далекого от русского и английского.

В качестве материала исследования для указанных целей, мы взяли пять из шести письменных нарративов, проанализированных в предыдущей главе. Общий объем текстов составил около 5000 знаков. Нарративы разбиты на 361 элементарную дискурсивную единицу (предикацию) и содержат 28 повторяющихся референтов. Всего в текстах встретилось 256 повторных упоминаний референтов. Для каждого упоминания референта, были определены соответствующие значения факторов активации, выделенные в модели, каждому значению фактора был приписан установленный для него числовой показатель, после чего для каждого референта числовые показатели были сложены и получен результирующий коэффициент активации референта.

Продемонстрируем на примере алгоритм подсчета активации референта. В отрывке текста, приведенном в примере (9) имеется три отсылки к референту 'девушка' — в строках 110, 111 и 112. При этом в строках 110 и 111 при упоминании этого референта используется референциальный ноль, а в строке 112 референт номинируется с помощью ИГ без WA. В единице 111 референциальный ноль нельзя заменить полной ИГ, а в строке 112 — можно вместо полной ИГ использовать ноль. (9) [Yanagita 1983]

110.... t fot

to 0m it-te

QUOT говорить-INF

... сказав,

111. itl-e ~ ftoX LiniLfc.

Om/*niusumem ga hitoride dokoka e it-te shimai-mashi-ta.

один куда-то ALL идги-INF кончаться-ADDR-PAST и куда-то ушла одна (пропала).

112. Щ. ШГ Ь ¿5 t

musumem/O,,, ga de-te shimau to

девушка SUBJ выходить-INF кончаться QUOT

Как только девушка вышла (исчезла)

ín.ütCíc <о $ & Щ I- SSLfc.

suguni jijisama no sugataj ga mina ni mie-te ki-mashi-ta.

скоро старик ATTR фигура SUBJ все IO быть.видным-INF ripиходить-ADDR-PAST фигура старика стала всем видна.

Посчитаем коэффициент активации для упоминаний референта девушка в 111 и 112 строке. Упоминание референта девушка 0т в 110 является антецедентом 0т в 111, а 0т в 111 в свою очередь — антецедентом для musumem ga в 112. Для подсчета риторического расстояния между 111 и 112 и между 112 и 113 изобразим риторическую структуру рассматриваемого фрагмента текста. Дискурсивные единицы 110, 111 и 112-113 связаны между собой отношением sequence (последовательность), единица 112 и 113 состоит из ядра 113 и зависимой единицы (сателлита) 112, которые связаны отношением circum (обстоятельство):

112 из Рисунок 2. Риторическая структура

Риторическое расстояние между 110 и 111 равно одному, а между 111 и 112 — двум. Значения факторов и приписываемые им значения приведены в таблице ниже. Таблица 4. Пример вычисления коэффициента активации для заданного референта в заданной точке дискурса___

От musumem

референт девушка девушка

Референциальный класс референциальный ноль полная ИГ без WA

Факторы значение показатель активации значение показатель активации

Линейное расстояние 1 0 1 0

Риторическое расстояние 1 +0,7 2 +0,4

Расстояние в абзацах 0 0 1 -0,2

Синтаксическая и семантическая роль антецедента подлежащее, актор +0,4 подлежащее, актор +0,4

Протагонист + 0 + 0

одушевленное да, рит. расст.= 1 0 да, рит. расст=2 +0,1

результирующий коэффициент 1,1 0,7

Итак, коэффициент активации для 0тв 111 равен 1,1, что приравнивается к 1, для musumem в 112 коэффициент активации равен 0,7.

Для того чтобы проверить адекватность модели, предложенной в [КлЬпк 1996] мы проанализировали подобным образом все повторные вхождения референтов и получили количественную оценку того, как часто определенный референциальный класс употребляется для обозначения референта с определенным коэффициентом активации. В таблице 5 представлены результаты подсчетов. В столбцах 2-4 в каждой клетке указано сколько раз встречается ИГ определенного референциального класса в определенном промежутке активации, и какой процент это число составляет от общего числа референтов с такой активацией. Общее количество упоминаний референтов в заданном активационным промежутке приводится в последнем, пятом, столбце. Например, при минимальной активации референта — меньшей или равной нулю — референты упоминались 54 раза (столбец «Итог», строка «<=0»), из них 46 раз для упоминания использовались ИГ без WA, что составляет 85%, и 8 раз полный ИГ с — 15% случаев. Таблица 5. Зависимость частоты употребления референциальных классов от

коэффициент активации полные ИГ без \УА полные ИГ с \\Л нули Итог

<=0 46(85%) 8(15%) 0(0%) 54(100%)

0,1-0,3 12(63%) 4(21%) 3(16%) 19(100%)

0,4 ~ 0,6 13(62%) 6(29%) 2(9%) 21(100%)

0,7 ~ 0,9 6(13%) 3(6%) 38(81%) 47(100%)

>=1 2(2%) 0(0%) 113(98%) 115(100%)

всего 79 21 156 256

По полученным данным можно сказать о различии между полными ИГ без XVА и полными ИГ с XVА в распределении по промежуткам активации. Статистически большая часть полных ИГ без WA — 46 (58%) из 79 полных ИГ без \¥А — была употреблена при минимальной активации, а полные ИГ с \УА реже использовались для обозначения референтов с низким коэффициентом активации - только в 8 (38%) из 21 случаев выражения этого референциального класса были употреблены при минимальном коэффициенте активации референта. Применяя к полученным распределениям <р-критерий Фишера, можно сказать, что с вероятностью р=0,05 этот разброс в распределениях является значимым (<рэмп=1,65, 9^=1,64 для р=0,05). Очевидно, полученная закономерность объясняется тем, что тематические ИГ преимущественно используются для референтов центральных на некотором промежутке текста референтов.

Несмотря на обнаруженную выше закономерность, видно, что выбор между двумя классами полных ИГ невозможно сформулировать в терминах активационных промежутков — оба класса полных ИГ встречаются в одинаковых промежутках активации, хотя и с несколько отличающейся частотой. При дальнейшем анализе представленных в Таблице 5 результатов, мы будем рассматривать классы полных ИГ без XVА и с \УА как единый референциальный класс полных ИГ.

Рассмотрим распределение нулей и полных ИГ в разных промежутках активации. Как и ожидалось, при минимальной активации 0 (и меньше) не встретилось ни одного нуля - всегда использовались полные ИГ.

При активации референтов от 0,1 до 0,3 преобладают полные ИГ. Вопреки ожиданиям, в данном промежутке активации встретилось три референциальных нуля. Интересно, в каких условиях, появляются нули в такой ситуации: два нуля из трех использовались при бенефактивных конструкциях, то есть когда действовал фактор «референциальная информативность глагола», выделенный нами во второй главе, но количественно не учтенный в опробуемой модели. Еще один ноль появляется при стирании границы между мирами: когда антецедентом референта в повествовании

является упоминание референта в прямой речи.25

При активации референта от 0,4 до 0,6 с большей частотой употребляются уже полные ИГ (91%). Только в двух из двадцати одного случая в данном активационном промежутке были использованы референциальные нули. В первом случае — референт в данной точке дискурса является получателем действия, выраженного бенефактивной конструкцией, во втором — ноль употребляется в точке пересечения двух референциальных цепочек. Пример (5) выше иллюстрирует возможность употребления референциального нуля при коэффициенте активации референта равной 0,6. В строке 70 происходит пересечение референциальных цепочек и используется референциальный ноль. Активация референта 'старик' в строке 70 равна 0,5 (риторическое расстояние=1, +0,7; неполная кореферентность с антецедентом, -0,2).26

В промежутке активации от 0,7 до 0,9 преобладают нули. Этот промежуток активации оказался самым неоднозначным для выбора референциального средства — с одной стороны, бывают случаи, когда возможна только полная ИГ, с другой стороны -много случаев, когда референциальный ноль невозможно заменить полной ИГ. Кроме того, бывают контексты, в которых возможно использование обоих референциальных классов. Нами были проанализированы все упоминания референтов с коэффициентом активации из данного промежутка и были сделаны следующие выводы:

- Если референт и антецедент находятся в одном предложении, то предпочтительно употребление референциального нуля. Исключение составили случаи, когда данное упоминание референта находится в фокусе или не полностью кореферентно со своим антецедентом (кроме случаев пересечения референциальных цепочек) — при этих условиях обязательна полная ИГ.

- Если референт и антецедент находятся в разных предложениях, то, как правило, возможно употребление как полной ИГ, так и референциального нуля.

При максимальной активации с 98%-вероятностью употреблялись нули. Дважды встретились полные ИГ при активации равной 1 — в обоих случаях полные ИГ занимали позицию посессива. В данном случае, возможность употребления ИГ при большой активации референта можно было бы объяснить трудной доступностью данной синтаксической роли в терминах [Keenan and Comrie 1977]27.

Выводы, сформулированные в главе 3:

В этой главе мы проверили на материале японского письменного нарратива вычислительную модель референциального выбора [Kibrik 1996] и пришли к выводу, что в целом, предложенный алгоритм работает и в большинстве случаев верно предсказывает выбор референциального средства. Вместе с тем, мы показали, что модель необходимо адаптировать к японскому языку. Мы отметили несколько явлений, на которые при этом необходимо обратить внимание.

© Были получены закономерности в распределении двух выделенных нами классов полных ИГ — ИГ без WA и ИГ с WA. ИГ без WA чаще употребляется для

25 Нами было принято, что при построении и анализе референциальных цепочек не учитывается прямая речь. Как правило, в нарративах редко бывает так, что для упоминания рефрента вне прямой речи выбирается антецедент в прямой речи. В [Kibrik 1996] было принято противоположное решение - упоминания из прямой речи включались в референциальную цепочку. Для случаев, когда при пересечении границы миров, цепочка прерывалась и, вопреки высокому коэфициенту активации, для обозначения референта использовалась полная ИГ, был специально введен фактор-фильтр «переключение миров», который затрудняет употребление редуцированных ИГ. В нашем случае можно было бы ввести другой фактор-фильтр — «стирание границы миров», облегчающий употребление редуцированных ИГ.

26 В соответствии с принятыми правилами, в случае пересечения референциальных цепочек, совместный референт учитывается в цепочке каждого референта, входящего в объединенный референт. В таких случаях, считается, что у такого совместного референта несколько антецедентов. Для точки пересечения, соотвественно, считается коэффициент активации относительно каждого антецедента.

27 Keenan, Е. L. and В. Comrie. 1977. Noun phrase accessibility and universal grammar. // Linguistic Inquiry, 8, 63-99

обозначения с минимальной степенью активации, чем со средней, а ИГ с WA — наоборот — чаще встречаются при референтах со средним коэффициентом активации. Полученные распределения перекликаются с результатами [Hinds 1983], где было показано, что полные ИГ с WA статистически чаще находятся ближе к своему антецеденту, чем полные ИГ без WA. Несмотря на полученную закономерность, мы пришли к выводу, что выбор между полными ИГ с WA и полными ИГ без WA нельзя сформулировать в терминах активации.

Q Для адаптации модели к японскому языку к ней необходимо добавить фактор «референциальная информативность глагола».

© Два выделенных нами типа неполной кореферентности с антецедентом — пересечение референциальных цепочек и другие виды неполной кореферентности - должны отражаться в модели референциального выбора по-разному. Пересечение референциальных цепочек, по-видимому, не снижает активации. Кроме того, мы пришли к выводу, что для других видов неполной кореферентности необходимо изменить показатель активации, приписываемый им в модели, - они настолько сильно снижают возможность правильной интерпретации слушателем референта, что почти всегда делают употребление полной ИГ обязательным. Нами была отмечена та же чувствительность к разным типам неполной кореферентности в русском языке. Так, в примере (10), где в строке 52 происходит расхождение референциальных цепочек референтов 'Том' и 'бульдог', объединенных в предыдущей строке, коэффициент активации референта 'Том' равен 0,9. Несмотря на то, что по предложенному в [Kibrik 1996] соответствию (см. рис.3), при таком коэффициенте активации допустимо употребление, как полных, так и редуцированных ИГ, в этом примере, равно как и в других аналогичных примерах, употребление местоимения или нуля невозможно.

© В письменном японском нарративе на возможность употребления полной ИГ при коэффициенте активации от 0,7 до 0,9 большое влияние имеет фактор расстояния до антецедента в предложениях. Если между данным упоминанием референта и его антецедентом проходит граница предложения, то полная ИГ возможна. Если данное упоминание референта и его антецедент находятся в пределах одного предложения, то, как правило, употребление полной ИГ невозможно. Q На возможность употребления различных референциальных классов влияют такие явления, как стирание границы миров, употребление фокусных частиц при референциальном выражении.28

Глава 4. Моделирование референциального выбора в японском устном нарративе

В этой главе была рассмотрена референциальная структура устного японского нарратива. Для этого в качестве основного материала исследования были использованы устные японские пересказы мультфильма. В качестве сравнительного материала были собраны устные пересказы этого же мультфильма на русском языке, а также письменные пересказы того же видеоряда на японском и русском языках. 4.1. Проблемы моделирования референциального выбора в устной речи

Несмотря на то, что большая часть исследований по референциальному выбору в японском языке сделана на материале именно устного языка, в этих работах не описывается, как анализируются с точки зрения референциальной структуры такие сущностные для устного дискурса явления, как коррекции, постпозитивные уточнения и т.п. Например, ни в одной известной нам работе не указывается, учитываются ли

28 В [КлЬпк 1996] подобные явления не включаются непосредственно в модель, а относятся к факторам-фильтрам, которые применяются уже после вычисления коэффициента активации.

отмененные при коррекции фрагменты дискурса при вычислении расстояний до антецедента. Аналогичным образом, несмотря на то, что часть исследований проблемы референциального выбора использует фактор «граница эпизода» как значимый для референциального выбора, в этих работах не объясняется, по каким принципам текст разбивался на эпизоды.

При разметке референциальной структуры устных корпусов на японском и русском языках мы приняли решение по трем наиболее частотным проблемам: разбиение устного текста на эпизоды, анализ постпозитивных уточняющих единиц и анализ, и отражение в референциальной структуре коррекций.

4.1.1. Определение границ эпизодов. Как уже говорилось выше, наличие границы абзаца в письменном дискурсе или эпизода в устном дискурсе — фактор значимый для референциального выбора. При анализе письменного текста трудности разделения на абзацы не возникает, в устном дискурсе нет эксплицитных маркеров границ эпизодов. В теории дискурса эпизод определяется как смысловой отрезок с высокой степенью связности — референциальной, временной, пространственной и событийной [С1уоп 1990]29. Граница эпизода, как правило, определяется как нарушение одного или нескольких видов связности. Тем не менее, такое определение эпизода — семантическое, и не обеспечивает нас при практическом подходе простым алгоритмом разбиения текста на эпизоды. В исследованиях структуры текста предлагались различные признаки наличия границы эпизода: наличие дискурсивных маркеров границ абзаца, наличие хезитации, появление нового действующего лица, смена грамматического времени или аспекта.

Для выделения эпизодов в текстах собранного и используемого нами корпуса устных текстов мы предложили свой алгоритм выделения эпизодов.

В связи с доступностью источника пересказов, на первом этапе разбиения текстов корпуса на эпизоды мы выделили в мульфильме 12 основных эпизодов, где можно ожидать появление признаков границы эпизода при пересказе. Мы выделяли новый эпизод в мультфильме, если появлялось новое действующее лицо, временной разрыв между событиями, происходила смена места событий. Выделенные границы эпизодов мультфильма мы считали наиболее вероятными претендентами на появление границы эпизода при пересказе, или «швом». На втором этапе разбиения на эпизоды каждый «шов» проверялся на наличие маркеров границы эпизода. Здесь мы использовали выделенные в работах предшественников признаки границы эпизодов. Самым сильным фактом в пользу проведения границы эпизода считалось эксплицитное указание говорящим на наличие этой границы. В японском языке использовались такие фразы как зИ 'йп аНа 'была такая сцена', таги за1зИо т 'в самом начале', за'ккиигеЫ т 'в конце' и т.д. В русской части устного корпуса нам встретились фразы: «И дальше нам показывают», «и на этом сцена заканчивается» «А вот что потом дальше-то было? А! ...». При отсутсвии эксплицитного указания на границу эпизода, мы считали, что в месте «шва» есть граница эпизода, если там есть граница предложения30 и один из следующих признаков наличия границы эпизода: 1) смена грамматического времени в повествовании (Типе-БЫй); 2) наличие дискурсивных маркеров конца и начала эпизода {вот, потом, $огес!е 'тогда'); 3) наличие хезитации — затянутой паузы, маркеров хезитации (в русском — «Ну-у», в японском — еМо), эксплицитное указание на речевое затруднение.

4.1.2. Уточнение референции и анализ референциальной структуры устного нарратива. Уточнение референции — один из видов уточняющих единиц, при котором говорящий в главной предикации употребляет редуцированную ИГ, а в уточняющей

29 Givon, Talmy. 1990. Syntax: A Functional-Typological Introduction. Vol.11. Amsterdam: John Benjamins.

30 Правило о наличии границы предложения действовало, если говорящий членил свою речь на предложения. Если говорящий не «ставил точек», то для проведения границы эпизода требовалось наличие в «шве» как минимум двух признаков границы эпизода из приведенного нами списка.

единице делает референциальную отсылку эксплицитной, употребляя полную именную группу. В примере (10) в строке 7 референт 'мышь' не называется эксплицитно, а в строке 8 говорящий, осознав трудность интерпретации референциального нуля, уточняет референцию с помощью полной ИГ:

(10) JS-F10

7 ШШ <к> т [Z ЩъЛ: <Da

nanka 0j zasshi по shita ni kakure-ta по

как бы журнал ATTR низ LOC прятаться-PAST PRT

Ну и как бы спряталась под журнал,

8 tf fro

nezumij ga ne.

мышь SUBJ PRT (Эта) мышь.

Очевидно, когда говорящий при уточнении референции употребляет полную ИГ, он не считает антецедентом этого упоминания предыдущее упоминание референта. Скорее говорящий приравнивает активацию референта в этой точке к активации этого же референта в уточняемой единице, считая, что активация референта в уточняемой единице недостаточна для правильной интерпретации редуцированной ИГ.

Приведем также пример из русского языка.

(11) RS-M5

71. а-а кот( поймал мышц,

72. 0t показывает её; из окна дома,

73. вот,

74. и-ии он, её; посадил в банку насколько я понимаю,

75. эту мышц.

В примере (11), говорящий, употребляя в последней строке полную ИГ эту мышь, не считает антецедентом предыдущее упоминание мыши её, а приравнивает активацию референта в уточнении к активации референта в главной предикации. Из этих соображений при разметке референциальной структуры в случаях уточнения референции мы предлагаем считать антецедентом упоминания референта в референциальном уточнении то упоминание референта, которое являлось антецедентом для референциального выражения в уточняемой предикации. При моделировании референциального выбора расстояния до антецедента в уточняющей предикации нужно приравнивать к расстояниям до антецедента для упоминания в уточняемой единице, то есть, например, в (11) линейное расстояние в предикациях от упоминания эту мышь в строке 75 до его антецедента её в строке 72 будет равно двум.

С точки зрения моделирования референциального выбора случаи уточнения референции представляют особенный интерес, так как это точки, в которых говорящий исправляет сделанный ранее референциальный выбор. В проанализированном нами корпусе устных текстов статистика употребления уточнений референции не показательна, однако, анализ большей базы подобных случаев сможет дать представление о том, как говорящие воспринимают допустимость тех или иных референциальных средств в разных активационных интервалах.

4.1.3. Коррекция и анализ референциальной структуры устного нарратива

Еще одну проблему при анализе устного дискурса представляет коррекция -ситуация отмены одного из фрагментов текста с последующей заменой его на другой, более правильный с точки зрения говорящего, фрагмент текста. Мы будем называть «забракованным фрагментом», а исправление этого фрагмента - «откорректированным коррелятом». Трудность разметки референциальной структуры в случае коррекций состоит в том, что в точке до начала забракованного фрагмента происходит своего рода раздвоение референциальной структуры, то есть говорящий после отмены возвращается в точку до забракованного фрагмента и начинает построение референциальной

структуры заново.

В примере (12) говорящий отменяет строку 52, так как прежде чем рассказывать, что собака сгрызла ручку топора, нужно объяснить, откуда этот топор взялся. Референт 'топор' вводится в строке 53, а в строке 54 до конца вербализуется содержание ранее отмененной строки 52. Строка 52 в данном случае — забракованный фрагмент, а строки 53-54 — откорректированные корреляты. (12) JS-M5

51. <п * -^У- 1С ЬЛ (i Lt. к, -С-Г ttiT, etto sono inuh to Jeriij ni osoikakar-oo to Tomu, wa shi-ta n desu kedo HEZ этот собака и Джерри IO напасть-решать Том ТОРрешать-PST SBST COP.ADDR.PRS однако

Ну и Том решил напасть на Собаку и Джерри, однако...

52. £ Г?

etto inub ga nanka ono„|| ono. o koo =31

HEZ собака SUBJ как бы топор топор DO так Ну и собака так топор =—

53. Иг; * Z.Ö fSoT -k. К/ "C"t" (t£\ О, ono„ о koo mot-te ta n desu kedo

топор DO так -INF 6bm>.PST SBST COP.ADDR.PRS(WHaKO и он взял топор, но

54. Z<D fipo * <D Л Ä* t^t^ot-, 0, kono motsu ki no bubun o inub ga tabechat-te-e,

этот держатьдеревоА 11K часть DO собака SUBJ съесть-INF деревянную часть [топора], за которую держат, собака съела,...

Коррекция — явление высокочастотное. Так, в пяти устных японских нарративах из 542 повторных упоминаний референтов 46 находились в отбракованных фрагментах текста. В связи с частой встречаемостью коррекций, мы рассмотрели четыре вопроса:

1. Какое упоминание референта считать антецедентом для именной группы, если она является первым упоминанием данного референта после забракованного фрагмента, и при этом референт упоминался как в забракованном фрагменте, так и до него? В этом случае мы считали антецедентом последнее подходящее в качестве антецедента упоминание этого референта до забракованного фрагмента, так как после отмены некоторого фрагмента говорящий, как правило, строит текст так, как будто забракованного фрагмента не было. Иллюстрация этого — однозначность интерпретации референциального нуля в строке 53 примера (12). Несмотря на то, что в строке 52 активирован референт — 'собака', ноль интерпретируется именно как отсылающий к упоминанию референта 'Том' в строке 51, поскольку говорящий строит откорректированный коррелят, не ориентируясь на забракованный фрагмент. В соответствии с принятым решением, антецедентом упоминания референта 'собака' в строке 54 будет его упоминание в строке 51, а не в забракованной строке 52.

2. Учитывать ли забракованный фрагмент при вычислении расстояний для упоминания референта после отмененного фрагмента? По причине, приведенной выше в пункте 1, при вычислении расстояний для упоминания референта после забракованного фрагмента сам забракованный фрагмент не учитывается. Например, линейное расстояние между двумя упоминаниями референта 'Том' в строках 53 и 51 равно единице.

3. Необходимо ли включать в референциальную структуру упоминания референтов, встречающиеся в забракованном фрагменте? Поскольку при построении фрагмента говорящий еще не знает, будет ли этот фрагмент отменен, референциальный выбор в забракованных фрагментах производится по тем же правилам, что и в не забракованных фрагментах. С другой стороны, для отражения реального процесса порождения референциальной структуры устного дискурса, необходимо указывать как правильные,

31 Двойной знак равенства «==» в используемой нами транскрипции означает обрыв строки, а двойная вертикальная черта «||» - коррекцию внутри одной строки.

так и ошибочные пути. Из указанных выше соображений, нами было решено включать в референциальную структуру все упоминания референтов, встречающиеся в забракованном фрагменте. Поскольку бывает трудно определить синтаксическую и семантическую роль оборванного референциального выражения, мы включали в референциальную цепочку референта только завершенные референциальные выражения. Таким образом, в референциальную цепочку референта 'собака' включено его упоминание в строке 52.

4. Если включать упоминания референтов в референциальную структуру текста, как вычислять риторическое расстояние до антецедента в данном случае? Традиционно забракованный фрагмент отражается в риторической структуре как сателлит к откорректированному корреляту, однако, как уже было сказано выше, референциальный выбор в забракованном фрагменте делается без ориентации на то, что потом этот фрагмент будет откорректирован. Поэтому для определения значения фактора риторического расстояния для референтов, упомянутых в забракованных фрагментах, мы определяли, какое место этот фрагмент занимал бы в риторической структуре текста, будь он закончен. В большинстве случаев подобные связи легко восстанавливаются. В примере (12) строка 52 находится в симметричном отношении с единицей 51. По-видимому, между этими единицами планировалось отношение «контраст» (здесь имеется в виду не синтаксическое противительное отношение, а риторическое (семантическое) отношение контраста). Таким образом, риторическое расстояние между двумя упоминаниями референта 'собака' строках 51 и 52 минимально.

4.2. Комплексный анализ факторов, влияющих на референциальный выбор в японском устном нарративе. Сопоставление действия факторов в устном и письменном нарративах. Для комплексного анализа факторов, влияющих на референциальный выбор в японском устном нарративе, мы выбрали три устных пересказа мультфильма. Эти тексты были обработаны аналогично тому, как это было сделано в главе 2 с письменными нарративами, но с учетом решений, принятых в 4.1. Всего в проанализированном материале нам встретилось 254 повторных упоминания референтов, 44% которых составили полные ИГ без WA, 8% — полные ИГ с 48% — референциальные нули. Проанализировав полученные результаты методом хи-квадрат, мы получили корреляции между референциальным выбором и дискурсивными факторами, представленные в Таблице 6. Таблица 6. Факторы и соответствующие им значения %,мп2

Название фактора Значение

Линейное расстояние 104,89

Риторическое расстояние 83,56

Расстояние в эпизодах 32,01

Синтаксическая роль ИГ 25,32

Синтаксическая роль антецедента 25,00

Семантическая роль референта 17,76

Семантическая роль антецедента 17,08

Расстояние в предложениях 15,91

Протагонизм 13,64

Одушевленность 11,40

Референциальный статус антецедента 11,19

Неполная кореферентность с антецедентом 9,27

На основании проведенного статистического анализа, можно сделать вывод о том, что все рассмотренные факторы коррелируют с референциальным выбором в устном японском нарративе. Сравнивая результаты, полученные для нарративов устного и письменного модусов (см. Таблицу 2 и Таблицу 6), мы отметили следующие значимые сходства и различия.

❖ По сравнению с письменным японским нарративом степень корреляций в устном японском нарративе в целом меньше. Так, максимальная степень корреляции с референциальным выбором в японском письменном нарративе составляет 121,45, в то время как в устном — 104,89. Если в письменном нарративе значение 40 превышает Хэмп2 для девяти факторов, то в устном нарративе этот уровень корреляции выше только для двух факторов — линейного и риторического расстояния. Этот общий результат подтверждает идею о том, что референциальный выбор в устном нарративе более свободен, чем в письменном (см., например, [Clancy 1982]).

❖ Так же, как и в письменном нарративе, синтаксическая роль референциального выражения текущего упоминания референта и его антецедента важнее, чем их семантическая роль.

❖ Фактором с максимальной степенью корреляции в устном модусе оказалось линейное расстояние, в то время как для письменного нарратива важнейший фактор — риторическое расстояние.

❖ Если в письменном японском нарративе фактор расстояния в предложениях стоит на втором месте по значимости и ограничивает употребление полных ИГ, то в устном японском нарративе этот фактор не играет важной роли. Эта закономерность напрямую связана с наблюдением разных авторов о том, что предложение как единица нерелевантна для устного дискурса.

4.3. Применение модели референциального выбора к материалу устных японских нарративов.

Подобно тому, как это было сделано в третьей главе, мы применили модель референциального выбора, предложенную в [Kibrik 1996] к материалу устных нарративов. В результате мы получили следующее распределение референциальных

классов по активационным промежуткам, представленное в Таблице 7.

Таблица 7, Зависимость частоты употребления референциальных классов от

промежутков активации в устных японских нарративах__

интервалы активации ИГ без WA ИГс WA нули Итог

<=0 46(90%) 4(8%) 1(2%) 51(100%)

0,1-0,3 18(82%) 4(18%) 0(0%) 22(100%)

0,4-0,6 24(77%) 4(13%) 3(10%) 31(100%)

0,7-0,9 21(25%) 8(10%) 55(65%) 84(100%)

>=1 2(3%) 0 64(97%) 66(100%)

всего 111 20 123 254

Проанализировав работу модели на устном японском материале, мы пришли к выводу, что в целом, применяемая нами модель референциального выбора работает и на этом материале, однако референциальный выбор в устном нарративе подчинен менее жестким правилам, чем в письменном нарративе. Так, полные ИГ в активационном промежутке от 0,7 до 0,9 часто встречаются в том же предложении, что и их антецедент. Эта особенность является следствием того, что в устном нарративе уровень сегментации на предложения слабо выражен. С другой стороны, в силу спонтанности устной речи, говорящий может использовать референциальные нули при довольно низкой активации референта без дополнительных факторов, облегчающих интерпретацию нулей.

Наблюдение о менее жестких правилах референциального выбора в устном нарративе по сравнению с письменным подтвердилось и при сравнении русских устных пересказов мультфильма с результатами, полученными в [КПэпк 1996]: местоимения в русских устных нарративах в 7 из 34 случаев имели референта с коэффициентом активации из промежутка от 0,4 до 0,6, в то время как в письменном нарративе в данном активационном промежутке употребление местоимений маловероятно.

Выводы, сформулированные в главе 4:

@ В целом, референциальный выбор в устном нарративе обусловлен теми же факторами, что и в письменном. Однако правила референциального выбора в устном модусе в целом менее жесткие, чем в письменном модусе.

<5 Фактор линейного расстояния больше коррелирует с референциальным выбором в устном японском нарративе, а в письменном нарративе на первое место по значимости при выборе референциального средства выходит риторическая структура текста.

© Фактор расстояния в предложениях в устном японском нарративе нерелевантен в силу слабой выраженности этого уровня сегментации в устном дискурсе.

О После некоторой адаптации вычислительной модели референциального выбора [КлЬпк 1996], модель может быть применена и к устному японском дискурсу, и обладает достаточной предсказательной силой.

Заключение

Нами был проведен анализ различных дискурсивных факторов, потенциально релевантных для референциального выбора в японском нарративе. Наиболее значимыми для референциального выбора в японском и русском языках оказались факторы расстояния между данным упоминанием референта и его антецедентом. В устном нарративе большую корреляцию с референциальным выбором имеет фактор линейного расстояния, а в письменном нарративе — фактор риторического расстояния. Фактор расстояния в предложениях имеет большое значение только письменного, но не для устного, нарратива, так как в устном нарративе сегментация на уровне предложения слабо выражена. Важными факторами, как для японского, так и для русского нарративов оказались факторы синтаксической и семантической роли данного упоминания референта и его антецедента, однако для референциальной структуры японского нарратива синтаксическая роль важнее, чем семантическая.

На примере устных и письменных японских нарративов мы показали, что возможно построить предсказывающую модель референциального выбора для японского нарратива. Мы выделили несколько особенностей японского языка, которые должны быть учтены при построении алгоритма. Необходимо добавить фактор референциальная информативность глагола, различать вид неполной кореферентности с антецедентом, ввести фактор синтаксической и семантической роли данного упоминания референта, а также добавить ряд фильтров, таких как стирание границы миров и употребление фокусных частиц при референциальном выражении.

При сравнении механизмов референциального выбора в японском и русском нарративах выяснилось, что в принципе механизмы действуют одинаково - в основе референциального выбора как в одном, так и в другом языке лежит активация референта в данной точке. В целом, списки действующих факторов совпадают — для русского, как и для японского наиболее важными являются факторы расстояния. Мы также обратили внимание на неоднородность значений традиционно выделяемого фактора неполной кореферентности с антецедентом — по крайней мере один из видов неполной кореферентности — пересечение референциальных цепочек при референциальном выборе не затрудняет употребление редуцированных ИГ. Описанный класс случаев неполной кореферентности с антецедентом, одинаково действует как в японском, так и в русском языках. В дальнейшем можно было бы рассмотреть такой тип случаев и на примере других языков.

Нами был также выделен лингвоспецифический фактор для японского языка — «референциальная информативность глагола». В русском языке информация об актантах, отражаемая в глаголе, не играет столь важной роли при референциальном выборе, как в японском языке.

Полученные результаты позволяют надеяться, что нами сделан один из необходимых шагов к пониманию механизма построения референциальной структуры в японском языке.

По теме диссертации автором опубликованы следующие работы

1. Проблема номинации при повторном упоминании референта: опыт

решения на материале японского языка // Компьютерная лингвистика и интеллектуальные технологии: труды Международной конференции Диалог'2004. - Москва, Наука, 2004, 191-197

2. Проблема референциального выбора в японском нарративе // ICANAS-37 Orientalist Congress, Moscow, 16-21 August, 2004, 56-57

3. Факторы, влияющие на выбор референциальных средств в японском нарративе // Актуальные вопросы японского и общего языкознания: Памяти И.Ф.Вардуля / М.: Восточная литература, 2005, 177-209

4. Referential systems in Japanese and Russian spoken narrative // Forth International School in Linguistic Typology and Anthropology. Moscow: Russian State University for the Humanities, 2005, 27-30

5. (соавт. А.А.Кибрик, В.И.Подлесская, Ю.В.Дараган, Н.А.Коротаев, А.О.Литвиненко, ВЛ.Цуканова) Опыт создания корпуса устного русского дискурса // Международная конференция «Корпусная лингвистика-2004»: Тезисы докладов. — СПб., 2004, 41-43

6. (соавт. А.А.Кибрик, В.И.Подлесская, Ю.В.Дараган, Н.А.Коротаев, А.О.Литвиненко, В.Л.Цуканова) Проблема сегментации устного дискурса и когнитивная система говорящего // Первая российская конференция по когнитивной науке. Тезисы докладов. Казань: КГУ. 2004, 107-109

 

Оглавление научной работы автор диссертации — кандидата филологических наук Ефимова, Зоя Викторовна

Введение

Глава 1. Основные понятия и постановка задачи

1.0. Постановка задачи

1.1 .Исходные понятия

1.2. Выделение референциальных классов в японском и русском 17 языках.

1.2.1. Полные ИГ

1.2.2. Местоимения

1.2.3. Референциальный ноль

1.2.3.1. Определение понятия референциальный ноль 19 и идентификация референциальных нулей в тексте

1.2.3.2. Разновидности референциальных нулей

1.2.3.3. Выделение класса референциальных нулей в 23 японском и русском языках

1.3. Обзор исследований референциальной структуры

1.3.1. Две перспективы исследований референциальной 25 структуры дискурса

1.3.2. Проблема референциального выбора с 27 синтаксической и с дискурсивной точек зрения

1.3.3 Объяснение референциального выбора

1.3.4. Факторы активации

1.3.5. Теория риторических структур (ТРС) 33 1.3.5.1. Классическая Теория риторических структур 3 3 1.3.5.2 Развитие ТРС 36 1.3.5.3. Пример представления риторической 38 структуры фрагмента текста

1.3.6. Модели взаимодействия активационных факторов

1.3.6.1. Однофакторные vs. многофакторные модели 40 референциального выбора

1.3.6.2. Статистические модели референциального 41 выбора

1.3.6.3. Динамическая модель референциального 49 выбора [Kibrik 1996], [Kibrik 1999]

1.3.7. Референциальная структура устного и письменного 51 модусов

1.4. Материал исследования и методы его обработки

1.4.1. Корпус японских текстов

1.4.2. Корпус русских текстов

1.4.3. Информанты

1.4.4. Обработка и представление корпуса текстов

Глава 2. Комплексный анализ факторов, влияющих на 58 референциальный выбор в японском языке (в сопоставлении с русским)

2.0. Введение

2.1. Список дискурсивных факторов, потенциально влияющих на 59 референциальный выбор

2.1.1. Одушевленность референта

2.1.2. Протагонизм

2.1.3. Синтаксическая роль ИГ и синтаксическая роль 60 антецедента

2.1.4. Семантическая роль референта и семантическая роль 62 антецедента

2.1.5. Линейное расстояние

2.1.6. Риторическое расстояние

2.1.7. Расстояние в предложениях 68 2.1.8 .Нахождение антецедента в другом абзаце

2.1.9. Тип антецедента

2.1.10. Референциальная информативность глагола.

2.1.11. Неполная кореферентность с антецедентом 71 2.1. Решения и конвенции при анализе корпуса

2.2.1. Разбиение текстов на элементарные дискурсивные 71 единицы

2.2.1.1. Большие ЭДЕ

2.2.1.2.Малые ЭДЕ. Обращения, заголовки, 73 завершающие ЭДЕ, разрывные ЭДЕ

2.2.2.Сложные случаи идентификации референциальных 77 нулей

2.2.2.1. Референциальный ноль, отсылающий к 77 говорящему при прямой речи при отсутствии глагола речи

2.2.2.2. Адресаты при глаголах речи

2.2.2.3. Бенефициант в бенефактивных конструкциях

2.2.2.4. Реляционные имена

2.2.2.5. Числительные или указывающие на 83 количество объектов выражения

2.2.3. Трудности построения риторической структуры и 83 вычисления риторического расстояния в японском нарративе

2.2.3.2. Правила выбора антецедента в риторической 84 структуре

2.2.3.1. Топикальные ИГ

2.2.4. Конвенция про катафорические элементы

2.2.5. Прямая речь

2.3. Результаты

2.4. Анализ полученных результатов 93 2.5 Сопоставление свойств референциальных классов и факторов 100 активации в японском и русском языках

Глава 3. Модель референциального выбора и результаты ее 106 применения к письменному японскому дискурсу (в сопоставлении с русским)

3.0. Введение

3.1. Исходная модель референциального выбора

3.2. Применение модели референциального выбора к материалу 110 японского языка

3.3. Проверка действия модели корпусным методом

3.4. Анализ активационных промежутков в японском письменном 116 нарраивае

3.4.1. Минимальная степень активации

3.4.2. Активационный промежуток 0,1-0,

3.4.3. Активационный промежуток 0,4-0,

3.4.4. Активационный промежуток 0,7-0,

3.4.5. Максимальная степень активации

3.5. Сравнение действия модели референциального выбора в 125 русском и японском письменных нарративах

3.5.1. Фактор синтаксической роли ИГ

3.5.2. Семантическая роль антецедента

3.5.3. Неполная кореферентность с антецедентом

Глава 4. Моделирование референциального выбора в 129 японском устном нарративе (в сопоставлении с письменным)

4.0. Введение

4.1. Материал исследования

4.1.1. Материал, использованный для задач четвертой главы

4.1.2. Эксперимент по сбору устных и письменных 130 пересказов

4.1.2.1. Видеоряд

4.1.2.2. Информанты

4.1.2.3. Запись

4.1.2.4. Процедура записи нарративов

4.1.2.5. Естественность дискурса

4.1.3. Представление материала

4.1.3.1. Этапы обработки материала

4.1.3.2. Общие принципы транскрибирования устных 134 текстов

4.1.3.3. Использованные транскрипционные системы

4.1.3.4. Информация, отражаемая в транскрипции

4.1.3.4.1. Сегментация дискурса. Разбиение на ЭДЕ

4.1.3.4.2. Сегментация дискурса. Разбиение на предложения

4.1.3.4.3. Сегментация дискурса. Разбиение на эпизоды

4.1.3.4.4. Паузация

4.1.3.4.5. Речевые сбои

4.1.3.4.6. Различные фонетические явления

4.1.3.4.7. Другие элементы речи и характеристики записи

4.2. Решения и конвенции при анализе устного дискурса

4.2.1. Разбиение на эпизоды в устных нарративах

4.2.1.1. Определение абзаца. Алгоритмы разбиения текстов на эпизоды

4.2.1.2. Процедура выделения эпизодов. Шаг первый.

4.2.1.3. Процедура выделения эпизодов. Шаг второй

4.2.2. Уточнение референции и строение референциальной цепочки

4.2.3. Явление коррекции и референциальная структура устного дискурса

4.3.2.1. Анализ референциальной структуры после забракованного фрагмента

4.3.2.2. Анализ референциальной структуры в забракованном фрагменте

4.3. Анализ корреляций дискурсивных факторов с референциальным выбором в устном японском нарративе

4.3.1.Распределение референциальных классов по значениям дискурсивных факторов

4.3.2. Корреляции между дискурсивными факторами и референциальным выбором

4.3.3. Сравнение действия активационных факторов в устном и письменном японских нарративах

4.4. Применение модели референциального выбора к материалу устных японских нарративов

4.5. Сравнение действия модели референциального выбора в русском устном и в японском устном нарративах

 

Введение диссертации2006 год, автореферат по филологии, Ефимова, Зоя Викторовна

0.1. Основные характеристики работы. Предмет и цели исследования

В последние 20 лет лингвистика все чаще обращается к проблеме дискурсивной структуры, к изучению внутренней организации связного текста. Одним из наиболее важных признаков связности является наличие референциальной структуры текста - внутренне организованной сети упоминаний объектов реального мира в тексте.

Предметом нашего исследования стала референциальная структура японского нарратива. К референциальной структуре текста есть два подхода - с точки зрения говорящего и с точки зрения слушающего. Референциальная структура японского языка изучалась преимущественно с точки зрения слушающего (например, [Walker, Iida and Cote 1994], [Iida 1998], [Nariyama 2003]) - в таких работах рассматривается процесс идентификации слушающим референтов в текущем дискурсе. Работ, исследующих референциальную структуру японского языка с точки зрения говорящего, довольно мало. В некоторых работах исследуются разрозненные дискурсивные факторы, на основании которых говорящий выбирает способ именования референта при порождении текста ([Hinds 1983], [Clancy 1980], [Clancy 1982]). Проблемы референциального выбора затрагивались также в связи с изучением эллипсиса в японском языке (см. например, [Басс 2004] и обзор японских исследований на эту тему там же). Тем не менее до сих пор не было проведено комплексного исследования факторов, определяющих это явление, а также не было предложено алгоритма, объясняющего или предсказывающего референциальный выбор в японском дискурсе.

Цель настоящей работы - применить комплексный подход к проблеме построения референциальной структуры в японском языке, выявить общие и лингвоспецифические свойства референциальной структуры японского нарратива.

Для достижения поставленной цели перед исследованием были поставлены следующие задачи.

• Провести анализ различных дискурсивных факторов и выделить среди них факторы, определяющие выбор референциальных средств в японском дискурсе.

• Предложить для японского языка алгоритм, предсказывающий референциальный выбор.

• Сравнить характеристики референциальной структуры японского языка с референциальной структурой русского языка как одного из представителей так называемых языков «средневропейского стандарта». Научная новизна исследования. Настоящее исследование углубляет понимание механизмов референциального выбора в японском дискурсе в целом - впервые комплексно рассмотрены факторы, влияющие на референциальный выбор, и предложен предсказывающий алгоритм референциального выбора. Кроме того, в работе решен ряд сопутствующих задач: приняты решения о том, как анализировать референциальную структуру в разрывных единицах, какое место занимают в структуре текста топики, также было рассмотрено, как влияют на референциальный выбор такие явления устной речи, как коррекция, уточнение, парцелляция.

В качестве материала исследования были использованы японские устные и письменные тексты нарративного жанра. Общий объем корпуса составляет примерно 120 тыс. знаков (около 4 тыс. предикаций). Первая часть корпуса состоит из шести письменных нарративов на современном японском языке -рассказов и переложений японских сказок. Вторая часть корпуса - нарративы на японском и русском языках, представляющие собой устные и письменные пересказы разными испытуемыми одного и того же мультфильма. Для представления устных японских текстов была использована транскрипционная система [Du Bois et al. 1993], для русских - система дискурсивной транскрипции, основанная на принципах, изложенных в [Земская (ред.) 1983], [Подлесская и Кибрик 2003]. При обработке текстов корпуса была проведена сегментация -разбиение на предикации и абзацы (эпизоды). Во всех текстах были проиндексированы ИГ, отсылающие к повторяющимся референтам и таким образом размечена референциальная структура текста. Для каждого текста строилась его риторическая структура (см. 1.4.2.).

Практическая ценность работы. Результаты исследования прежде всего могут быть использованы в автоматических системах синтеза языка. Кроме того, результаты исследования и обработанный корпус текстов можно использовать в практике преподавания японского и русского языков как иностранных: в частности, они уже успешно используются в курсе японского языка, который автор ведет в Институте лингвистики и в Институте восточных культур РГГУ. Собранные в ходе исследования электронные корпуса текстов также могут представлять самостоятельный интерес для специалистов по лингвистике текста, когнитивной лингвистике, автоматическим системам перевода. 0.2. Структура работы

Настоящая работа состоит из введения, четырех глав, заключения и приложений. Первая глава данной работы является вводной. В ней даются определения основных понятий, используемых в работе, описывается корпус и методология работы с ним, рассматривается теоретическая база исследования, делается краткий обзор работ, на которые опирается данное исследование. Во второй главе рассматриваются проблемы представления корпусов письменных текстов и некоторые проблемы анализа референциальной структуры в письменном нарративе, принимается ряд конвенций и решений. Далее, методом корпусного исследования выделяются дискурсивные факторы, релевантные для референциального выбора в японских письменных нарративах. Полученный список факторов сопоставляется с аналогичным списком для русского языка, предложенным в [Kibrik 1996], на основе этого сравнения делаются первые выводы об общих и специфичных свойствах референциальной структуры японского языка.

В третьей главе модель референциального выбора, разработанная и опробованная на русском и английском языках в работах А.А.Кибрика [Kibrik 1996], [Kibrik 1999], применяется к материалу японского языка. Показывается, что в целом, модель работает на рассматриваемом материале, а также выделяются и объясняются случаи, когда алгоритм неверно предсказывает выбор референциального класса. В конце второй главы сравниваются результаты применения модели референциального выбора к японскому и русскому языкам. На основании этого делаются выводы о схожих и отличных свойствах референциальных структур японского и русского языков. В четвертой главе сделанные в предыдущих главах наблюдения проверяются на устном материале. В этой глав подробно рассматриваются некоторые проблемы сегментации, а также отражения референциальной структуры устных текстов. Устные японские и русские нарративы анализируются на тех же основаниях, что и письменные нарративы в предыдущих главах: выделяются факторы, значимые для референциального выбора, и проверяется возможность применения предсказывающей модели референциального выбора к устному материалу. На базе полученных результатов сравниваются свойства референциальных структур в японских устных и японских письменных нарративах, делается вывод о том, какие из свойств референциальной структуры присущи нарративному жанру в целом, а какие варьируются в зависимости от модуса нарратива. Сделанные выводы о разнице референциальных структур в устном и письменном модусах в японском языке подтверждаются при сравнении устных и письменных русских нарративов.

В заключении подводится итог полученных в ходе исследования результатов, и рассматриваются перспективы дальнейших исследований референциальной структуры японского языка.

 

Заключение научной работыдиссертация на тему "Референциальная структура нарратива в японском языке"

Выводы, сформулированные в главе 4 В целом, референциальный выбор в устном нарративе обусловлен теми же факторами, что и в письменном. Однако правила референциального выбора в устном модусе в целом менее жесткие, чем в письменном модусе. Фактор линейного расстояния больше коррелирует с референциальным выбором в устном японском нарративе, а в письменном нарративе на первое место по значимости при выборе референциального средства выходит риторическая структура текста. Фактор расстояния в предложениях в устном японском нарративе нерелевантен в силу слабой выраженности этого уровня сегментации в устном дискурсе. Для устного дискурса После некоторой адаптации вычислительной модели референциального выбора [Kibrik 1996], модель может быть применена и к устному японском дискурсу, и обладает достаточной предсказательной силой.

ЗАКЛЮЧЕНИЕ

Нами был проведен анализ различных дискурсивных факторов, потенциально релевантных для референциального выбора в японском нарративе. Наиболее значимыми для референциального выбора в японском и русском языках оказались факторы расстояния между данным упоминанием референта и его антецедентом. В устном нарративе большую корреляцию с референциальным выбором имеет фактор линейного расстояния, а в письменном нарративе - фактор риторического расстояния. Фактор расстояния в предложениях имеет большое значение только письменного, но не для устного, нарратива, так как в устном нарративе сегментация на уровне предложения слабо выражена. Важными факторами, как для японского, так и для русского нарративов оказались факторы синтаксической и семантической роли данного упоминания референта и его антецедента, однако для референциальной структуры японского нарратива синтаксическая роль важнее, чем семантическая.

На примере устных и письменных японских нарративов мы показали, что возможно построить предсказывающую модель референциального выбора для японского нарратива. Мы выделили несколько особенностей японского языка, которые должны быть учтены при построении алгоритма. Необходимо добавить фактор референциальная информативность глагола, различать вид неполной кореферентности с антецедентом, ввести фактор синтаксической и семантической роли данного упоминания референта, а также добавить ряд фильтров, таких как стирание границы миров и употребление фокусных частиц при референциальном выражении.

При сравнении механизмов референциального выбора в японском и русском нарративах выяснилось, что в принципе механизмы действуют одинаково - в основе референциального выбора как в одном, так и в другом языке лежит активация референта в данной точке. В целом, списки действующих факторов совпадают - для русского, как и для японского наиболее важными являются факторы расстояния. Мы также обратили внимание на неоднородность значений традиционно выделяемого фактора неполной кореферентности с антецедентом - по крайней мере один из видов неполной кореферентности - пересечение референциальных цепочек при референциальном выборе не затрудняет употребление редуцированных ИГ. Описанный класс случаев неполной кореферентности с антецедентом, одинаково действует как в японском, так и в русском языках. В дальнейшем можно было бы рассмотреть такой тип случаев и на примере других языков.

Нами был также выделен лингвоспецифический фактор для японского языка - «референциальная информативность глагола». В русском языке информация об актантах, отражаемая в глаголе, не играет столь важной роли при референциальном выборе, как в японском языке.

Полученные результаты позволяют надеяться, что нами сделан один из необходимых шагов к пониманию механизма построения референциальной структуры в японском языке.

Список условных сокращений

ADDR адресив

ALL аллатив

ATTR атрибутив

CAUS каузатив

CONC уступка

СОР глагол-связка

DO прямое дополнение

FOC фокус

GOAL цель

IMV императив

INF инфинитная форма

ГШтинструменталис

10 непрямое дополнение

HEZ хезитация LOC локатив NEG отрицание PASS пассив PAST прошедшее время PRS настоящее время PRT частица

Q вопросительная частица QUOT цитационный союз SBST субстантиватор SUBJ подлежащее TEMP темпоратив ТОР топик

Источники

1. Kawabata, Yasunari. 1981. Mizu. In Tenohira no sho:setsu, 366-67. Tokyo: Shincho: Bunko.

2. Hoshi, Shin'ichi. 1982. Ari to kirigirisu. In Mirai Issopu, 9-11. Tokyo: Shincho: Bunko.

3. Yanagita, Tamemasa. 1983. Nihon no mukashibanashi. Tokyo: Shincho: Bunko.

 

Список научной литературыЕфимова, Зоя Викторовна, диссертация по теме "Языки народов зарубежных стран Азии, Африки, аборигенов Америки и Австралии"

1. Алпатов B.M. 1973. Категории вежливости в современном японском языке. М.: Наука.

2. Басс И.И. 2004. Проблемы современного японского языкознания: лингвистика текста. СПб: Санкт-Петербургский государственный университет культуры и искусств.

3. Булыгина Т.В., Шмелев А.Д. 1990. Синтаксические нули и их референциальные свойства. // (ред. Храковский B.C.) Типология и грамматика. М.: Наука.

4. Вардуль И.Ф. 1971. Супрасинтаксические потенции предложения и частица ВА. // Вопросы японского языка. М: Наука.

5. Земская Е.А., М.В.Китайгородская, Е.Н.Ширяев. 1981. Русская разговорная речь. Общие вопросы. Словообразование. Синтаксис. М.:Наука.

6. Земская Е. А. (ред.) 1973 Русская разговорная речь. М.:Наука.

7. Кибрик А.А. 1987. Фокусирование внимания и местоименно-анафорическая номинация. // Вопросы языкознания №3, стр.79-90.

8. Кибрик, А.А. 2003. Анализ дискурса в когнитивной перспективе. Автореферат диссертации на соискание ученой степени д-ра филол. наук. М.:ИЯ РАН.

9. Кибрик А.А., Подлесская В.И. 2003. К созданию корпусов устной русской речи: принципы транскрибирования. // Научно-техническая информация, серия 2, №10, 2003,5-12.

10. Ю.Кибрик А.А., В.И.Подлесская, Ю.В.Дараган, З.В.Ефимова, Н.А.Коротаев, А.О.Литвиненко, В.Л.Цуканова. 2004а. Опыт создания корпуса устного русского дискурса. // Международная конференция «Корпусная лингвистика-2004»: Тезисы докладов. СПб. Стр.41-43.

11. Кибрик, А.Е. 1992. Очерки по общим и прикладным вопросам языкознания. М.: Издательство МГУ.

12. Ковтунова И.И. 1976. Современный русский язык: Порядок слов и актуальное членение предложения. Москва

13. Лютикова Е.А. 1999. Без подлежащих и дополнений: рефлексивизация в багвалинском языке. // Рахилина Е.В., Тестелец Я.Г. (ред.) Типология и теория языка. К 60-ю Александра Евгеньевича Кибрика. М.: «Языки русской культуры».

14. Мельчук И.А. 1995. Русский язык в модели «Смысл о Текст». М.: «Языки русской культуры»; Wien: Wiener Slawistischer Almanach. Sonderband 39.

15. Падучева E. В. 1974. О семантике синтаксиса. М: Наука.

16. Падучева Е. В. 1985. Высказывание и его соотнесенность с действительностью. М.

17. Падучева Е.В., Успенский В.А. 1979. Подлежащее или сказуемое? // Изв. АН СССР: Сер. лит.и яз. 1979. № 4.

18. Подлесская В.И. 1990. Вопросы лексической и синтаксической семантики: Анафора в современном японском языке. М.: Наука

19. Подлесская В.И. 1993. Сложное предложение в современном японском языке. Материалы к типологии полипредикативности. М.: ИВРАН

20. Рахилина Е.В. 2000. Когнитивный анализ предметных имен: семантика и сочетаемость. М.: Русские словари.

21. Тестелец Я.Г. 2001. Введение в общий синтаксис. М.: РГГУ.

22. Холодович, А.А. 1979. Проблемы грамматической теории. Ленинград: Наука.

23. Чехов А.С. 1981. Отождествляющее анафорическое отношение как фактор внутренней организации высказывания. // Машинный перевод и прикладная лингвистика, вып. 19, стр. 39-61.

24. Янко Т.Е. 2001. Коммуникативные стратегии русской речи. М.: Языки славянской культуры.

25. Akinnaso, F. 1982. On the differences between spoken and written language. // Language and speech, v.25, part 2, 97-125

26. Andersen, G. 2001. Pragmatic markers of sociolinguistic variation: A Relevance-thoretic approach to the language adolescents. Amsterdam: John Benjamins.

27. Ariel, Mira. 1988. Referring and accessibility. // Journal of linguistics 24. Pp.6587.

28. Backhouse, A.E. 1993. The Japanese language: An introduction. New York: Oxford University Press.

29. Brown, Gillian and George Yule. 1983. Discourse analysis. Cambridge:

30. Cambridge University press.

31. Carlson, L, Daniel Marcu, and Mary Okurowski. 2001. Building a Discourse-Tagged Corpus in the Framework of Rhetorical Structure Theory. In: Proceedings of the 2nd SIGDIAL Workshop on Discourse and Dialog, Eurospeech2001.

32. Chafe, W. (ed) 1980. The pear stories: cognitive, cultural and linguistic aspects of narrative production. Norwood, NJ:Ablex.

33. Chafe, W. 1988. Linking intonation units in spoken English. // Clause combining in Grammar and discourse. Typological studies in Languages. Vol.18. Amsterdam. 1-27

34. Chafe, Wallace. 1994. Discourse, consciousness, and time. The flow and displacement of conscious experience in speaking and writing. Chicago: University of Chicago Press.

35. Chiarcos, Christian and Olga Krasavina. 2005. Rhetorical distance revisited: A parametrized approach. // in Proceedings of Workshop in constraints in discourse. Dortmund, Germany.

36. Chomsky, Naom. 1981. Lectures on Government and Binding. Foris, Dordrecht.

37. Chomsky, Naom. 1982. Some Concepts and Consequences of the Theory of Government and Binding. (Camridge, Mass: The MIT Press).

38. Clancy, P.M. 1980. Referential choice in English and Japanese Narrative discourse.// in W.Chafe (ed.) 1980. 127-202.

39. Clancy, P. M. 1982. Written and Spoken Style in Japanese Narratives. In D. Tannen (ed), Spoken and Written Language: Exploring Orality and Literacy. Norwood, New Jersey: Ablex Publishing Corp., 55-76

40. Cook, H.M. 1993. Functions of the discourse marker ano in Japanese. // In S.Choi ed. Japanese Korean Linguistics. Stanndford, CA. Center for the study of Language and information, 19-38.

41. Cornish, Francis. 1986. Anaphoric relations in English and French. Croom1. Helm, London.

42. Cornish, Francis. 1999. Anaphora, discourse, and understanding. Oxford University Press.

43. Cristea, Dan, Nancy Ide and Laurent Romary. 1998. Veins Theory. An Approach to Global Cohesion and Coherence. In: Proceedings of Coling/ACL, Montreal, August 1998.

44. Du Bois, John W. 1987. The discourse basis of ergativity. // Language 63, 805855.

45. Foley, W. 1993. The conceptual basis of grammatical relations. // The role of theory in language description. Berlin; NY.: Mouton de Gruyter. 131-174

46. Fox, Barbara. 1987. Discourse structure and anaphora. Cambridge: Cambridge University Press.

47. Freidin, Robert. 1992. Foundations of generative syntax. Cambridge, MA: MIT Press.

48. Givon, Talmy. 1983. Topic continuity in discourse: An Introduction. //Topic continuity in discourse: a quantitative cross-linguistic study (Typological studies in language, vol. 3). Amsterdam: Benjamins. 3-41

49. Givon, Talmy. 1990. Syntax: A Functional-Typological Introduction. Vol.11. Amsterdam: John Benjamins.

50. Givon, Talmy. 1995. Functionalism and grammar. Amsterdam: Benjamins.

51. Green, G.M. 1994. Assessing techniques for analysis of natural language use. University of Illinois.

52. Grimes, J. (ed.) 1978. Papers on Discourse. Arlington: Summer Institute of Linguistics.

53. Grosz, Barbara J., and Candace L. Sydner. 1986. Attention, intentions, and the structure of discourse. // Computational Linguistics, 12(3). 175-204

54. Gundel, Jeanette K., Hedberg, Nancy, and Zacharsky, Ron. 1993. Cognitive status and the form of referring expressions in discourse. // Language, 69. 274307

55. Gundel, Jeanette K. 2003. Information structure and referential givenness/newness: how much belongs in the grammar? // Stefan Muller (ed.) Proceedings of the HPSG03. Conference. CSLI Publications.

56. Hearst, Marti A. 1997. Segmenting Text into Multi-paragraph Subtopic Passages. In: Computational Linguistics. V. 23, N1, p.33-64

57. Hinds, John ed. 1978. Anaphora in discourse. Edmonton: Linguistic research inc.

58. Hinds, John, and Wako Hinds. 1979. Note on time and space. // Papers in Japanese Linguistics Vol. 6. Los Angeles: Japanese Linguistics Workshop, Univ. of Southern California

59. Hinds, John. 1983. Topic continuity in Japanese. // Topic continuity in discourse: a quantitative cross-linguistic study (Typological studies in language, vol. 3).-Amsterdam: Benjamins. 183-195

60. Hinds, John. 1984. Topic maintenance in Japanese narratives and Japanese conversation in Conversation interaction. In: Discourse processes, 7. 465-482.

61. Hirschberg, Julia and Christine H. Nakatani. 1996. A prosodic analysis ofdiscourse segments in direction giving monologues. // Proceedings of the 34^ Annual meeting, Santa Cruz, CA. Association for Computational Linguistics, 286-293

62. Huang, Yan. 2000. Anaphora: A Cross-linguistic Study (Oxford Studies in Typology and Linguistic Theory). Oxford: Oxford University Press.

63. Hwang, Chung Нее and Lenhart K. Schubert. 1992. Tense trees as the 'fine'structure of discourse. // Proceedings of the 33rc* Meeting . Association for

64. Computational Linguistics. 232-240 66.1ida, Masayo. 1998. Discourse coherence and shifting centers in Japanese texts. // Centering theory in discourse, ed.: Marylin A. Walker, Aravind K. Joshi, and Ellen F. Prince. New York.

65. Keenan, E. L. and B. Comrie. 1977. Noun phrase accessibility and universal grammar, Linguistic Inquiry 8, pp. 63-99

66. Kehler, A. 2002. Coherence, Reference, and the Theory of Grammar. CSLI Lecture Notes no. 104, CSLI Publications, Stanford, CA.

67. Kibrik, Andrej A. 1991. Maintenance of reference in sentence and discourse. // Language Typology, ed. Helen-Jo J. Hewitt and Winfred P. Lehmann. Amsterdam: Benjamins. 57-84

68. Kibrik, Andrej A. 1996. Anaphora in Russian narrative discourse: A cognitive calculative account. // Studies in Anaphora, ed. Barbara Fox. Amsterdam: Benjamins, 255-304.

69. Kibrik, Andrej A. 2001. Reference-maintenance in discourse. In: Haspelmath, Martin, Ekkehard Koenig, Wolfgang Oesterreicher, and Wolfgang Raible eds. Language typology and language universals. An international handbook. Berlin: De Gruyter.

70. Koiso et al. Nihongo hanashi kotoba koopasu ni okeru kakiokoshi no hoohoo to sono kijun ni tsuite. Transcription criteria for the Corpus of spontaneous

71. Japanese. //Nihongo kagaku, 9. Tokyo: Kokuritsukokugokenkyuujo.

72. Kuno, S., and E. Kaburaki. 1977. Empathy and Syntax. // Linguistic Inquiry 8.4. 627-672.

73. Lehmann W.P. 1974 Proto-Indo-European syntax. Austin; L.

74. Litman, Diane J. and Rebecca J. Passonneau. 1985. Combining multiplerHknowledge sources for discourse segmentation. // Proceedings of the 33 u Meeting. Association for Computational Linguistics. 108-115

75. Longacre, R. 1983. The grammar of discourse. New York: Penum Press.

76. Makino, Seiichi and Michio Tsutsui. 2000. A dictionary of intermediate Japanese grammar. Tokyo: The Japan Times.

77. Mann, William, and Sandra A. Thompson. 1988. Rhetorical structure theory: toward a functional theory of text organization. // Text 8, 243-281

78. Mann, William, Christian Matthiessen, and Sandra Thompson. 1992. Rhetorical structure theory and text analysis. //Discourse description. Diverse linguistic analyses of fund-raising text. W.Mann and S.Thompson (eds.) Amsterdam: Benjamins, 39-78.

79. Marcu, Daniel. 1997. From discourse structures to text summaries. // Proceedings of ACL'97/EACL'97 Workshop on Intelligent Scalable Text Summarization. Inderjeet Mani and Mark T. Maybury (ed.), Madrid, Spain, 8288.

80. Martin, Samuel. 1975. A reference grammar of Japanese. New Haven: Yale University Press.

81. Maynard, Senko. 1989. The language of conversation. Japanese conversation: self-contextualization through structure and interactional management. Norwood:1. Ablex.

82. Maynard, Senko. 1998. Principles of Japanese discourse: a handbook. Cambridge: Cambridge University Press.

83. Mitkov, Ruslan. 2002. Anaphora resolution. London: Longman.

84. Nakano, Hiroshi. '(-te) itadaku' bun ni okeru shouryaku // Keiryou Kokugogaku. vol.18, 2, 66-79

85. Nariyama, Shigeko. 2003. Ellipsis and Reference Tracking in Japanese. Amsterdam: Benjamins.

86. Nichols, Johanna. 1985 The grammatical marking of theme in literary Russian. // R. D. Brecht and M. S. Flier, eds., Issues in Russian Morphosyntax, Columbus: Slavica. 1985. 170-186

87. University of Colorado at Boulder, 1993.

88. Sadanobu, Т., & Takubo, Y. 1995. The monitoring devices of mental operations in discourse: A case of "eeto" and "апо(о)" II Gengo Kenkyu, 108(11), 74-92.

89. Schourup, L. 1999. Discourse markers. // Lingua 107, 227-265

90. Shibatani, Masayoshi. 1990. The languages of Japan. Cambridge: Cambridge University Press.

91. Mann, W.C. and M. Taboada. 2006. Applications of Rhetorical Structure Theory. Discourse Studies. 2006, 8, 567-588

92. Tomlin, Russell. S. 1987. Linguistic reflections of cognitive events. // R. S. Tomlin (Ed.), Coherence and grounding in discourse. Amsterdam: John Benjamins. 455-479

93. Tsunoda Tasaku. 1991. Sekai no gengo to nihongo. Tokyo : Kuroshio.106. van Dijk, Teun A., and Walter Kintsch. 1983. Strategies of discourse comprehension. New York:Academic Press.

94. Webber, Bonny Lynn. 1988. Discourse deixis: Reference for discoursesegments. // Proceedings of the 26^ Annual Meeting. Buffalo, NY. Association for Computational Linguistics, 113 -122

95. Walker, Marilyn A., Masayo Iida and Sharon Cote. 1994. Japanese discourse and the process of centering. // Computational Linguistics, 20/2: 193232

96. Wiese, Berndt. 1983. Anaphora by pronouns. // Linguistics, 21, 373-417