автореферат диссертации по филологии, специальность ВАК РФ 10.02.19
диссертация на тему:
Лингвистический анализ и формальное представление содержания нарративного текста

  • Год: 2004
  • Автор научной работы: Ефимова, Татьяна Владимировна
  • Ученая cтепень: кандидата филологических наук
  • Место защиты диссертации: Воронеж
  • Код cпециальности ВАК: 10.02.19
Диссертация по филологии на тему 'Лингвистический анализ и формальное представление содержания нарративного текста'

Полный текст автореферата диссертации по теме "Лингвистический анализ и формальное представление содержания нарративного текста"

На правахрукописи

Ефимова Татьяна Владимировна

ЛИНГВИСТИЧЕСКИЙ АНАЛИЗ И ФОРМАЛЬНОЕ ПРЕДСТАВЛЕНИЕ СОДЕРЖАНИЯ НАРРАТИВНОГО ТЕКСТА

Специальность 10.02.19 - теория языка

Автореферат диссертации на соискание ученой степени кандидата филологических наук

Воронеж - 2004

Работа выполнена в Воронежском государственном университете

Научный руководитель: - доктор филологических наук,

профессор Кретов Алексей Александрович

Официальные оппоненты - доктор филологических наук,

профессор Кашкин Вячеслав Борисович

- кандидат филологических наук, доцент Ковыршина Елена Олеговна

Ведущая организация

- Воронежский государственный педагогический университет

Защита состоится 10 июня 2004 г. в 14 часов на заседании диссертационного совета Д 212.038.07 в Воронежском государственном университете по адресу:394006, Воронеж, пл. Ленина 10, ауд. 14.

С диссертацией можно ознакомиться в научной библиотеке Воронежского государственного университета.

Автореферат разослан 2004 г.

Ученый секретарь диссертационного совета

В реферируемой работе предлагается метод извлечения, формализации и наглядного представления существенной информации нарративного текста.

В середине XX века Эмиль Бенвенист прогнозировал "формальное" будущее лингвистики, подчеркивая ее стремление к точности, которое заключалось, прежде всего, в изменении отношения к своему объекту: «Если наука о языке должна выбирать себе образец для подражания, то им будут науки математические или дедуктивные, которые представляют свой объект в полностью рациональной форме, сводя его к совокупности объективных свойств, получающих постоянные определения. Из этого следует, что лингвистика будет становиться все более и более "формальной", по крайней мере, в том смысле, что язык предстанет как некоторая совокупность всех своих наблюдаемых форм» [Benveniste 1966; русск. пер. в кн.: Бенвенист 1974:37].

На современном этапе развития лингвистики, в эпоху всеобщей компьютеризации и глобальной информатизации наш интерес к опыту точных наук и использование этого опыта в разработке авторской технологии исследования текста можно считать отвечающим запросам времени.

Выявление семантически значимой информации происходит во многом благодаря использованию средств компьютерной графики. Высокая эффективность графического представления информации подтверждена многочисленными исследованиями- наглядно-образного и визуального мышления на основе когнитивного подхода. Фундаментальная идея этого подхода заключается в том, что мышление есть не что иное, как манипулирование внутренними (мысленными) репрезентациями структурированных определенным образом знаний - фреймов, сетей, планов, сценариев. Исходя из этого, разработаны модели представления

знаний на основе семантических сетей, продукций, логики предикатов и нечетких знаний [Поспелов 1989].

Следует отметить, что разработанное на основе когнитивного подхода новое направление в области искусственного интеллекта - когнитивная компьютерная графика (ККГ) - с 1988 г. является «стратегическим приоритетом национальной политики США в области развития перспективных информационных технологий, прежде всего для науки и образования. Суть концепции ККГ очень проста: если на экране дисплея удается визуализировать существенные свойства и отношения между объектами некоторой предметной области (даже любой степени абстракции), то такой ККГ-образ, как правило, содержит в себе информацию (на уровне графических деталей компьютерного изображения) о возможных и не всегда заранее известных следствиях этих свойств и этих отношений» [Агеев 2002:37].

Изложенные выше соображения определяют актуальность данного исследования.

Цель нашего исследования - разработка и применение метода анализа нарративного текста как системы таких алгоритмизируемых процедур, которые способны выявлять лингвистически значимую информацию, моделировать процесс перехода от лексико-грамматического уровня текста к структуре его содержания, визуализировать статику и динамику последнего.

Объектом анализа является содержание нарративного текста как ментальное образование - семантика текста в её статике и становлении.

Материалом для исследования послужил рассказ А.П. Чехова «Дама с собачкой», хорошо структурированный небольшой по объему текст (его длина составляет 317 предложений (5238 ЛЕ)) как обозримое целое для анализа, но с достаточным материалом для классификации. Исследуемые единицы отбирались при помощи компьютерной программы "Словари",

разработанной под руководством сотрудников Научно-методического центра по компьютерной лингвистике факультета РГФ ВГУ. Обработка материала проводилась на компьютере Pentium IV в редакторе Word for Windows; для количественной обработки использовались электронные таблицы и графические представления Excel for Windows.

Предлагаемый нами метод исследования семантики текста предполагает пошаговое решение следующих задач:

- выявление ключевых слов посредством анализа частотного словаря;

- выявление кореферентных наименований ключевых слов;

- анализ семантико-синтаксической связи между ключевыми словами и составление структурных схем, формируемых определенным предикативным типом и репрезентирующих статус ключевых слов;

- грамматическое и кореферентное обобщение контрагентов ключевых слов;

- представление системы семантических связей в тексте в виде графических моделей; определение с использованием графических моделей количественных параметров, характеризующих систему семантических связей в тексте: семантической связности, характеризующей план содержания текста, его семантическую монолитность; цепочечного коэффициента, определяющего среднюю длину цепочки сложного-синтаксического целого (ССЦ), в которой каждое предшествующее ССЦ непосредственно связано с последующим за ним ССЦ; функционального веса, параметра, определяемого числом семантических связей, в которые вступает в данном тексте рассматриваемая единица.

- исследование и визуализация динамики референтов и предикативной связи;

- интерпретация фактов, выявленных с помощью предлагаемой технологии обработки информации; а также решение целого спектра более частных задач.

О методе исследования изучаемого объекта заявлено в названии темы диссертации, а его создание определено как цель. Предлагаемый метод разработан на основе частных лингвистических методов исследования письменных текстов, основанных на количественном анализе, методах контент-анализа и валентного анализа, методов и средств когнитивной компьютерной графики.

Научная новизна исследования заключается

1) в разработке оригинального метода анализа и формализации содержания нарративного текста;

2) в выборе в качестве материала исследования самого сложного случая -художественного текста (существует мнение, что художественная проза и поэтические тексты, «не могут быть объектом формализации» [А.Новиков 1983:6], поскольку их формализация «не диктуется какой-либо практической необходимостью» [Там же]); одновременно отмечается, что «проза А.П. Чехова - наиболее трудно поддающиеся формализации и моделированию тексты» [Лотман 1972:355];

3) в разработке и представлении динамической модели содержания текста.

Теоретическая значимость работы состоит в попытке выйти за рамки анализа художественного текста, который является на данном этапе исследований пока традиционным и собственно лингвистическим, и разработать алгоритмический метод использования лингвистической информации для выявления и наглядного представления содержания текста.

Практическая ценность предложенного алгоритма заключается в возможности как его самостоятельного использования, так и в составе других алгоритмических процедур для решения ряда практических задач, связанных с компьютерной обработкой текста в рамках литературо- и

переводоведения, а также для построения интегрированных технологий для систем искусственного интеллекта Поэтому наблюдения и обобщения, сделанные в процессе исследования, могут быть использованы специалистами по теоретической и прикладной лингвистике и прогностике текста, квантитативной лингвистике, литературоведению и переводу в лекционных курсах и практических занятиях

Положения, выносимые на защиту, формулируются следующим образом

1 Первым этапом анализа является выделение ключевых слов, опирающееся на анализ употребительности слов в тексте

2 Вторым, к сожалению, пока не формализованным этапом анализа является установление кореферентного тождества слов и словосочетаний с целью получения полной информации о номинировании персонажей (действующих лиц, участников ситуации).

3 Формализация семантического пространства может осуществляться через анализ синтаксических связей членов предложения.

4 Количество минимально необходимых для существенного представления содержания нарративного текста в его статике и динамике предикативных типов равно 11: акциональный перцептивный экзистенциальный сущностный квалификативно-дескриптивный социативный посессивный

коммуникативно-контактный предикаты речи

движения и состояния

5 Динамика отношений между персонажами (количество и качество их отношений) может измеряться через количество и качество их синтаксических связей, опосредованных глаголами указанных семантических типов

б Семантическая сеть текста, построенная по методу Э.Ф.Скороходько, может использоваться для выделения значимых частей текста как условие моделирования динамики его содержания.

Основные положения диссертации изложены и апробированы в период с 2000 по 2003 гг. на научных конференциях и семинарах различных уровней: международной конференции «Актуальные проблемы языкознания и методики обучения иностранным языкам», организованной факультетом иностранных языков Воронежского государственного педагогического университета (март 2000); ежегодной международной конференции «Перевод: язык и культура», проводимой факультетом РГФ Воронежского государственного университета (октябрь 2000, сентябрь 2001); второй и третьей конференциях «Проблемы лингвистической прогностики», организованных и проведенных факультетом РГФ, Научно-методическим центром по компьютерной лингвистике и кафедрой теоретической и прикладной лингвистики Воронежского государственного университета (ноябрь 2001, май 2003); международной научной конференции «Проблемы компьютерной лингвистики», организованной Научно-методическим центром по компьютерной лингвистике, факультетом РГФ и факультетом ПММ Воронежского государственного университета (май 2002); на третьем международном семинаре по когнитивной лингвистике (Тамбовский госуниверситет, сентябрь 2002), а также отражены в 9 публикациях.

Структура работы обусловлена поставленными задачами. Диссертация состоит из введения, двух глав и заключения, 29-ти таблиц, 11-ти схем, 10-ти диаграмм, 4-х графиков, списка использованной литературы, 10-ти приложений.

Таблицы содержат количественную характеристику изучаемых объектов, а также иллюстрируют качественную динамику референтов и предикатов.

Графики и диаграммы визуализируют эту динамику по частям семантической сети и по тексту в целом.

Граф моделирует семантическую структуру текста, а схемы - связи между персонажами.

Во Введении обосновывается выбор темы, описываются объект и материал исследования, формулируется цель исследования, намечаются его задачи, раскрывается теоретическая и практическая значимость работы.

В Главе 1 дается определение текста как объекта лингвистического анализа; перечисляются его основные текстообразующие категории и свойства; характеризуется такой параметр как жанрово-стилевая принадлежность исследуемого текста; анализируется его структурная организация - объемно-прагматическая (или абзацная) и контекстно-вариативная; проводится анализ (кореферентный и предикативный) семантического пространства текста.

Глава II посвящена формализации содержания текста (построению обобщенной статической и динамической моделей содержания). Сначала дается определение текста как объекта формализации. Затем осуществляется моделирование содержания текста в статике на базе данных лингвистического анализа, полученных в Главе I. Далее проводится структурно-смысловое сегментирование текста: определяются критерии выделения основных структурно-смысловых единиц — сложных синтаксических целых, дается описание их внутреннего композиционного устройства. Затем строится модель семантической структуры текста -семантическая сеть (СемСеть), с помощью которой определяются количественные параметры, важные для системы семантических связей в тексте (семантическая связность, цепочечный коэффициент, функциональный вес ССЦ); прослеживается динамика референтов и типов предикативной связи, а также внутритиповая динамика, которая визуализируется с помощью компьютерной графики - различных графических образов (схем, графиков, диаграмм); интерпретируются результаты исследования, полученные предложенным методом.

В Заключении подводятся итоги исследования. Основное содержание диссертации состоит в следующем. Исходя из того, что текст - это система индивидуально-авторских знаний о мире, воплощенная в литературно-художественной форме и направленная читателю, мы исследуем семантическое пространство текста как пространство, определенным образом организованное подобно индивидуальной базе знаний, содержащее множество объектов и связей. Определение этих объектов, а также структуры и типа связей между ними, связано с решением конкретных задач формализации содержания текста с использованием статистических и сетевых методов.

Предлагаемый нами алгоритм анализа семантического пространства осуществляется в три этапа: а) обработка текстовой информации, б) визуальная презентация полученной информации и в) интерпретация результатов исследования. Он включает следующие шаги:

1. Составление частотного словаря с целью выявления ключевых слов (КС) текста и их лемматизация, т.е. приведение разных текстовых форм КС к одной канонической, назначенной в качестве главной, исходной, которая несет основную информацию1.

2. Анализ лексического состава текста с целью выявления кореферентных наименований ключевых слов (Сг).

3. Анализ семантико-синтаксической связи между ключевыми словами и составление структурных схем, формируемых определенным предикативным типом и репрезентирующих статус ключевых слов (персонажей).

4. Обобщение (грамматическое и кореферентное) контрагентов ключевых слов.

Для информационного поиска лемматизация связана с идентификацией лексических единиц одной семантики, то есть является частью процесса индексации и поиска а тезаурусе, предусмотренном а системе Лемматизация рассматривается, прежде всего, в качестве одного из объектов компьютерной лингвистики

5 Моделирование семантического пространства текста

1 Термин "ключевое слово" встречается в разных науках в литературоведении он обозначает лейтмотив произведения [Новиков 1988 31], в информатике и психолингвистике - слово или словосочетание, несущее основную семантическую нагрузку с точки зрения информационного поиска Процесс выделения таких слов носит название индексирования с целью устранения информационного шума1 «Для усунення информацийного шуму застосовують методики индексування тексту, яки враховують комуникативну значущисть та функцюнальне навантаження слив у ньому» [Картловська 2003 145] Как показали эксперименты по восприятию содержания текста, ключевые слова называют персонажей, основной предмет, о котором идет речь в произведении, и характеризуют его, т е «так1 слова в конденсирований форм1 виражають основну информацию про змиет тексту» [Картловська 2003 144]

По данным психолингвистики, формальными показателями, свидетельствующими о значительной информационной весомости КС в тексте, являются

1) частотность слова (именно этот показатель КС использовал в области информатики Г Лун при создании системы автоматического реферирования в 1958 году),

2) его синтаксическая позиция (КС содержатся, прежде всего, в заголовке и первом предложении «Название дается рассказу, конечно, не зря, оно несет в себе раскрытие самой важной темы, оно намечает ту доминанту, которая определяет собой все построение рассказа [Выготский 2000 217]

' Информационный шум - это информация, неправичьно выданная информационно-поисковой снстемои в ответ нт запрос нужного документа

3) Набор КС связан с отражением цельности текста, что также было подтверждено экспериментально: текст хранится в памяти в наборе КС, которые затем эксплицируются при его воспроизведении [Сахарный 1994].

Выполненный с помощью компьютерной программы частотный словарь текстовых слов и их лемматизация позволили выявить КС, которые представлены в нижеследующей таблице.

Ключевые слова - персонажи

Гуров Анна Сергеевна муж Анны Сергеевны жена Гурова

12 12 6 3

2. Переходя к конкретному анализу эксплицитных форм когерентности текста (языковых средств, выполняющих как репрезентативную, так и связующую функцию, то есть средств, обеспечивающих его формальное и смысловое единство), мы провели такое кореферентное обобщение, которое, по словам Н.Д. Арутюновой, «позволяет пронести тождество предмета сквозь текст» [Арутюнова 1982:26]. Это тождество достигается следующим образом:

1) Через чистый лексический повтор без модификаций. Любой повтор выполняет не только текстообразующую функцию, но и функцию усиления, подчеркивания. Прежде всего, речь идет о заглавии «Дама с собачкой». В исследуемом произведении ключевое слово, точнее словосочетание, вынесено в позицию заглавия - в сильную позицию текста, что подчеркивает его концептуальную значимость. Оно повторяется в тексте пять раз (включая заглавие). Повторяемость данного словосочетания в контекстах, конкретизирующих и всякий раз по-новому раскрывающих его смысл, обусловливает динамику текста. С этим словосочетанием парадигматически и синтагматически сопряжены и такие слова, которые в целом образуют ментальное

пространство рассказа: кореферентные наименования персонажей, их атрибуты, предикаты и ассоциации.

2) Через повторную номинацию. Это эффективное средство детальной характеристики персонажа - благодаря ей объект, с которым связаны кореферентные наименования в художественном произведении, предстает перед читателем, наделенным новыми качествами: сначала текстовый референт вводится в форме неопределенной дескрипции, затем следует его постепенная идентификация при помощи серии вариантных номинаций в виде длинной цепочки кореферентных синонимов. При этом объем их значения уже, чем объем значения элемента с первичной номинацией, поскольку количество сведений об объекте увеличивается.

3) Через репрезентацию, основанную на метонимических и гипо-гиперонимических отношениях. Например: Анна Сергеевна - новое лицоo, дама, невысокого роста блондинка в берете, молодая женщина.

4) Через субституцию, реализуемую посредством прономинализации. Информация о количестве местоимений, кореферентных главным персонажам, представлена в нижеследующей таблице.

Ключевые слова - персонажи и количество кореферентных

им местоимений

Г\ ров Анна Сергеевна муж жена

219 168 13 5

3. Поскольку кореференция обеспечивает единство темы и единый план ее развития на парадигматическом и синтагматическом уровне, то следующим шагом нашего алгоритма является семантико-синтаксический анализ окружения ключевых слов. Следует также заметить, что, если выбор лексики, по мнению психологов, обусловлен интенцией автора текста, то употребление грамматических форм в меньшей степени поддается

авторскому контролю. Поэтому доминирующие синтаксические конструкции, выявленные в результате семантико-синтаксического анализа, не только специфицируют художественной текст, отражают уникальность его стилевой организации, но и определяют особенности художественного мышления автора.

Как известно, каждую семантико-синтаксическую структуру формирует определенный тип предиката с относящимися к нему актантами. Оперируя термином "предикат", мы понимаем его вслед за Ю.С.Степановым как «особую семантическую сущность, чья категоризация представляет собой обобщение объективных явлений бытия» [Степанов 1981:312]. Другими словами, под предикатом понимаются слова (глаголы) и выражения (связка+прилагательное; связка+ограниченный круг слов типа печален, жаль, надо и т.д.) в предикатной функции, то есть выполняющие в предложении роль сказуемого.

Что касается семантических типов предикатов, то в этом вопросе в семасиологических исследованиях отсутствует единое мнение относительно их количественного и качественного состава. В исследованиях семантики глагола противопоставляются элементы разных систем, описываются различные признаки их субстанций, предпринимаются попытки различных классификаций, однако отсутствие однозначно описанной семантики глагола оставляет почву для дальнейших исследований.

Известно, что каждый семантический тип предиката эксплицируется соответствующей предикатной лексикой - предикаторами, обладающими общностью грамматических и семантических признаков, предикаторами одного и того же валентного типа; и составляет основу семантико-синтаксической структуры с относящимися к нему актантами и отражает один и тот же тип отношений в реальной действительности.

В основе нашей семантической классификации предикатов лежат знания актантной структуры предикатов, общность синтаксем эксплицирующих их предикаторов [см. Г.А. Золотова 1991].

Выделение семантических типов предикатов и их структур осуществлялось в два этапа; на первом этапе дифференцировались конкретные высказывания, а на втором - идентифицировались и обобщались однотипные конкретные высказывания как по форме, так и по смыслу.

В результате анализа связи персонажей через предикацию выявлено 11 типов предикативной связи (Р-типов) - акциональный (Pact)» перцептивный экзистенциальный сущностный

квалификативно-дескриптивный (Р^с), социативн^йЛосессивный

коммуникативно-контактный предикаты речи

движения и состояния каждый из которых на семантико-

синтаксическом уровне эксплицируется определенными структурами.

Семантико-синтаксический анализ показал, что в качестве синтаксической доминанты «Дамы...» следует рассматривать: а) экспрессивные синтаксические конструкции: сравнительные конструкции с союзом точно, присоединительные конструкции с союзами и и но, обособленные и присоединенные обстоятельства (чаще обстоятельства образа действия, выраженные деепричастными оборотами или наречиями в постпозиции), неопределенно-личные предложения с необозначенным подлежащим, в которых основное внимание сосредоточено на состоянии или действии; сложные синтаксические конструкции с разнотипной синтаксической связью: с сочинением и внутренней подчинительной связью, с сочинением и бессоюзной связью, с сочинением, подчинением и бессоюзной связью;

б) сложноподчиненные предложения, а также сложные синтаксические конструкции с придаточными изъяснительными (изъяснения требуют глаголы речи, восприятия, эмоционального состояния);

в) однотипные конструкции с перцептивными (мыслительной деятельности) глаголами и глаголами внутренней речи.

Структурные схемы, обусловленные определенным семантическим типом предиката, репрезентируют статус ключевых слов: чаще субъектную позицию занимает Гуров. Анализ структурных схем позволяет также сделать вывод о том, что повторение ключевых слов и их кореферентных наименований в разной синтаксической роли (подлежащего или дополнения) является существенным признаком связности текста. 4. Предлагаемый нами алгоритм дает возможность на этапе лингвистического анализа получить необходимые данные (отчасти формализованные в виде таблиц и структурных схем) для решения ряда семантических задач, в частности, предполагающих в той или иной форме моделирование семантического пространства текста в статике и динамике. Речь идет, прежде всего, о визуализации полученной информации в виде графических образов (далее ГО), которые трактуются как модели отображаемого объекта - текста, как средство представления данных исследований сложных структур, явлений, процессов [Валькман 2002].

Для построения статической модели проводится статистическая обработка данных и представляется в относительных величинах с учетом общего количества кореферентных наименований в тексте и предикативных связей между персонажами: Статическая модель в виде графа, состоящего из вершин и ребер, является способом отражения как относительного веса КС, так и силы связей между персонажами произведения в целом по тексту.

Формализация предикативной связи позволяет выявить предикативную доминанту в целом по тексту (Р-доминанту), критерием релевантности которой является самая высокая частотность Р-типа. Как

показал качественный и количественный анализ Р-связи, такой Р-доминантой оказался перцептивный Р-тип. Визуализация данных в виде круговой диаграммы дает возможность продемонстрировать соотношение типов предикативной связи и Р-доминанту в целом по тексту.

Для построения динамической модели семантического пространства текста применяется семантическая сеть (СемСеть) как инструмент содержательного членения и мощное наглядное средство описания знаний. Сетевое моделирование визуализирует систему семантических связей между единицами этой системы - сложными-синтаксическими целыми

(ССЦ)1, семантическую структуру исследуемого текста и позволяет

2

определить ее тип .

Применяя сетевой метод, мы определили ряд важных количественных параметров, представляющих особую ценность для характеристики системы семантических связей в тексте, а именно: семантическую связность (С=0,115), цепочечный коэффициент (2=3,7); функциональный вес ССЦ

Как известно, любой ГО, как и модель, строится с определенной целью. В нашем случае построение семантический сети (СемСети) и дальнейшая ее сегментация на части (в другой терминологии цепочки) проводится с целью выявления КС в каждой из частей и связей между этими частями. Затем при помощи статистического метода определяется их динамика (интенсивность и качество), а также доминанта лексическая и предикативная

1 В результате сегментирования текста выявлено 33 ССЦ

2 1 ип сечашической структуры «Дамы » по семантической связи между ССЦ - это к\сочно-нечинеииая,т е включающая нескотько фрагментов;

некшкнмная, т е не имеющая свял! между первым и последним ССЦ, ветвящаяся структура Эго объясняется мноюплановостью художественного произведения, в котором сюжет развивается в нескочькич направлениях

Для построения модели связей между персонажами каждой из девяти частей СемСети, используется тот же способ представления данных в относительных величинах, что и при создании статической модели.

Визуализация данных в виде круговой диаграммы для каждой части СемСети позволяет нагляднее продемонстрировать динамику предикативной связи.

Чтобы получить целостную картину пошаговой динамики Р-связи по частям СемСети и в целом по тексту, а также поведения каждого из Р-типов в отдельности, вся полученная информация представлена на четырех графиках, репрезентирующих динамику самых частотных Р-типов (Ррегс, среднечастотных Р-типов и наименее

частотных Р-типов 11 кривых последнего графика

соответствуют всем 11-ти типам Р-связи.

На заключительном этапе факты, выявленные формальным путем, интерпретированы в ходе их сопоставления с результатами литературоведческих исследований [см. Барлас 1991; Бердников 1974; Катаев В.Б. 1979; Мелетинский 1994; Чудаков 1972, 1992; и мн. др.], полученными посредством неформального, интуитивного анализа. Таким образом, интуитивные ощущения динамики содержания переведены в наглядность.

Поскольку формальные и содержательные компоненты текста представлены в разной степени, каждый из девяти графов и соответствующее количество диаграмм частей СемСети дают возможность визуализировать существенные отношения между объектами и установить определенную связь между смыслом графического образа моделируемой ситуации и вербального его описания.

Итак, основные результаты исследования с применением предлагаемого метода исследования и визуального представления содержания нарративного текста в статике и динамике в обобщенном виде можно сформулировать следующим образом:

1. Выявлены ключевые слова (КС), характеризующиеся своей функциональной значимостью: употребление КС в сильных синтаксических позициях (в заглавии и зачине), частотой употребления и своей связью с другими словами в тексте. Высокая частотность употребления достигается средствами повторной номинации во всем ее лексическом разнообразии и способами применения: с одной стороны, это средства-усилители информативности текста (кореферентные синонимы), с другой -формальные маркеры связи текстовых элементов (местоимения). Главным персонажем является Гуров (Сг=265), а не дама с собачкой (Сг=208).

2. Благодаря сегментации СемСети на части (в другой терминологии цепочки) прослежена динамика референтов и предикативной связи (их интенсивность и качество). При этом установлено, что а) среди ключевых персонажей Гуров занимает лидирующую позицию в I, VI, VII, VIII и IX частях СемСети; Анна Сергеевна - во II, III, IV и ^ой; б) наибольшей силой связи обладает пара персонажей Сергеевна (максимальной величины эта сила достигает в V части); динамика, проявляется только в отношениях главных героев произведения; Р-связь с другими персонажами носит статический характер.

3. Установлено, что различный порядок убывания частот Р-типов и изменение их состава в каждой из 9-ти частей СемСети текста является свидетельством о смене темы в этих частях и перемещения акцента с одной стороны ситуации на другую.

4. Определена роль различных видо-временных контекстов в создании эффекта статичности микроситуаций, картинно-изобразительного характера повествования, или, наоборот, динамичности.

5. Анализ динамической модели содержания текста дает возможность уяснить авторскую стратегию размещения информации; наглядно доказать, что вектор действия направлен не во внешний мир главных героев:

глобальные метаморфозы происходят в их внутреннем мире;

"визуализировать" переход персонажа от прежнего состояния к новому.

6. Предлагаемый метод создаёт необходимые предпосылки для

компьютерного представления и анализа содержания текста.

Содержание диссертации отражено в следующих публикациях автора:

1. Ефимова Т.В. Опыт формального анализа содержания текста (на материале рассказов А.П. Чехова и их переводов на французский язык)

/ Т.В. Ефимова // Актуальные проблемы языкознания и методики обучения

иностранным языкам: Материалы международной научной конференции. -

Воронеж, 2000. - С. 77-78.

2. Ефимова Т.В. К вопросу о внутриязыковой и межъязыковой кореферентности (на материале рассказа А.П. Чехова "Дама с собачкой" и его перевода на французский язык) / Т.В. Ефимова // Перевод: язык и культура: Материалы международной научной конференции. - Воронеж, 2000. - Вып. 3.-С. 52-53.

3. Ефимова Т.В. Опыт лингвистического анализа нарративного текста / Т.В. Ефимова // Перевод: язык и культура: Материалы международной научной конференции. - Воронеж, 2001. - Вып. 4. - С. 43-44.

4. Ефимова Т.В. Опыт лингвистического анализа нарративного текста (переводческий аспект) / Т.В. Ефимова // Социокультурные проблемы перевода: Сб. науч. тр. - Воронеж, 2002. - Вып. 5. - С. 153-165.

5. Ефимова Т.В. Прогностический аспект лингвистического анализа и формализация содержания нарративного текста / Т.В. Ефимова // Проблемы лингвистической прогностики: Сб. науч. тр. - Воронеж, 2002. -Вып. 2 . - С. 115-122.

6. Ефимова Т.В. Формализация содержания нарративного текста / Т.В. Ефимова // Композиционная семантика: Материалы 3-ьей международной школы-семинара по когнитивной лингвистике. -Тамбов, 2002.-Ч. И.-С. 174-176.

7. Ефимова Т.В. Анализ художественного текста с применением семантической сети / Т.В. Ефимова// Вестник ВГУ, Серия лингвистика и межкультурная коммуникация. - 2003. - №1. — С. 57-67.

8. Ефимова Т.В. Проблемы лингвистической прогностики - 2003/ Т.В.Ефимова // Вестник ВГУ, Серия лингвистика и межкультурная коммуникация. - 2003. - №2. - С. 111-113.

9. Ефимова Т.В. К прогностике текста: динамика предикативной связи / Т.В. Ефимова // Проблемы лингвистической прогностики: Сб. науч. тр. -Воронеж, 2003. - Вып. 3. - (В печати).

Лицензия ИД №00437 от 10.11.99

Подписано в печать 27.04.04 Формат 60х841у16. Объем 1,5 п.л. Тираж 100. Заказ № 240

Отпечатано в типографии ВГУ 394000, г. Воронеж, ул. Пушкинская, 3

»117 13

 

Оглавление научной работы автор диссертации — кандидата филологических наук Ефимова, Татьяна Владимировна

Введение.

Глава 1. Лингвистический анализ нарративного текста.

1.1. Текст как объект лингвистического анализа.

1.2. Определение жанрово-стилевой принадлежности текста.

1.3. Анализ структурной организации текста.

1.3.1. Объемно-прагматическое членение текста.

1.3.2. Контекстно-вариативное членение текста.

1.4. Анализ семантического пространства текста.

1.4.1. Выявление ключевых слов и их лемматизация.

1.4.2. Кореферентное обобщение ключевых слов.

1.4.3. Анализ семантико-синтаксической связи между ключевыми словами и их контрагентами.

1.4.3.1. Выделение семантических типов предикатов и их структур.

1.4.3.2. Анализ семантико-синтаксической связи между ключевыми словами.

1.4.3.3. Анализ семантико-синтаксической связи между ключевыми словами и их контрагентами.

Выводы по 1-ой главе.

Глава 2. Формальное представление содержания нарративного текста.95,

2.1. Текст как объект формализации.

2.2. Построение обобщенной статической модели содержания текста.

2.2.1. Выявление кореферентной доминанты в целом по тексту.

2.2.2. Построение графической модели связей между персонажами и оценка силы этих связей.

2.2.3. Выявление предикативной доминанты в целом по тексту.

2.2.4. Визуализация полученной информации в виде диаграммы.

2.3. Семантическая сеть как инструмент структурно-смыслового сегментирования содержания текста.

2.3.1. Выявление семантических связей между элементами текста.

2.3.2. Понятие сложного синтаксического целого.

2.3.3. Критерии выделения сложного синтаксического целого.

2.3.4. Описание внутреннего композиционного устройства сложного синтаксического целого.

2.3.5. Построение семантической сети.

2.3.6. Установление типа семантической сети.

2.3.7. Определение с использованием семантической сети количественных параметров, характеризующих систему семантических связей в тексте.

2.3.7.1. Семантическая связность.

2.3.7.2. Цепочечный коэффициент.

2.3.7.3. Функциональный вес сложного синтаксического целого.

2.4. Построение динамической модели содержания текста.

2.4.1. Исследование динамики референтов по частям семантической сети и визуализация полученной информации в виде схемы связей.

2.4.2. Исследование динамики типов предикативной связи по частям семантической сети и визуализация полученной информации в виде диаграмм и графиков.

2.4.3. Внутритиповая динамика предикативной связи.

2.5. Интерпретация результатов исследования.

Выводы по 2-ой главе.

 

Введение диссертации2004 год, автореферат по филологии, Ефимова, Татьяна Владимировна

В данной работе «Лингвистический анализ и формальное представление содержания нарративного текста» предлагается метод извлечения, формализации и наглядного представления существенной информации текста.

В середине XX века Эмиль Бенвенист прогнозировал "формальное" будущее лингвистики, подчеркивая ее стремление к точности, которое заключалось, прежде всего, в изменении отношения к своему объекту: «Если наука о языке должна выбирать себе образец для подражания, то им будут науки математические или дедуктивные, которые представляют свой объект в полностью рациональной форме, сводя его к совокупности объективных свойств, получающих постоянные определения. Из этого следует, что лингвистика будет становиться все более и более "формальной", по крайней мере, в том смысле, что язык предстанет как некоторая совокупность всех своих наблюдаемых форм» [Вепуепи^е 1966; русск. пер. в кн.: Бенвенист 1974:37].

На современном этапе развития лингвистики, в эпоху всеобщей компьютеризации и глобальной информатизации наш интерес к опыту точных наук и использование этого опыта в разработке авторской технологии исследования текста можно считать отвечающим запросам времени.

Выявление семантически значимой информации происходит во многом благодаря использованию средств компьютерной графики. Высокая эффективность графического представления информации подтверждена многочисленными исследованиями наглядно-образного и визуального мышления на основе когнитивного подхода. Фундаментальная идея этого подхода заключается в том, что мышление есть не что иное, как манипулирование внутренними (мысленными) репрезентациями структурированных определенным образом знаний - фреймов, сетей, планов, сценариев. Исходя из этого, разработаны модели представления знаний на основе семантических сетей, продукций, логики предикатов и нечетких знаний [Поспелов 1989].

Следует отметить, что разработанное на основе когнитивного подхода новое направление в области искусственного интеллекта - когнитивная компьютерная графика (ККГ) - с 1988 г. является «стратегическим приоритетом национальной политики США в области развития перспективных информационных технологий, прежде всего для науки и образования. Суть концепции ККГ очень проста: если на экране дисплея удается визуализировать существенные свойства и отношения между объектами некоторой предметной области (даже любой степени абстракции), то такой ККГ-образ, как правило, содержит в себе информацию (на уровне графических деталей компьютерного изображения) о возможных и не всегда заранее известных следствиях этих свойств и этих отношений» [Агеев 2002:37].

Изложенные выше соображения определяют актуальность данного исследования.

Цель нашего исследования - разработка и применение метода анализа нарративного текста как системы таких алгоритмизируемых процедур, которые способны выявлять лингвистически значимую информацию, моделировать процесс перехода от лексико-грамматического уровня текста к структуре его содержания, визуализировать статику и динамику последнего.

Объектом анализа является содержание нарративного текста как ментальное образование - семантика текста в её статике и становлении.

Материалом для исследования послужил рассказ А.П. Чехова «Дама с собачкой», хорошо структурированный небольшой по объему текст (его длина составляет 317 предложений (5238 ЛЕ)) как обозримое целое для анализа, но с достаточным материалом для классификации. Исследуемые единицы отбирались при помощи компьютерной программы "Словари", разработанной под руководством сотрудников Научно-методического центра по компьютерной лингвистике факультета РГФ ВГУ. Обработка материала проводилась на компьютере Pentium IV в редакторе Word for Windows; для количественной обработки использовались электронные таблицы и графические представления Excel for Windows.

Предлагаемый нами метод исследования семантики текста предполагает пошаговое решение следующих задач:

- выявление ключевых слов посредством анализа частотного словаря;

- выявление кореферентных наименований ключевых слов;

- анализ семантико-синтаксической связи между ключевыми словами и составление структурных схем, формируемых определенным предикативным типом и репрезентирующих статус ключевых слов; грамматическое и кореферентное обобщение контрагентов ключевых слов;

- представление системы семантических связей в тексте в виде графических моделей;

- определение с использованием графических моделей количественных параметров, характеризующих систему семантических связей в тексте: семантической связности, характеризующей план содержания текста, его семантическую монолитность; цепочечного коэффициента, определяющего среднюю длину цепочки сложного синтаксического целого (ССЦ), в которой каждое предшествующее ССЦ непосредственно связано с последующим за ним ССЦ; функционального веса, параметра, определяемого числом семантических связей, в которые вступает в данном тексте рассматриваемая единица;

- исследование и визуализация динамики референтов и предикативной связи;

- интерпретация фактов, выявленных с помощью предлагаемой технологии обработки информации; а также решение целого спектра более частных задач.

О методе исследования изучаемого объекта заявлено в названии темы диссертации, а его создание определено как цель. Предлагаемый метод разработан на основе частных лингвистических методов исследования письменных текстов, основанных на количественном анализе, методах контент-анализа и валентного анализа, методов и средств когнитивной компьютерной графики.

Научная новизна исследования заключается

1) в разработке оригинального метода анализа и формализации содержания нарративного текста;

2) в выборе в качестве материала исследования самого сложного случая -художественного текста1;

3) в разработке и представлении динамической модели содержания нарративного текста.

Теоретическая значимость работы состоит в попытке выйти за рамки анализа художественного текста, который является на данном этапе исследований пока традиционным и собственно лингвистическим, и разработать алгоритмический метод использования лингвистической информации для выявления и наглядного представления содержания текста.

Практическая ценность предложенного алгоритма заключается в возможности как его самостоятельного использования, так и в составе других алгоритмических процедур для решения ряда практических задач, связанных с компьютерной обработкой текста в рамках литературо- и переводоведения, а также для построения интегрированных технологий для систем искусственного интеллекта. Поэтому наблюдения и обобщения, сделанные в процессе исследования, могут быть использованы специалистами по теоретической и прикладной лингвистике и прогностике текста, квантитативной лингвистике, литературоведению и переводу в лекционных курсах и на практических занятиях.

1 Существует мнение, что художественная проза и поэтические тексты, «не могут быть объектом формализации» [А. Новиков 1983:6], поскольку их формализация «не диктуется какой-либо практической необходимостью» [Там же]); одновременно отмечается, что «проза А.П. Чехова -наиболее трудно поддающиеся формализации и моделированию тексты» [Лотман 1972:355].

Положения, выносимые на защиту, формулируются следующим образом:

1. Первым этапом анализа является выделение ключевых слов, опирающееся на анализ употребительности слов в тексте.

2. Вторым, к сожалению, пока не формализованным этапом анализа является установление кореферентного тождества слов и словосочетаний с целью получения полной информации о номинировании персонажей (действующих лиц, участников ситуации).

3. Формализация семантического пространства может осуществляться через анализ синтаксических связей членов предложения.

4. Количество минимально необходимых для существенного представления содержания нарративного текста в его статике и динамике предикативных типов равно 11: акциональный, перцептивный, экзистенциальный, сущностный, квалификативно-дескриптивный, социативный, посессивный, коммуникативно-контактный, предикаты речи, движения и состояния.

5. Динамика отношений между персонажами (количество и качество их отношений) может измеряться через количество и качество их синтаксических связей, опосредованных глаголами указанных семантических типов.

6. Семантическая сеть текста, построенная по методу Э.Ф. Скороходько, может использоваться для выделения значимых частей текста как условие моделирования динамики его содержания.

Основные положения диссертации изложены и апробированы в период с 2000 по 2003 гг. на научных конференциях и семинарах различных уровней: международной конференции «Актуальные проблемы языкознания и методики обучения иностранным языкам», организованной факультетом иностранных языков Воронежского государственного педагогического университета (март 2000); международной конференции «Перевод: язык и культура», проводимой факультетом РГФ Воронежского государственного университета (октябрь 2000, сентябрь 2001); второй и третьей конференциях «Проблемы лингвистической прогностики», организованных и проведенных факультетом РГФ, Научно-методическим центром по компьютерной лингвистике и кафедрой теоретической и прикладной лингвистики Воронежского государственного университета (ноябрь 2001, май 2003); международной научной конференции «Проблемы компьютерной лингвистики», организованной Научно-методическим центром по компьютерной лингвистике, факультетом РГФ и факультетом ПММ Воронежского государственного университета (май 2002 и 2004); на третьем международном семинаре по когнитивной лингвистике (Тамбовский госуниверситет, сентябрь 2002), а также отражены в 9 публикациях.

Структура работы обусловлена поставленными задачами. Диссертация состоит из введения, двух глав и заключения, 29-ти таблиц, 11-ти схем, 10-ти диаграмм, 4-х графиков, списка использованной литературы, 10-ти приложений.

 

Заключение научной работыдиссертация на тему "Лингвистический анализ и формальное представление содержания нарративного текста"

Выводы по 2-ой главе.

1. Построение семантической сети позволяет визуализировать систему семантических отношений между ССЦ и семантическую структуру такого объекта повышенной сложности, как художественный текст.

2. Применяя сетевой метод, мы определили ряд важных количественных параметров, представляющих особую ценность для характеристики системы семантических связей в тексте, а именно: семантическую связность (С=0Д15); цепочечный коэффициент (Z=3,7); функциональный вес ССЦ (ф!7=136) .

3. В результате сетевого моделирования выявлено девять частей СемСети. Анализ динамики КС и силы Р-связи между персонажами в каждой из этих частей, визуализация полученной информации в виде графов (схемы связей) позволяют констатировать, что а) среди ключевых персонажей Гуров занимает лидирующую позицию в I, VI, VII, VIII и IX частях СС; Анна Сергеевна - во II, Ш, IV и V-ой; б) наибольшей силой связи обладает пара персонажей Гуров<-»Анна Сергеевна. Максимальной величины эта сила достигает в V части; в) формализация кореферентных наименований КС в виде таблиц (см. Приложение 2-10) позволяет рассматривать в качестве доминанты местоимение 3 л. им. п.: Гурова - во всех частях СемСети кроме 1-ой, Анны

Сергеевны - во II, IV, V, VIII, IX частях; имя собственное: Гурова - в VIII-ой,

Анны Сергеевны - в I, Ш, VI, VII, VIII, IX частях. Причем, Сг-доминантами одновременно являются и местоимения, и имена собственные КС: Гурова - в

VIII части СС, Анны Сергеевны - в VIII и 1Х-ой.

4. Если сила связей между персонажами выражается в их количестве, то характер зависит от качества предикативной связи. Анализ Р-связи по частям, визуализация его результатов в виде таблиц, графиков и диаграмм позволили проследить динамику этой связи и выявить Р-доминанту - это р х регс.

5. Анализ динамической модели содержания текста дает возможность уяснить авторскую стратегию размещения информации. Эта стратегия нацелена в конечном итоге на реализацию главной задачи - отразить процесс поиска истины, анализа ложных стереотипов, переход персонажа от прежнего состояния к новому.

6. Процедура по выявлению Р-доминанты в произведении А.П. Чехова «Дама с собачкой», а также предикатная динамика, наблюдаемая, прежде всего, внутри таких Р-типов как Ррегс, Pstat? Pmouv, Pact, Pdescr, позволяют определить вектор действия, который направлен не во внешний мир главных героев: глобальные метаморфозы происходят в их внутреннем мире.

7. Как показал дискурсивный анализ, смена различных видо-временных контекстов свидетельствует о неоднородности нарративного темпа то стремительного, с быстрой сменой действий, то картинно-замедленного.

186

ЗАКЛЮЧЕНИЕ

Подведем итоги проведенного исследования и обобщим полученные в его ходе результаты. В работе предлагается метод анализа и визуального представления текста в его статике и динамике.

Предлагаемый метод исследования содержательного пространства нарративного текста осуществлялся в три этапа: а) обработка информации, б) визуальная презентация полученной информации и в) интерпретация результатов исследования.

Его применение позволило выявить ключевые слова (КС), характеризующиеся своей функциональной значимостью: употребление КС в сильных синтаксических позициях (в заглавии и зачине), частотой употребления и своей связью с другими словами в тексте.

С целью получения полной информации о номинировании персонажей (участников ситуации) было установлено кореферентное тождество слов и словосочетаний (кореферентные синонимы и местоимения).

Если выбор лексики, по мнению психологов, обусловлен интенцией автора текста, то употребление грамматических форм в меньшей - степени поддается авторскому контролю. Поэтому доминирующие синтаксические конструкции, выявленные в результате семантико-синтаксического анализа, не только специфицируют художественной текст, отражают уникальность его стилевой организации, но и определяют особенности художественного мышления автора.

Для решения задач прикладного характера, связанных с компьютерной обработкой текста, было проведено подробное описание синтаксических связей членов предложения. Для машины такое описание делает "понятной" структуру анализируемого предложения и возможным построение дерева вывода соответствующей структуры.

В ходе исследования выявлены 11 типов предикативной связи (Р-типов) КС и их контрагентов, охарактеризованной посредством семантических типов предиката, и репрезентирован статус КС.

Получены данные, структурированные в виде таблиц и схем, необходимые для визуализации существенной информации средствами компьютерной графики в виде статической и динамической моделей содержания.

Для построения статической модели проведена статистическая обработка данных и представлена в относительных величинах путем составления пропорций с учетом общего количества кореферентных наименований в тексте и предикативных связей между персонажами. Статическая модель в виде графа, состоящего из вершин и ребер, является способом отражения как относительного веса КС, так и силы связей между персонажами произведения в целом по тексту.

Формализация предикативной связи позволила выявить предикативную доминанту в целом по тексту (Р-доминанту), критерием релевантности которой является самая высокая частотность Р-типа. Как показал качественный и количественный анализ Р-связи, такой Р-доминантой оказался перцептивный Р-тип.

Для построения динамической модели семантического пространства текста применена семантическая сеть (СемСеть) как инструмент содержательного членения и мощное наглядное средство описания знаний. Сетевое моделирование позволило визуализировать систему семантических связей между единицами этой системы - сложными синтаксическими целыми (ССЦ), семантическую структуру исследуемого текста и определить её тип.

Посредством сетевого моделирования определены основные количественные параметры системы семантических связей, важные для автоматизированного анализа текста на естественном языке: семантическая связность, функциональный вес ССЦ, цепочечный коэффициент.

Сегментация СемСети на части (в другой терминологии цепочки) позволила проследить динамику референтов и предикативной связи (их интенсивность и качество). При этом было установлено, что динамика проявляется только в отношениях главных героев произведения; связь через предикацию с другими персонажами статична.

Для построения модели связей между персонажами каждой из девяти частей СемСети, был использован тот же способ представления данных в относительных величинах, что и при создании статической модели.

Визуализация данных в виде круговой диаграммы для каждой части СемСети позволила нагляднее продемонстрировать динамику предикативной связи.

Чтобы получить целостную картину пошаговой динамики Р-связи по частям СемСети и в целом по тексту, а также поведения каждого из Р-типов в отдельности, вся полученная информация была представлена на четырех графиках, репрезентирующих динамику самых частотных Р-типов (Pperc, Pstat> Pmouv, Pdei), среднечастотных Р-типов (Р^, Pdescr, Pcomm-cont) и наименее частотных Р-типов (Pexist, Ропот, Psoc, Pposs); 11 кривых последнего графика соответствуют всем 11-ти типам Р-связи.

Интерпретированы факты, полученные формальным путём, в ходе сопоставления их с результатами литературоведческих исследований [см. Барлас 1991; Бердников 1974; Катаев В.Б. 1979; Мелетинский 1994; Чудаков 1972, 1992; и мн. др.], полученных посредством неформального, интуитивного анализа. Таким образом, интуитивные ощущения динамики содержания переведены в наглядность.

Каждый из девяти графов и соответствующее количество диаграмм частей СемСети визуализируют существенные отношения между объектами и указывают на определенные связи между смыслом графического образа моделируемой ситуации и его вербального описания.

Установлено, что различный порядок убывания частот Р-типов и изменение их состава в каждой из 9-ти частей СемСети текста является свидетельством о смене темы в этих частях и перемещения акцента с одной стороны ситуации на другую.

Определена роль различных видо-временных контекстов в создании эффекта статичности микроситуаций, картинно-изобразительного характера повествования, или, наоборот, динамичности.

Всё это дает возможность 1) уяснить авторскую стратегию размещения информации; 2) показать, что вектор действия направлен не во внешний мир главных героев: глобальные метаморфозы происходят в их внутреннем мире; 3) "визуализировать" переход персонажа от прежнего состояния к новому.

Предлагаемый метод создает необходимые предпосылки для компьютерного представления и анализа содержания текста. Он может быть использован в различных лингвистических исследованиях; позволяет решать ряд теоретических и прикладных задач, особенно связанных с проектированием лингвистического обеспечения систем искусственного интеллекта; анализом архитектоники литературного произведения; созданием языков описания документов; информационным поиском, автоматическим реферированием, индексированием и экстрагированием.

 

Список научной литературыЕфимова, Татьяна Владимировна, диссертация по теме "Теория языка"

1. Авилова Н.С. Вид залога и семантика глагольного слова / Н.С. Авилова. М.: Наука, 1976. - 328 с. .

2. Агеев В.Н. Семиотика / В.Н. Агеев. М.: Изд-во «Весь мир», 2002. - 256 с. Адмони В.Г. Система форм речевого высказывания / В.Г. Адмони. - Спб.: Наука, 1994. - 153 с.

3. Алисова Т.Б. Очерки синтаксиса итальянского языка. Семантическая и грамматическая структура простого предложения / Т.Б. Алисова. М.: Изд-во МГУ, 1971.-293 с.

4. Андреев Н.Д. Возможный путь моделирования семантики языка / Н.Д. Андреев. -М.: ВИНИТИ, 1961. 126 с.

5. Апресян Ю.Д. Современные методы изучения значений и некоторые проблемы структурной лингвистики / Ю.Д. Апресян // Проблемы структурной лингвистики. М.: Изд-во АН СССР, 1963. - С. 102-150.

6. Арутюнова Н.Д. Лингвистические проблемы референции / Н.Д. Арутюнова // НЗЛ / М.: Радуга. 1982. - Вып. XIII. - С. 5-40.

7. Арутюнова Н.Д. Номинация и текст / Н.Д. Арутюнова // Языковая номинация. Виды наименований / Отв. ред. Б.А. Серебренников, A.A. Уфимцева. М.: Наука, 1977.-С. 304-357.

8. Ахманова О.С. Словарь лингвистических терминов / О.С. Ахманова. М.: СЭ, 1968.-608 с.

9. Ахутина Т.В. Порождение речи. Нейро-лингвистический анализ порождения синтаксиса / Т.В. Ахутина. М.: МГУ, 1989. - 215 с.

10. Бабенко Л.Г. Лингвистический анализ художественного текста. Теория и практика: Учебник; Практикум / Л.Г. Бабенко, Ю.В. Казарин. М.: Флинта: Наука, 2003.-496 с.

11. Балли Ш. Общая лингвистика и вопросы французского языка / Ш. Балли. М.: ИЛ, 1955.-416 с.

12. Баранов А.Н. Введение в прикладную лингвистику: Учеб. пособие для вузов / А.Н. Баранов. -М.: Изд-во «УРСС», 2001. 358 с.

13. Барлас Л.Г. Язык повествовательной прозы Чехова. Проблемы анализа / Л.Г. Барлас. Ростов-на-Дону: Изд-во Рост, ун-та, 1991. - 208 с. Бахтин М.М. Проблема, речевых жанров / М.М. Бахтин // Эстетика словесного творчества. -М.: Искусство, 1979. - С.237-280.

14. Бахтин М.М. Литературно-критические статьи / М.М. Бахтин. М.: ХЛ, 1986. -543 с.

15. Бахтин М.М. Автор и герой в эстетической деятельности / М.М. Бахтин // Работы 20-х годов. Киев, 1994. - 349 с.

16. Берж К, Теория графов и её применения / К. Берж. М.: Изд-во ИЛ, 1962. -320 с.

17. Бирюков Б.В. Кибернетика в гуманитарных науках / Бирюков Б.В., Геллер Е.С. -М.: Наука, 1973. 214 с.

18. Богданов В.В. Семантико-синтаксическая организация предложения / В.В. Богданов. Л.: Изд-во ЛГУ, 1977. - 204 с.

19. Болотнова Н.С, Коммуникативные универсалии и их лексическое воплощение в художественном тексте / Н.С. Болотнова // Филол. науки / Науч. докл. высш. шк. 1992. - №4. - С.75-87.

20. Бондарко A.B. Прикладное языкознание. Учебник / A.B. Бондарко, Л.А. Вербицкая, Г.Я. Мартыненко и др. / Отв. ред. А.С.Герд. СПб: Изд-во СпбГУ, 1996. - 528 с.

21. Боумэн У. Графическое представление информации / У. Боумэн. М.: Изд-во «Мир», 1971. - 228 с.

22. Брагина H.H. Функциональные асимметрии человека / H.H. Брагина, Т.А.Доброхотова. -М.: Медицина, 1981.-287 с.

23. Булаховский JI.A. Курс русского литературного языка / Л.А. Булаховский. -Киев, 1952. С.392-395.

24. Булыгина Т.В. К построению типологии предикатов в русском языке / Т.В. Бу-лыгина // Семантические типы предикатов. М.: Наука, 1982. - С. 5-85. Валгина Н.С. Синтаксис современного русского языка. Учебник / Н.С. Валгина. -М.: Агар, 2000.-416 с.

25. Валгина Н.С. Теория текста: Учебное пособие / Н.С. Валгина. М.: Логос, 2003.-280с.

26. Валькман Ю.Р. Когнитивные графические метафоры: когда, зачем, почему и как мы их используем/ Ю.Р. Валькман // Знания-Диалог-Решение (KDS-95): Тр. междунар. конф. Ялта, 1995. - С.261-272.

27. Валькман Ю.Р. Видеообразы в операциях исследовательского проектирования / Ю.Р. Валькман // Искусственный интеллект-96 (КИИ-96): Тр. междунар. конф. -Казань, 1996. -С.118-123.

28. Валькман Ю.Р. Модельно-параметрическое пространство в исследованиях сложных объектов: Дис. .докт. тех. наук / Валькман Юрий Романович. -Киев, 1997.-250 с.

29. Валькман Ю.Р. Анализ понятия «графический образ» / Ю.Р. Валькман. 2002. - (http//www. dialog-21.ru/Archive\2002\volumel.

30. Валькман Ю.Р. Интеллектуальные технологии исследовательского проектирования: формальные системы и семиотические модели / Ю.Р. Валькман. Киев: Port-Royal, 1998. - 250 с.

31. Веденов А.А. Моделирование элементов мышления / А.А. Веденов. М.: Наука, 1988.- 159 с.

32. Вежбицка А. Дескрипция или цитация? / А. Вежбицка // Новое в зарубежной лингвистике-М.: Радуга, 1982. Вып. XIII. - С. 237-262.

33. Виноградов В.В. О языке художественной прозы / В.В. Виноградов // Избр. труды. -М.: Наука, 1980. 360 с.

34. Виноградов В.В. Основные вопросы синтаксиса предложения / В.В.Виноградов // Исследования по русской грамматике / М.: Наука, 1975. - С. 254-294.

35. Выготский Л.С. Психология искусства / Л.С. Выготский. СПб: Азбука, 2000. -416 с.

36. Гак В.Г. О семантической организации повествовательного текста / В.Г. Гак // Лингвистика текста: Сб. науч. трудов МГПИИЯ им. М. Тореза. 1976. - Вып. 103.-С. 5-14.

37. Гак В.Г. К типологии лингвистических номинаций /В.Г. Гак // Языковая номинация: Общие вопросы. М.: Наука, 1977. - С. 233-293. Гак В.Г. Языковые преобразования / В.Г. Гак. - М.: Школа «Языки русской литературы», 1998. - 768 с.

38. Гальперин И.Р. Текст как объект лингвистического исследования / И.Р. Гальперин. М.: Наука, 1981. - 140 с.

39. Гарская Л.В. Возможности прогнозирования содержательно-смыслового развертывания в художественном тексте / Л.В. Гарская // Проблемы лингвистической прогностики: Сб. науч. тр.- Воронеж, 2002. Вып.2. - С. 102-114.

40. Гиндин С.И. Внутренняя организация текста: Автореф. дис.канд. фил. наук /

41. Гиндин Сергей Ильич. М., 1972. - 31 с.

42. Гинзбург Л.Я. О литературном герое / Л.Я. Гинзбург. Л.: Сов. писатель, 1979. - 222 с.

43. Глазерман Т.Б. Психофизические основы нарушений мышления при афазии / Т.Б. Глазерман. М.: Наука, 1986. - 230 с.

44. Гончарова Е.А. Лингвистические средства создания образа персонажа в художественном тексте / Е.А. Гончарова // Лингвистические исследования художественного текста. Л., 1983. - С. 105-111

45. Гришаева Л.И. Номинативно-коммуникативная функция предложений с глаголами поведения / Л.И. Гришаева. Воронеж: Изд-во ВГУ, 1998. - 272 с.

46. Демьянков В.З. О формализации прагматических свойств языка / В.З. Демьян-ков // Языковая деятельность в аспекте лингвистической прагматики: Сб. обзоров. -М., 1984.-С. 197-221.

47. Дресслер В. К вопросу о реконструкции индоевропейского синтаксиса / В. Дресслер // НЗЛ. М., 1988. - Вып. 21. - С. 409-432.

48. Зенкин A.A. Когнитивная компьютерная графика / A.A. Зенкин. М.: Наука, 1991.-187 с.

49. Зенкин A.A. Экология мышления / A.A. Зенкин // Информатика и образование. -1989.-№6. -С. 112-117.

50. Кибрик А.Е. Очерки по общим и прикладным вопросам языкознания/ А.Е. Кибрик.- М.: Изд-во МГУ, 1992. 335 с.

51. Кожевникова К. Об аспектах связности в тексте как целом / К. Кожевникова // Синтаксис текста. М.: Наука, 1979. - С. 47-67.

52. Кожевникова К. Формирование содержания и синтаксис художественного текста/ К. Кожевникова // Синтаксис текста. -М.: Наука, 1976. С. 301-315.

53. Кожевникова H.A. Язык и композиция произведений А.П. Чехова: Научноеиздание / H.A. Кожевникова. Нижний Новгород, 1999. - 103 с.

54. Кретов A.A. Основы лексико-семантической прогностики. Дис. .докт. филол.наук / Кретов Алексей Александрович. М., 1994. - 450 с.

55. Кузнецов И.П. Семантические представления / И.П. Кузнецов. М.: Наука,1986. -268 с.

56. Куо K.M. Формальная методология приобретения и представления знаний / K.M. Куо, Дж.Э. Макдональд // ТИИЭР. М.: Октябрь, 1986. - Т.74. - №10. -С.55-75.

57. Кухаренко В.А. Интерпретация текста: Учеб. пособие для студентов пед. ин-тов / В.А. Кухаренко. М.: Просвещение, 1988. - 191 с.

58. Левин Ю.И. О семантике местоимений / Ю.И. Левин // Проблемыграмматического моделирования. М.: Наука, 1973. - С. 108-121.

59. Лекант П.А. Краткий справочник по современному русскому языку / П.А. Лекант, Л.Л. Касаткин, Е.В. Клобуков-М.: Высш. шк., 1991. 383 с.

60. Леонтьев A.A. Признаки связности и цельности текста/ A.A. Леонтьев//

61. Лингвистика текста: Сб. науч. трудов МГПИИЯ им. М. Тореза. 1976. - Вып.103.-С. 60-70.

62. Лотман Ю.М. Структура художественного текста / Ю.М. Лотман. М.: ХЛ, 1972. - 366 с.

63. Лотман Ю.М. Семиосфера: Культура и взрыв. Внутри мыслящих миров / Ю.М.Лотман // Ст. Исслед. заметки.- СПб.: Искусство-СПБ, 2000. 703 с. Лурия А.Р. Основные проблемы нейролингвистики / А.Р. Лурия. - М.: Изд-во МГУ, 1975.-253 с.

64. Марчук И.А. Опыт теории лингвистических моделей «Смысл Текст». Семантика, синтаксис / И.А. Марчук. - М.: Школа «Языки русской культуры», 1999.-350 с.

65. Марчук Ю.Н. Математические методы в языкознании. Актуальные проблемы прикладного языкознания / Ю.Н. Марчук.- М.: ИНИОН АН СССР, 1990. 47 с.

66. Марчук Ю.Н. Основы компьютерной лингвистики / Ю.Н. Марчук. М.: Изд-во МПУ «Народный учитель», 2000. - 226 с.

67. Маслов Б. А. Проблемы лингвистического анализа связного текста (надфразовый уровень) / Б.А. Маслов. Таллин: Изд-во ТПИ им. Э.Вильде, 1974. - 104 с.

68. Маслова В.А. Филологический анализ поэтического текста / В.А. Маслова. -Минск, 1999. 209 с.

69. Материалы Диалога 2002. Том 1. Теоретические проблемы-(http://www.dialog-2 lru/Archiv\2002).

70. Мелетинский Е.М. О литературных архетипах / Е.М. Мелетинский- М.: Наука, 1994. 244 с.

71. Мельников Г.П. Системология и языковые аспекты кибернетики / Г.П. Мельников. М.: Советское Радио, 1978. - 367 с.

72. Москальская О.И. Грамматика текста. Учеб. пособие / О.И. Москальская . М.: Высшая школа, 1981. - 194 с.

73. Новиков А.И. Семантика текста и его формализация / А.И. Новиков. М.: Наука, 1983.-361 с.

74. Новиков Л.А. Художественный текст и его анализ/ Л.А. Новиков. М.: Русский язык, 1988. - 256 с.

75. Откупщикова М.И. Синтаксис связного текста / М.И. Откупщикова. Л.: Изд-во ЛГУ, 1982. - 104 с.

76. Падучева Е.В. Высказывание и его соотнесенность с действительностью (референциальные аспекты семантики местоимений) / Е.В. Падучева. М.: Наука, 1985.-272 с.

77. Падучева Е.В. О семантике синтаксиса/Е.В. Падучева.- М.: Наука, 1974 292 с. Пешковский А.М. Русский синтаксис в научном освещении / A.M. Пешковский. -М.: Просвещение, 1956. - 511 с.

78. Пищальникова В.А. Проблемы лингвоэстетического анализа художественного текста / В.А. Пищальникова / Алт. гос. ун-т. Барнаул, 1984. - 12 с. Попов Ю.В. Текст: структура и семантика / Ю.В. Попов, Т.П. Трегубович-Минск: Вышэйшая школа, 1984. - 189 с.

79. Попов Э.В. Динамические интеллектуальные системы в управлении и моделировании / Э.В. Попов. М.: МИФИ, 1996. - 360 с.

80. Поспелов Д.А. Моделирование рассуждений / Д.А. Поспелов. М.: Наука, 1989.-215 с.

81. Поспелов Д.А. Серые и/или черно-белые / Д.А. Поспелов // Прикладная эргономика. Рефлексивные процессы: Спец. вып. -1994. №1. - С. 29-43. Поспелов Д.А. Фантазия или наука? На пути к искусственному интеллекту / Д.А. Поспелов. - М.: Наука, 1982. - 213 с.

82. Поспелов Н.С. Сложное синтаксическое целое и основные особенности его структуры / Н.С. Поспелов // Доклады и сообщения: Сб. ин-та рус.яз. 1948. -Вып.2. - С. 53-56.

83. Принципы и методы семантических исследований. М.: Наука, 1976. - 379 с. Пропп В.Я. Морфология волшебной- сказки / В.Я. Пропп. - М.: Лабиринт, 2001.-143 с.

84. Пропп В.Я. Структурное и историческое изучение волшебной сказки / В.Я. Пропп // Семиотика/Отв. ред. Ю.С. Степанов. М.: Радуга, 1983- С. 566-584.

85. Ревзин И.И. К общесемиотическому истолкованию трех постулатов Проппа / И.И. Ревзин // Типологические исследования по фольклору: Сб. ст. памяти В.Я. Проппа. М., 1975. - С. 77-91.

86. Ревзин И.И. Некоторые вопросы общей теории текста / И.И. Ревзин // Семиотика и информатика. — 1979. Вып. 2. - С.12-27. Реферовская Е. А. Лингвистические исследования структуры текста / Е.А. Рефе-ровская. - JI.: Наука, 1983. - 216 с.

87. Скороходько Э.Ф. Семантические сети и автоматическая обработка текста / Э.Ф. Скороходько. Киев: Наук, думка, 1983. - 217 с.

88. Скрэг Г. Семантические сети как модели памяти / Г. Скрэг // НЗЛ- М.: Прогресс, 1999. Т. III. - С. 259-302.

89. Солганик Г.Я. О способах объединения самостоятельных предложений в прозаические строфы (сложные синтаксические целые) на материале современной публицистики: Автореф. дис. .канд.филол. наук / Солганик Григорий Яковлевич. -М., 1965. -28 с.

90. Сорокин Ю.А. Текст и его пространство / Ю.А. Сорокин // Категоризация мира: пространство и время. М.: Наука, 1997. - С. 36-49.

91. Толстой JI.H. Что такое искусство?/ JI.H. Толстой // Собр. соч.: В 22 т. М., 1983.-Т.15.-С. 480.

92. Тураева З.И. Текст как высшая коммуникативная единица и его категории / З.И. Тураева // Коммуникативные единицы языка: Тезисы докладов. М., 1984. -С.129-130.

93. Фигуровский И.А. Синтаксис целого текста и ученические письменные работы / И.А. Фигуровский. М., 1961. - 129 с.

94. Харламов A.A. Технология обработки текстовой информации с опорой на семантическое представление на основе иерархических структур из динамических нейронных сетей / A.A. Харламов, А.Е. Ермаков, Д.М. Кузнецов // Информ. технологии. 1998, - № 2. - С. 26-32.

95. Чесноков В.Ф. Об одном подходе к извлечению из текстов фрагментов системценностей автора / В.Ф. Чесноков // Методолог, и метод, проблемы контентанализа: Сб. ст. M.-JL, 1973. - С. 97-98.

96. Чехов А.П. Дама с собачкой / А.П. Чехов. Электр, текст - 10 с.

97. Чехов A.C. Проблемы описания кореферентных и анафорических отношений вязыке: Автореф. дис. .канд. филол. наук / A.C. Чехов. М., 1979. - 19 с.

98. Чудаков А.П. Об эволюции стиля прозы Чехова / А.П. Чудаков // Слав.филология. -М.: Изд-во МГУ, 1963. Вып. V. - С. 5-28.

99. Чудаков А.П. Поэтика Чехова / А.П. Чудаков. М.: Наука, 1971.-281 с.

100. Чудаков А.П. Чехов. Единство видения / А.П. Чудаков // Слово вещь - мир.

101. От Пушкина до Толстого. М.: Соврем, писатель, 1992. - С. 105-131.

102. Шендельс Е.И. Некоторые проблемы грамматики текста / Е.И. Шендельс //

103. Современные зарубежные грамматические теории: Сб. научно-аналитическихобзоров/ Отв. ред. Е.С. Кубрякова. М.: ИНИОН, 1985. - С. 30-67.

104. Щерба JI.B. Языковая система и речевая деятельность / Л.В. Щерба. JI.:1. Наука, 1974.-427 с.

105. Эйхбаум Б.М. О прозе/Б.М. Эйхбаум: Сб ст. Л.: ХЛ, 1969. - 501 с. Эйхбаум Б.М. О литературе: Работы разных лет / Б.М. Эйхбаум. - М.: Сов. писатель, 1987. - 540 с.

106. Якобсон Р. Лингвистика и поэтика / Р. Якобсон // Структурализм: «за» и «против». М.: Прогресс, 1975. - С.183-230.

107. Якобсон Р. Доминанта / P.O. Якобсон // Язык и бессознательное. М.: Гнозис, 1996.-С. 119-125.

108. Ярцева В.Н. Лингвистический энциклопедический словарь/ Под ред. В.Н. Ярцевой. М.: Науч. изд-во «Большая Российская Энциклопедия», 2000. - 688 с.

109. ЛИТЕРАТУРА НА ИНОСТРАННЫХ ЯЗЫКАХ Agricola Е. Semantische Relationen im Text und im System./ E. Agricola. Halle/ Saale: Niemeyer, 1969. - 171 s.

110. Agrícola E. Vom Text zum Thema/ Probleme der Textgrammatik / E. Agricola-Berlin, 1976. Bd. XI. - S. 13-29.

111. Barthes R. Introduction à l'analyse structurale du récit / R. Barthes // Communications. Paris, 1966. - No 8. - P. 1-27.

112. Barthes R. La liguistique du discours / R. Barthes. In: Sign. Language. Culture. -The Prague. - Paris, 1970. - P. 580-589.

113. Dressler W. Einführung in die Textliguistik / W. Dressler. Tübingen: Max Niemeyer, 1973. - 134 s.

114. Eco U. A Theory of Semiotics / U. Eco. Indiana University Press, Bloomington, 1976. - 158 p.

115. Fauconnier G. La coréférence: syntaxe ou sémantique? / G. Fauconnier. Paris: Seuil, 1974.-223 p.

116. Generating narratives: interrelations of knowledge, text variants and Cushitic focus strategies/ Klaus Wedekind. Berlin: Mouton de Gruyter, 1990. - 727p. Greimas A.-J. Eléments de grammaire narrative / A.-J. Greimas. - Paris: Hachette, 1973.-243 p.

117. Hausenblas K. On the Characterization and Classification of Discourses / K. Hausenblas. TLP 1,1964. - P. 63-64.

118. Herwig R. "Kohärenz" in Textlinguistik und Fremd sprachenunterrichtmetliode / \¡ R. Herwig I ! Deutsch als Fremdsprache, 1984. H. 1. - S. 36-41.

119. Heß К. Maschinenlesbare Deutschen Wörterbücher / K. Heß, J. Brustkern, W. Lenders. Max Niemeyer Verlag, Tübingen, 1983 - 228 s.

120. Miller T. Visual Persuasion: A Comparison of Visuals in Academic Texts and the

121. Popular Press / T. Miller // English for Special Purposes. 1998. - vol.17. - № 1.1. P.54-68.

122. Oswald Th. La nouvelle / Th. Oswald. Paris: Hachette, Livre Supérieur, 1996. -186 p.

123. Pêcheux M. Analyse automatique du discours / M. Pêcheux. Paris: Dunod, 1969. -264 p.

124. Pfütze M. Zu einigen Aspekten der Textlinguistik als Teil einer theoretischen Grundlage für den Fremdsprachenunterricht. Eine Standortbeschreibung / M. Pfütze //Deutsch als Fremdsprache, 1985. H. 1. - S. 14-19.

125. Pposs посессивный тип Pcomm-cont коммуникативно-контактный тип Pdei - предикат речи Pmouv - предикат движения Pstat - предикат состояния

126. V- глагольный предикатор определенного предикативного типа

127. Vpr предикат, выраженный возвратным глаголом

128. Vrf предикат, выраженный рефлексивным глаголом1. Vmod- модальный глагол

129. Adjdescr адъективный предикатор

130. М\-первый актант, выраженный кореферентными наименованиями персонажей N2а —второй актант, выраженный кореферентными наименованиями персонажей N2c/a второй актант, выраженный одушевленным именем существительным или существительным конкретной семантики

131. N3C третий актант, выраженный существительным конкретной семантики щ Nab - существительным абстрактной семантики

132. S-субъектная позиция 0 нулевая субъектная позиция О - объектная позиция

133. S (Гуров) тот или иной персонаж (например, Гуров) в субъектной позиции

134. О (Гуров)2/з/4/5/б~ тот или иной персонаж (например, Гуров) и егокореферентные наименования в соответствующем падеже в объектной позиции1. АС- Анна Сергеевна1. Adv наречие1.e обстоятельство места

135. Dir обстоятельство места (направление перемещения субъекта) Temp - обстоятельство времени М - масштабЩ

136. Man обстоятельство образа действия Мп - средство передвижения Dim - обстоятельство меры ГО - графический образ R - радиус D - диаметр

137. Сг количество кореферентных наименований персонажей1. А 40:1 масштаб 40:11. Si предложение с индексом

138. Si+k— каждое последующее предложение1. С семантическая связностьп число пар ССЦ, семантически связанных между собой m - общая длина текста (количество ССЦ) Z - цепочечный коэффициент ф - функциональный вес