автореферат диссертации по филологии, специальность ВАК РФ 10.02.19
диссертация на тему: Лингвистические принципы тематической организации текста (к проблеме динамики текстовых структур)
Полный текст автореферата диссертации по теме "Лингвистические принципы тематической организации текста (к проблеме динамики текстовых структур)"
к.}
Московский ордена Дружбы народов Государственный педагогический институт 'иностранных языков имени Мориса Тореза
Специализированный совет Д-053Л7.01
На правах рукописи
СКИРДАЧ Ольга Максимовна
ЛИНГВИСТИЧЕСКИЕ ПРИНЦИПЫ ТЕМАТИЧЕСКОЙ ОРГАНИЗАЦИИ ТЕКСТА (к проблеме динамики текстовых структур)
Специальность № 10.02.19 — общее.языкознание, социолингвистика, психолингвистика
Автореферат диссертации на соискание ученой степени кандидата филологических наук
Москва —
1985
I
Работа выполнена на кафедре общего языкознания Московского ордена Дружбы народов государственного педагогического института иностранных языков имени Мориса Тореза.
Научный руководитель — кандидат филологических наук,
доцент О. Л. КАМЕНСКАЯ
Официальные оппоненты — доктор филологических наук,
профессор С. И. КАНОНИЧ; ,
— кандидат филологических наук, старший научный сотрудник Ю. В. ВАННИКОВ
Ведущая организация — Институт научной информации
по общественным наукам АН СССР.
Защита диссертации состоится « » ■ 1986 г.
на заседании специализированного совета Д-053.17.01 в Московском ордена Дружбы народов государственном педагогическом институте иностранных языков имени Мориса Тореза по адресу: 119034, Москва, ул. Метростроевская, д. 38.
С диссертацией можно ознакомиться в библиотеке Института.
Автореферат разослан «
// » Л 1986 г.
Ученый секретарь специализированного совета
И. Г. Ольшанский
/
, Реферируемая диссертация посвящена одной из важнейших пробен.'коммуникативной лингвистики - проблеме тема текста. Теорети-еско:1 -предпосылкой для проведения исследования поолужнло ело -ившевся в современной лингвистике представление о том, что язык ледует изучать, прежде всего, в аспекте речевой (кошушяатив-ой) деятельности, й этой связи проблема исследования текста как сноеной единицу коммуникации приобретает первостепенное знача -ие. В частности, значительное вшшадае уделяется изучению меха-игма передачи информации в процессе коммуникации.
Важнейшей особенностью всякого текста является линейность, о есть последовательная передача информации автором текста и акое жв последовательное восприятие информации реципиентом, Ли-ейная передача информации не только определяет внешнюю структу-у текста, но и отражает динамическое развитие семантической труктуры текста. Особый интереа при этом представляет иослёдо-анкв теш текста, поскольку тема является одной из основных ка-егорий текста и вопросы ее описания привлекает внимание как линг-исгов, так и литературоведов (С.Д.Кацнельсон, Н.А.Сяюсарева, .И.Москальсная, А..И.Новиков, И.В! Арнольд, Э.Агрйкола, Л.И.Ти-офеев и др.).
Актуальность диссертационной работа определяется тем, что . ней исследуются некоторые важные вопросы коммуникативной линг-истики, не нашедшие одноеначного решения, а именно, механизм ормирсвания тема текста в раьжая речешелительной деятельности, ематкчевкое развитие текста как результат динамического процес-а поровдения/восприятия текста и реализация этого процесса язн-обыми средствами.
Цель Исследования заключается в теоретическом обосновании,
-I -
* , 1 '
изучении и описании тематической организации текста и динамики ее развития. В соответствии с общей целью в диссертации ставят- [ ся и реиЕШгея сле.лувт.мз задачи; '
- разработать методику выявления кдичевнх слов в тексте } '
- последовать тематическую структуру теиста т основе <ша-лиза ключеик слов !
- разработать методику анализа динамики текстовых структур, и применить ее к и. следованию конкретных текстов ( ;
- проанализировать динамику тематического развития конкре!г-| иых текстов.
Научная новизна диссертации определяется тем, что предлинен нетрадиционный пода од н выявлению теш текста И описанию диняш* ки его тематического развития:
- формулируются принципы описания теш текста и динамики тематического развития текста на основе анализа частотных харак-
\ теристик слов в тексте }
- динамика текста исследуется на основе анализа текста в целок (рассказ, лекций), а не его патентов (сверх^разовые единства, сложные синтаксические целые и т.д.) }
- впервые формулируется подход к частотным показателям как специфической характеристике слова в коммуникативном Процессе ;
- устанавливается, что частота встречаемости слова в тексте определяется как частотой встречаемости слога в корпусе текстов, так и спецификой содержания конкретного текста \
- исследуется взаимосвязь частотных показателей слова с анализируемым корпусом текстов ;
- предлагается частотный показатель для выявления ключевых " К слов конкретного текста и формализованная методика выявления
ключевых слов с использованием принципа текстовой сетантизаиии.
Эти положения определяет теоретическую ценность работы, направленной на дальнейшую разработку проблем тематического развития '¡■«кота.
Практическая значимость диссертации состоит в возможности использовать полученные результаты в лекционных курсах и практически* занятиях по общему языкознании, в спецкурсах по киллуника-тишой лингвистике, з процессе обучения иностранным языкам, в том числе русскому как иностранному, а частности, для обосновании лексического минимуиа и подготовки текстового материала для еп> усвоения ; при аннотировании и реферировании текстов, для объективной оценки адекватности перевода, для стилистических исследований .
Материалом для исследования; послужили тексты научно-популярного жанра, в которых общее число словоупотреблений составило более 5 тысяч.
Осковша.: методом диссертационной исследования явился подход основанный на сужении корпуса текстов, подвергаемых статистической обработке-. Э предельнём случае объектом исследования становится е,типичный текст. В работе используется также комплексный семантический анализ структуры текста о привлечением статистической обработки лингвистических денных при установлении частоты встречаемости слова в тексте, табличное и графическое представление результатов исследования.
Структура работы. Диссертация состоит из введения, трех глав, заключения, списка литературы к приложения.
Во введении рассматривается общая проблематика- области исследования. На этой основе определяется цель и задачи диссертации.
- 3-
Обосновывается актуальность и новизна исследуемых вопросов.
В первой главе рассматриваются существующие подходы к опре-' делению теш текста в литературоведении и лингвистике, внутрен-
!
ние универсальные свойства текста, отражающие динамику развитид '
мысли автора и реципиента * Отмечается возможность изучения внут-.
!
ренних свойств текста на основе анализа языковых средств, используемых автором,'
Вторая глава посвяцона рассмотрению проблем, связанных с тематической организацией текста. Процесс вербальной коммуникации
I
(порождение текста автором и адекватное его восприятие реципиен-; том) осуществляется за счет актуализации единиц семантических полей коммуникенгов. Слово рассматривается как важнейший элемент вербальной коммуникации, свош значением связанное с зкстралинг-вистической реальностью, идентифицирующее объекты внеязыкового ряда, тем самым реализуя становление и развитие теш текста. Проводится анализ частотных характеристик слова, позволяющий еде -лать заключение, что частоту слова в тексте можно рассматривать как его одну из коммуникативных характеристик.
В третьей главе изучается тематическая структура текста, устанавливаемая на основе ключевых слов. Разработана методика выявления ключевых слов в тексте и предложен алгоритм анализа тематической организации текста. Методика установления ключевых слов использует принцип текстовой семантизации, позволяющий выявить семантические группы слов и их репрезентанты (потенциальные ключевые слова), на основе которых в дальнейшем определяются ключевые слова для данного текста. Глава включает анализ динамики подтем конкретных текстов.
Б заключении сформулированы основные результаты исгледова-
- 4 _
ния.
В приложении приведены структурированные тексты, алфавитно-частотный словник по каздоцу тексту, иллкстоации и таблицы, отражающие результаты анализа конкретных текстов. * и х
Изучение круга вопросов, связантшх с категорией теш текста, показало, что это понятие не имеет однозначного определения. В работе дается обзор ряда трактовок понятия теш, которые предлагаются разными исследователя,!!!.
Для исследования статуса категория тепы в лингвистическом аспекте определяется ее спеви^ика по сравнению с понятие» теми в литературоведении.
Тема в данном исследовании определяется как "смысловое ядро, концентрированное содержание текста" (О.И.Чоскальская, Э.Агрчко-?ла), как единство предмета изложения (П.Беллерт). Существуют двр основные группы способов означивания reí ja текста:
1) прямое (авторское) означивание. В этих случаях тепа текста в явном виде формулируется либо в заглавии, либо в самом тексте ;
2) непряное (косвенное) означивание, которое, как правило, знаменуется увеличением сеиЕнтичесгсой нагрузки тех: янзденатель-ннх (ключевых) слов, которые наиболее полно выражают его тему.
Слово рассматривается в работе как элемент текста, с помощью которого автор реализует свои коммуникативные намерения,в том числе и экстралингвистические.
Нельзя сказать, что обращение к изучению слова началось лишь со становлением коммуникативной лингвистики. Слово всогда
- 5 -
привлекало внимание языковедов, их обращение к слову было связано не только с изучением его семантической структуры. Слово всец-j да было и продолжа т оставаться одшш из главных объектов изучения лексикология, фонетики, грвдматикм.
о
В агих дисцшлинах нашли сгракениа такие проблеш, как описание лекшгческого состава разных языков, изучение фонетической, морфологической и семантической структуры слова, его семантических потенций и т.д. Однако, еог.и тр&диидонныа задачи изучения слова определяются исследованием его как единица лексико-семан-тической сиетеш, то коммуникативная лингвистика по-новому под -ходит к проблема слова, в связи с чец ставятся ноше задачи его исследования.
Положение о том, 4.J слово является основным носителем семантики текста обосновывается теоретическими положениями, получившими разработку в трудах, как советских, так и з ару бегала язи-коведов (Г.В.Степанов, В.;.3,йф«унский, fc.С.Степанов, Й.А.Зишяя, И.И.Черншюва, Дд. Б.Смит, !1. Хишсдей и др.). Так, по taw та L.C.Степанова, отражение объективной действительности фиг.агруьт-ся как общественное; достояние именно в словах. При этом вално учитывать, что номинативной аспект слова предполагает наличие у него вдшт1фидарутмцей^функции, которая непосредственно связана с референцией. Объективная действительность, получажцая отражение в тексте, может быть представлена в виде некоторого количества объектов - "ситуативных рейерентов" (С.И.Канонич), какдай из которых получает свое наименование в соответствии с оСцей тематической линией развития.
С другой сторона, номинация тесно связана с комыушшацией,
то ость един)ланка обнаруживает определешшь коммуникативные
- 6 -
потенции. Слово и его значение коммуникативно по своей природе (В.Н.Комиссаров, Е.С.Кубрякова, И.И.Чердашова).
Слово, идентифицируя объект, о котором делается сообщение, тем самым реализует свои коммуникативную йушацп. Повседневный вербальный опыт показывает, что многие слова в тексте употребляются неоднократно. Поотог.'у у слова появляется одна из коммуникативных характеристик, которую оно приобретает лишь в тексте -его частота. 3 настоящем исследовании принимается следующая рабочая гипотеза - частота слова ( с учетом его семантических эквивалентов) свидетельствует о важности обозначаемого им понятия для данного текста, коррелирует с семантической (тематической) нагрузкой данного слога и может быть использована для определения темы текста и описания ее динамики.
Частота - понятие статистическое и поэтому существенно зависит от исходного массива информации, используемого для ее определения. В лингвистическом аспекте под исходной информацией понимается корпус текстов, применительно к которому определяются частотные характеристики. Если рассмотреть большое число текстов, которые репрезентируют все имеющиеся тексты данного языка, то на этой базе мокит быть построен частотный словарь данного языка. При рассмотрении текстов художественного, научного, публицистического и т.д. канра, строится соответствущий словарь художественного, научного или публицисигческого языка. Если еще более сузить корпус текстов, подвергаемых статистической обработке, например, внутри научного жанра рассмотреть подъязык какой-либо отрасли - подъязык электроники, биологии, химии и т.д., то на этой основе может быть построен частотны!', словарь данной отрасли,
В предельной случае изучение частотных характеристик слова мо.ает быть произведено на основе анализа единичного текста, что и было предпринято в предлагаемом исследовании.
Основное внимание уделяется в диссертации выявлению и анализу клшешх слов, которые несут основную семантическую (тематическую) нагрузку в тексте, обеспечивая становление и развитие теш текста, связывает отдельные текстовые структуры, создавая тун самый связность и целостность текста.
В лингвистике разработан цеякй рад методик установления основного содержания текста с понощыо набора ключевых слов. Б большинстве своем эти методики строятся на выведении прямой корреляции >леэду частотой встречаемости слова в тексте и его (>,:.кшти-ческоИ значимостью. Как правило, в основе таких методик лекит представление о том, что частота встречаемости слова в тексте * является определяыции фактором его тематического веса.. Данные М последних лингвистических исследовании показывают,* что высокая частота встречаемости слова в тексте не всегда может служить адекватшн критерием для выявления его ключевых слов. Это положение поолушло одним из отправных моментов для разработки в : диссертации новой методики установления ключевых слов. Для этой цели производится структурирование текста сначала на уровне предложений , а затем на уровне слов.
На уровне предложений компонентами структуры являются предложения текста, сегиепти и интервалы. Сегментом называется совокупность шомшх предложении в тексте. .Длина сегмента определяется количеством предложений, иходяицк в сегмент. Интервалом н^а.'.гасл'сл союкупность смежшх сегментов текста.
¡¡а уроше .слов производится объединение слов в сшантичес-
- а -
aje группы, осуществляется частотный анализ и составляется алфа-нгано-частотный оловнин, в котором указывается частота встречае-гасти слов в калвдом из сегментов текста, а тахока частота встре-(аемости кавдого знаменательного слова в теисте,
Произведенное структурирование текста служит для последующего описания динамики ключевых слов в тексте.
Для объединения слов в семантические группы рассматривается )азличные способы идентификаций ситуативного референта в тексте i на этой основе в диссертации предлагается принцип текстовой ¡еиаятизащи.
Под тексУОЕОй семантизацией поишается выявление таких язы-ювых средств* в частности, номинагшшх единиц, которые соотно-¡ятся о одним л тем же ситуативным референтом в тексте, обеспе-швая его однозначную идентификацию реципиентои.
Принцип текстовой семантизации базируется на теоретических юлоясниях, разработанных в советской лингвистике (Н.Д.Арутшова, ¡.И.Канонич, 0»М|Носкальокая), суть которых состоит в том, что 1демтифицируюп;ал функция слов Предназначена для выполнения двух ¡сновных задач: идентификации предмета относительно действитель-locTH й идентификаций предмета в тексте (указание на кореферент--юсть обозначающих один и тот же предает выражений).
На основании этого эксгралгагвистичесную ситуацию, получшо-туп отражение'а тексте, можно представить как состоянию из Некоторого количества объектов - ситуативных референтов, каждой из toTopux получает свое наименование в соответствии с общей тематической линией развития текста.
Простейшим случаем идентификации ситуативного референта и
)дним из средств досТжшшя семантической организации текста яв-
- 9 -
ляется лексический повтор. Так, в приводимом ниже тексте многократный повтор слота "до.тдъ" свидетельствует об авторской акцентуации внимания на опй*яга*рцсч обьт.ге. ти- самим слово "дождь" приобретает поилпошук' орнпнгичрогу!- <1шлтичес.тув) погрузку:
"Лег двадцать назад и Москве показывали так называемую экспериментальную, созданную только для опыта, картину о долще. Показывали ее работникам кино, так как думали, что обыкновенный зритель на такой картш.з будет зевать и уйдет из кинотеатра в недоумении. В картине был показан дождь во всем его многообразии. Дождь в городе на черном асфальте, дощь в лисие, йощь дневной и ночной, ливень и так называемый грибной дождик..." , ^
(К. Паустовский). '
Известно, однако, что многократное упоминание ситуативного референта в тексте достигается не только повторением одного и того же слова, но и употребление« разных слов, связываемых с описываемым ситуативным референтом. Ор. с выше приводимым примером -ливень, дождик. Наряду с лексичесюм повтором широко используется прономинализация, словарная и текстовая синонимия, употребление слов, ЕЫраиапЕ(их гиперо-гигюнимические отношения. Многократное упоминание объектов внеязыковой деПствительностн, которое достигается посредством словарной и текстовой синоншии, а также употреблением слов, выражающих гиперо-гипонимические отношения, в лингвистической литературе классифюзфуется часто как "гетеро-. номтоатизность" (Н.Д. Арутюнова).
Гетероноципативность является наиболее употребительным средством идентификации объектов экстралингвистичеекоГг реальности. Примером гегерономинативности служит следущео описание белого медведя: "Белый медведь, он же оикуй, наиболее известный из су- ТО -
хопутных улготных Арктики ... . Зверь могучий, самый силъшй на земле хивдпш, и ишнь его сама по себе удивительна".(И.Акимушин).
Кроме того, принцип текстовой семантиэацин учитывает еще один исключительно важный. критерий - критерий словообразовательной производности, В его основе яши идея, предлол;итоая Е.С.Ку-бряковоН, согласно которой, наличие в тексте нескольких производных от одного корпя является приемом, обеспечивающим проведение сквознрй теш через все произведение как его леГииотив. Исходная единица деривации оказывается в этом случае ключевым понятием, облегчающая понимание последующего текста.
Таким образом, в работе обосновывается нетрадициошшй подход к установлегаго юючевих слов в тексте на основе принципа текстовой сеыантпэации, который учитывает разнообразные способа про-явлешш идентифицирующей йункн^и олова и его ре;1еренциальше связи с объективной действительностью и тепой текста. Независимо от конкретного проявления все средства идентификации элементов вне-язнкового рада - 1)ленсический повтор, 2)проношшаллзация, 3)сло-варная синонпшя, 4)текстовая синонишя, 5)словообразование, 6)слова, выражающие гиперо-гипошмические отношения, связываит их с ситуацией, обеспечивая тем самым становление и развитие теми текста.
Применение принципа текстовой семантизации позволило структурировать ситуативный рес'ерент, описываешй в тексте, то есть каждый ситуативный референт репрезентируется в тексте в виде своеобразного семаычп/еского сгустка или семантической груш, которая представлена некоторым знаменательны.! словом. Таким зна-монательнш.1 еловой, именугчш в работе репрезентантом, мокет
стать один из членов дшюй семантической групгм.
- II -
В качестве репрезентанта выбирается, как правило, самое час тое слово, входящее в данную семантическую группу. Например, для следующей группы однокориеик слов: прятать (I), припрятать (I), спрятать (8), залрятнвание (I) - репрезентанте!.! избирается слово "спрятать", Имеющее большую частоту встречаемости в тексте "Память у птиц", приведенном в приложении к диссертации, чем все остальные слова, входящие в данную семантическую группу.
Однако не всегда репрезентантом семантической группы может стать самый частый ее представитель, В случае, если в состав семантической группы входит слово, обладающее невысокой частотой встречаемости в данном тексте, но оно носит обобв^ающий характер, то есть является гиперонимом для данной группы слов, то это слово также избирается в качестве репрезентанта данной семантической группы. Как например, для приводимой семантической группы репрезентантом избирается слово "суша", несмотря на то, что в тексте оно встретилось всего лишь один раз! суша (I), берег(З), остров (3), ыатерик (I), прибрежье (I).
Если ряд конспектов семантической группы обладает одинаковой частотой встречаемости в тексте, то в таком случае репрезентантом также избирается гипероним. Например, для группы слов: ученые (2), исследователи (2), экспериментаторы (2), психологи (I), зоопсихологи (I), биологи (I) - таким репрезентантом является слово "ученые".
Всякий репрезентант может быть рассмотрен как потенциальное
■ ключевое слово. Полный набор репрезентантов дает развернутое
представление о содержании текста. Однако поскольку речь идет о
том, какие репрезентанты важнее в тексте, то есть наиболее соот-
' ветствуют тематическому плану текста и оформлению его кемцуника-
- 12 -
тинного развертывания, то важным является установление частота встречаемости каждого из них.
Абсолютная частота встречаемости репрезентанта определяется путем подсчета абсолютной частоты встречаемости всех слов, входящих в каждую из семантических групп, на основе которых определяются репрезентанты. Так, в текста "Память у птиц" репрезентанту "тайник" приписывается абсолютная частота встречаемости равная 21, полученная-в результате суммирования абсолютных частст слов, вошедших в семантическую группу, представле!шую датжм репрезентантом?
запасы (4)
клад (2) гайШ1К (21)
склад (5) тайник (10)
Абсолютная частота встречаемости слова в тексте обусловлена ч$ак содержанием данного текста, ты. и частотной характеристикой Ьлова в области знания, к которой принадлежит текст. Поэтому для исюшчения"фонаУ создаваемого этой область» в диссертации используется относительная частота встречаемости слова в тексте, которая дает возможность определить слова, наиболее адекватно характеризующие тему текста у дифференцировать их от слов, свойственных данной области знания.
Иначе говоря, относительная (внутритекстовая) частота позволяет выявить слова, специфичные для данного текста. Определение относительной частоты слова в тексте производится по следующей формуле!
вЛтг) г^Су)
. 1- в .(у)
где - абсолютная частота встречаемости слова V в тексте
г
» о
с - о5щее число словоупотреблений в тексте ;
- частота встречаемости слова V в генеральной сово-
а
купности текстов " ;
С - общее число словоупотреблений в текстах данного жанра )
¿¿(у) - относительная частота или показатель специфичности слова у для анализируемого текста ^ ,
Относительная частота позволяет элиминировать влияние области знания на показатель специфичности слова для данного текста и показывает, во сколько раз чаще данное слово встречается в анализируемом тексте, чин в средней в генеральной совокупности текстов,представляющие данную область. Слова (репрезентанты),которые обладают достаточно высокими показателями специфичности (то есть имеют высокую относительную частоту), признаются югаче-Шй1 и, следовательно, характеризующим тему текста.
Анализ частот репрезентантов показывает, что высокие значения абсолютной частоты встречаемости неспецифичных для теш текста слов обусловливаются столь же высокими {значениями абсолютной частоты этих слов % генеральной совокупности текстов, характеризующих данную область знании.
Анализ текстовых частотных характеристик репрезентантов демонстрирует, что иногда встречается неключевые слова, которые, однако, обладают высокой абсолютной частотой встречаемости в тексте. Тематическая нагрузка каждого из она слов.устанавливается благодаря относительной (внутритекстовой) частоте данных слов.
В результате ряя репрезентантов оказывается в конце списка - 14 -
слов, расположенных но степени значимости для теш анализируемого текста, несмотря на то, что значения их абсолютной частоты достаточно высоки. Установление относительной частоты позволяет, таким образе?'.!, сделать вывод о том, что иссчегл нчняе для темы текста слова несут тгнимальнуи тематическую нагрузку, что соответствует низким значениям их относительных частот.
И наоборот, как показывают результаты исследования, в текстах существуют ключевые слова, которые по свое!! частоте встречаемости удалены от начала списка репрезентантов, однако, после установления 1И внутритекстовой частоты, приобретают высокий показатель специфичности для данного текста. Иными словами, такие репрезентанты имеют большую тематическую нагрузку в тексте и оказываются важными для передачи его теш, а потому они будут находиться я начале списка, отражающего относительные частоты репрезентантов.
' 1 'Итак, установление относительной частоты репрезентантов в анализируемых текстах позволяет отделить существенные, валнне для теш текста слова от несущественных.
Высокие значения абсолютной частоты встречаемости несущественных для теш текста слов можно объяснить теп, что оти слова вообще обладают высокой встречаемостью в текстах аногтзеруемой области знания, о чем свидетельствуют дшнне частотного словаря.
Условившись для включения в ключевые слова установить в качестве минимальной порогогой величины некоторое число <гС , сокращаем попадание в ключевые менее существенных для темы текста слов и получаем ограничений список репрезентантов. На основании этого в работе принимается следувщее определение ключевого слова:
ключевым для данного текста считается такой репрезентант, относите ль-ная .частота которого равна или п р е-восходитнекоторуй пороговую величин у УГ .
Порог ^г , допускаюв(ий вхокдение слов в список ключевых, ыокно варьировать (уменьшать или увеличивать), тогда полнота и точность отражения теш и подтем текста также будет меняться.
Анализ распределения ключевых слов в тексте показывает, что возмогши два случая такого распределения:
1) данное ключевое слово встречается во всех сегментах текста, то есть ни в одной сегменте относительная частота этого слова не равна 0. Такое ключеэое слово называется Непрерывным ;
2) в тексте есть сегменты, в которых дашое ключевое слово ' отсутствует, то есть его относительная частота а отом сегменте равна 0. Такое юпочовоо слово именуется дискретным/
Одним из вакнейших понятий для изучения распределения ключевых слов в тексте является понятие интервала непрерывности. Интервалом непрерывности для данного ключевого слова называется такой интервал, внутри которого относительна с частота зтого слова не равна 0, то есть не равна 0 ни в одном из сегментов, входящих в данный интервал.
Границаш (начало и конец) интервала непрерывности некоторого ключевого слова считаются игр вин и последний сегменты, входящие в 'да.пшЛ интервал. Из этого определения интервала непрерывности слг.'(уег:
I) » тексте могут бить ключевые ^лова, гагаоршлы п'"-прерив-
дк>сти котор:с< совпадают со веш тскстои ;
- 16 - '
2) в тексте встречаются ключевые слова, которые могут иметь »дан или несколько интервалов непрерывности.
Длину интервала непрерывности можно рассматривать в качесг-ie диагностирующего признака групп ключевых слов, характеризующих тему и подте:.е текста. Проведенное исследование показало, reo ключевые слова, интервалы непрерывности которых совпадают со зсем текстом или с большей (например, свыше 50Й) его длиной, мо-гуп быть интерпретированы как слова-идентификаторы теш текста, 1т структурированного текста это означает, что интервалы непрерывности ключевых слов определяющее тему текста, охватывают все ¿лл более половины сегментов текста. Ключевые слова, длина интервалов непрерывности которых составляет менее половины сегментов текста (менее 5СШ), характеризуют подтема текста .
Завершение подтем текста определяется окончанием интервалов непрерывности более половины ключевых слов, характеризующих эту годтену. Начало подтем определяется появлением интервалов непрерывности ношх ключевых слов, характеризующих очередную подтему. Иначе говоря, левой границей (началом) подтемы структурированного текста является такой сегмент, в котором монет быть констатировано появление интервалов непрерывности новых ключевых слов, относящихся к данной подтеме. Правой границей подтемы текста считается такой сегмент, в котором завершаются интервалы непрерывности более 50% ключевых слов, характеризующих данную подтему.
Однако в тексте можно наблюдать такие сегменты, которые являются зоной пересечения интервалов непрерывности ключевых слов, иденти^ицирукцих дие смежные подтемы, В таком случае ш говорим о нечетких, размытых границах подтем текста.
Установление групп клочевнх слов, характеризующих тему и - 17 -
и подтемы текста, диагностирующими признаками которых являются интервалы непрерывности ключевых слов, позволяет составить краткие рефераты. В таблице I приведены интервалы непрерывности ключевых слов текста "Вертикальный стадион". Ключевые слова, отражающие тему текста следующие! тренировка - оздоровительный -доктор - бег - нагрузка. Краткий реферат на основе этих слов: ДОКТОР об ОЗДОРОЫЯЕШЮЗ ТРЙИРОЕКЕ, при которой НАГРУЗКОЙ является БЕГ.
Выявленные в тексте подтемы представлены следующими ключевыми словами. Подгона I г тренировка - оздоровительный - бег - недельный - нагрузка. Краткий реферат: ДОКТОР об ОЗДОРОВИТЕЛЬНОЙ "М ТРЕНКРОНСЕ (БЕГЕ и ВДДЕЯШСЙ НАГРУЗКЕ). Подтема П: доктор - на- ! грузка - оздоровительный - тренировка - бег - танцы - скакалка. Краткий реферат: ДОКТОР о НАГРУЗКЕ при ОЗДОРОВИТЕЛЬНО!] ТРЕНИРОВКЕ в веде БЕГА, ТАНЦЕВ и СКАШКИ. Подтема Ш: тренировка - оздоровительный - этаж - лестница - нагрузка - доктор - недельный. Краткий реферат: ДОКТОР о ВДЕШЮЙ НАГРУЗКЕ при ОЗДСШЖГЕЛЬКОЯ ТРШРОШЕ на ЛЕСТНИЦЕ между ЭГАШШ.
Всякому тексту присущ рад универсальных свойств, важнейшими из которых являются целостность (интегративность), с одной стороны, смена подтем, отражающая дияадшку развития шелм автора, с другой.
Суть нонятия"иерархия", применительно к тематическому членению текста, состоит в том, что теп.', текста, являясь его семантической базой, разбивается на несколько Солее частных подтем,которые, в свою .очередь, могут состоять из субподтем, то есть подтем второго, третьего и т.д. порядке. В результате процесс раскрытия темы текста может бить представлен в виде иерархии подтем
-18-
Таблица I Интервалы непрерывности текста "Вертикальный стадион"
ИЯ Ключевые сегментация текста с/ = 10
п/п слова . "^п И о о С С4 с с* о-ОЗ ОЗ 04 ¡56 ¿>7 08 09
1. тренировка
2. танцы
3. оздорови-
тельный
4. скакглка
5. агая
6. бег
7. лестница
8. доктор
9. недельный 10. нагрузка
Иерархическая структура тематического членения текста «ь 1
I уровень , ПГ: (подтема) ^—
I
П уровень , (сусподтеш)
спг.
пг<
2 _,
ПТп
СПТр ,
О
и субподтем, последовательное появление которых в тексте дополняет, насыщает тему текста, позволяет более достоверно раскрыть ее. В качестве основного признака иерархии выделяются соподчиншл ность и самостоятельность отдельных подтем текста. Подтемы не обязательно подчиняются одна другой, однако в целом они взаита-обусловливают друг друга и служат одно!'! цели - распитию теш текста.
С понятием внутренней организации текста связано другое, ш> ( менее важное свойство текста - интеграция. Интеграция применит-з-ть-
I
но к тексту означает связность отдельных дифференцированных час- : тей текста (представленных его подтемами) в единую целостность, определяемую темой. Интеграция и иерархии, отражающие свойства механизма речешслительной деятельности коммуникантов, тесно связаны между собой. Висшш уровнем прояилешш интеграции является .кристаллизация теш текста. Единство теш держится на идентификации подтем текста, интегрирование которых обеспечивает целостность всего текста. В результате шгеграции подтем в последовательном раскрытии теш текста, создается единая смысловая нить, которая репрезентирует данное сообщение.
Иерархическая структура тематического членения тексте., рассмотренного примера ( см. таблицу I), включает три уровня. Построение иерархической структуры с большим числом уровней, предполагает снижение порога включения репрезентз.нтов в ключевые слова, что увеличивает их количество и, соответственно, количество субподтем и их уровней.
Интеграция подтем в единую тему проявляется в том, что слова, обзше всем (большинству) под;?;.;, вовли в характеристику там ' текста.
Тексту присущ динамический характер, который проявляется в взаимодействии подтем текста. С позиций автора тома текста предстает как концентрированное содержание, ядро будущего текста.Последовательное появление и развитие подтем направлено на развертывание этого ядра. Появляющиеся на разни участках текста подтемы как бы "высвечивают" каждый раз новую или дополняют утке описанную грань ситуативного ре^ернта. Каждое появление новой подтемн или наращивание свойств старой, раскрывает новый модус существования теш текста. Таким образом, процесс кристаллизации тепы текста происходит как цепь последовательных переходов от одного состояния текста к другому, с точки зрения автора, более завершенное. Именно взаимодействие подтем текста и последовательный переход от одной подтемы к другой создает динамическое развитие и единую целостность текста.
ц Говоря о последовательности подтем, мы не имеем в виду, что "■в процессе становления текста полностью закашивается развитие сначала одной подтемы, затем начинается другая подтема. Картина взаимодействия подтем, репрезентирующая динамику развития текста, представляется более сложной, чем просто появление одной, вто -рой, третьей и т.д. подтем. Хотя такая структура текста, в принципе, возможна, но чаще всего в реальннх текстах наблюдается "переплетение" или "внедрение" подтем. В тексте, как правило, можно наблюдать появление новой подтемы на фоне предыдущей. Появление новой подтема свидетельствует о тем, что раскрывается дополнительный признак описываемого объекта или экстрялиигвисти-ческой ситуации в целом. См. таблицу I.
Изучение рассмотренных свойств текста позволяет сделать заключение, что динамическое развитие текста является его вадппвд
- ¿1 -
онтологическим свойством, иначе говоря, динамику подтем текста следует рассматривать как способ существования теиста.
Как показало исслэдог^ше, иеаду ключевыми словами и подтема;, 31 текста существует тесная корреляция, отражением которой являются вариативные значения относительных частот ключевых слов. Увеличение значения относительной частоты ключевого слова свидетельствует об авторской акцентуации внимания на описываемом ситуативном. референте в том или ином сегменте текста. Вариативность значении относительных частот ключевых слов, отражающих динамическое взаимодействие подтем текста, кллмстрируется таблицей 2,
Таблица 2
Диняышса частот ключевых слов текста "Вертикальный стадион"
Sí.s Ключевые п/п слова
1. тренировка
2. танцы
3. оздоровительный
4. скакалка
5. этаж G. бег
7. лестница
8. доктор
9. недельный 1С. in грузка
_сегментация текста d ■ 10_
51 За Sb Sa S5 5б Si S в
4934 1824 612? 8982: 134ЗД 98S3 2193 1773 5Г45
- 299 2395 657 -
328 96 - 99- 299 430 292 236 215
- 2245 374 -
- - 153 220 178 162
75 320' IQ6 -
- 548 365 295 403
- 54й 5.98 - - - 463
- 80 - 124/л 24S- Тт 1096 806 537
1057 5-9J
493 547'
- 45©
- 608
Полученные в диссертации данные дают возможность сделать следующие выводы:
I. Слово - важнейший элемент вербальной коммуникации. Одной из функциональных характеристик слова является его способность формировать семантическую структуру текста на основе единой теин. Тематическая нагрузка слова в тексте объективируется через многократное его употребление или употребление его семантических -эквивалентов, Многократное употребление слова в тексте определяет его частоту как одну из шшукикативных характеристик слова.
Возможность идентифицировать один и тот яе объект экстраЛингвистической реальности, описываемой в тексте разнили словам, с одной стороны, а также наличие у слов оби;их семанигеских признаков - с другоИ, является Предпосылкой установления в теисте семантических групп. Выявление этих групп производится на основ? принципа текстовой семантиэацпи. Семантические группы являются основой для установления частотных характеристик тематических слов текста. ,
3. Значение абсолютной частоты встречаемости слова в тексте обусловлено как содержанием данного текста, так и частотно:! ■характеристикой слова в области знания, к которой принадлежит текст. Для исключения "фона" области мохно использовать относительную ( внутритекстовую ) частоту, которая позволяет выявить олова, характеризуйте тему и подтемы текста, и дифференцировать их от слов," наличие которых в тексте обусловлено ситьга текста
с областью знания.
4. Иктегративность текста, характеризуемая темой, динамика и иерархия подтем текста, отражающие речемислителькую деятельность автора, являются впетейюига своГтствэли текста. Г>ги слой- 23 -
ства отражает динамика ключевых слов, которая нскет быть исследована на основа сравнительного анализа относительных частот слов .текста.
к x ¡í
Основные положения диссертации отражены в следующих публикациях:
1. Роль ключевых слов в процессе контекстной секактизации.
- В сб. научных трудов ЩТ1ЩЯ ш. Ы.Тореза "Контекстная семанти-зация лингвистических единиц". Шп. 238, Ы., 1984. - 0,5 п.л.
2. Динамика развития теш в тексте. - В сб. научных тралов МП1Ш1Я им. L!. Тороэа "Лексико-^разеологическая система немецкого я',ш:а и ее реализация в текста". Ban. 232, li., 1984.- 0,5 п.л.
3. Коммуникативная роль слова в тексте. - Депонирована в ЙНИОН АН СССР. - Бюллетень "Новая советская литература'по общественным наукам. Языкознание", - М., 1965, № 6. - I п.л.
4. К описаний динамики тематического развития текста. -В сб. научных трудов БГУ им. 40-летия Октября, Уфа, IS85. -0 3 п.л. ( в печати ).
¡i од и. к г. очити \ ■' r'-'ISy V г. У п. и зд. л. Типография ШШ1Я ш.К.Торв8а
_(усл. п. л. vf- .5 _
Зак. ;Á." f ilan.9 —
?'Гир. /лТ> экз.
кап.