автореферат диссертации по филологии, специальность ВАК РФ 10.02.19
диссертация на тему: Квантитативный анализ лексической ассоциативности
Полный текст автореферата диссертации по теме "Квантитативный анализ лексической ассоциативности"
МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ им. М.В.ЛОМОНОСОВА ФИЛОЛОГИЧЕСКИЙ ФАКУЛЬТЕТ
?Г6 од
На правах рукописи
■^Р ЩОЬ
ДОЛИНСКИЙ Владимир Аркадьевич
КВАНТИТАТИВНЫЙ АНАЛИЗ ЛЕКСИЧЕСКОЙ АССОЦИАТИВНОСТИ
Специальность 10.02.19 - теория языкознания
Автореферат диссертации на соискание ученой степени кандидата филологических наук
Москва 1994
Работа выполнена на кафедре теоретической и прикладной лингвистики Московского государственного университета им.-М.В.Ломоносова.
- кандидат филологических наук, доцент А.А.Поликарпов.
- доктор филологических наук, ведущий научный сотрудник Института языкознания РАН А.И.Новиков; кандидат филологических наук, старший научный сотрудник ВИНИТИ В.Н.Белоозеров.
- кафедра общего и русского языкознания Российского университета дружбы народов.
Защита диссертации состоится " И" М&Л. 1994 г. на заседании специализированного Совета Д-053.05.16 при Московском государственном университете им. М.В.Ломоносова.
Адрес: I19899, ГСП, Москва В-234, Ленинские горы, МГУ, 1-й корпус гуманитарных факультетов, филологический факультет.
С диссертацией можно ознакомиться в библиотеке филологического факультета МГУ им. М.В.Ломоносова.
Автореферат разослан " $ " О.К'Ур^Л^ 1994 г.
Ученый секретарь специализированного Совета, кандидат филологических наук, доцент / '
А.А.Поликарпов
Научный руководитель Официальные оппоненты
' Ведущая организация
В диссертации проведено исследование ассоциативных характеристик лексики в аспекте квантитативной организации ассоциативных полей слов, а также связи этих характеристик с рядом других количественных и качественных параметров лексики и языка в целом.
Предметом исследования явились ассоциативные поля существительных и прилагательных русского языка, полученные в результате обработки материалов ассоциативных экспериментов.
Актуальность теш исследования связана с возрастающим интересом к "человеческому измерению" языка и лексики со стороны представителей общего языкознания, психолингвистики, квантитативной лингвистики, семантики, информатики, культурологии, лин-гводидактики и др. Материалы ассоциативных экспериментов используются для изучения лексической системности, семантической структуры слова, культурноязыковых архетипов, в лексикографии, диахронной лингвистике, герменевтике,
Вербальные ассоциации исследовались в работах Ф.Гальтона, Г.Кент и А.Розанова, Б.Скиннера, Дж.Диза, Л.Постмзна, А.Залев-ской и др. Роль и место ассоциаций на языковом уровне исследовались И.Бодуэном де Куртенэ, Э.Сепиром, их квантитативная организация - В.Хорватом, Ф.Хэйтом, Г.Аминевым, Г.Альтманом. В теоретическом плане тлеется много неясностей в определении онтологического статуса ассоциаций слова и их места в устройстве и функционировании языка. Исследования ассоциаций в русском языке проводились в ограниченном масштабе, при этом не ставились задачи широкого многоаспектного анализа. Особый интерес представляет ассоциативный потенциал языка современной молодежи, в котором происходят наиболее быстрые, наиболее важные для последующего развития всего языка изменения.
)
О Целью настоящей работы является квантитативное описание ассоциативных полей слов. Поставленная цель потребовала решения конкретных задач: I/ Выработать теоретические понятия и разработать адекватный математический аппарат, на которых базируется описание фактов. 2/ Выдвинуть гипотезу и представить систему аргументации, обосновывающие онтологический, эпистемологический и языковой статус ассоциативных полей слов. 3/ Представить ассоциативную модель языка и вывести аналитические соотношения, аппроксимирующие ассоциативные распределения /АР/. 4/ Собрать, обработать и представить в частотных списках ассоциации, полученные в экспериментах. 5/ Провести квантитативный анализ АР в разных аспектах, а также анализ связи параметров этих распределений с рядом других количественных и качественных характеристик лексики.
Материалом исследования послужили опросные листы, заполненные участниками ассоциативных экспериментов, проводившихся автором, а таюке литературные'источники с материалами других экспериментов. Общее количество ассоциаций, привлекаемых в работе - более 200000.
Научная новизна работы обусловлена актуальностью темы и расширением области исследований в квантитативной лингвистике. Она состоит: а/ в разработке понятия "ассоциативное поле слов"; б/ в применении оригинального проблемно-ориентированного математического аппарата; в/ в открытии и исследовании ряда новых квантитативных закономерностей в языке; г/ во введении в научный обиход лексико-ассоциативного материала, который в таком объёме и в таком аспекте не был предметом специального рассмотрения и может служить банком лингвистических данных для многих сфер приложения.
Практическая ценность работы состоит в возможности использования предлагаемых методов и выводов при изучении языка и его лексико-семантического уровня, при разработке систем искусственного интеллекта, экспертных систем, разного рода компьютерных программ, ассоциативных тезаурусов, в социологических, культурологических, психолингвистических исследованиях. Приложение к работе представляет собой готовый к изданию оригинал-макет словаря "Вербальные ассоциации московского студенчества"/чЛ; 100 стимулов, 1010 испытуемых/. Теоретические выводы и обобщения, сделанные в работе, могут быть использованы при подготовке общих и специальных курсов по квантитативной лингвистике, психолингвистике, лексикологии, общему языкознанию.
Диссертация обсуждалась на заседании кафедры теоретической и прикладной лингвистики филологического факультета МГУ. Основные положения работы были изложены в докладах на конференциях и семинарах по квантитативной лингвистике, статистике речи, междисциплинарным исследованиям текста, математической психологии /1985-1993 гг./, а также опубликованы в девяти статьях. Отзывы на работу опубликованы в Германии и США^. В рамках научно-исследовательской программы кооператива "Лингва" под руководством аьтора осуществляется проект создания и исследования базы данных "Московские студенческие ассоциации".
Текст диссертации включает следующие разделы: введение, четыре главы, заключение, список литературы, приложения. При-
I Altmann G. TWo models for word association data // Quantitative linguistics, vol.49, Glottometrika 13. Bochum: Brockmeyer, 1992. РЛ05-120. Rudakov S. Data from Russia // Physicians and computers, vol.II, IP 6, 1993. P.38-40.
ложения включают Списки ассоциаций трёх массивов /124 стимула, 109462 ассоциации/. В работе даны 58 графиков и 48 таблиц. Основной текст диссертации занимает 205 страниц, библиография расположена на 17 страницах и включает 415 наименований, приложения занимают 252 страницы.
Во Введении обосновывается актуальность теш диссертации, определяются цель и задачи исследования. Особенностью ассоциативного эксперимента является эмпирический и процедурный характер лингвистической информации, содержащейся в его данных, возможность повторения и верификации, что выгодно отличает данный метод, близкий к естественнонаучному, от наблюдений лексиколога, ограниченного интроспекцией. Главными квантитативными характеристиками ассоциаций являются их частота /?/ и ассортимент или А-словарь /Ь/. Качественный состав ассоциативного поля не измерим с помощью квантитативных параметров без привлечения дополнительных гипотез /семантических, грамматических и др./. Среди факторов, определяющих выбор испытуемым той или иной реакции, выделяются /помимо условий эксперимента и характеристик испытуемых/ собственно языковые факторы: а/ ассоциативность слова-стимула; б/ ассоциативность системно-языковая. Любому слову, языку, культурноязыковому сообществу соответствует общее и специфически-преломлённое строение ассоциативного поля в квантитативном измерении. Это строение накладывает ограничения на свободу ассоциирования, формируя надындивидуальные образы слов, связывая языковые единицы с внеязыковыми смыслами, обусловливая ассоциативностью лексики квантитативные параметры словаря и текста.
В первой главе - "Ассоциативный эксперимент и его исследования" - рассматриваются различные направления и главные тен-
денции в исследованиях вербальных ассоциаций. Хотя имеет место пересечение психологического и лингвистического терминов "ассоциация", в реальности мы имеем дело с единой ассоциативной природой любого аспекта значения слова. Слово имеет значение не само по себе, а только в силу того, что оно возбувдает определённые спонтанные психические образы, связывающие подсознание /неоязыковлённые смыслы/ и сознание /лексические ассоциаты/ носителей языка. Специфика ассоциирования, отражающая отношения слов и смыслов, состоит в использовании таких принципов /не входивших ранее в компетенцию лингвистики/, как' вызываемые словами наглядные образы, символы, эмоциональные состояния, предметные действия и т.д. Представляется важной постановка вопроса о содержательном осмыслении материалов ассоциативных экспериментов в рамках общего языкознания, где статус языковых ассоциаций остаётся весьма неопределённым и нуждается в экспликации как самостоятельный феномен. Изучение количественного аспекта ассоциаций на языковом уровне вливается в более широкий круг исследований в языкознании, объединяемых сегодня единым термином - квантитативная лингвистика. Это направление объединяет подходы в изучении языка, базирующиеся на параметрах количества и порядка. Ассоциации, ранжированные по частоте соответствующих реакций, полученных в эксперименте, дают распределения, обладающие специфической структурой. В главе даётся обзор и обсуждение формул, предлагавшихся разными авторами для аппроксимации АР. Различаются теоретические и эмпирические модели данных вербальных ассоциаций; распределения ассоциатов на отдельный стимул /индивидуальные/ и обобщения для большой группы стимулов в одном языке и межъязыковые /усреднённые/; частотно-ранговые /Г;,I/, частотно-спектральные /пг, ?/, словарно-спек-
тральные /Ьр, V/ и другие формы представления данных ассоциаций слов.
Вторая глава - "Теоретические предпосылки квантитативного анализа лексической ассоциативности" - посвящена рассмотрению нерешённых и спорных вопросов лексической ассоциативности,в рамках общелингвистического подхода. Естественный язык насквозь ассоциативен, пронизан смыслом, а достижение говорящими на нём понимания осуществляется благодаря осмыслению ассоциаций и ассоциированию смыслов. Ассоциативность языковых единиц, простота, естественность и свобода реализации ассоциативных связей - зто главное, что отличает естественный язык /и интеллект/ от искусственного. Каядое слово, воспринимаемое нами, приводит в возбуждение огромный механизм ассоциативных связей, формирующих образ слова. Структура связей не только извлекает из сигналов их признаки. Наедая единица связана с остальными, но сила связей неодинакова. Сила связей отрегулирована в1 языке по определённым точным правилам, обычно так, что те проводящие пути, которые часто активируются совместно, каким-то образом усиливаются. Поскольку ассоциативные поля слов образны, они логически не элементарны. Неопределённость семантики языковых единиц, их по-лисемичность и ассоциативность, легко схватываемая и "снимаемая" носителями естественного языка, но сопротивляющаяся логической интерпретации,- реальность, с которой столкнулись специалисты по информатике, искусственному интеллекту, программисты и пользователи ЭВМ в попытке перевоплотить естественный язык в электронную субстанцию. С другой стороны, компьютерное моделирование само по себе является мощным полигоном для проверок самых глобальных идей в теории языка, в особенности, в исследованиях, связанных с обработкой больших массивов данных. Среди перепек-
тивньк задач теоретической к прикладной лингвистики особую актуальность приобретают аналоговые, оперирующие образами, голо-графические и ассоциативные направления в языковом моделировании. Одни?/ из таких направлений становится "лингвистический ассошанизм" /ЛЛ/, раздел языкознания, ориентированный на изучение ассоциаций языковых единиц, полученных опытным путём, рассматривающий ассоциации слов, наряду со словарём и текстом, в качестве реального феномена, воплощающего языковую субстанцию. ЛА опираемся на богатую историография языкознания, в памятниках которого проблема ассоциации слов ставилась с древнейших времён до наших дней: от Платона и Чжуан-Цзы до экспериментов Ф.Галь-тона и компьютерных ассоциативных тезаурусов, полученных в результате обработки больших экспериментальных массивов данных. Идейные истоки ЛА - концепция языка В.фон Гумбольдта, труде И.А.Бодуэна де Куртенэ, З.Сепира,. Дк.К.Ципфа. Отмежёвываясь от редукционистских построений бихевиоризма и "теории речевой деятельности", ЛА основывается на экспериментальном изучении ассоциаций и использует подхода и методы квантитативной лингвистики. В центре внимания ЛА стоит слово, основная единица языка, "воплощённое" в своём ассоциативном поле - зримом и реальном образе открытого, иерархически упорядоченного и специфичного множества других языковых единиц, связанных с данным словом сетью ассоциаций, присущих индивидууму и языковому коллективу. Эмпирический аналог ассоциативного поля слова - это группа ассоциатов, полученная в эксперименте с коллективом носителей языка по определённой методике, позволяющей моделировать потенциальное теоретическое распределение и состав яьыкового ассоциативного поля слова. Ассоциативное поле слова раскрывает всё многообразие смысла, заключенного в нём и раскрывающегося
с разных сторон. Ассоциация возникает как реакция на Бнешний или шутрешшЯ стимул, как отпот на попрос, как прояснение, разгадывание и раскрытие смутного или скрытого смысла. Слова языка раскрываются в двух ипостасях: ассоциативно-символической, когда они являются ключами, открывающими вход в бессознательное, и знаково-дискурсивной, когда они становятся элементам:, над которши строятся логические-исчисления. Слово, исполненное глубокого смысла, хранящее духовный опыт поколений, носитель человеческой мудрости и Божественного Откровения
- не есть пустой элемент речевой синтагмы или грамматического анализа, заполняемый "значением", обусловленным контекстом.
ЛА исходит из способности слов быть, благодаря своему ассоциативному спектру, неоднозначными и формировать и направлять, благодаря силе ассоциативного потенциала и вопреки контексту, речевое русло. Слово - не хамелеон, а ледокол. Оно значимо не только в системе или контексте, "само его нахождение в контексте предполагает, что слово никогда нельзя отделить от той многозначности, какой оно обладает само по себе - даже если контекстом ему придан однозначный смысл"-'-. Жизненное единство языка складывается из тех образов его центральной единицы - слова
- какие оно обретает в философской, религиозной и поэтической речи. Знаковости и предикативности элементов высказывания, свя-г.янных нормой, противостоят окказиональность и персональность единиц лексики, связанных ассоциациями /ы особенности, сущест-иитольнгх прилагательных, благодаря именному - безглагольному - способу передач» внутреннего хода ассоциаций/. Язык, как
* Гадамер Г.Г. Актуальность прекрасного. »1.: Искусство, 1991. С. 59.
реальность семантическая и психофизическая, состоит из поля ассоциаций языковых представлений с представлениями внеязьпсовпми, свойственных его носителям. Пти продотаплинил, или обилии, объединяют элементы опыта, соотносимые с внеязьгковой реальностью, и единицы языка в целостные образования, удерживаемые посредством ассоциаций в более или менее долговременные единства, и субъективно передаваемые как смыслы. Способ ассоциации, основанный на принципе сходства, обслуживает универсальную потребность человеческого духа в осмыслении бессознательного, преодолении психофизической дуальности в реальности семантической, освещении и упорядочении тьмы и хаоса иррациональности светом и'порядком абстрагирующего разума. Вербальные связи, существующие в языке, потенциально бесконечны, открыты, по структуре они представляют собой сети иерархически упорядоченных, динамически изменяющихся, частично пересекающихся индивидуальных ассоциативных полей. Ассоциативное поле слова служит ключом к раскрытию его смысла. Оценить смысл - означает задать на континууме ассоциаций "весовую" функцию, аксиологический ранжир, чтобы придать различные веса его участкам, или ранжировать ассоциации по их силе, прочности, ценности или уместности. Взаимопод-страиваясь в процессах когнитивного и коммуникативного ассоциирования смыслов, формируя образы слов, "персональные" функции распределения ассоциаций перестают быть антагонистическими, • возникает "трансперсональная семантическая реальность" /по Бо-дуэну - "коллективная индивидуальность", по Вяч.Вс.Иванову -"общечеловеческая субъективность"/ языка, ассоциативное поле языковой единицы, как мера потенциальной возможности раскрытия смысла слова. Ассоциации между словами, структурируясь согласно определённому числовому коду, за счёт суммирования сходных и от-
сечения различающихся ассоциаций, превращаются в ассоциации слов^, становятся "языковыми значениями". Чтобы структура АР сохранялась во времени, поток ассоциаций в языке должен быть непрерывным. Для этого он должен зависеть от объёма лексикона, числа слов на единичном интервале частот и скорости дйи-
кения вдоль координаты частот. "Только то имеет право оставать-
о
ся в языке, что образует новый момент в его жизни". Языковая "энергейя" объединяет в ассоциацию слов мир внеязыковой, превращая егЬ в мир языковой. Так через ассоциируемые образы в сознании челозека раскрывается семантический универсум. Семантический облик слова может быть задан моделью, адекватной содержанию ассоциаций, вызываемых данным словом или вызывающих его. Это некий инвариант семантики слова, модификациями которого являются полученные экспериментально слова-ассоциаты, сопоставимые по содержанию. Представление о том, что одни и те же элементы используются для создания внешнего и внутреннего /психологического/ мира, позволяет существенно углубить понимание физического поля, включив в него психофизическую составляющую - ассоциативно-семантические поля слов, образуемые и питаемые энергией смыслов. Вместилищем смысла служит семантическая вселенная, соединяющая физическую и психическую реальность. Ключом, открывающим двери к смыслу, слухшт ассоциация. Для возникновения ассоциации ничто но имеет значения. Ничто не приобретает значения без ассоциации.
^ Ассоциации^ /спяпь мегкду племснтами/ пропращаются в ассоциа-
ЦИИ2 /группа элементов, объединенная на основании смысла/. ^ Гумбольдт В.фон. Язык и философия культуры. М.: Прогресс, 1985. С.365.
Предлагаемая ассоциативная модель языка сопоставляется с традиционными кодовой и организменной моделями. В устройство языка заложено напряжение, сопротивление, которое оказывают друг другу как коммуниканты, так и языковые единицы, обладающие неравновесным ассоциативным потенциалом. Ценность сообщения связана с передачей информации между непересекающимися частями смыслового пространства и сохранением информации в его пересекающихся /совпадающих/ частях. Примеры первой ситуации - речь переводчика, интерпретация текста, различия языков. Примеры второй ситуации - повторение Символа веры, речь психотиков, произнесение отрезка речи в унисон. Для обозначения этих ситуаций вводятся термины "гетерогенный" и
"гомогенный" языки. Их аналогами могут служить Вавилонское
I 2
смешение и Пятидесятничное объединение языков . Противоречивость коммуникативно-когнитивной ситуации, порождающая смысловую неопределённость сообщения, в ассоциативной модели объясняется тем, что исходной точкой языковой системы является не отдельное слово, единица кода или организм, а отношение минимально двух слов, не единичная субстанция, а поле ассоциаций, совокупность элементов языка, находящихся в отношениях разной степени связности. Разнообразие и энергетическая характеристика связей создают объёмный смысловой континуум, который постигается из отношений всех языковых единиц, слов, между собой и каждого из них к целому лекоикону. Воспринимая произнесённое слово, слушающий ранжирует ассоциации по их силе, прочности, частоте, т.е. по их ценности, вступает в со-
£
прикосновение с ассоциативным полем говорящего, с той духовной общностью, в основе которой лежит сходство образов и един-
1 Быт., II, 1-7.
2 Деян.,2,1- II.
ство смыслов. Прежде чем стать абстрактным символом, знаком, подчинённым логике высказывания, слово должно быть проинтерпретировано на уровне неосознанной языковой символики, объединяющей говорящих и слушающих сходством ассоциированных смыслов. Лишь тогда, когда ассоциативное поле слова, его образ, объединяет носителей ассоциаций, слово становится элементом языка, а носители ассоциаций - культурноязыковым социумом. Слово есть некий черпак, пригодный для зачерпывания смысла, единый для всех, но зачерпывающий не одинаково для каждого. Зачерпывание глубокого и ёмкого содержания, проникновение в смысл,.есть выход в пространство, колеблющееся "между" значениями, полное спонтанных ассоциаций, связываемых в узел единством слова. Смысл слова не представим как конечная, завершённая величина, как совокупность значений или признаков, как его общее или главное значение. Частотная /волновая/ структура ассоциативных полей слов, формируется за счёт фундаментального противоречия, характеризуемого как "скрывающе-раскрывакщий" статус слова по отношению к смыслам. Это противоречие проявляется в устройстве ассоциативных полей через действие двух тенденций: А/ тенденция к сохранению смыслов за счёт гомогенности распределения ассоциаций, ограничения их ассортимента, стабилизации коммуникативных условий, доминирования принципа наименьших усилий; Б/ тенденция к раскрытию смыслов за счёт гетерогенности распределения ассоциаций, расширения их ассортимента, изменения коммуникативных условий, доминирования принципа наибольших усилий. Стремление к гомогенности служит сохранению языка от естественных "шумов", разрушающих его строй. Стремление к гетерогенности сохраняет язык от преднамеренных попыток выхолостить его смысл. Обе тенденции носят антиэнтропийный
характер и служат защите языка от крайних проявлений "кодовой" и "организменнай" составляющих его строя. Эти тенденции задают частотную структуру ассоциативного поля: "голова" рангового распределения состоит из одной или нескольких прочных ассоциаций, а его "хвост" включает множество уникальных непрочных ассоциаций: первые играют роль социальных ограничителей' и хранителей смыслов, вторые - роль индивидуальных расширителей и открывателей смыслов. Так, в английском языке, 2% А-словаря /распространённые ассоциации/ покрывают 5054 А-текста, а 60Я А-словаря /уникальные ассоциации/ покрывают 8% А-текста. Подобная частотная структура ассоциативного поля, сохраняя устойчивость /для лексикона в целом/ и гибкость /для отдельных единиц лексики/, позволяет языку сохранять общеизвестные и раскрывать новые смыслы, обеспечивать взаимопонимание и субъективность носителей языка, поддерживать ыовдзы культуры и свободный поиск смыслов. Ассоциативное поле слов поддерживает и взаимно адаптирует дуалистически противопоставленные миры дискретности /слова и носители языка/ и континуальности /реальность физическая и психическая/. Ассоциация связывает языковые единицы друг с другом /ассортимент, разнообразие/ и формирует образ слова в соответствии со своей силой и прочностью /частота, ценность/. Ассоциативная модель языка ориентирована на квантитативную интерпретацию данных АЭ. Язык соотносится с числом, структурирующим ассоциативно-семантические поля языковых единиц. Число задает параметры распределений ассоциативно связанных слов, языков и "обобщённого" ассоциативного распределения языка как такового.
Лексическая система распределяет свои единицы по принципу согласованного оптимума. Одним из первых, магматически сформулированных, законов в гуманитарном знании является закон Ципфа, онтологические основания которого, несмотря на обилие гипотез, не вполне ясны. Обратившись к терминам аксиологии и психофизики, мы можем представить ряды внеязыковых и языковых образов, упорядоченных на соответствующих шкалах, как иерархию ценностей, связывающую физические и психические величины в континуумах стимулов и реакций. Тогда их соотношение может интерпретироваться как проявление психофизического закона Вебера-Фехнера:
дГ? , дБ
хвс<т
где Б - ценностная величина на шкале физических /внеязыковых/ стимулов, К - ценностная величина на шкале психических /языковых/ реакций. Слово рассматривается здесь /в отличие от реакции на зрительные, слуховые и др. ощущения/ как реакция, основанная на синестезии, т.е. "соощущении" ассоциативного происхождения. После интегрирования и преобразований по-луч&еи выражение для распределения языковых реакций на'данный стимул, ассоциированный с внеязыковыми представлениями:
1л Ъ~Ьс1п5 + у) 1л 5 .+ 1п К. Потенцируя, получим:
К .
Для измерения АР необходимо от ценностных величин К и Б перейти к эмпирическим частотам Г*и рангам 1 . Положим Г = Е и I »5"1. Тогда
р. я рт.; - (у +«<•!"'О (О
I I
ИЛИ, при у « I И <зС = О,
- хорошо известный классический вариант закона Цидфа.
Функция распределения рангов и частот ассоциаций носит ступенчатый характер /"гиперболическая лестница"/, выражающий дискретность слов и их "носителей". В этом смысле можно говорить о слове как о социуме, объединённом единым пониманием его смысла /лат. as-sociare - объединять группу/. В то же время, функция отражает континуальность физической и психической реальности в своём дифференциальном виде. В этом смысле единство шкал ценностей проявляется в том, что пороговое значение стимула есть значение, при котором появляется реакция. Тенденция А проявляется в росте у выше I, сокращении А-словаря L /¡тах/ и стремлении Fj к N /объём А-текста/. Тенденция Б проявляется в уменьшении у от I до 0, расширении А-словаря L, падении Fj и стремлении L к N. Параметр ос балансирует в окрестностях 0: при <=<.>0, распределение однородное, выпуклое; при ос<0, распределение неоднородное, вогнутое. Вырожденные случаи проявления указанных тенденций: /А/ Fj «N» L= I /единственная ассоциация на слово/; /Б/ Fj » I, L « M /все ассоциации - разные/.
Смысл формализованного представления языкового дуализма не сводится к обозначейию "пропасти" меаду унификацией и диверсификацией: формула /I/ выражает единство означаемого и означающего как ассоциированных смыслов на шкале ценностей S/R. С одной стороны, общий рост лексикона /в диахронии/ приводит к дифференциации индивидов, "некоммуникабельности", утрате универсализма. С другой стороны, ограниченность памяти, необходимость взаимопонимания, общность внеязыковой континуальной составляющей психики порождают догматизм и мифологию, отход от линейных текстов в пользу невербальных, образных средств
коммуникации. Информацию нельзя наращивать путём увеличения лексикона, не рискуя сделать её лишь достоянием посвящённых; в то же время, информацию нельзя ограничить и "загнать" в старые слова, не рискуя её уничтожить.
Формула /I/ для распределения ассоциаций на данный стимул может быть преобразована в формулу для "усреднённого" распределения в некотором массиве стимулов /2/. При у = I и ос=0
«.КГ1 ; 1Р= КТ-1 ; т,- К^+1)] , (2)
где К = N/5 . Обозначив п - натуральный ряд чисел /п = I = ?/, получим
Гп = Е„ -т„(п+0 . (3)
то есть, частота ассоциации ранга п равна объёму А-словаря с частотой не ниже И и равна числу п-разовых слов, умноженному нап+1.
В задачи квантитативного анализа ассоциативных распределений, помимо выявления индивидуальных и усреднённых характеристик, включены расчёты зависимостей между ассоциативными и другими системными свойствами лексических единиц. С этой целью предложены и обсуждаются гипотезы: а/ об ассоциативной частотно-спектральной природе полисемической .структуры слова; 6/ об аналогии структур распознавания акустико-фонетического и ассоциативно-семантического сигналов; в/ о динамике пересечения и сложения индивидуальных множеств ассоциаций в суммарное общеязыковое множество ассоциаций - образ слова /матрица частотных спектров/; г/, о модели элементарной спектральной "ячейки" ассоциативного .поля с применением энергетического "вектора" ассоциативного потенциала.
Исследования в квантитативной лингвистике позволили по-новому оценить природу системных закономерностей, носящих су-
щественно "недискретный" характер и плохо поддающихся описанию на неадекватном языке "алгебраической" модели. Вместе с тем, методы теории вероятностей имеют свои границы. Ассоциативные поля слов, как и многие другие объекты изучения в гуманитарных областях, в отличие от фундаментальной физики, слишком сложны и нестабильны для построения их моделей, исходя из удалённых от эксперимента общих принципов, характерных для основ физики. Здесь следует с насторожённостью относиться к привлечению сложной математики. Более уместны феноменологические модели, опирающиеся на измеряемые характеристики, нежели опора на принцип максимума статистической энтропии. Распределения ассоциаций не являются вероятностными в принятом смысле слова. Для ассоциативных полей неопределённым остаётся само понятие генеральной■ совокупности. Помимо бесконечной дисперсии, однородность ассоциативного поля и однородность культурноязыновой сообщности находятся в тесной взаимосвязи, и, определяя одно через другое, мы объясняем obscurum per obscurius. С увеличежеы размера пробы частотно-спектральное отношение не обязательно становится стабильным, кроме регулярно снижающейся степени разнообразия /в однородной группе/. Но то же разнообразие не является постоянным для разных языков. Пробы порядка 10^ описываются соотношениями, включающими параметры "насыщения" и гетерогенности /у и ос / распределений. "Демонстрируя наш формулы, мы не должны считать вопрос решённым статистически; наш формулы - не "статистические артефакты". На самом деле, то, что мы обнаружили такое близкое соответствие нашим формулам, чрезвычайно противоположно вероятностям"^.
1 Zipf G.K. Homogeneity and heterogeneity in language // The psychological records, 2, 1938. P.360.
Третья глава описывает материалы и метода исследования. Использовались данные трех основных и пяти дополнительных экспериментальных массивов. Эксперименты проводились с регистрацией первого и единственного ответа /дискретные ассоциации/. Приводятся описания массивов: характеристика стимулов, испытуемых, условий проведения экспериментов и методов обработки полученных данных. Основные массивы: массив В - 12 прилагательных протяжённости /6 пар антонимов/, 205 испытуемых-взрослых; массив Д - те же 12 стимулов, 200 испытуемых-дошкольников /6-7 лет/; массив М - 100 стимулов /65 существительных и 35 прилагательных/, 1010 испытуемых - студентов московских вузов.
Список стимулов массивов В,Д
высокий
низкий
широкий
узкий
длинный
короткий
глубокий
мелкий
далёкий
близкий
толстый
тонкий
Список стимулов массива М
деревня соблазн джазовый' чистота бассейн пионерский длина бессмертие белый шоиш' догма матерный' шомпол близкий доктор субботних' старый право' юбка' достоинство невесомый' клюква бог
паспортной гобой
шут владение' пристальная • сыр товар-краснорё» жизнь чекист' вкусный' примета' влюблённый митинг• калитка; ручной' хлеб смертельный демократ свеча' скупой цирк' глубина картйна' одинокий' райой черный'
истина день тонкий гражданин радость красный' нога' цветок' жестокий' религия паук высокий' кожа слава русский наличие рок адский чистка' бабочка' советский' диван' магический письмо длинный
библия менестрель' старый ! близость стол добрый ( духовка широкий' солдат I черепаха' внештатный мир теннис ¡октябрьский 1 вафля невезучий' бумага ■ тёлка всесоюзный префикс тонкость ' овощной буря ленинский углерод
Массив М охватывает первые 100 слов из 200, имеющихся в базе данных "Московские студенческие ассоциации". Состав списка определялся задачами многоаспектного междисциплинарного исследования, в частности, необходимостью взвешенной представленности разных зон лексики /полисемия, частота, семантические области и т.п./, учетом ранее полученных данных для проведения сопоставительных исследований /в том числе, межъязы-
ковых, диахронических/ и др.
Четвёртая глава - "Результаты исследования: обоснования, интерпретация, обсуждение" - посвящена квантитативному анализу экспериментальных данных в различных аспектах, исследованию связи ассоциативных параметров с рядом других количественных и качественных характеристик языковых единиц, языков, групп носителей языка, диахронических процессов. В ходе исследования получен ряд важных результатов, по-новому осмысляющих нерешённые и спорные вопросы лексической ассоциативности и роли ассоциаций слов в языке, а также обнаружены некоторые зависимости и закономерности", не рассматривавшиеся ранее.
1. Выведенная формула /I/ зависимости рангов и частот ассоциаций на отдельное слово-стимул /распределение Ципфа-Долин-ского/ продемонстрировала соответствие эмпирическим данным обследованиих массивов, включая данные Дженкинса и Постмэна*. Независимо от нас предлагаемая версия была экспериментально проверена немецким лингвистом Г.Альтманом, отметившим её наилучшую пригодность, по сравнению с ранее предлагавшимися формулами, для аппроксимации наблюдаемых распределений частот ответов
р .
в экспериментах . В теоретическом плане это подтверждает устойчивый характер ассоциативных структур лингвистических единиц, не зависящий от условий проведения экспериментов.
2. Выведенная зависимость частотно-ранговых, частотно-спектральных, словарно-спектральных распределений, усреднённых для массива стимулов данного языка /формулы /2/, /3//, показала наилучшее соответствие экспериментальным данным массива М. При помощи единой аналитической формулы удалось пред-
* Norms of worci Association. N.Y. - L.: Academic Press, 1970. 2 Altmann G. Op. cit.
ставить разные аспекты структуры усреднённого ассоциативного поля слова через натуральный ряд П , общий для частот, равно-частотных групп и А-словаря с частотой не ниже данной; а также единый параметр Q, связанный с размером пробы S . Изучение следствий из этой формулы может стать предметом специального рассмотрения в квантитативной лингвистике. Укажем на одно из них. Из формулы следует, например, что "среднее" слово-имя языка порождает такой ассортимент ассоциаций, какова численность языкового коллектива, объединённого самой популярной в нём ассоциацией на это слово.
3. Установлен ряд зависимостей в строении ассоциативных полей слов, не исследовавшихся ранее: а/исследованы интегральные АР, в которых каждое индивидуальное АР "свёрнуто" в точку с координатами log L ; log Fj, а все точки вынесены на одну диаграмму рассеяния в новой системе координат /билогарифмиче-ской/, подвергнуты регрессионному анализу и аппроксимировались прямой с тангенсом угла наклона (3 . Получены формулы ИАР для разных массивов; б/ исследованы закономерности релятивных час-
л
тот F = /Fj, позволяющих обнаружить закономерности образования гармонических рядов за счёт "стабилизации" параметра Fj и выявления локальных максимумов в массивах стимулов. Обнаружено, что релятивно-частотные закономерности действуют на уровне индивидуальных слов, тогда как частотно-ранговые - на уровне лексикона в целом; в/ исследованы 2-распределения для массивов больших объёмов, в которых частота ассоциации 1-го ранга есть сумма частот данной ассоциации "входящих" в данное распределение подмассивов. 2-распределения позволяют отслеживать динамику изменения параметров АР с изменением объёма пробы, повторении эксперимента, смене группы испытуемых и т.п.; г/ исследо-
ваны R-распределения для повторного предъявления стимула той же или другой группам испытуемых. R-распределения вводят фактор индивидуальности испытуемого в статистику АР; д/ исследованы матрицы частотных спектров, позволяющие в едином трёхмерном пространстве представить данные АР для двух /минимум/ разных массивов, не прибегая к понятию ранга при построении координат, а обращаясь к эмпирическим частотам 2-распределения /от F = 0 до Fj/ и "входящих"в него подмассивов. Матрицы спектров отражают степень гомо- или гетерогенности распределений.
4. Установлено, что обратно пропорциональная зависимость рангов и частот в АР достигается за счёт использования в языке фактора гомо-/гетерогенности психосоциальной составляющей языка - его носителей. Широкое варьирование частоты главной реакции Fj и умеренное варьирование А-словаря L имеет эффект в виде изменения однородности /кривизны/ АР. С ростом ассортимента ассоциаций возрастает однородность распределений, повышается прочность ассоциативных связей.,
5. Параметры усреднённого АР массива М: Fj = 145,06 /35-г--г-617/; L = 273,05 /1584-420/; rflj = 191,02 /1064-293/; у = 0,89 /0,384-1,24/; |2» = 4,63; среднее число случаев отсутствия реакций на данный стимул "-" = 94,14 /26-Г-367/. Значение параметра Q в формуле /2/ - 6,58.
6. Повторное предъявление стимула той же группе испытуемых, даже оставшееся незамеченным /стимул "старый" - № 17 и № 68/, вызывает значительно большие отклонения в распределении ассоциаций, чем при смене групп испытуемых; например, самая популярная реакция /"дед"/ в первом предъявлении остаётся первой и для массива в целом, самая популярная реакция при втором предъявлении /"новый"/ оказывается второй по частоте для мае-
сива в целом.
7. С ростом объёма пробы прирост одноразовых ассоциатов никогда не становится равным нулю, хотя постоянно падает. Даны результаты замеров частоты F* /накопленной/ для ассоциатов ранга i , при i = I, 2, 1С, 20 на пробах объёмом-5,- при S = 31 63, 126, 252, 505, 101I, 2022. Рассчитаны относительные часто ты F'= Ff/S для каждой пробы. На тех же объёмах пробы S рас считаны значения числа F-разовых ассоциатов при F = I, 2, 10, 20. Получены данные об объёмах A-словаря с пороговым значением частоты F = I, 2, 3, а также относительные величины Lp/S, IT)p/S, Частоты устойчиво стабилизируются в характерных для данного стимула значениях. Что касается частотных и слова ных спектров, то медленное снижение роста их абсолютных, и па дения относительных значений можно рассматривать как общую за кономерность в удлиняющейся серии испытаний.
8. Обнаружено /отчасти, подтверждено/ наличие зависимостей между ассоциативной характеристикой слова и рядом других его системно-языковых характеристик /частотной, полисемичес-кой, категориально-грамматических, категориально-понятийных
и др./. Наибольший A-словарь L вызывают стимулы высокочастотные, многозначные•/второй, значительно меньший максимум - в зоне достаточно редких и олигосемичных слов/. Для семантически однородной и узкой по частотному диапазону группы /массивы В,Д/ удалось выявить сепаратное влияние полисемии стимула. Дяя ряда стимулов показано, какие именно ЛСВ реализуются в ча стотном спектре ассоциативного поля /что поможет пролить свет на вопрос о том, в какой форме "хранятся" в психике носителя языка его единицы - лексем или ЛСВ/. A-словарь существительных несколько выше, чем прилагательных; абстрактных существа-
тельных - выше, чем конкретных /302 и 279/. Самые большие затруднения в поиске ассоциата носители языка испытывают при предъявлении редких и однозначных слов /и наоборот/.
9. Ассоциации детей 6-7 лет отличаются повышенной стереотипностью, меньшим ассортиментом и лексическим запасом. Для массивов Д и В получены сводные словари ассоциаций массива для реакций, вызванных не менее, чем 4 стимулами. Суммарная частота 20 самых распространённых ассоциаций у детей покрывает А-текста /у взрослых - 31#/. У детей преобладают синтагматические реакции, связанные с конкретно-образной основой смысла слова-стимула, выше доля фонетических ассоциаций и неверных истолкований. Взрослые дают значительную долю реакций абстрактными существительными, устойчивых оборотов и клише.
10. Сопоставлены данные русских массивов с двумя массивами данных, полученных Дк.Дженкинсом и Л.Постмэном в экспериментах с американскими студентами,/Миннесотские и Калифорнийские нормы/. Для массива M характерно большее разнообразие ассоциаций /!?= 273; LJ = 158; L* » 163/ и, соответственно-, меньшее значение первой по частоте реакции, весьма стереотипной у американцев /F* = 145; F/ « 304; ?[ « 221/. График АР усреднённого ассоциативного поля для английского стимула отличается большей крутизной уклона 0,89; 1,24; '¡fp =
= 1,01/. Те же соотношения наблюдаются в индивидуальных АР на параллельных словах-стимулах. Это согласуется с данными о статистике текстов-переводов, что связано, по-видимому, с типологическими особенностями лексической системы языков, соответственно, более синтетического и более аналитического строя.
11. Квантитативный анализ ассоциативных полей послужил средством выявления качественных семантических характеристик
языковых единиц и незаменимым источником информации о культур-ноязыковых реалиях, отражаемых в смысловых образах слов. Приведены примеры некоторых элементарных методов квантитативно-семантического анализа ассоциативных полей массива М с привлечением данных по 5 другим массивам /для сопоставлений в фило-и онтогенезе и разных языках/: а/ имена собственные в ассоциативных полях; б/ праобразы; в/ жаргонизмы; г/ "судьба" и "рок"; д/ "белый", "красный", "чёрный"; е/ "русский" и "советский" /конец 1960-х - начало 1990-х; студенты - дошкольники/; ж/ "вера", "belief" /русские - американцы/; з/ "демократ" /положительные - отрицательные коннотации/.
В Заключении сделаны выводы из проведённого исследования. Разработаны общетеоретические предпосылки лингвистического подхода к словесным ассоциациям, в рамках которого- обоснованы место, проблематика и значение лингвистического ассоцианизма -перспективного раздела общего языкознания и квантитативной лингвистики. Наиболее "узким местом" в информационной технологии являются лингвистические модели, что связано с противоречием между смысловым характером естественноязыковой информации и необходимостью формальной её обработки с помощью ЭВМ. "Смягчение" этого противоречия видится в разработке ассоциативной модели языка, развиваемой в русле ЛА. Сегодня органическое сопряжение результатов квантитативного исследования и моделирования ассоциативных структур с современными логико-лингвистическими и лингво-синергетическими представлениями является, по-видимому, одной из самых актуальных и сложных задач современной науки о языке. Без её решения невозможно достижение необходимой степени адекватности моделей естественного языка. Решение этой задачи немыслимо без привлечения средств количественной математики.
Опубликованные работы по теме диссертации:
1. Борода М.Г., Долинский В.А. Проблемы квантитативного анали-
за текста // Уч.записки Тартуского университета. Вып.745. - Тарту, 1986.
2. Долинский В.А. Ассоциативность: к основаниям вероятностной
лексикологии // Квантитативные аспекты системной организации текстов. - Тбилиси, 1987.
3. Долинский В.А. Распределение реакций в экспериментах по
вербальным ассоциациям // Уч.записки Тартуского университета. Вып.827. - Тарту, 1988.
4. Долинский В.А. Полисемия в словарях и в ассоциациях // Ак-
туальные проблемы компьютерной лингвистики. - Тарту, 1990.
5. Долинский В.А. Ассоциативные поля слов // Эвристические воз-
можности квантитативных методов изучения языка. - Смоленск, 1991.
6. Долинский В.А., Дубов В.А., Р&зуваев М.К., Рудаков С.С. Син-
дромологический подход к решению прикладных задач детской хирургии: теоретическое обоснование, достижения и перспективы// Вестник РАМН, В 8, 1993.
7. Долинский В.А. Ассоциативная модель коммуникации // Кванти-
тативная лингвистика и автоматический анализ текстов. Вып. I. - М.: Изд. Московского университета, 1994.
8. Boroda H.G., Dolinskij ,V.A. Problems of quantitative text
analysis // Glottometrika 9. - Bochum: brockmeyer, 1988.
9. Dolinsky V.A. A,model for word association //.European Mathe-
matical Psychology Group, 24-th Annual Meeting. - Moscow, 1993.