автореферат диссертации по филологии, специальность ВАК РФ 10.02.19
диссертация на тему: Моделирование порождающих семантико-синтаксических структур в языках различного грамматического строя
Полный текст автореферата диссертации по теме "Моделирование порождающих семантико-синтаксических структур в языках различного грамматического строя"
Направахрукописи
Силантьев Аркадий Николаевич
МОДЕЛИРОВАНИЕ ПОРОЖДАЮЩИХ СЕМАНТИКО-СИНТАКСИЧЕСКИХ СТРУКТУР В ЯЗЫКАХ РАЗЛИЧНОГО ГРАММАТИЧЕСКОГО СТРОЯ
Специальность 10.02.19-Теория языка
АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата филологических наук
Ставрополь - 2004
Работа выполнена на кафедре общего и славяно-русского языкознания Ставропольского государственного университета
Научные руководители доктор филологических наук, профессор
Грязнова Виолетта Михайловна
Официальные оппоненты
доктор филологических наук, профессор Чесноков Петр Вениаминозич доктор филологических наук, профессор Гусейнов Гарун-Рашид Абдул-Керимович
Ведущая организация
Карачаево-Черкесский государственный университет
Защита состоится 17 июня 2004 года на заседании диссертационного совета Д212.256.02 по присуждению ученой степени кандидата филологических наук в Ставропольском государственном университете по адресу 355009, г. Ставрополь, ул. Пушкина, д. 1-а, ауд.
С диссертацией можно ознакомиться в читальном зале научной библиотеки СГУ по адресу
г. Ставрополь, ул. Пушкина, д. 1 Автореферат разослан 15 мая 2004 года
Ученый секретарь
диссертационного совета,
кандидат филологических наук, доцент
Т.К. Черная
Общая характеристика работы.
В диссертационной работе сделана попытка обобщать определенный опыт в области построения моделей связи семантики естественного языка, представляемой в терминах глубинной структуры, и системы формообразования, описанной в грамматике нормативного типа, так, чтобы модель обладала свойством универсальности по отношению к языковой типологии. Такая программно-целевая установка определила необходимость рассмотрения на начальном этапе работы общей проблематики теории языка в поиске тех формулировок основных концепций, которые позволили бы выдержать разделение контенсивного и функционального аспектов содержания языковых конструкций на всех уровнях языкового отображения. Смешение этих аспектов выглядит совершенно неизбежным в концепциях классической парадигмы: влияние постулата произвольности языкового знака и постулата коммуникативной направленности речевого акта сказывается в том, что специфика выражения не объясняется из трансформаций - напротив, сами они формулируются, исходя из этой наблюдаемой специфики. Примером может быть сопоставительный анализ номинативной и эргативной конструкций предложения, при котором наблюдаемое различие в поверхностном уровне последовательно транслируется в глубинные репрезентации семантики и в порождающие механизмы вывода на их основе тех же поверхностных структур. Последние оказываются, действительно, моделируемыми, но унификация двух типологий не достигается. Возможность таковой обнаруживается в опоре на известные концепции Т.П. Ломтева, П. Хомского, А. Вежбицкой и И.А. Мельчука, в которых используется моделирование семантики фразы множеством элементарных предикаций. Такой набор предикаций свободен от формы поверхностной структуры, так как трансформации описываются не в терминах значений, а в некоторых, свободных от значений, но обязательных для языкового механизма, понятиях. Но как раз в роли механизма язык обладает таким обязательным свойством, как линейность, одномерность его образований; следовательно, индуктивные универсалии в порядке значимых компонент, рассмотренные в свое время Дж. Гринбергом в качестве важнейшего комплекса фактов для лингвистической теории, должны быть руководящим материалом в построении модели предположенного типа. В свою очередь, этот вывод помогает избегнуть неадекватной по отношению к естественному языку логизации - исходные элементарные предикации являются таковыми только в анализе, будучи по образованию констатациями совместного наличия, называниями комплексов черт языковой ситуации. Линейность формы выражения ведет к необходимости упорядочивания монем поверхностной структуры в результирующей цепочке. Предположением модели является условие повторяемости правил относительного упорядочения на основе наследования выбранного в начальном уровне принципа выбора двух позиций бинома характеризации, являющегося ядром как атрибутивной, так и предикативной группы. Встраивание третьей компоненты, в частности, объекта в предикативной группе, ведет к
ве значений, а только в силу ограничений линейной структуры. Конфликт разрешается добавлением новых значимых элементов, осмысляемых в описании как контенсивные; но унифицирующая установка модели помогает предположить в них исходные диахронически экстенсивные ситуационные признаки актантов. Подтверждение этой гипотезы достигается сопоставлением моделей синтаксических структур языков адыгской и индоевропейской семей с привлечением данных диахронии египетского языка.
В недавнем прошлом лингвист-теоретик вынужден был ограничиваться тщательным анализом языкового материала, не имея средств непосредственного наблюдения динамики глубинного уровня. Но теперь теоретическая лингвистика может обратиться к инструментальным средствам прикладной лингвистики, в частности к имитационному моделированию на базе компьютерных технологий и материалов корпусов текстов. При этом принципиальной основой в описанном выше круге проблем может быть принцип становления морфологических структур в результате закрепления синтаксических групп, эксплицитную формулировку которого дал, например, выдающийся теоретик и историк языка П.С. Кузнецов. Предполагая подобие динамики слов в корпусе динамике элементов смысла в индивидуальной речи, удается построить модельное представление динамики элементов смысла по отношению к выполнению условия линейности и стохастически определяемой организованности.
Актуальность работы. Бурное развитие прикладной и компьютерной лингвистики в наши дни является уже общеизвестным фактом: достаточно взглянуть в программы обязательных учгбных курсов студентов специальностей, связанных с обработкой информации, управлением, принятием решений, построением экспертных систем и т.п. В методической практике этих курсов преподавателю приходится иметь дело в первую очередь не столько с традиционным предметом классической лингвистической теории, сколько с непосредственной данностью объекта новой технологии - корпуса текстов. Этот объект легко становится предметом формального описания, представления и обработки в системах, располагающих достаточными техническими возможностями для того, чтобы корпус текстов рассматривать в качестве популяции его составляющих - текстов, фраз, словосочетаний, словоформ и т.д. Популяционный подход охватывает гораздо больший спектр явлений языковой структуры, чем традиционная лингвостатистика - на материале своего объекта, vo есть корпуса текстов, данный подход дает возможность полностью включить в наблюдение динамику наблюдаемой структуры. Сегодняшний уровень технической вооруженности не только научной лаборатории, но и учебной, аудитории вполне позволяют применить соответствующий подход в исследовании и практических разработках в области компьютерной лингвистики. Количество основополагающих работ, посвященных этой теме, на сегодняшний день уже достаточно велико; упомянем прежде всего обзорную работу «Современная американская лингвистика: фундаментальные направления», монографию А.Е. Кибрика, учебники А.Н. Баранова, ВА. Плунгяна, Р.К.Потаповой. В опоре на методологические и теоретические концепции
этой линии развития современной теории языка вполне возможно рассчитывать на научную состоятельность предпринимаемой здесь попытки решения некоторой частной задачи.
Особо следует отметить актуальность сформулированных выше проблем в региональных условиях Северного Кавказа, с его общеизвестным богатством разноязыковых и разносистемных устных и письменных традиций и средств внутри- и межкультурной коммуникации. Контактные и арсальные тенденции в диахронии, понимание которых существенно для адекЕ.атиой реконструкции исторических грамматик языков региона, находят естественное представление в рамках предлагаемых моделей. Научная новизна работы заключается в том, что:
1. Систематически на основе строгих формальных посылок рассмотрен структурный аспект проблемы описания и моделирования а области теоретических проблем типологической специфики языковых систем с помощью инструментальных средств прикладной лингвистики.
2. Предложены новые системы формальных грамматик для конкретного языкового материала языков абхазо-адыгской группы, ранее еще не бывших объектом изучения в рамках подобных систем.
3. Средствами моделирования решена проблема интерпретации различения типологических структур языков при единстве смысла; в частно -сти, теория эргативной конструкции в адыгских языках представлена в виде эксплицитной порождающей схемы, основанной на одном порождающем правиле, в отличие от традиционного описательного варианта, где наличие двух независимых правил необходимо.
4. Сформулированы принципы соответствий, позволяющие использовать материал типологического сопоставления различных языковых систем в качестве модели диахронического сравнения этапов развития одной и той же либо родственных систем. В частности, проблема эргативного либо активного строя праиндоевропейского языка (по данным реконструкции) получает новую трактовку и модельное разрешение: на основе уравнивания функциональных значений в схемах порождающих глубинных семантико-синтаксических структур диахронически снимается различие морфемы *-т в роли показателя субъекта среднего рода и в роли объекта прямопереходного действия.
5. В экспериментальной части работы на материале представительных корпусов текстов показана выполнимость выдвинутых предпосылок, служащих методологической основой формальных постулатов, введенных в качестве аксиоматического базиса модели.
Объектом диссертационного исследования, таким образом, явились компоненты структуры смысла и структуры содержания высказывания в их инвариантном относительно языковой системы представлении, а также системы соответствий между специфическими для сопоставляемых языков реализациями этих представлений.
Предметом исследования явилась модель универсализирующей системы соответствий в терминах языковой прагматики, прослеживаемая на материале корпусов текстов языков различного строя и взаимодействие семанти-ко-синтаксических структур различных типов в этом материале как в синхроническом аспекте - в тексте, так и в диахронии - в типологических системах различного строя по данным реконструкции.
Цель диссертационной работы. Цель настоящей работы состоит в формулировке основных положений модели порождающего типа, дающей возможность унифицированного описания порождения определенных структур поверхностного уровня фразы в различных системах языковой типологии на базе единой семантико-прагматической глубинной структуры. Для получения достоверного и адекватного предмету исследования первичного мате-pиалa потребовалось прежде всего исследование стохастической динамики составляющих корпусов текстов средствами современной компьютерной и прикладной лингвистики и ее математического обеспечения в аспекте основных предпосылок конструируемой модели. Эта подцель определила первую задачу работы - формализацию описания и преобразований структур данных, получаемых в качестве первичного материала корпусной лингвистики - массивов текстов. Наблюдаемая в такой модели динамика объектов фиксируется в терминах формальной системы, которая, в свою очередь, дает возможность формулировки определенных гипотез, следствия из которых могут быть проверены в дальнейшей обработке исследуемого корпуса текстов. Рассмотрение таких гипотез с точки зрения их интерпретируемости в терминах традиционной лингвистики является следующей задачей исследования в связи с тем, как была в свое время определена профессором А.Н. Савченко (РГУ) исходная постановка научной проблема, в контексте решения которой проводились работы, положенные в основу диссертации. Он предположил, что типологический анализ двух различных систем грамматического строя - эр-гативной в абхазо-адыгских языках и номинативной в языках индоевропейской семьи - обнаружит единую систему глубинных характеристик структурирования линейной последовательности речевых единиц, вариации которой в связи со значением определенного «скрытого» параметра и дают различия наблюдаемого синтаксического аппарата. Естественной средой для типологического сравнения является узус языка, то есть практика речи; но фиксированная речь - корпус текстов — не может быть корректно обработана по отношению к так сформулированной задаче в опоре на описательную грамматику, индивидуализирующую язык. Фрейм типологического сопоставления обнаруживается только при рассмотрении массовой проблемы, которой в лингвистике является общая задача передачи инварианта ситуационно-обусловленного смысла сообщения при варьировании используемой типологии языка. Переход к массовой проблеме и означает принятие популяцион-ной трактовки данных наблюдения. Таким образом, исходная теоретическая задача конкретной области языкознания приводит к необходимости разработки средств модельного представления ее объектов и процессов для при-
менимости соответствующего инструментария прикладной лингвистики, вооруженной современными средствами информатики и статистики.
Итак, достижение поставленной цели предполагает решение определенных частных задач. В их числе:
1. Сформулировать систему основных постулатов модели глубинной семантической структуры языка, лежащей в основе всякой наблюдаемой языковой формы.
2. Построить интерпретирующий морфизм - отображение постулированной глубинной структуры семантики языка в синтаксическую структуру поверхностного уровня языка, регулярное по отношению к возможным вариациям правил упорядочения промежуточных результатов, что позволяет охватить единым алгоритмом различные языковые типологии и задать их в виде параметров отображения.
3. Построить формальную грамматику, описывающую фрагмент порождающей грамматики адыгских языков: формообразование глагола в области личного согласования его с другими членами предложения, а также интерпретировать с помощью этой системы порождающих выводов другие грамматические конструкции так, чтобы в результате получить модельную верификацию положений, сформулированных в п. 2 выше.
4. Построить типологический морфизм - отображение, связывающее интерпретированные в п.З на уровне глубинных структур схемы адыгской языковой системы и наблюдаемые (поверхностные) структуры индоевропейского синтаксиса по данным реконструкции.
5. Продолжить (расширить) типологический морфнзм п. 4 па материале подсистемы среднеегипетского синтаксиса предложных конструкций, переходящей в диахронии в подсистему префиксального словоизменения (в коптском языке).
6. Проиллюстрировать применимость модельных концепций в достаточно широкой области, для чего дать обзор возможных приложений ее в виде дальнейшего расширения типологического морфизма п. 5 на данные аустронезийских языков.
Методы исследования. Для моделирования объекта исследования применялись концепты теории формальных грамматик, а для моделирования его поведения как популяции - методы стохастического анализа. Конкретные значения тех параметров, которые оказались введенными в качестве единиц описания, были получены в экспериментах с образцами корпусов текстов. Для этих экспериментов использовалось программное обеспечение известных пакетов «MathLab 6.0», «STATIST1CA 6.0» и «Maple 7». Все подготовительные операции с массивами текстов производились с помощью оперативного набора служебных программ, составлявшихся автором работы применительно к используемым данным в среде системы баз данных «MAPINFO». С помощью этих инструментальных средств решались следующие задачи:
а вычисление статистических характеристик составляющих корпуса текстов;
b. кластеризация составляющих на основе вычисленных значений параметров;
c. моделирование языковой динамики на основе анализа последовательности кластеров в тексте как марковской цепи;
(i. моделирование формообразования и морфогенеза посредством рассмотрения относительных величин переходных вероятностей марковской цепи и экстраполяции обнаруживаемых тенденций. Теоретико-методологической основой диссертационного исследования явились положения сравнительно-исторической грамматики в их обобщении применительно к сопоставительному изучению языков различного строя, как они развивались в трудах школы проф. А.Н. Савченко, теория логической структуры фразы и смысловой структуры предложения, созданная профессором РГУ П. В. Чесноковым, типологические и теоретико-грамматические концепции И.А. Мельчука и А.Е. Кибрика, теория структуры и организации текста, начало которой положили труды проф. Вяч. Вс. Иванова, и разрабатываемая в работах проф. К.Э. Шгайн v сотрудников кафедр русского языка и общего и славяно-русского языкознания СГУ.
Достоверность и обоснованность результатов. Для исследований был использован материал аутентичных корпусов авторских текстов на различных языках, подготовленных в независимых авторитетных организациях - издательствах и центрах электронных публикаций. В качестве основных были использованы корпусы текстов поэта, члена группы ОБЭРИУ А.И. Введенского (русский язык, объем около 350 Кб); Ш. Бодлера, «Les Flcur du Mai» («Цветы зла», французский язык, около 170 Кб); Л. Кэрролла: стихи из книги «Сильвия и Бруно» и книги «Алиса в Стране чудес» и «Алиса в Зазеркалье» (английский язык; а также переводы на русский язык Н. Дсмуровой и В. Набокова, в целом около 550 Кб); P.M. Рильке, «Сонеты к Орфею» (немецкий язык, около 120 Кб); К. Мхце, Сочинения (абазинский язык, около 600 Кб); У. Шекспира: «Сонеты» (английский язык, около 100 Кб).
Статистические процедуры и процедуры моделирования, применяющиеся в работе, входят в комплексы программ научного назначения, вошедших в мировую) практику: универсальный математический пакет «MathLab» (использовалась версия 6.0), пакет прикладного статистического анализа «STATISTTCA» (версия 6.0), средства символьной алгебры и графики математического пакета « Maple» (версия 7), и средства работы с данными системы баз данных «MAPINFO» (версия 5).
Конкретные результаты расчетов процедур стохастического анализа и моделирования сопровождаются нормативными характеристиками степени достоверности, предусмотренными в соответствующих программных средствах. Постулаты, образующие основу строящегося в работе модельного представления, обосновываются результативностью модели в решении сформулированных выше целей и задач ее разработки.
На защиту выносятся следующие основные положения:
1. Глубинной семантико-синтаксической структурой является частичный порядок множества элементарных номинаций, связанных в парные комплексы локальной - глобальной составляющей так, что глобальная составляющая оказывается локальной на следующем уровне включений.
2. Языковое отображение смысла в поверхностную структуру рекурсивно независимо от языковой типологии: если окрестностная структура подцепочки текста заданного языка, переданная в категориальных единицах одного уровня, гомоморфна окрестностной структуре другой подцепочки, возможно представленной в категориальных единицах другого уровня, то вычисляющие эти цепочки программы в модели грамматики прсдставимы графами, изоморфными одному и тому же графу.
3. Формальная грамматика, описывающая морфологию спряжения адыгского глагола в области личного согласования и оснозообразования, задается одной аксиомой и одним правилом вывода:
Наполнение позиций в этих схемах происходит подстановкой элементарных единиц из конечного множества морфем, известных из описательной грамматики адыгских языков, которые в контексте предлагаемой модели получают новые спектры значений.
4. Схема (модель) эволюции глубинных семантико-синтаксических структур в диахронии, которая для случая сопоставления адыгских и египетских форм имеет вид
[Субъект М* Объект Р* Имя Действия => Субъект м Объект р Глагол.
5. Переформулировка схем пп. 3 и 4 применительно к фактам сравнительной грамматики индоевропейских языков (по данным реконструкции) позволяет утверждать действие той же модели синтаксически обусловленного закрепления соположенных единиц в составе переосмысляемой словоформы; в этом случае различение степени удаленности в алломорфах единой основной семантики в позиции Р* (см. схему выше), как это наблюдается в адыгских формах с 3-им лицом косвенного объекта, привело к внешней омонимии конструкций с именами «неактивного» класса в позиции субъекта и конструкций с прямым объектом.
Практическое применение результаты работы находят в дальнейшем развитии методик описания (с помощью порождающих грамматик предложенного типа) оригинальных и специфических конструкций разносистемных языков, что позволяет установить нозые связи и факты, не обнаруживаемые без их использования. Реальное поле приложений в этой области действительно весьма обширно ввиду возросшего во всем мире с развитием компью-
терной лингвистики интереса к конкретным особенностям типологии отдельных языков с точки зрения универсализирующих принципов интерпретации. Отметим, что и факты хорошо изученных и описанных языков, таких как греческий и латинский, получают новую интерпретацию в таком аспекте. Параллели классических и новых младописьменных языков в области глубинных порождающих структур имеют большое значение в практической методике преподавания лингвистических курсов как прикладной, так и традиционной тематики.
Реализация результатов. Методические установки и формальные средства описания и моделирования, развиваемые в работе, применялись в учебных и научных проектах, выполняемых на переводческом факультете СК ГТУ как автором работы, так и студентами, работающими под его руководством; результаты этих работ были предметом публикаций в сборниках материалов ежегодных региональных научны к конференций профессорско-преподавательского состава, студентов и аспирантов СК ГТУ в 2001-2004 гг., в «Вестнике СК ГТУ», № 1 (7) за 2003 г.
Апробация работы. Результаты работы докладывались в форме докладов и выступлений на международных конференциях в Институте языкознания АН СССР в 1977 г., в Институте языка и истории АН Абхазской АССР в 1977 г., в Пятигорском лингвистическом университете в 1998 г., на международных конференции в Майкопе, Нальчике, Черкесске в 1997-1998 гг., в Ростове-на-Дону, в СГУ в 2003 г., на ежегодных региональных научных конференциях в СКГТУв 1999-2004 гг.
Публикации. Методика и результаты диссертации составили предмет 10 статей в сборниках научных трудов и 10 тезисов выступлений на научных конференциях.
Структура и объем диссертации. Работа состоит из введения, трёх глав и заключения. Список литературы включает 154 названия.
Краткое содержание работы.
Во введении обоснована актуальность темы диссертации, сформулированы цель и задачи работы, ее научная новизна, практическая значимость результатов, указаны основные положения, выносимые на защиту.
В первой главе на базе анализа предложенных в отечественной и зарубежной научной литературе подходов и методов моделирования смысловой структуры предложений естественных языков проведено обоснование целесообразности выбора начальных постулатов строящейся модели ввиду ее специфических целей, сформулированы задачи исследования. Дан обзор содержания результатов типологических исследований в области языковых универсалий, ставших уже классическими, но до сих пор не получивших систематического представления в развитых исчислениях типа формальных грамматик. Предложена теоретико-категорная трактовка основного отношения «Смысл-Текст», являющаяся методической основой последующих шагов исследования: язык определен как функтор из категории смыслов в (малую)
категорию текстов. Это определение полностью согласовано с традиционным для теории формальных грамматик пониманием языка как выделенного множества цепочек над заданным алфавитом символов: последнее есть проекция первого при проектировании по координате смысла на координату текста.
С точки зрения специфики языка как функтора именно линейность его области значений должна быть определяющей для многих искомых параметров его структуры. Множество решений для каждого из таких параметров может состоять более чем из одного варианта. Их перечисление, собственно, и составляет решение определенной задачи либо теоретической проблемы типологии языка вообще (абсолютные языковые универсалии традиционной лингвистики), либо наблюдаемых языков (статистические универсалии и языковые законы для того или иного вида системных зависимостей различного рода - по генетической, ареальной и т.п. связи). Универсалии формулируются в виде не простых констатаций фактов, а как условные предложения с антецедентом и консеквентом, например: если в языке объект действия предшествует глаголу, то придаточное предложение в нем присоединяется к главному служебным словом, занимающим конечную позицию в этом придаточном. Это утверждение можно представить схемой ОУ => где О — позиция объект?, позиция глагольной формы, а подчинительные слова наречного характера, занимающие конечную позицию в своей синтаксической группе.
С точки зргния методики построения модели приведенное правило означает системность грамматики в смысле наличия в ней связей закономерного характера между различными уровнями порождаемого ею текста. Использование определенных порождающих правил, то есть некоторой подпрограммы вычислений цепочки синтаксических составляющих, связано с обязательным использованием некоторых подпрограмм в другом месте процесса порождения результирующего текста. Поэтому естественным образом формулируется постулат рекурсивности языкового отображения смысла:
Если окрестностная структура подцепочки текста заданного языка, переданная в категориальных единицах одного уровня, гомоморфна окрестностной структуре другой подцепочки, возможно представлен-1 ной в категориальных единицах другого уровня, то вычисляющие эти цепочки про1раммы в модели грамматики представимы графами, изоморфными одному и тому же графу.
Далее рассмотрен вопрос об основном понятии формальной модели структуры языка. На основании разбора и анализа концепций, представленных в этой области, сделан вывод, что действительно сущностной характеристикой языка может быть структура матроида, лежащая в глубинной основе каждой его единицы. Матроидом М=(Е, Е) называется конечное множество Е и семейство его подмножеств £, называемых независимыми, такое, что выполнены три аксиомы: Ам1. Пустое множество входит в Е.
Ам2. Если А входит в 2! и В есть подмножество А, то В входит к. Г.
АмЗ. Если А и В входят в I и мощность В больше мощности А, то существует такой элемент .V в дополнении к А в составе В, что объединение А и
этого элемента входит в Z.
Во втором параграфе первой главы общее определение матроида поставлено в связь с модельной интерпретацией содержательных лингвистических категории связей и зависимостей в составе языковой единицы того либо другого уровня. На материале примеров из языков индоевропейской и адыгской семей показано, что постулирование матроидной структуры всякого аспекта языкового содержания - семантического, синтаксическогс и прагматического - не ведет к потерг информации, задаваемой традиционной методикой описания, приводимой к графовому представлению.
Затем рассмотрена задача представления прагматического аспекта языкового знака - то есть отнесенности знака к контексту его употребления - в модели матроидного представления. Исходя из такого упорядочения основных терминов теории графовых матроидов, когда неопределяемым, первичным понятием формальной структуры являются ребра (а не вершины), вводятся модельные представления, позволяющие отразить все три аспекта языкового знака: его синтаксис, семантику и прагматику. Введгно понятие ко-пустого ребра, то есть ребра, которое не включено в порождающие списки вершин; таким образом ко-пустое ребро «не имеет» вершин, подобно тому, как в пустом графе при наличии вершин нет ребер.
Определгние ко-пустых ребер уточняется детализацией его для каждой из потенциальной пары его вершин. При этом возможны три варианта: левое ко-пустое ребро должно быть включено в порождающие списки своей правой вершины, а правое ко-пустое ребро, соответственно - в пэрождающие списки своей левой вершины. В этих терминах действительное ребро, то есть данное в наблюдении языксвое образование, двусторонне, имеет обе вершины. Ко-пустое ребро очевидным образом виртуально, но является полезной модельной реализацией и формализацией того, что обычно остается неформализованным в моделях языка- базиса семантической структуры.
Для использования определений односторонне ко-пустых ребер фиксируем в модели визуальное представление фудаментальной ситуации речи. Всякий языковой знак (фраза) в узусе есть одна из двух вершин графического представления языкового отображения, которое носит в англоязычной литературе выразительное наименование mapping - картирование:
Пусть далее всюду подразумевается такое условно фиксированное взаиморасположение объектов модели, когда внешняя ситуация речи (включающая в себя прообраз собственной семантики сообщения) находится слепа, а речевое образование (сообщение) справа. Тогда левое ко-пустое ребро представляет элементарную структуру языковой компетенции; правое ко-пустое ребро есть элементарная структура языковой прагматики.
Третий параграф первой главы диссертации посвящен дальнейшей детализации базисных структур языковых матроидов. Опыт нормативной грамматики является основой для введения в модель дальнейшего постулата: Принцип вершинного замыкания ребер. Ребра языкового мат-роида, имеющего более одного ребра, образуют вершины, причем так, что левым ко-пустым может быть не более одного ребра. Замыкание ребра на себя недопустимо. При этом правые ко-пустые ребра ненаблюдасмы.
Последнее означает, что все операции семантизации синтаксической структуры фразы должны быть связаны с некоторой, наблюдаемой в ее собственном материале либо в материале связной текстуальной последовательности, информацией. Принцип же запрета самозамыкания (то есть наличия петель в иллюстрирующем графе) очевиден из семантических соображений определения знака как двуплановой структуры. Известный еще из греческой филологии пример квазипарадокса - притча о критянине, делает наглядной эту онтологическую характеристику знака. В результате вывода в модельных терминах мы получаем формулировку принципа: «Языковой матроид, то есть матроид, где множество-носитель образовано двувершинными ребрами, есть глубинная структура фразы как факта речи, репрезентирующая все три стороны языкового знака в их конкретном фактическом единстве ».
В ходе дальнейших рассуждений этого параграфа выясняется, каким именно образом функционально-грамматически подобные системы согласования конкретных языковых систем могут отличаться в своем истоке значением структурного инварианта - количеством реализованных вершин простейшего языкового матроида, связанного с представлением структурно простейшей внешней ситуации с двумя денотатами. Минимальная не-монемная структура поверхностного уровня языка состоит из двух самостоятельных единиц. Пусть каждая наблюдаемая подструктура является элементарной, то есть непосредственно соответствует одному элементу носителя языкового матроида анализируемой фразы. В этом случае его ребра имеют в сумме четыре потенциальные вершины и успешно замыкаются по выведенному правилу. Но если в языке есть тенденция оставлять одно из ребер гевым ко-пустым в качестве «подразумеваемой» связки, она ведет к конфликту двух правил. На материале примеров эргагивного строя языков адыгской семьи и номинативного строя индоевропейских, близких к ним ареально, показано, как выявленное различие манифестируется в структурно неизоморфных, но функционально подобных системах синтаксического согласования.
Заключительный четвертый параграф первой главы диссертации посвящен демонстрации начальных возможностей модели в задаче сопоста-
вителыюго анализа эргативной и номинативной конструкции предложения. Эргативным строем называется такая грамматическая система, где субъект (подлежащее) предложения с непереходным глаголом (интранзитивным) оформляется тем же самым падежом, что и объект (дополнение) предложения с глаголом переходным (транзитивным). Таким образом, внешне система подобна такой, где либо все непереходные глаголы, в том числе и связка, относятся к категории инверсных, как в дативных оборотах русского языка типа «Мне дремлется», либо все переходные глаголы требуют пассивной конструкции, как в русском примере «Преподавателем читаются лекции и ведутся практические занятия». Однако соотношения форм в других категориях формообразования таковы, что нельзя ни эргатив - падеж переходного субъекта, ни абсолютив - падеж непереходного субъекта, считать каким-либо косвенным падежом, как это имеет место в дативной и пассивной конструкциях. Оба этих падежа вместе функционально равнообъемны единственному прямому падежу грамматической системы номинативного строя, где все глаголы в активном залоге одинаково требуют номинатива - «именительного» падежа субъекта, а объект переходного действия, так называемый прямой объект, оформлен специальным падежом, называемым в русской грамматике «винительным» или аккузативом. В адыгских языках - адыгейском, кабардинском, черкесском — показателем эргатива является суффикс имени -л», показателем прямого падежа или абсолютива-суффикс имени -р:
Щ1алэ-,и тхылъы-/? и-тха-щ Мальчик (эрг) письмо (абс) написал (трат).
Щ1алэ-р ма-тхэ Afa.ib4ii,<(абс) пишет (интранз/.
Образцом номинативного строя являются древние языки индоевропейской семьи - латинский, греческий, санс<рит. Сравнительная грамматика индоевропейских языков реконструирует для них общую форму номинатива с суффиксом имени -s и общую форму аккузатива с суффиксом имени -т, как в латинском:
Discipulu-s libru-w legit Ученик (ном) книгу (акк) читает (транз).
Discipulu-i venit Ученик (ном) пришел (интранз).
Для объяснения различения внешних структур фраз с переходным и непереходным предикатом необходимо учесть, что переход от глубинной семантической структуры к поверхностной, согласно концепции модели, происходит в соответствии с некоторым вариантом так называемого «жадного алгоритма» (J. Edmonds, 1971), дающего решение задачи построения множества, максимального по некоторому свойству и одновременно минимального в соответствии с некоторой оценкой веса. Для матроидов упомянутым свойством является независимость отбираемого множества, вес же отражает специфику задачи его нахождения. Известно, что матроиды являются как раз тем классом структур, к которым эффективно применим «жадный алгоритм». Этот факт завершает обоснование выбора концептуального базиса модели; для перехода к конкретному представлению на его основе механизмов языкового отображения в работе рассмотрены детали его реализации.
Признание предложения основной единицей языковой деятельности означает необходимость описания процесса структурирования предложения
в терминах, характеризующих само предложение. Этот вывод в модели фиксирует постулат рекурсивности. Следовательно, подструктуры предложения должны выделяться в соответствии с подситуациями исходной идеальной ситуации.
Подситуация, таким образом, — это ситуация, могущая быть выделенной из исходной как самостоятельная, но не образовываемая заново, хотя бы и из составляющих исходной. Отношение между ситуацией и её подси-туацией естественно трактовать и описывать как включение второй в первую. Назовём тс составляющие ситуации, которое образуют в ней какую-либо подситуацию, локальными. Составляющие, не являющиеся локальными в ситуации, назовём глобальными.
Очевидно, эти термины применимы в описании структуры любой ситуации, в том числе — рассматриваемой самостоятельно подситуации некоторой большей идеальной ситуации. Следовательно, описание структуры идеальной ситуации может быть продолжено описанием структур её подси-туации, вплоть до неразлагаемых далее составляющих в одних и тех же терминах локальных и глобальных составляющих. Структура смысла ( = структура идеальной ситуации) представляется в таком описании как иерархия включений её составляющих, причем максимальной составляющей, включающей все остальные, является сама идеальная ситуация.
В содержательном плане глобальные составляющие являются ситуационными «акциденциями» расположенных в них локальных составляющих, так как, относясь к ситуации в целом, глобальная составляющая характеризует всякую локальную именно как включённую в данную ситуацию. Наоборот, только общие характеристики локальных составляющих ситуации могут явиться глобальными её составляющими (в предельном случае — это просто нахождение в одной ситуации). Такая функциональная интерпретации отношения Глобальная составляющая — Локальная составляющая, полученная на основе соображений структурного порядка, позволяет полагать, что построение в терминах этого отношения структур идеальных ситуаций как структур смыслов отражает определённые черты деятельности субъекта речи по формированию этого смысла. Таким образом, это отношение моделирует элементарную логическую предикацию, элементарное суждение. Переход глобальной составляющей в локальную при включении в большую ситуацию соответствует переходу предикации в номинацию при включении предиката в другой предикат в качестве предикатного предмета. Возможный случай отсутствия локальных составляющих в идеальной ситуации интерпретируется как пуль-местная предикация, констатация (ситуации).
Так понимаемая структура включений составляющих идеальной ситуации моделирует схему иерархии мыслительных действий субъекта речи, обусловленную объективной структурой ситуации.
Способ соотнесения глубинной структуры включений глобальных и локальных составляющих (то есть универсальной формы смысла) с поверхностной структурой предложения задан соотношением, связывающим единицы мыслительной и собственно языковой деятельности:
Идеальная ситуация--> Предложение (*).
Внешняя форма предложения является образом формы смысла, и, раскрывая приведенное соотношение, получаем общую схему языкового отображения ситуационно заданной семантики, составляющей содержание речевого акт?'
Идеальная ситуация-»Предложение
I I (**)
Структура Подситуации-> Структура Синтагм
в которой термин синтагма принят для всякой группы составляющих плана выражения, дающей образ подструктуры смысла, то есть образ подситуации идеальной ситуации.
Сформулированный ранее в роли средства модельного аппарата постулат рекурсивности языкового отображения смысла теперь должен быть интерпретирован в совокупности всех возможных идеальных ситуации: Универсальная форма идеальной ситуации представляется конечной структурой включений (иерархией) её составляющих, причём всякий урсвень иерархии рассматривается при отображении (•*) единообразно, вне зависимости от собственной структуры составляющих, а только с учётом их ролей как глобальных или локальных составляющих.
Два денотата индуцируют в глубинной семантико-синтаксической схеме либо тройственную, либо четверичную структуру, как было показано выше. В языковой трактовке действие, которое дает в поверхностной структуре предложения оформленный глагол-сказуемое, в глубинной схеме является таким же денотатом, как и имя. Существует много языков, например, китайский (вэньянь, классический литературный язык), где глагол в функции личной (финитной) формы и имя действия не различаются ничем, кроме позиции во фразе. Поэтому можно полагать, что ситуация непереходного действия трактуется адыгской грамматической системой как схема с двумя денотатами - именем субьекта и именем действия, которые и образуют реальные вершины исходных двух ребер глубинного матроида; затем, в процессе порождения полной глубинной структуры, индуцируются и реализуются виртуальные ребра и вершины по четверичной модели. Очевидно, заполнение реализуемых позиций служебных, чисто грамматических составляющих, происходит согласно с определенной семантикой лексических основ (корней), дающих этимологию суффиксов -м и -р и префикса ма-. Эта семантика отражает связанность, близость двух денотатов в отображаемой ситуации действия. Префикс ма-, по данным описательной грамматики адыгских языков, оказывается более «близким» для субъекта непереходного действия, чем суффикс -р, поскольку возможны и даже нормативны случаи отсутствия последнего в устойчивых сочетаниях типа пословиц, в случае собственного имени в позиции подлежащего и т.д. Например, л!ы ма-к1уз и л!ы-р ма-к1уэ «мужчина идёт»', уиэм щ!ал? щЬхьащ «в дом вошел (некий) юноша» и у/о и щ1алг-р гцЬхьащ «в дом вошел (известный) юноша»', о щ/алэ стъагъу «я вижу юношу» и сэ
щ1алэ-р сольагъу «я виз/су юношу (определенного)» (кабард.-черк. яз); гъогу-рык/о гъогу тэнэрэп «путник на дороге не останется» (адыгсйск. яз.).
Близость субъекта и действия является определяющей для расстановки служебных, индуцированных показателей при «внедрении» в ситуацию с двумя денотатами - субъектом и действием - третьего, объекта.
Эта ситуация не рассматривалась выше непосредственно с позиции глубинной праструктуры матронда, так как она не является простейшей по количеству денотатов и, соответственно, действительных ребер матроида. В модели можно предположить, что языковой механизм работает в таком случае не непосредственно с самими ребрами, а использует сформулированный нами еще во Введении постулат ре курсивности. В данной конструкции «близким» к субъекту оказывается объект, а не глагол, в соответствии с пониманием переходного действия вообще как непосредственного воздействия, и поэтому между субъектом и объектом правилом грамматики предусмотрен показатель -м. Действие как бы отодвинуто своим объектом от субъекта на следующий план, между первым планом субъекта-объекта в их общей группировке и планом действия внедряется показатель этой отстраненности, формант дальнего дейксиса -р. В силу просодических условий первый формант синтаксической структуры (ГССС) в поверхностном ее представлении (ПССС) объединяется с предшествующим именем субъекта как энклитика, и те же морфонологические условия фразы, снова на основании принципа рекурсивности, стягивают дейктическое -р не с именем действия, к которому оно, собственно, относится в ГССС, а с именем объекта, по отношению к которому этот показатель оказывается тоже в позиции энклитики. Представим этот процесс схемой:
((Субъект: Л/*-*Объекг): /"''-»Действие) => Субъект+.н, Объект+/>. Глагол
Интерпретация ГССС этой схемы дается в виде условного дословно-пословного, то есть покомпонентного перевода:
Субъект взявший (держащий) Объект у(рядом с) Действия,
где выделены этимологизирующие соответствия основ Л/* и Р* (звездочка означает неуточняемую вокализацию). Например, егъэджак1уэ-м тхыпы-р и-р-чтащ «учитель книгу ему дач»; (кабард.-черк.яз); хьак1э-м к!пэ-р ы-лъэгъугъ «гость юношу увидел», л!ыжъы-м чъыгы-р ы-гъэт/ысыгъ «старик
nocaдил дерево» (адыгейск. яз.). В примерах из адыгейского языка видно, что сохранение в нем нейотированного варианта аффикса прямого объекта ы-для некоторых категорий имен может быть непосредственно следствием предложенной схемы.
В индоевропейском языке, по данным реконструкции, в отличие от адыгских с их схемой SOV: Субъект-Объект-Глагол, стандартным порядком слов является схема SVO: Субъект-Глагол-Объект. Таким образом, на основании вышеизложенных модельных соображений можно предположить, что оформление и закрепление синтаксических связей в праиндоевропейском
шло по образцу расширения первичной бинарной связи между именем субъекта и именем действия посредством расширения полученной ядерной синтагмы SV именем объекта:
При этом действие оператора глубинной синтаксической рекурсии (означенное в формуле запятой) - оказывается согласованным с определенными речевыми действиями — некоторой эмфазой имени объекта. Этот оттенок актуального речевого значения, индуцированный порождающими операциями ГССС, естественным образом ведет к маркировке соответствующего имени в ПССС, и опять-таки естественно появление дейктического значения прямого указания в качестве средства такой маркировки. В заключение разбором конкретно-лингвистического материала показано, что предложенная модель согласована с выводами сравнительно-исторической грамматики, основанными на обобщении индуктивных данных наблюдений. Например, условный перевод латинской глагольной фразы discipitl-u-s legit «ученик читает» как семантически притяжательной (посессивной) конструкции, но дативного синтаксиса вида
показывает согласованность ее с модельной гипотезой. При этом форма родительного падежа атематических имен оказывается построенной именно по такой схеме, как видно в вышеприведенном примере. Огласовка -i- в этом случае (потея ~ nomin-i-s) есть результат раздельной эволюции оформившихся подсистем двух представителей обособившихся из единой синтаксической схемы новой грамматической категории падежа. Пополненная схема с прямым объектом discipul-u-s libnt-m legit интерпретируется в предлагаемой модели как *discipvl-o se libro те leg-i-t «*ученчку эта книга вот чтение идет (относится)». Известная из сравнительно-исторической грамматики связь форманта с ближним дейксисом поддерживает построения модели.
Вторая глава диссертации демонстрирует применение базисной модели фразовой структуры к анализу развернутого предложения. В ее первом параграфе установлена единая схема префиксального формообразования глаголов, резюмированная в виде аксиомы и правила вывода формальной грамматики:
Использованные обозначения: Пред — глагольная основа; Лок — позиция локализатора, т.е. префикса, локализирующего направленность действия Пред; позиции префиксов, находящихся в отношении определения по содержанию к Пред; А — показатель актуализации. Всякая позиция, кроме Пред, может быть заполнена нулевым показателем. Актуализацией назван способ противопоставления форм настоящего времени формам не-настоящих времён и форм с направительным значением преверба формам с местным значением, посредством единообразной замены огласовки префикса в позиции Дет (в первом случае семантика префикса — личная, во втором — обстоятельственная).
Специально рассмотрен случай употребления эргатива в соответствии с глагольным префиксом -ры- (-р-) (так называемый префикс косвенного объекта). Он появляется прежде всего в трёхличных переходных глаголах, например, сы-р-йэ-т меня ему он даёт. Для них однократное применение правила вывода даёт общую модель:
Выясняется наличие в системе адыгских языков противопоставления совместной «точки зрения» 1-2-го лиц, являющейся актуализированной, нейтральной «точке зрения» 3-го лица. Это противопоставление отражается в соответствующем различении употребляемых в одних и тех же позициях глубинных структур формантов. В частности, форманты типа -р-/-ры-/-рэ-, как нейтральнее п этом смысле, противопоставлены актуализирующим формантам типа -Й-/-ЙЫ-/-ЙЭ-; ср. например, у-а-й-с-тащ «тебя им я дал», у-а• ры-й-тащ «тебя чм он дач» (каб.-черк. язык); къы-с-и-тыгъ «он мне то дат», сы-р-и-тыгь «он меня ему дат» (адыгейск. яз.).
Второй параграф второй главы посвяц.ен изучению возможности приложения использованной в работе модели к сопоставительному изучению индоевропейских и абхазо-адыгских языков. На основе анализа сформулированных в специальной литературе различных точек зрения и в споре на конкретные языковые факты сделан вывод, что комплекс глубинных сичтакси-ческих структур, связанный с реализацией так называемой абсолютной конструкции в поверхностном уровне (например, Ablativus absolutus в латинском, Geneitivus absolutus в греческом, Dativus absolutus в старославянском языках), имеет непосредственную связь с соответствующими комплексауи для конструкции эргативной.
В третьем параграфе второй главы рассматривается формообразование адыгского имени в системе эргативной конструкции с привлечением основных понятии, формируемых для теории интерпретации текста при модслиро-вании с помощью структурных схем. Для устранения амбивалентности синтаксической цепочки с именами двух денотатов (субъекта и объекта действия) языки аналитической типологии часто используют лексическую основу, имеющую асимметричную исходную семантику, глагольную, как в классическом китайском, именную либо наречную, как в индоевропейских языках. Подобная детализирующая лексемная основа (слово) оказывается в позиции перед объектом, а при дальнейшей потере им лексической семантики и переходе в разряд служебных синтаксических формантов в условиях отсутствия письменной фиксации речи, очередное поколение говорящих оказывается перед выбором его просодической трактовки либо как энклитики к имени субъекта, либо как проклитики к имени объекта. В первом случае выбор определяет возможное (в дальнейшей эволюции) становление послелогов и флексии падежа, но втором - развитие предложного управления и префиксации.
Схематически: a) JI¡ JT¡ JI¡ Jl¡ ф>Л}, либо, соответственно, б) J!¡ fl¡ Jl) означают исходные синтаксические позиции лексем, а . и n2_ суть два возможных варианта диахронического развития исходной лек-
семы Л2 в неустойчивой синтаксически позиции ее функционального использования. В итоге, с учетом конкретного языкового материала, предложена общая формула, моделирующая исторические сдвиги в поверхностном синтаксисе адыгских языков:
Субъект М* Объект Р* Имя_Дейатая Субъект м Объекту Глагол При этом морфемы -м и -р в составе конструкции мотивирсваны прототипи-ческой семантикой «рука» и «по направлению к», выводимой из материала описательной лингвистики абхазо-адыгских и связанных с ними ареально языков. Поскольку факты морфологии этих языков получают объяснительные модели, применимость исходных принципов и положений диссертационной работы подтверждается в расширенной области приложений. В качестве примеров особенно наглядны изученные Н.С. Петровским среднееги-петские конструкции, характеризуемые им как «обстоятельства образа действия со значением определительнэ-усилительной характеристики действия»: dd.tr! т 1р.1-г;.1п «да скажете вы изречением вашим», «глотает
он это глотанием». Оба форманта выступают в полном согласии с моделью в таких примерах, как iw.pt г М т г;.(п «вы скажете устами вашими», букв. «будет вам к сказанию с устами вашими». Пример г т/г т р; п[г А/у «чтобы завладеть этим богом старшим» иллюстрирует при этом как исходную систему конкретно-семантических сЕязей, так и функциональное расширение ее до включения произвольного объекта.
Третья глава диссертационной работы посвящена дальнейшему развитию модельных концепций и выяснению перспектив применения разработанного в ней подхода к вопросам типологии в рамках общей теории языка.
В первом параграфе третьей главы подробно рассмотрен фактический материал нового для отечественной науки содержания - описательная грамматика языка киривина (Kiriwina), относящегося к аустрочезийской семье и распространенного на островах Тробриана, входящих в состав Республики Папуа-Новая Гвинея. С точки зрения типологии СЛОВЕ, ЭТО ЯЗЫК агглютинативный; первый исследователь его, знаменитый польский этнолог Бронислав Малиновский, пишет об этом так: «различия в формах имен и глаголов выражаются просто посредством соответственно значащих частиц. Подлинная трудность этого языка не в сложности грамматического аппарата, но скорее как раз в чрезвычайной простоте его». Это последнее замечание объясняется фактом исключительно устного бытования языка, когда большая, если не большая, часть семантики фразы определяется через ее прагматику (контекст). Ввиду этого структура киривинского языка является хорошей иллюстрацией применимости основных положений модельного подхода, развитого выше. Так, В области морфологии глагола в киривинском языке формообразование лиц происходит префиксально, а множественное число отмечается суффиксом, что сразу делает эту систему важной сопоставительной единицей при изучении, например, аэхазо-адыгских языков. С другой стороны, глагольный префикс Ь- / Ьа- / Ьи- является модификатором, вносящим значение несовершенности действия, и, возможно, сравним с суффиксальными показателями инфекта в индоевропейских языках (напр., в латинском). К вы-
воду о близости киривинской типологии с индоевропейской приходит и современный исследователь этого языка Т. Щербовский. В то же время только применение модельного подхода, развиваемого в диссертации, позволяет провести комплексное сопоставление многофакторного характера.
Во втором параграфе третьей главы диссертации рассмотрены задачи включения методов и результатов диссертации в парадигму современной компьютерной лингвистики, в первую очередь - корпусной лингвистики (или лингвистики корпусов текстов, Corpus Lingnistcs). После обзора основных положений этой области иа материале актуальной научной литературы в работе впервые в качестве меры различия дзух индивидуальных текстов одного и того же корпуса введена величина
с!(Л,В) = 0.5*[N(P(A))+N(P(B))1 l[(N(A )+1\'(В)) -N(U(A ,B)J, где Л, В - ДЕа текста пары, взятой для сразнения, N(S) - число элементов в некотором множестве S, U(S1, S2) - теоретико-множественное пересечение множеств SI и S?, а символ Р(Т) означает множество слов, принадлежащих тексту Г, но не входящих больше ни в какой другой текст рассматриваемого корпуса (т. н. hapax legomena). Эта мера увязана по конструкции с основными комбинаторными определениями первой главы работы и позволяет сочетать методы моделирования второй главы, ориентированные на задачи теоретической лингвистики з традиционной постановке, с новой парадигмой компьютерной и корпусной лингвистики. Соответствующей обработке в ходе выполнения практических и экспериментальных разделов исследования были подвергнуты несколько корпусов авторских текстов па различных языках. В третьей глазе диссертации приведены данные для двух из них - сборника сонетов У.Шекспира (154 текста) и сборника «Сонеты к Орфею» Р.М.Рильке (55 текстов).
На заключительном этапе работы по описываемой методике был применен специальной прием кластеризации, зыбор которого мотивирован соображениями семантического плана. Если линейная мера различим d(*,*) связана с лексическим составом текста, то ее квадрат связан с количеством сочетании лексем, что может быть принято в качестве «внешней», чисто'ко-личественной меры потенциала текста в образовании сложных понятии. Значит, площадь фигуры, образуемой несколькими текстами корпуса, явится мерой их совместного концептообразующего потенциала. Таким образом, прослеживание эзолюции семантических структур в корпусе может быть опосредовано процедурой кластеризации, начинающейся с минимума площади, образованной тргмя текстами, поскольку три - наименьшее число вершин в прямолинейной фигуре, обладающей площадью. Затем последовательно к получаемой i-a каждом шаге цепочке присоединяются следующие тройки, каждый раз минимальной возможной площади.
Поскольку, как было отмечено выше, пространство, задаваемое нашей мерой различий, может быть искривлено, то есть неравенство треугольника в нем может не выполняться, то намечаемый алгоритм должен быть дополнен промежуточным шагом предварительной минимизации периметра фигуры, образуемой тремя следующими представителями корпуса. Это обеспечивает
использование на каждом шаге только ограниченной окрестности расширения подразумеваемой семантики контекста. В эксперименте с описанными корпусами текстов оказалось, что полученные меры различий обладают свойствами почти полноценного расстояния: только девять троек из общего числа их 51 на пути кластеризации по описанному алгоритму для сонетов Шекспира, и семь троек из общего числа их 18 для «Сонетов к Орфею» оказываются «закрученными» в семантическом пространстве. Несомненно, этот эмпирический факт связан с реальной семантической полноценностью сонетов и должен рассматриваться как индуктивное обоснование практической значимости предложенных методик.
Заключение. Проведенное в диссертации исследование было начато как решение конкретной задачи в предметной области современной теории языка - поиск средств адекватного сопоставления различных в структурном отношении языковых систем в терминах их базисных конструкций: модели предложения и составляющих ее моделей согласования словоформ. Поставленная задача была рассматрена как массовая проблема применения единого алгоритма с закономерным варьированием единого параметра, задающего определенную типологию. Решение этой проблемы было получено в виде модели общего процесса порождения языковых образований, реализации которого при задании конкретного значения некоторого управляющего параметра ЯЕЛЯЮТСЯ текстами определенной типологии.
Такая спецификация первичной задачи в области формальных грамматик делает естественным переход к стохастическим моделям процессов генерирования корпуса текстов с определенными параметрами матрицы переходов между состояниями. В свою очередь, для идентификации структурных характеристик такого порождающего процесса доступны представительные корпусы текстов. Исследование таким образом явилось вполне замкнутым и определенным в отношении методики и материала. Эта методика впервые применяется в области моделирования языковых структур и процессов, хотя она является вполне согласованной с общим характером практических приложений теории языка сегодняшнего дня, входящей в состав комплекса информационных наук.
Подтверждена гипотеза о связи стохастического анализа модели тек-стопорождения и .моделей типа формальных грамматик для описания результатов случайного выбора определенного вида решающих правил фиксации структуры порождаемого потока с целью кодирования функционального и ситуационного смысла текста.
Полученное решение исходной задачи из предметной области традиционной лингвистики демонстрирует эффективность методов моделирования в области типологии языковых систем. Эволюционное моделирование языковых изменений (диахронических процессов истории языка) получает новую методическую основу. Предлагаемые моделью связи конкретных языковых систем являются новой информадией для соответствующих предметных областей.
Основные результаты диссертации опубликованы в работах:
1. К вопросу о модели семантической структуры предложения. Известия СКНЦВШ, 1976 г., № 1, стр. 64-70, Ростов-на-Дону.
2. К проблеме анатиза функционального содержании грамматических конструкции. Известия СКНЦВШ, 1977 г., № 3, стр. 62-65, Ростов-на-Дону.
3. Особенности адыгского глагольного словоизменения в связи с проблемой типологического анализа. Известия СКНЦВШ, 1983 г., № 1, стр. 81-86, Ростов-на-Дону.
4. Основообразование адыгского глагола с типологической точки зрения. , Известия СКНЦВШ, 1984 г., № 1, стр. 51-56, Ростов-на-Дону.
5.О некоторых концепциях значения и жеста в тексте. Организация и самоорганизации текста. Альманах «TEXSTUS», вып.1, СанктПстербург-Ставрополь, 1996.С. 122-137.
6. К проблеме абхазо-адыгского каузатива. Актуальные вопросы абхазо-адыгской филологии, Карачаевск, 1997, с. 131-136.
7. О некоторых возможностях сопоставительного изучения абчаоо-адыгских языков. Актуальные проблемы общей и адыгской филологии. Материалы Всероссийской научной конференции. Майкоп, 1999, с. 63-68.
8. Модель семантической структуры предложения как единицы языковой деятельности. Языковая деятельность: переходность и синкретизм. «TEXTUS», вып. 7, Москва-Ставрополь, 2001, с. 327-331.
9. О киривинском языке на островах Тробриана. Рецензия с наброском интерпретации. Язык и текст в пространстве культуры. Научно-методический семинар «TEXTUS», вып. 9. СПб-Ставрополь, 2003, с. 396402.
10. Интерпретации текста как метод построения модели глубинного синтаксиса оргативной конструкции адыгских языков.
Антропоцентрическая парадигма в филологии Материалы Международней научной конференции (Ставрополь, 14-15 мая 2003 г). ч. Н.Лингвистика. Ставрополь, СГУ, 2003, с. 85-90.
Изд. лиц. серия ИД № 00502 Подписано к печати 05.05.04 г.
Формат 60x84. 1/16 Усл. печ. л. - 1,5. Уч.-изд. л. - 1,2.
Бумага офсетная. Печать офсегная. Заказ 1041 Тираж 100 экз. Северо-Кавказский государственный технический университет 355029 г. Ставрополь пр. Кулакова, 2
Отпечатано в типографии СевКавГТУ Издательство Северо-кавказского государственного технического университета
»11 49Ï
Оглавление научной работы автор диссертации — кандидата филологических наук Силантьев, Аркадий Николаевич
Введение страница
Глава 1. Модельный формализм описания языковой структуры
§ 1. Основные постулаты базового компонента модели языкового отображения смысла
§ 2. Определение матроида и связь с модельной интерпретацией
§ 3. Базисные структуры языковых матроидов
§ 4. Сопоставительный анализ эргативной и номинативной конструкций предложения
Выводы к гл.
Глава 2. Применение базисной модели фразовой структуры к анализу развернутого предложения
§ 1. Формализация фрагмента описательной грамматики адыгских языков: согласование в именных и глагольных синтагмах
§ 2. Расширение области приложения модели: некоторые возможности сопоставительного изучения индоевропейских и абхазо-адыгских языков
§ 3. Расширение инструментальных средств модели: привлечение концептуальных основ теории интерпретации текста
Выводы к гл.
Глава 3. Некоторые приложения модельных концепций к типологической проблематике с точки зрения общей теории языка
§ 1. Использование модели в практике сопоставительного анализа и интерпретации: аустронезийские структурные схемы
§2. Моделирование основных структур и процессов лингвистики текста на материале ограниченного корпуса текстов
Выводы к гл.
Введение диссертации2004 год, автореферат по филологии, Силантьев, Аркадий Николаевич
В диссертационной работе сделана попытка обобщить определенный опыт в области построения моделей связи семантики естественного языка, представляемой в терминах глубинной структуры, и системы формообразования, описанной в грамматике нормативного типа, так, чтобы модель обладала свойством универсальности по отношению к языковой типологии. Такая программно-целевая установка определила необходимость рассмотрения на начальном этапе работы общей проблематики теории языка в поиске тех формулировок основных концепций, которые позволили бы выдержать разделение контенсивного и функционального аспектов содержания языковых конструкций на всех уровнях языкового отображения. Смешение этих аспектов выглядит совершенно неизбежным в концепциях классической парадигмы: влияние постулата произвольности языкового знака и постулата коммуникативной направленности речевого акта сказывается в том, что специфика выражения не объясняется из трансформаций - напротив, сами они формулируются, исходя из этой наблюдаемой специфики. Примером может быть сопоставительный анализ номинативной и эргативной конструкций предложения, при котором наблюдаемое различие в поверхностном уровне последовательно транслируется в глубинные репрезентации семантики и в порождающие механизмы вывода на их основе тех же поверхностных структур. Последние оказываются, действительно, моделируемыми, но унификация двух типологий не достигается. Возможность таковой обнаруживается в опоре на известные концепции Т.П. Ломтева, Н. Хомского, А. Вежбицкой и И.А. Мельчука, в которых используется моделирование семантики фразы множеством элементарных предикаций. Такой набор предикаций свободен от формы поверхностной структуры, так как трансформации описываются не в терминах значений, а в некоторых, свободных от значений, но обязательных для языкового механизма, понятиях. Но как раз в роли механизма язык обладает таким обязательным свойством, как линейность, одномерность его образований; следовательно, индуктивные универсалии в порядке значимых компонент, рассмотренные в свое время Дж. Гринбергом в качестве важнейшего комплекса фактов для лингвистической теории, должны быть руководящим материалом в построении модели предположенного типа. В свою очередь, этот вывод помогает избегнуть неадекватной по отношению к естественному языку логизации - исходные элементарные предикации являются таковыми только в анализе, будучи по образованию констатациями совместного наличия, называниями комплексов черт языковой ситуации. Линейность формы выражения ведет к необходимости упорядочивания монем поверхностной структуры в результирующей цепочке. Предположением модели является условие повторяемости правил относительного упорядочения на основе наследования выбранного в начальном уровне принципа выбора двух позиций бинома характеризации, являющегося ядром как атрибутивной, так и предикативной группы, г Встраивание третьей компоненты, в частности, объекта в предикативной группе, ведет к конфликту приоритетов, но не на основе значений, а только в силу ограничений линейной структуры. Конфликт разрешается добавлением новых значимых элементов, осмыслясмых в описании как контенсивные; но унифицирующая установка модели помогает предположить в них исходные диахронически экстенсивные ситуационные признаки актантов. Подтверждение этой гипотезы достигается сопоставлением моделей синтаксических структур языков адыгской и индоевропейской семей с привлечением данных диахронии египетского языка.
В недавнем прошлом лингвист-теоретик вынужден был ограничиваться тщательным анализом языкового материала, не имея средств непосредственного наблюдения динамики глубинного уровня. Но теперь теоретическая лингвистика может обратиться к инструментальным средствам прикладной лингвистики, в частности к имитационному моделированию на базе компьютерных технологий и материалов корпусов текстов. При этом принципиальной основой в описанном выше круге проблем может быть принцип становления морфологических структур в результате закрепления синтаксических групп, эксплицитную формулировку которого дал, например, выдающийся теоретик и историк языка П.С. Кузнецов [55; 56]. Предполагая подобие динамики слов в корпусе динамике элементов смысла в индивидуальной речи, удается построить модельное представление динамики элементов смысла по отношению к выполнению условия линейности и стохастически определяемой организованности.
Актуальность работы. Бурное развитие прикладной и компьютерной лингвистики в наши дни является уже общеизвестным фактом: достаточно взглянуть в программы обязательных учебных курсов студентов специальностей, связанных с обработкой информации, управлением, принятием решений, построением экспертных систем и т.п. В методической практике этих курсов преподавателю приходится иметь дело в первую очередь не столько с традиционным предметом классической лингвистической теории, сколько с непосредственной данностью объекта новой технологии - корпуса текстов. Этот объект легко становится предметом формального описания, представления и обработки в системах, располагающих достаточными техническими возможностями для того, чтобы корпус текстов рассматривать в качестве популяции его составляющих -текстов, фраз, словосочетаний, словоформ и т.д. Популяционный подход охватывает гораздо больший спектр явлений языковой структуры, чем традиционная лингвостатистика — на материале своего объекта, то есть корпуса текстов, данный подход дает возможность полностью включить в наблюдение динамику наблюдаемой структуры. Сегодняшний уровень технической вооруженности не только научной лаборатории, но и учебной аудитории вполне позволяют применить соответствующий подход в исследовании и практических разработках в области компьютерной лингвистики. Количество основополагающих работ, посвященных этой теме, на сегодняшний день уже достаточно велико; упомянем прежде всего обзорную работу «Современная американская лингвистика: фундаментальные направления» [113], монографию А.Е. Кибрика [46], учебники А.Н. Баранова [7], В.А. Плунгяна [90], Р.К.Потаповой [92]. В опоре на методологические и теоретические концепции этой линии развития современной теории языка вполне возможно рассчитывать на научную состоятельность предпринимаемой здесь попытки решения некоторой частной задачи.
Особо следует отметить актуальность сформулированных выше проблем в региональных условиях Северного Кавказа, с его общеизвестным богатством разноязыковых и разносистемных устных и письменных традиций и средств внутри- и межкультурной коммуникации. Контактные и ареальные тенденции в диахронии, понимание которых существенно для адекватной реконструкции исторических грамматик языков региона, находят естественное представление в рамках предлагаемых моделей. Научная новизна работы заключается в том, что:
1. Систематически на основе строгих формальных посылок рассмотрен структурный аспект проблемы описания и моделирования в области теоретических проблем типологической специфики языковых систем с помощью инструментальных средств прикладной лингвистики.
2. Предложены новые системы формальных грамматик для конкретного языкового материала языков абхазо-адыгской группы, ранее еще не бывших объектом изучения в рамках подобных систем.
3. Средствами моделирования решена проблема интерпретации различения типологических структур языков при единстве смысла; в частности, теория эргативной конструкции в адыгских языках представлена в виде эксплицитной порождающей схемы, основанной на одном порождающем правиле, в отличие от традиционного описательного варианта, где наличие двух независимых правил необходимо.
4. Сформулированы принципы соответствий, позволяющие использовать материал типологического сопоставления различных языковых систем в качестве модели диахронического сравнения этапов развития одной и той же либо родственных систем. В частности, проблема эргативного либо активного строя праиндоевропейского языка (по данным реконструкции) получает новую трактовку и модельное разрешение: на основе уравнивания функциональных значений в схемах порождающих глубинных семантико-синтаксических структур диахронически снимается различие морфемы *-т в роли показателя субъекта среднего рода и в роли объекта прямопереходного действия.
5. В экспериментальной части работы на материале представительных корпусов текстов показана выполнимость выдвинутых предпосылок, служащих методологической основой формальных постулатов, введенных в качестве аксиоматического базиса модели.
Объектом диссертационного исследования, таким образом, явились компоненты структуры смысла и структуры содержания высказывания в их инвариантном относительно языковой системы представлении, а также системы соответствий между специфическими для сопоставляемых языков реализациями этих представлений.
Предметом исследования явилась модель универсализирующей системы соответствий в терминах языковой прагматики, прослеживаемая на материале корпусов текстов языков различного строя и взаимодействие семантико-синтаксических структур различных типов в этом материале как в синхроническом аспекте - в тексте, так и в диахронии - в типологических системах различного строя по данным реконструкции.
Цель диссертационной работы. Цель настоящей работы состоит в формулировке основных положений модели порождающего типа, дающей возможность унифицированного описания порождения определенных структур поверхностного уровня фразы в различных системах языковой типологии на базе единой семантико-прагматической глубинной структуры. Для получения достоверного и адекватного предмету исследования первичного материала потребовалось прежде всего исследование стохастической динамики составляющих корпусов текстов средствами современной компьютерной и прикладной лингвистики и ее математического обеспечения в аспекте основных предпосылок конструируемой модели. Эта подцель определила первую задачу работы - формализацию описания и преобразований структур данных, получаемых в качестве первичного материала корпусной лингвистики — массивов текстов. Наблюдаемая в такой модели динамика объектов фиксируется в терминах формальной системы, которая, в свою очередь, дает возможность формулировки определенных гипотез, следствия из которых могут быть проверены в дальнейшей обработке исследуемого корпуса текстов. Рассмотрение таких гипотез с точки зрения их интерпретируемости в терминах традиционной лингвистики является следующей задачей исследования в связи с тем, как была в свое время определена профессором А.Н. Савченко (РГУ) исходная постановка научной проблемы, в контексте решения которой проводились работы, положенные в основу диссертации. Он предположил, что типологический анализ двух различных систем грамматического строя — эргативной в абхазо-адыгских языках и номинативной в языках индоевропейской семьи -обнаружит единую систему глубинных характеристик структурирования линейной последовательности речевых единиц, вариации которой в связи со значением определенного «скрытого» параметра и дают различия наблюдаемого синтаксического аппарата. Естественной средой для типологического сравнения является узус языка, то есть практика речи; но фиксированная речь - корпус текстов - не может быть корректно обработана по отношению к так сформулированной задаче в опоре на описательную грамматику, индивидуализирующую язык. Фрейм типологического сопоставления обнаруживается только при рассмотрении массовой проблемы, которой в лингвистике является общая задача передачи инварианта ситуационно-обусловленного смысла сообщения при варьировании используемой типологии языка. Переход к массовой проблеме и означает принятие популяционной трактовки данных наблюдения. Таким образом, исходная теоретическая задача конкретной области языкознания приводит к необходимости разработки средств модельного представления ее объектов и процессов для применимости соответствующего инструментария прикладной лингвистики, вооруженной современными средствами информатики и статистики.
Итак, достижение поставленной цели предполагает решение определенных частных задач. В их числе:
1. Сформулировать систему основных постулатов модели глубинной семантической структуры языка, лежащей в основе всякой наблюдаемой языковой формы.
2. Построить интерпретирующий морфизм - отображение постулированной глубинной структуры семантики языка в синтаксическую структуру поверхностного уровня языка, регулярное по отношению к возможным вариациям правил упорядочения промежуточных результатов, что позволяет охватить единым алгоритмом различные языковые типологии и задать их в виде параметров отображения.
3. Построить формальную грамматику, описывающую фрагмент порождающей грамматики адыгских языков: формообразование глагола в области личного согласования его с другими членами предложения, а также интерпретировать с помощью этой системы порождающих выводов другие грамматические конструкции так, чтобы в результате получить модельную верификацию положений, сформулированных в п. 2 выше.
4. Построить типологический морфизм - отображение, связывающее интерпретированные в п.З на уровне глубинных структур схемы адыгской языковой системы и наблюдаемые (поверхностные) структуры индоевропейского синтаксиса по данным реконструкции.
5. Продолжить (расширить) типологический морфизм п. 4 на материале подсистемы среднеегипетского синтаксиса предложных конструкций, переходящей в диахронии в подсистему префиксального словоизменения (в коптском языке).
6. Проиллюстрировать применимость модельных концепций в достаточно широкой области, для чего дать обзор возможных приложений ее в виде дальнейшего расширения типологического морфизма п. 5 на данные аустронезийских языков.
Методы " исследования. Для моделирования объекта исследования применялись концепты теории формальных грамматик, а для моделирования его поведения как популяции - методы стохастического анализа. Конкретные значения тех параметров, которые оказались введенными в качестве единиц описания, были получены в экспериментах с образцами корпусов текстов. Для этих экспериментов использовалось программное обеспечение известных пакетов «MathLab 6.0», «STATISTICA 6.0» и «Maple 7». Все подготовительные операции с массивами текстов производились с помощью оперативного набора служебных программ, составлявшихся автором работы применительно к используемым данным в среде системы баз данных «MAPINFO». С помощью этих инструментальных средств решались следующие задачи: a. вычисление статистических характеристик составляющих корпуса текстов; b. кластеризация составляющих на основе вычисленных значений параметров; c. моделирование языковой динамики на основе анализа последовательности кластеров в тексте как марковской цепи; d. моделирование формообразования и морфогенеза посредством рассмотрения относительных величин переходных вероятностей марковской цепи и экстраполяции обнаруживаемых тенденций. Теоретико-методологической основой диссертационного исследования явились положения сравнительно-исторической грамматики в их обобщении применительно к сопоставительному изучению языков различного строя, как они развивались в трудах школы проф. А.Н. Савченко, теория логической структуры фразы и смысловой структуры предложения, созданная профессором РГУ П. В. Чесноковым, типологические и теоретико-грамматические концепции И.А. Мельчука и А.Е. Кибрика, теория структуры и организации текста, начало которой положили труды проф. Вяч. В с. Иванова, и разрабатываемая в работах проф. К.Э. Штайн и сотрудников кафедр русского языка и общего и славяно-русского языкознания СГУ. Достоверность и обоснованность результатов. Для исследований был использован материал аутентичных корпусов авторских текстов на различных языках, подготовленных в независимых авторитетных организациях - издательствах и центрах электронных публикаций. В качестве основных были использованы корпусы текстов поэта, члена группы ОБЭРИУ А.И. Введенского (русский язык, объем около 350 Кб); Ш. Бодлера, «Les Fleur du Mal» («Цветы зла», французский язык, около 170 Кб); JT. Кэрролла: стихи из книги «Сильвия и Бруно» и книги «Алиса в Стране чудес» и «Алиса в Зазеркалье» (английский язык; а также переводы на русский язык Н. Демуровой и В. Набокова, в целом около 550 Кб); P.M. Рильке, «Сонеты к Орфею» (немецкий язык, около 120 Кб); К. Мхце, Сочинения (абазинский язык, около 600 Кб); У. Шекспира: «Сонеты» (английский язык, около 100 Кб).
Статистические процедуры и процедуры моделирования, применяющиеся в работе, входят в комплексы программ научного назначения, вошедших в мировую практику: универсальный математический пакет «MathLab» (использовалась версия 6.0), пакет прикладного статистического анализа «STATISTICA» (версия 6.0), средства символьной алгебры и графики математического пакета «Maple» (версия 7), и средства работы с данными системы баз данных «MAPINFO» (версия 5).
Конкретные результаты расчетов процедур стохастического анализа и моделирования сопровождаются нормативными характеристиками степени достоверности, предусмотренными в соответствующих программных средствах. Постулаты, образующие основу строящегося в работе модельного представления, обосновываются результативностью модели в решении сформулированных выше целей и задач ее разработки.
На защиту выносятся следующие основные положения:
1. Глубинной семантико-синтаксической структурой является частичный порядок множества элементарных номинаций, связанных в парные комплексы локальной — глобальной составляющей так, что глобальная составляющая оказывается локальной на следующем уровне включений.
2. Языковое отображение смысла в поверхностную структуру рекурсивно независимо от языковой типологии: если окрестностная структура подцепочки текста заданного языка, переданная в категориальных единицах одного уровня, гомоморфна окрестностной структуре другой подцепочки, возможно представленной в категориальных единицах другого уровня, то вычисляющие эти цепочки программы в модели грамматики представимы графами, изоморфными одному и тому же графу.
3. Формальная грамматика, описывающая морфологию спряжения адыгского глагола в области личного согласования и основообразования, задается одной аксиомой и одним правилом вывода:
Лок — Дет0 — Дет(А) — Пред (аксиома)
Дет0-> Дет0 — Дет(А) (правило вывода)
Наполнение позиций в этих схемах происходит подстановкой элементарных единиц из конечного множества морфем, известных из описательной грамматики адыгских языков, которые в контексте предлагаемой модели получают новые спектры значений.
4. Схема (модель) эволюции глубинных семантико-синтаксических структур в диахронии, которая для случая сопоставления адыгских и египетских форм имеет вид
Субъект М* Объект Р* ИмяДействия => Субъект а Объект р Глагол.
5. Переформулировка схем пп. 3 и 4 применительно к фактам сравнительной грамматики индоевропейских языков (по данным реконструкции) позволяет утверждать действие той же модели синтаксически обусловленного закрепления соположенных единиц в составе переосмысляемой словоформы; в этом случае различение степени удаленности в алломорфах единой основной семантики в позиции Р* (см. схему выше), как это наблюдается в адыгских формах с 3-им лицом косвенного объекта, привело к внешней омонимии конструкций с именами «неактивного» класса в позиции субъекта и конструкций с прямым объектом.
Практическое применение результаты работы находят в дальнейшем развитии методик описания (с помощью порождающих грамматик предложенного типа) оригинальных и специфических конструкций разносистемных языков, что позволяет установить новые связи и факты, не обнаруживаемые без их использования. Реальное поле приложений в этой области действительно весьма обширно ввиду возросшего во всем мире с развитием компьютерной лингвистики интереса к конкретным особенностям типологии отдельных языков с точки зрения универсализирующих принципов интерпретации. Отметим, что и факты хорошо изученных и описанных языков, таких как греческий и латинский, получают новую интерпретацию в таком аспекте. Параллели классических и новых младописьменных языков в области глубинных порождающих структур имеют большое значение в практической методике преподавания лингвистических курсов как прикладной, так и традиционной тематики. Реализация результатов. Методические установки и формальные средства описания и моделирования, развиваемые в работе, применялись в учебных и научных проектах, выполняемых на переводческом факультете СК ГТУ как автором работы, так и студентами, работающими под его руководством; результаты этих работ были предметом публикаций в сборниках материалов ежегодных региональных научных конференций профессорско-преподавательского состава, студентов и аспирантов СК ГТУ в 2001-2004 гг., в «Вестнике С К ГТУ», № 1 (7) за 2003 г.
Апробация работы. Результаты работы докладывались в форме докладов и выступлений на международных конференциях в Институте языкознания АН СССР в 1977 г., в Институте языка и истории АН Абхазской АССР в 1977 г., в Пятигорском лингвистическом университете в 1998 г., на международных конференции в Майкопе, Нальчике, Черкесске в 1997-1998 гг., в Ростове-на-Дону, в СГУ в 2003 г., на ежегодных региональных научных конференциях в СК ГТУ в 1999-2004 гг.
Публикации. Методика и результаты диссертации составили предмет 10 статей в сборниках научных трудов и 10 тезисов выступлений на научных конференциях.
Структура и объем диссертации. Работа состоит из введения, трёх глав и заключения. Список литературы включает 154 названия.
Заключение научной работыдиссертация на тему "Моделирование порождающих семантико-синтаксических структур в языках различного грамматического строя"
Выводы к главе 3.
Третья глава диссертационной работы посвящена дальнейшему развитию модельных концепций и выяснению перспектив применения разработанного в ней подхода к вопросам типологии в рамках общей теории языка.
В первом параграфе третьей главы подробно рассмотрен фактический материал нового для отечественной науки содержания -описательная грамматика языка киривина (Ктм?та), относящегося к аустронезийской семье и распространенного на островах Тробриана, входящих в состав Республики Папуа-Новая Гвинея. С точки зрения типологии слова это язык агглютинативный; первый исследователь его, знаменитый польский этнолог Бронислав Малиновский, пишет об этом так: «различия в формах имен и глаголов выражаются просто посредством соответственно значащих частиц. Подлинная трудность этого языка не в сложности грамматического аппарата, но скорее как раз в чрезвычайной простоте его». Это последнее замечание объясняется фактом исключительно устного бытования языка, когда большая, если не большая, часть семантики фразы определяется через ее прагматику (контекст). Ввиду этого структура киривинского языка является хорошей иллюстрацией применимости основных положений модельного подхода, развитого выше. Так, в области морфологии глагола в киривинском языке формообразование лиц происходит префиксально, а множественное число отмечается суффиксом, что сразу делает эту систему важной сопоставительной единицей при изучении, например, абхазо-адыгских языков. С другой стороны, глагольный префикс Ь- / Ьа- / Ьи- является модификатором, вносящим значение несовершенности действия, и, возможно, сравним с суффиксальными показателями инфекта в индоевропейских языках (напр., в латинском). К выводу о близости киривинской типологии с индоевропейской приходит и современный исследователь этого языка Т. Щербовский. В то же время только применение модельного подхода, развиваемого в диссертации, позволяет провести комплексное сопоставление многофакторного характера.
Во втором параграфе третьей главы диссертации рассмотрены задачи включения методов и результатов диссертации в парадигму современной компьютерной лингвистики, в первую очередь - корпусной лингвистики (или лингвистики корпусов текстов, Corpus Linguistes). После обзора основных положений этой области на материале актуальной научной литературы в работе впервые в качестве меры различия двух индивидуальных текстов одного и того же корпуса введена величина d(A,B) = 0.5*[N(P(A))+N(P(B))J/[(N(A)+N(B))-N(U(A,B)J, где А, В — два текста пары, взятой для сравнения, N(S) - число элементов в некотором множестве S, U(S1, S2) — теоретико-множественное пересечение множеств S1 и S2, а символ Р(Т) означает множество слов, принадлежащих тексту Т, но не входящих больше ни в какой другой текст рассматриваемого корпуса (т. н. hapax legomena). Эта мера увязана по конструкции с основными комбинаторными определениями первой главы работы и позволяет сочетать методы моделирования второй главы, ориентированные на задачи теоретической лингвистики в традиционной постановке, с новой парадигмой компьютерной и корпусной лингвистики. Соответствующей обработке в ходе выполнения практических и экспериментальных разделов исследования были подвергнуты несколько корпусов авторских текстов на различных языках. В третьей главе диссертации приведены данные для двух из них - сборника сонетов У.Шекспира (154 текста) и сборника «Сонеты к Орфею» Р.М.Рильке (55 текстов).
На заключительном этапе работы по описываемой методике был применен специальный прием кластеризации, выбор которого мотивирован соображениями семантического плана. Если линейная мера различий d(*, *) связана с лексическим составом текста, то ее квадрат связан с количеством сочетании лексем, что может быть принято в качестве «внешней», чисто количественной меры потенциала текста в образовании сложных понятий.
Значит, площадь фигуры, образуемой несколькими текстами корпуса, явится мерой их совместного концептообразующего потенциала. Таким образом, прослеживание эволюции семантических структур в корпусе может быть опосредовано процедурой кластеризации, начинающейся с минимума площади, образованной тремя текстами, поскольку три - наименьшее число вершин в прямолинейной фигуре, обладающей площадью. Затем последовательно к получаемой на каждом шаге цепочке присоединяются следующие тройки, каждый раз минимальной возможной площади.
Поскольку, как было отмечено выше, пространство, задаваемое нашей мерой различий, может быть искривлено, то есть неравенство треугольника в нем может не выполняться, то намечаемый алгоритм должен быть дополнен промежуточным шагом предварительной минимизации периметра фигуры, образуемой тремя следующими представителями корпуса. Это обеспечивает использование на каждом шаге только ограниченной окрестности расширения подразумеваемой семантики контекста. В эксперименте с описанными корпусами текстов оказалось, что полученные меры различий обладают свойствами почти полноценного расстояния: только девять троек из общего числа их 51 на пути кластеризации по описанному алгоритму для сонетов Шекспира, и семь троек из общего числа их 18 для «Сонетов к Орфею» оказываются «закрученными» в семантическом пространстве. Несомненно, этот эмпирический факт связан с реальной семантической полноценностью сонетов и должен рассматриваться как индуктивное обоснование практической значимости предложенных методик.