автореферат диссертации по филологии, специальность ВАК РФ 10.02.19
диссертация на тему: Полнота / неполнота лингвистического универсума на разных уровнях
Полный текст автореферата диссертации по теме "Полнота / неполнота лингвистического универсума на разных уровнях"
фЦЖРУССКИЯ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
На правах рукописи
МВРЕНЕНКО Анжелла Валерьевна
ПОЛНОТА / НЕПОЛНОТА ЛИНГБИСТИЧЕСКОГО УНИВЕРСУМА НА. РАЗНЬК УРОВНЯХ
Специальность 10.02.19 — Теория языкознания
АВТОРЕФЕРАТ
диссертации на соискание ученой степени кандидата филологических наук
Минск 1993
Работа выполнена на кафедре теоретического и славянского языкознания Белорусского государственного унверситетз.
Научный руководитель -. доктор филологических наук
доцент В. А. Карлов
Официальные оппоненты - доктор филологических наук
профеооор О. А. ХАРИТОНЧИК
- кандидат филологических наук доцент О. Е Беляевская
Ведущая организация - Минский педагогический институт
Защита диссертации состоится "//" Ш-снл} 1993 г. в 14 часов на заседании специализированного совета Д 056.03. Об по присуждению ученой степени кандидата филологических наук при Белорусском государственном университете.
Адрес совета: 220030, г. Минск, ул. Карла Маркса, 31, филологический факультет, аудитория 47.
С диссертацией можно ознакомиться в библиотеке Еелгос-университета.
Автореферат разослан "//" 1993 г.
УЧЕНЫЙ СЕКРЕТАРЬ " специализированного совета Д 065.03. Об
доктор филологических кзук ¡,
,,/ ; . I"
профессор /////'^ п. 11 ШУБА
- а -
Работа "ПолнотаУнеполнота лингвистического универсума на разных уровнях" является попыткой показать то, как отражается неполнота в восприятии мира, каким! способами она снимается и, следовательно, как через язык возникают новые знания.' Актуальность ее определяется следующим: 1. В общефилософском и теорети-аском планах выяснение полноты/неполноты объекта как системы является доказательством его системности. 2. В методическом аспекте знания о "полноте/неполноте объекта позволяет строить научную методику снятия неполноты, т.е. обучения. 3. В прикладном плане исследование полноты/неполноты языка . необходимо длл работы со знаниями в интеллектуальных системах. Чтобы ЭВМ могла выполнять интеллектуальную работу, ее знания о мире и языке долины приближаться к полноте.
Научная попнзна исследования заключается в том, что полнота/неполнота лингвистического универсума на всех его уровнях исследуется впервые с помощью единой методологии — общей теории систем Ю. А. Урмандева и ее приложения к языку В. А. Карпова. Зто привело к системному доказательству существования в языке нефункциональных и функциональных уровней с разными количественными и качественными характеристиками их элементов и отношений. Вводятся понятия лингвистической полноты и неполноты, на разных уровнях анализируется их соотношение. Определяются способы снятия неполноты языка.
Практическая значимость работы в том, что представление языкового матерт-а^а в виде полных математических структур позволило на нефункциональных уровнях составить полные списки единиц анализа; на функциональных уровнях -- показать возможность прогнозирования появления/непоявления тех или иных единиц. В процессе работы создан словообразовательный словарь открытого матричного типа,' на его основе можно разрабатывать системную этимологию. Результа-
ты исследования могут использоваться при чтении лекций и проведении семинаров по теоретическому языкознанию,■ русскому языку, компьютерной лингвистике. На его основе возможна разработка ряда спецкурсов.
Цели исследования: 1. Создать философскую, гносеологическую . концепцию полноты/неполноты языковой системы. 2. Представить знания о единицах разных уровней языка в виде полных математических . структур, ' где это возможно, показать и доказать кензб-элоюсть т""-полноты универсума гп отношении к языку-ол^геме, ее необходимость для развития системы со входам и выходом, каковой является язык.
3. Показать, что неполнота как. причина развития присупр только функциональным уровням системы; на уровнях анализа система полна.
4. Доказать, что неполноту как явление' можно обнаружить при описании любого факта .универсума; все зависит от признаков, которые выбираются для характеристики объекта. 5. Доказать, что способом снятия неполноты универсума является моделирование в рамках языка-системы, представить процесс моделирования в виде формальной системы.
На защиту выносятся следующие положения:
1. Уровневость языка-системы неравнозначна, существуют нефункциональные и функциональные уровни. Они различаются по возможности/невозможности полного формального представления их элементов, замкнутости/неаамкнутоетн, воспроизводимости/ мэделируе-мости элементов.
2. Единицы нефункционального уровня всегда представимы в виде полной конечной математической структуры. Е универсуме этот уровень также полон до перехода его к функциональным.
3. функциональный уровень * нельзя представать з .виде полной конечной структуры, Он представим полной бесконечной, ст^.таурбй,
ОФТ^пптлЛлп1 г» г»*%г\тя/-гим^птчг г\т -ттпттсчпгят*»»"» гтглг^^гтп I тлт»
, К* I Ь сашдидмуи!» ил гллиичъ*-, 1ва ¿^»юпагьиа.
- б -
4. Несовпадение языка-потенции и языка-реальности необходимо. Неполнота универсума на функциональном уровне — гарантия развития эволюционной системы.
5. Неполнота лингвистического универсума определяется неполнотой знаний о мире. Знания выступают как средство идентификации смысла ситуация.
Апробация работы. Отдельные положения диссертации докладывались на ряде, всесоюзных и республиканских научных конференций по языкознанию, философии, новым информационным технологиям. Отдельные главы вошли составной частью в отчет по НИР научно-исследовательской лаборатории теоретической и прикладной лингвистики Бед-• госуниверситета.
. Структура диссертации. Работа состоит из введения, четырех глав, заключения, библиографии, приложений. В приложения вынесены больше по объему таблицы, протоколы эксперимента.
Во введении обосновывается .выбор теш исследования, уточняются исходные понятия "полнота" я "неполнота" в применении к языку-системе, ставятся цеди и задачи работы, определяется методология, описываются математические структуры представления лингвистического ^материала: декартово произведение, таблица Кэли, код Грея, группа, симметрично-асимметричная матрица. Здесь же описан материал исследования: лексический — около 160 тыс. слов, синтаксический ~ около 1,5 млн. композиций,' извлеченных сплошной выборкой из текстов.,
В первой главе рассматривается полнота/неполнота лингвистического универсума на уровнях анализа: ■ ■ графическом и слоговом. Уровень графем выделен по двум причинам,. 1. Мы имеем дело только: с письменными текстами/ 2. Графема —. минимальная единица, по ко-': горой можно судить с том,, что,ш имеём дело с системой "язык". В русском языке реализуется принцип фонематического письма, и ана-
- в -
Лиз графики частично представляет картину .полноты/неполноты на фонематическом уровне.
Анализируя данные эксперимента по выводу алфавитов 7-и языков, приходим к следующему: 1. Уровень графики является уровнем ' I анализа, закрытой, 'вторичной системой, ; поэтому характеризуется ' полнотой. . 2. ПЬлнота проявляется в количественном и качественном . планах. На 20-и словах выводится большая часть алфавита в языках, которые ■ используют . буквенное письмо; для вывода всего алфавита необходима несколько страниц текста. Наблюдаются значительные колебания • частоты встречаемости тех или иных букв по лингвиетичес-. ким причинам: а) наличие двух качественных типов букв — гласных и согласных; б) наличие в языке собственных и заимствованных слов. 3. Полнота на уровне, графики позволит построить полную ■ комбинаторную систему-потенцию на слоговом уровне.
Теоретически возможные слоги русского языка задаются , декартовым произведением множества согласных на множество гласных и -наоборот. Таблицы заполняются реальным материалом (словоформами . русского .языка,-., встречающимися в текстах в свободном употреблении) на 67 и 47 X. Словоформы-слоги чаще представляют собой целые 'морфемы (корневые), .которые потом превращались в морфемы другого типа (префиксальные, суффиксальные). С грамматической и семанти-,'ческой точек зрения слова-слоги — это:, 1) служебные слова: частицы, союзы, предлоги, междометия; 2) полноаначные слова: местои-, мения и их падежные формы; местоименные прилагательные; т-Еання нот и русских букв; существительные (,ь том числе и сокралгг.ч'!.'?); имена собственные-! томногачисленные «ругие формы. Среди словоформ-слогов раавита омонимия; - но принадлежности к классу и ■ по происхождению выделяется 4 группы омонимов. В качестве иллюстративного -материала для сопоставления проанализированы .слова-слоги 1 японского языка, среди которых отмечены те же закономерности, а
именно: 1. Слоговой уровень, связанный с аналитическим буквенным уровнем, в теоретическом отношении характеризуется полнотой. 2. Реальное наличие слогов в свободном употреблении в виде словоформ или слов всегда нижа 100 % и демонстрирует неполноту реальности по сравнении с потенцией. Э. Слоги типа СГ создаются легче и чаще представляют собой целые слова, недели слоги типа ГС. 4. Среди слов-слогов исконно русского проиохоидения большинство служебных слов, которые легко становятся морфемами и позволяют переход к анализу следующего уровня. ,5. Среди слов-слогов имеются полноа-начные слова и формы слов, что также выводит на морфологический и лексический уровень. 6. Даже при немногочисленности слов-слогов в современном русском языке отмечается системная, т.е. предсказываемаяОТСУ, изомерия, квазисишетрия (омонимия). .
Во второй главе рассмотрена полнота/неполнота лингвистического универсума на уровне морфем и словаря. Уровень морфем можно считать переходным от аналитического к функциональным. Признак аналитичности заключается в относительной замкнутости множества. Новых префиксов и суффиксов в блитайшэе время трудно ожидать: они появляются "с трудом" именно ,иэ-эа несамостоятельности. Можно считать, $то в русском языке сложился определенный набор некорневых морфем, относительно,неизменных, который исчислим и поддается формализации. Значит, некоторая часть новых слов может быть автоматически идентифицирована, правильно закодирована и "понята" ЭВМ. Всего в анализе встретилось с учетом вариантов 87 одиночных префиксов, из них 64 русских и 23 иноязычных. ,
Во многих языках имеется полипрефиксация. Нас она интересует в связи с задачей составления полного списка теоретически воэмож-. ньгх префиксов русского языка, выяснения их употребляемости в ре- . альноети. Представляем теоретически возможную комбинаторику префиксов в виде таблицы Кэлл (таблица 1). Все варианты префиксов
... 8 - ... сведены к одному, . поэтому размер матрицы . 26 х 26, ..приведена
■.часть.- , ■ ■ • • • ■ •
• . • • Таблица 1
■ ¿4. . —- - "
. 1Ю НА- НЕ ГОРЙ. ЗА: Д) БЕЗ .ПРЕД.; ОТ НАД-..,
"ДО .. 4, 65. 7 ..2 - • Б6 4 ■ +■.■,.■■.. 20 ;■'■ •' '
..НА 20 .. • . + ,'.- а ;.;• '2 ... : 5 -.■.■.... .'. Б ,
НЕ 71 23 .+ : в ;.; .73.. .246 ■ + ■ . 3.\- 2В- 1 ,
, ПЕРЕ 4 20 + .. 36 14 ... : + •
.ЗА 29 1Б Б 1 + .•■•■ • +. „|
ДО 10 , ; Л.:. .1 л:. 6 ... . . +
БЕЗ 14 4'., 1 6 '3 , .З.Л.-.24 1
■ ПРЕД 26 14 • .г.'. 3 1 .....■,• 6 • -
'ОТ 5 'V 1- , ... . .
1
•НАД ■ ■ .......
• Из 676 теоретически: возможных .сочетаний реализовано 287, или 42%. ' В унииверсуме, таким образом, наблюдается -неполнота. Чэтко выде-. ляюгся три еоньв .1) эойа полного взаимодействия;. 2) зона частич-; ного взаимодействия;-., 3) зона полного вэаимспедействин. Ксдичест-.'венный и качественный,анализ полипрефииксащш показывает: -1. Раэ-; , ные сочетания префиксов, нвравномошды., Так," двойной префикс :НЕДО-
встретился в 249 словах разных матриц, 0ÉE3----в 1130 словах, а
многие двойные префиксы ~ в единственном слове или на одной корневой матрице: ВОСПРЕпятствовать, РАЗОТкррвенннчаться, ВОЗНЕгодовать. Мощность префикса формирует продуктивные и непрол'т-этивные оловооОразогагллыпге.шдааи;' активно рапсхлкпщтся.цустотн новым лингвистическим материалом. Из 237 сочетаний 34 составляют новые
слова: ПЕРЕО'Глагать, ГОДВСшшть, ■ ОВЗрослять,и диалектизмы: НАНЕволить, ЗАЗАёмной, ВУкрадку. а. Существует симметричные префиксы: ПЕРЕПЕРЕстройка, ПОДПОДмножество, Они' малопродуктивны: симметрия снижает информативность. 4. В системе двойной префиксации существуют "взаимооОратные" и "невзаишобратные" сочетания префиксов, обнаруживается левизна, правиана и право-левизна (тя- , готение префикса к определенной позиции по. отношению к другому префиксу). Эта явление присуще не только языку, носит универсальный, общесистемный характер. Закон полиморфизации доказан Ю. А. Ур-ыанцевым и является одним из основных законов преобразования объектов-систем. Даж,е на предфункциональном уровне есть изоиерийныв и неизомериЯ^ые полиморфические модификации префиксов.
Проблема полноты/неполноты списка , словообразовательных суффиксов русского языка чрезвычайно сложна. Во-первых, разделение слова на составляющие его корень, префикс и финаль неизбежно связано с чередованиями, историческими и позиционным!. • Структура слова, таким образом, претерпевает сильные изменения. Во-вторых, при суффиксации присоединение каждого последующего словообразовательного суффикса чаще всего влечет за собой изменение парадигмы слова, иногда и класса. Это затрудняет выявление,всех существующих на сегодня даже единичных суффиксов и не позволяет нам ■• путем построения декартова произведения показать теоретическую полноту двойной и полисуффиксации и рельное количество многосуффиксных слов в русском языке. Комбинаторика суффиксов зависит от их семантики и "классовости";. последующий суффикс определяется, предыдущим не только фонетическими разрешениями и запрета!.«, . но и логической словообразовательной цепочкой. Приведем примеры образования существительных на -<К?ТЬ: признак с конкретной семантикой -сущ. с конкретной семантикой - признак с ^абстрактной семантикой';-сущ. с абстрактной семантикой:';КИСЛЦЙ.- КИСЛОТА - КИСЛОТНЫЙ - '•
КИСЖЛНОСТЬ, но: СОЛЬ - СОЛЕНЫЙ - СОЛЕНОСТЬ (отсутствует первое ввено цепочки).
Более наглядно неполнота языка-реальности по отношению к языку-системе проявляется в лексике. Именно лексика и есть та , смысловая основа, с'помощью которой отражается мир. Степень полноты/неполноты этого уровня зависит от взаимовлияния языковых и неязыковых факторов. Достижение полноты лексики лингвистическим ■ способом почти невозможно: можно составить только списки реальных морфем, но из-за утраты ими слогового характера, появления поли-.префиксации и полисуффиксации нельзя предположить да:*е длину возможной новой морфемы. Приближение к, полноте возможно при представлении корней в их вариантах с помощью симметрично-асимметричных матриц и заполнении материалом дтгзлектов. Симметрии асимметрия корней покавана в работе на примере 6-и идей, получены 16 из 63-х возможных подтипов пересечений/непересечений, что демонстрирует неполноту языковой системы на корневом уровне и доказывает:
1. В языке-системе достичь полноты на корневом уровне невозможно именно потому, что этот уровень -- переходный от аналитического (графического) к функциональным (лексическому и синтаксическому) с явной склонностью к функциональности 'по причине сеызнтичности.
2. Корни не строятся из единиц аналитического уровня (ни из букв, ни из звуков, ни из- фонем) по тай же причине. 3. Корни представляют собой слоги разных типов (единичные или в комбинаторике) и. в принципе, могут быть заданы формально симметрично-асимметричной матрицей либо декарговь-м произведением. Но это имеет смысл до определенного предела в целях систематизации этимологии и словообразования.
Попытки симметризации патриц раскрыли фундаментальны- свойства динамических (эволюционных) систем: юнвергеренцию и дивергенцию ь языке. Необходимость существования конвергеренцли и ди-
вергенции в любой развивающейся системе доказана Ю. А. Урманцевым. Понятие дивергенции обозначает процесс порождения новых видов путем постепенно! о расхождения признаков. Понятие. конвергеренции обозначает процесс порождения новых видов путем слияния признаков. Значит, в процессе развития сходными могут оказаться объекты не только по причине родства, но и случайно.
Конвергерентно-дивергентный характер словообразования показан в работе на примере развития 6-и идей; БИТЬ, ЕИТЬ, ЖИТЬ,. ЛИТЬ, ПИТЬ, ШИТЬ. Из 63-х возможных типов симметрии/асимметрии получен 41. Приведем для иллюстрация сокращенную матрицу для 3-х идей. Предполагается наличие 7-и типов подсистем: одной конвер- , гентной (потюе пересечение), 3-х конвергерентных (частичное пересечение) и 3-х дивергентных (специфика).
Таблица 2
КОД лить . пить вить
+++ ' - ЛИВА -ГОША -А -ВИВА
-литочныл ,-питочньш —
-\ЛИВНЫЙ — -ВИВНЫЙ
-++ --- (ШГГОСТЬ) -витость
г— ЛИВЕНЬ -—
-4- — ШТОМЕЦ —
--- — вйльчатш
Таблица заполняется частично диалектизмами (с пометой *) и швыми словаш (в скобках). При рассмотрении 6-и идей оказьгаа^-¡я, что. конзергерентн!"' «г^ов представлено из 57-и возможных, . гпос^ентных -- 6 из 6-и. Значит, система развивается преимуцест- : ¡енно за счет конвергеренции, т. е. симметрии.
Развитие матрицы по столбцам для каждой идеи в отдельности демонстрирует генетику лексической системы. О словообравователь-, ной мощности каждой из идей можно судить из таблицы 3, куда внесены количественные данные о дериватах с учетом частей речи (без г учета диалектизмов). '
Таблица 3
Суц. Прил. Глаг. Нареч. Суша
КСК дер. КСК дер. ■ КСК дер. КСК дер. КСК дер.
ЛИТЬ 45 206 29 66 11 108 3 3 88 383
петь 87 148 40 Б6 22 164 5 6 . 153 374
БКТЬ 73 163 . -.28, 71 9 115 5 7 115 356
ШЪ 76 135 41 70 23 115 6 . 7 146 327
ВИТЬ 63 117 30 47,. 23 1 139, г 3 118 306
шить 36 82 14 37 4'' 65 - - 54 184
Самой моощой по общему количеству дериватов является матрица ЛИТЬ. Однако словообразовательная потенция наиболее развита на матрице ПИТЬ — 153 корне-суффксальньа 'комплекса (КСК) при стандартном наборе префиксов оставляют широчайшие возможности для образования новых слов с определенной, вычислимой (это очень важно! ) семантикой. ; '
Рассмотрение симметрично-асимметричной матрицы по горизочта-ля и выход с помощью симметрии на другие идеи заслуживзет внимания. Если рост матрицы по вертикали показывает генетику лексической системы, то симметричньй переход к другим идеям монно назвать развитием системы по аналогии. Каждый из дериватов любой идеи может, стать исходной точкой для продолжения матрицы по горизонтали. Эта ' означает, что данная словообразовательная модель не един-
; - 13 -
ственна. Симметричное словопорождение — это наиболее легкий способ словообразования, следовательно, и более частотный. Построение симметрично-асимметричных патриц гсонвергерентно-дивергент-ного типа, в которых по вертикали расположены элементы с едиными генетическими признаками (развитие одной семантики), а ¡то горизонтали -- элементы негекетические (симметричные по фенотипу, по
• внешнему виду), внесение в матрицы данных,других близко- и неблизкородственных языков приведет к нетрадиционным выводам в этимологии, покажет пути развития словообразования, подобно гомологическим рядам а II Вавилова в биологии.
Анализ полноты/неполноты лексики показал: 1. Лексика — первый функциональный уровень языка, ее можно считать главным, т. к. ока связана с первичной семантикой — семантикой понятий. Поэтому полнота лексики недостижима в принципе: на этом уровне она означала бы остановку в развитии индивида, коллектива и через нюс -- языка. 2. Лингвистическая причина неполноты лексики кроется в реальной неполноте на предыдущем уровне — уровне слогов и морфем. Теоретически возможная комбинаторика очень аелига, но не ис-'~ черпана даже наполовину. 3. Неполнота на уровне лексики доказывает, что развитие лексики шло двумя путями: генетическим и негене-тическнм. 4. Неполнота лингвистического универсума на уровне лек- , елки (и словообразования, т. к. они тесно связаны) стимулирует по-
• рождение большого количества новых слов, а это можно считать своего рода творчеством. С.ятие неполноты на лексическом уровне идет за счет моделирования одним из двух названных путей. Это важно для обучения языку как в школе, так и в нерусскоговоряш/эй аудитории. 5. Неполнота лексики становится проблемой при создании компьютерных систем, работающих с текстами на естественном языке. Создание матричного словаря открытого типа позволит в некоторой степени решить эту проблему и автоматически распознавать, кодиро-
- 14 -
вать и вычислять значения слов, не введенных в ЭВМ.
В третьей глазе рассматривается полнота/неполнота лингвистического универсума на грамматическом (морфологическом и синтаксическом) уровне. Любое слово первоначально возникает в одной определенной грамматической форме. И только .в том случае, если оно приобретает грамматический статус, повторяется в разных формах, можно считать, что это^ слово вошло в систему языка. Язык отражает •мир настолько полно, насколько зто необходимо для понимания гово-, рящего слушающим (следовательно, для приспособления к среде и выживания). Редко создание нового слова и его парадигмы является самоцелью; чаиэ всего словоформы создаются именно при отражении определенной ситуации. Форма отражения логики ситуации и будет грамматикой — морфологией слов и синтаксисом. А. логическая ограниченность ситуаций и отношений между.объектами приводит к тому, что грамматика (больше морфология, чем синтаксис) становится замкнутой системой в рамках данного языка, в отличие от лексики.
В универсуме наблюдается обратное. Кз 4G00Q слов, включенных в Частотный словарь русского языка, только 9044 встречаются в текстах с частотой не менее 10. Каждый класс имеет в среднем по 10 форм изменения. Вероятность встречаемости каждой формы равна единице менее чем для 2-5% слов. Представительный объем текстов выборки показывает, что лишь четвертая часть лексики теоретически может быть освоена в грамматическом отношении непосредственно из . восприятия. 75 % слов требуют моделирования большей части своей парадигмы по аналогии, которая основана на симметрии/асимметрии.
Представление форм числа существительного в виде двухмерного куба Грея позволило показать 4 разных теоретических типа парадигм и их наполнение реальным материалом. Формально получены существительные имеющие обе формы числа, pluralia tantum, smgularia tantum и неизменяемые, у которых число выражается синтаксически
(ситуационно). Возможен переход из одной подсистемы а другую, что и происходит в универсуме. Так, наюг отмечены формы КЛЕИ, ДОПИНГИ, ЗАСТОИ, ЛЮБОВИ, ЗЛЫ. Значит, происходит "достройка" парадигмы до полноты. Анализ, употребительности форм числа также показывает неполноту, но семантического плана (так, названия парных частей тела чаще употребляются во мн. ч.), Как и формы числа, падедныэ
• форш ограничиваются логической семантикой. Данные по частотности форм падежа приводят к семантической классификации существительных, доказывает их "тяготение" к определенному падежу и,.значит, : к определенной логической семантике. Несмотря на некоторые разли- ; чия, носители разных языков в делом отражают единый мир с одинаковыми элементами, отношениями, логическими зшеонами. А поскольку язык ~ это лишь средство отражение мира, • то в разных языках должны быть некоторые общие, функционально подобные способы отражения ситуаций. В атом плане противопоставление языка, имеющего 22 падежных формы (венгерского) другим, имеющим шесть (русскому, ! белорусскому) или три (болгарскому, английскому) падежа, носит чисто формальный характер. Вся проблема заключается в синтетическом или аналитическом способе адекватной передачи информации одного языка средствами другого. Итак: 1. Морфологическая система любого языка отражает логику отношений и ситуаций окружающего мира, в целом общего для всех людей. .Следовательно, морфология лк>-
• бого языка должна быть представлена в универсуме (на достаточно большом объеме текстов) в относительной полноте. 2. Неполнота языка-реальности на этом уровне зависит от семантических причин. 3. Грамматические форш легко воспроизводятся (моделируются) по аналогии, т. е. симметрично-асимметричным способом. За счет появления ранее отсутствовавших форм, обретения или измене- , ния парадигмы слов развивается морфологическая система. 4. Теоре- ; т и чес ют полнота морфологии языка обеспечизает полноту
представления на следующем уровне -- бинарного синтаксиса. Однако реальная неполнота парадигм заставляет предполагать, что и на синтаксическом уровне в универсуме обнаружатся взаимонедействия и царит неполнота, требуюищ снятия, а следовательно, моделирования.
Синтаксический уровень описания языковой системы с точки зрения полноты/неполноты представляет собой совокупность и взаимосвязь элементов лексического и морфологического (парадигматического) уровней. Его системное рассмотрение представляет интерес в плане теории взаимодействий/взаимонедействий ОТСУ. Потенциальная грамматическая полнота лингвистического универсума, которую мы понимаем как возможность создания всех форм парадигмы для всех элементов, обеспечивает теоретическую полноту ядерного синтаксиса. Вслед эа В. А. Карповым мы считаем, что бинарный синтаксис можно рассматривать в терминах модусов, моделей и модификаций как разной степени грамматического обобщения. Модус — это композиция классов слов. При наличии 6-и самостоятельных классов имеем 36 синтаксических модусов. В таблице.4 представлен 21 модус-в виде треугольной декартовой матрицы, (без учета порядка элементов) и указано количество примеров.
Таблица 4
С Г .И Н Ч М
1 69000 31000 40000 2500 ■ 858 . 927 С
2 2000 . 1700 • 3000 87 3000 Г
3 1000 . 407 53 589 П
4 681 20. 212 Н
6 60 14 Ч
6 28 м
На уровне бинарных модусов вое классы.взаимодействуют друг с дру-. -гом. Шщность этого взаимодействия зависит от лингвистических и1 < ;. зкстралингвистических факторов- Конкретная семантика существительных, прилагательных, ■ глаголов и наречий обеспечивает их мощ-.куга сочетаемость на , уровне модусов- .При этом существительные, прилагательные и-глаголы имс-кт еще и разветвленную систему, форм,;.: позволяющую создавать множество «оделей и модификаций. Абстракт-:. ;нал семантика местоимений и числительных обуславливает, их нега-.'г ; формативное гь во взаимных сочетаниях. Сложение двух абстракций:; :еще больше усиливает неопределенность,ситуации и практически ее не отражает. . ■
Полный список всех теоретически возможных бинарных моделей ..V задается декартовым произведением множества позиций. При анализе ... универсума выделена 31 синтаксически значимая- позиция. Шлучим •' 961 теоретически возможную минимальную синтаксическуи модель с .:, прямым и обратным порядком элементов.. Реальное заполнение таблицы"' .показало, три относительно четких зоны: 1) зона.полного взаимо-';1, действия; 2) зона частичного взаимодействия; 3).зона случайного взаимодействия, э которой вьщеляется подзона полного взаимоне-действия. . •':..'■
Дальнейший анализ показал наличие в синтаксисе полиморфизма, ■ неиэомерийного и кгомерийного. . Подробно, .рассмотрен неизешрийный " полиморфизм на примере юделей "сущ. в им., п. + нареч." и "нареч. ;; +. сущ. в им. п. ". (ПАЛКА' НАГОТОВЕ и ВДАЛЕКЕ ДЕРЕВНЯ). • Обнаружены,.''. наречия только левые, только правые и лево-правые. ■ Они различны по семантике, к мы связываем это с разным происхождением, рзссмат-. риваемых моделей. .Доказана, тагам образом, семантическая левиа-.'./ иа/правиэнз модели. .Возыомяо, .лезиэна/прззизкз, целых сеьзнтичес-ких групп слов связана с. разной функцией левого и правого гголушз—'
рнй иоэга и с тем, что разные по семантике слова хранятся в памяти в разных отделах мозга. Язык как средство отражения деятельности мозга обязательно должен каким-то образом такую информацию содержать.
Семантико-грамматическая неполнота универсума, отраженная в синтаксисе, рассмотрена на примере глагольного беспредложного уп-, равления. Объектом анализа послужили законы композиции "глагол + сущ в род, дат., твор. и вин. п." в их полиморфических модификациях. Выявлены группы поли- и моновалентных глаголов, показывающие неполноту семантики. Для представления полноты/неполноты глагольного беспредложного управления мы вновь воспользовались четырехмерным кубом Грея. Четыре признака.— четыре косвенных падежа — предопределяют существование 15-и и только 15-и групп глаголов по типу управления: 11-и поливалентных и 4-х моновалентных. Такая система позволит экономно кодировать глагольное управление в сна-■ темах ИИ.
Полнота/неполнота расширенного синтаксиса рассмотрена на примере расширения логической модели "деятель + действие" позици-: ями разных падежных форм. Доказана неполнота по следующим параметрам: 1. Разные полиморфические модификации встречается с раз-. ной частотой, еплоть до нуля. Это доказывает нёсаоб<?тт:г порядка слов в русское языке. 2. Порядок и^ов во многом зависит от того, какими классами выражены деятель и "расширители". Совокупность несамостоятельных иди абстрактных классов (местоимения, прилагательного) снижает встречаемость, т.к. такое сочетание неинформативно. 3. Семантическая неоднозначность и неполнота зависят от того, от какого элемента зависит "расширитель". 4. Представить все расширенные композиции с помощью полной математической структуры невозможно (их количество бесконечно). Значит, снятие неполноты синтаксиса происходит моделированием и оклейкой "длинных"
t
композиций из ядерных. Рамки одной работы не позволяют более подробно анализировать расширенные модели вообще. Следует переходить к детальному анализу каждого закона композиции в отдельности, что и делается несколько лет в ВИЛ теоретической и прикладной линг-' вистики.
В четвертой главе рассмотрены способы снятия неполноты уии-. версума на разных уровнях, начиная с текстового. Проблема полноты/неполноты на сверхсинтаксическом уровне выходит за пределы собственно лингвистики и становится предметом науки о знаниях — когнитологии. Во поскольку познание и мышление тесно связаны с языком, решение этой проблемы во многом зависит от лингвистов. . Любая неполнота на функциональном языковом уровне есть неполнота : знаний. Поэтому мы подробно остановились на неполноте знаний, ее отражении в текстах и способах снятия неполноты, т.е. на познании. Система познания представлена в виде математической группы 8-го порядка.
Основная масса информации существует на уровне текстов. МЫ попытались построить относительно полную формально-логическую'" структуру текста — сценарий. Он представляет собой семантическую сеть в виде многомерного куба, вершины которого заполнены информацией, извлеченной из текста, или не заполнены. Бесконечность структуры определяет ее гибкость, а неполнота позволяет развитие, * т. е. пополнение информации.
Основным способом снятия неполноты в системе является моделирование на всех ее функциональныых уровнях. Шделирование-представляет собой разновидность поведенческого акта и, значит, , как процесс является труппой 8-го порядка. Снятие неполноты как акт обязательно содержит цель, возникающую вне языковой системы. Следовательно, о моделировании может идти речь только на функциональных уровнях языка: лексической и грашитико-синтакслческом.
Конечной целью моделирования слов должно стать адекватное отраде- , ние конкретной ситуации реальной действительности. Действия при моделировании слов не носят механического, характера. Недостаточно просто соединить префикс, корень, суффикс, флексию. "Соединение", происходит осмысленно, т.е. в процессе моделирования идет поста. . янный однозначный выбор между разными значениями частей слова и в итоге ~ приписывание результату конкретного, единственного зна-' чения. Любое слово возникает сначала как моносешчное. Что касается средств моделирования слов, то словообразовательный потенци- . ал системы испольаован в, лучшем случае на 3-5 % и только в .рамках простой деривации. Выяснение разрешений и запретов на комбинато-'. рику частей слов должно привести к .разработке алгоритмов автома- ■ тического поиска и распознавания новых,слов, новой методики раз-, вития речи ребенка.
Бесконечно большое количество законов композиции при их не- , . .. ограниченной длине приводит к тому, что ¿се композиции, за ис-•ключениеы клише и цитат, каждому человеку всякий раз приходится ■ создавать заново, т. е. моделировать,. Действительно, быстрее создать композицию САМОЛЕТ ЛЕТИТ, .чем вспомнить ее, выбрав из миллиардов "знакомых" и "незнакомых" подобных композиций. ^ Доказатель- _ ством'того/ что композиции не просто запоминаются, а создаются,', : служит быстрое развитие - речи ребенка: к трем годам он овладевает ,7 практически полностью системой языка и шжет произносить длинные фразы и монологи. - На уровне расширенного синтаксиса из-за неограниченного количества элементов структурная неполнота постоянна, и1 тут идет постоянный процесс моделирования. Один из способов моде-. лирования — "склейка" развернутых композиций из двухэлементных ,на основании общего элемента. Увеличение количества элементов теоретически должно Вс(.1И к увеличению энтропии. .Из практически ■ происходит" резкое вытормаживание семантики каадого' последукздэго-,
¡емента. Вытормаяивание может быть грамматическим, ситуационным нания о мире и предметной области) и семантическим (в связанных овосочетаниях перебор сводится до минимума: например, прилага-льное ПОВАРЕННАЯ предполагает.. только существительные СОЛЬ и ИГА). Семантика является самым расплывчатым ограничителем, т. к. емантика возможных миров" позволяет практически любую сочетае-сть в рамках любой модели.
С целью выявления сгругоуры смысла текста нами проведен экс-римент по сборке текста, рассыпанного на словоформы. Результаты казали: 1. Общий смысл текста строится из а) теш, которую фор- . руют лексико-семантичесгаю поля значимых классов и взаимоотно-ния между ними; б) ролевых отношений иг аду элементами (грамма-ки); в) союзов (их характер заставляет искать определенные от- . шения медду ситуациями и, значит, создавать некоторый смысл; г). аков препинания, которые могут подсказать некоторые причин--следстзенные спззи между ситуациями, количество и виды предло-ний и др. 2. Связь между предложениями устанавливается в эави-мости от типа текста, но всегда.выражена формально. 3. Важга " яснить природу (декларированные или продукционные) и объем , Зственных знаний испытуемых при создании текстов. На это на--авлена дальнейшая работа. Полнота/неполнота лингвистического ¡[версума вывела к сложнейшей проблеме — структуре и смыслу сста. Начав с текста как объекта анализа, ш вернулись к нему. ■' объекту синтеза при моделировании новых знаний. Это приводит . эыводу в философском плане: анализ не равен синтезу, когда речь" ?т о функциональной системе типа языка, и причина тому — не-пнота этой системы. . .
Основные положения диссертации отражены в следущих публика-эх автора:
Похдота-неполнота универсума на уровне словаря// Словообра-
зование и номинативная деривация в славянских языках. Тезисы до] ладов III республиканской конференции (5 -.- Б октября 1989 т.] Часть 1. Гродно, 1989, с. '252-253.
Разработка теоретических основ и концепций представлен! знаний на естественном языке для реализации баз знаний// Hay но-технический отчет о составной части НИР, Книга 1, части 1 и ¡ PK 013900755135. Госномер 03900027220. Минск, 1989, с. 7-1: 104-105., 137-148, 181-187.
Шлипрэфиксация и ее представление в машинном словаре// Aj туальные проблемы компьютерной лингвистики. Тезисы докладов Bei • союзной конференции. Тарту, 1990, с. 99-100.
Структурное представление процесса познания// X' Всесоюзн; конференция по логике, методологии н философии науки. Тезисы до: ладов и выступлений (секции 11-13). Минск, 1990, с. 153.
Концепция лингвистической неполноты и ее снятия// Лингвист ка: взаимодействие концепций и парадигм. Материалы межведомстве, ной научно-теоретической конференции. Харьков --"Сочи, 1991. Вы 1, часть 2, с. 450. ..
Структура логических знаний о ситуации в системе искусстве нога интеллекта// Вопросы экономики и организации информационн .технологий. Материалы Всесоюзной научно-практической конференци Гомель, 1991. Часть 1, с.176-177.
Пути оптимизации обучения русскому и белорусскому языкам в ек ле // Тезисы докладов научно-методической конференции "Пробле изучения и преподавания русского языка в вузах и школах республ ки" (20 — 22 мая 1992 г.). Часть 2, с. 3.