автореферат диссертации по филологии, специальность ВАК РФ 10.02.21
диссертация на тему: Теоретические и прикладные проблемы инженерно-лингвистического моделирования сверхфазовой структуры текста
Полный текст автореферата диссертации по теме "Теоретические и прикладные проблемы инженерно-лингвистического моделирования сверхфазовой структуры текста"
ВОЕННЫЙ КРАСНОЗНАМЕННЫЙ ИНСТИТУТ
На правах рукописи УДК 801.73
БЕРЗОН Виктор Ефимович
ТЕОРЕТИЧЕСКИЕ И ПРИКЛАДНЫЕ ПРОБЛЕМЫ ИНЖЕНЕРНО-ЛИНГВИСТИЧЕСКОГО МОДЕЛИРОВАНИЯ 0ВЕРХФРА30В0Й СТРУКТУРЫ ТЕКСТА
Специальность: 10.02.21 — Структурная, прикладная и математическая лингвистика
Автореферат диссертации на соискание ученой степени доктора филологических наук
МОСКВА — 1988
Работа выполнена в Магаданском государственном педагогическом институте.
Официальные оппоненты: доктор технических наук, профессор Р. Г. Котов,
доктор филологических наук, профессор Ю. Н. Марчук, доктор филологических наук И. П. Белецкая
Ведущая организация — Ленинградский государственный университет им. А. А. Жданова.
Защита состоится «. -/{ > .ЩрвсСО' 1989 года в часов на заседании специализированного совета Д. 106.04.01 при Военном Краснознаменном институте по адресу: 109033, Москва, ул. Волочаевская, 3/4. Тел. 362-41-38.
С диссертацией можно ознакомиться в библиотеке Военного Краснознаменного института.
Автореферат разослан
« ФС6ШЛА.Ш года.
Ученый секретарь специализированного совета доктор филологических наук
Е. В. Сидоров
? Д^туачь^ость теш. Естественный язнк в настоящее лремя 11гЛЗО0ЛЬ~° слУп:т ос:»вой речевого облагая, то и является базой для соадаиия дка.чогошх иистеы типа "человек-ЗЕМ". Для npiwmwtu;«! такого дчалога ¡геобходимн адакватныа сведения о лингвистических закономерностях построения связного текста, ого ОЁэркфразсшй стру.*лурт, исследозза:г,!зм которсс пртзвана ее.кк«9?ься лингшсглгса. текста - новая формирующаяся отрасль языкознания. К,чучонк8 продлен лингвистики текста актуальго вэ:: с тгореянчаскоп, так и с практической точи« зрения. Тсорз-ггячапкая актуальность состоит а необходимости перехода от сугубо о;?кеатольпогс> иеспвдоБйшя проблем дангчистикн текста к таг.ому :ct кз'Л!9гтн>» которое лрздуематряБает выяяледав и фор-»«лънул вкспликашя» оскоаккя объектов и отношений сзязкого то-ота i» предполагав? в ср««м« о применение методов инее-к0рки--лингвисг»,иччск01х) модплирэваммг. Использовало данных ые-тодоб только япляэтсл нообходпкны условном для oprikícaljr.l
диалога человека о ¡¿шиной, по i¡ тязт стать ключом для разрз-mctBTíi целого ряда вопрссоа коге-угккацчк и актуализации язшео-пнх объектов в речи»
Как только згдаш выявления к (формальной экспликации оо-ircEü'.i-c обтьзктор ликгшетнки текста сказывается сформулирозагкэй а ликом становится оч?зддной и прикладная актуальность
тзттюЯ проблемы. Необходимость коделирования сложных процессов обработка лзьшоаой ¡я-форкщии требует создания гффэя-ткбкой теории анализа овяпнж текстов. Опираясь на эту теорию, нуяно рэпрзэонтировать систему организации таитгосых ерздетв 2 спялном тексте, в частности обосновать наличие в тексто структурных мелфразовыя связей и евврхфразовых единиц, а также ок?рх-фразоЕой структуры текста с последующей их формальной экспликацией. Подлежит также решению и ряд других задач, необходимых для эффективного анализ» сеяэных текстов на ЭВМ, а следовательно, и для cuno л иски я социального заказа на разработку и реализацию промышленных сисЛ'еы автоматизированной пороработки полных текстов научных документов.
Применение инженерно-лингвистических методов з рамках лингвистики текста преследует не только утилитарные целч.
Свчзь ЛИНГГ.ИС5ИКЙ тзгоэт с якг'ЭнврйОй яг'кгсисйкой енпа.чяязр одновременно и вм.ну:; ьазтодолкяи'пгсяу» Зудацию. Настоящее исследование в сьяан с этиа ка заканчивается построением модели 1!сслсд,у0:.;с»'0 оинжта. ЗаБоршагацгЩ залшэклчм обратную связь мэжду моделью мажфразоктх отксатиА и 6Э оштиретеся кой текстовой основой, здесь являетог иоспрэкзЕ-здсниэ данной К9Д8ЛИ в виде едаиэчгов ^оргаяьной такогчяйй ко---* юрт йогу? исполгьэоэаться в «икгьистичзею» «аттз» при рз-гаиги прикладных оедач, оснодйшах ни свэр:£разс1<он Евалмуд.
Ц?ль ксэдо^овш-мз закгючагтел и раар'откз изтодог ао;:~ оч-рум-ивного оиисакиА ссерх^рсзогаЯ «?пук*урц гззв*с .тасре«" С9СОИ и?вхс!юрнэ-л2£нггчсяРг«ся»го «оде.шро1<ш-ив об'ье»?яад» су-Чэстгувяцта г нем сперкгрсовых оаяззй и едглзщ.
Эта общая цеяь абуслоплло наобходакегь ряшвймп целого ряда теореточоскщг я ПЕКчпааузрс зз&я»» а чиияе. коч-оры* наиио-лез важкъэд шшдося слв,'^.^;^;
•-■> изучение и сикс&шо форячиг.-яхгэ хнш'вясгичэодоо аопарйта оверлфра.-озого синтаксиса;
- определение к здрдеябодетдо «¿©детавгйяио сииоддочв-окой сверл£р:\сс>Бой екзй кот. соиош форикрэвгимя езорхфуаао-воп структур« текста;
- построения уипочагии си1»см»еячьсик сверкфрлоондх сгАсзй к их саркср"1«;
- экспликация ссер:з£рз£своЯ структуры юкста посредством разработки нетодов аз алгоритмической реконструкции е виде ориентированного расположенного расцвеченного графа;
- разработка фг>рмив»зованнцк способов сегмонтац!'.:; тексте.
на сосч'авлптацие евврх^розопчо образования, обоснование объективного существования в тексте СТруЛГуркрОШННИХ свзрхфраоо-вих одиющ, алгоритмическое ввдеяеще ка в тзкете и уотаног— лзнио их иерархии;
- разработка и репликация ка ЭВМ алгоритмов сверхфразового анализа и переработки научных текстов;
- экспериментальная проверка адекватности выдвинутых теоретических гпложашШ и аппарата, описания о^.эрх^разоый структуры тскста.
<"еяяя?ся письивнш;з науч-щэ токсты ш английском и рудокоп» языках кэ различных областей знания обидим обт.з?гам около одного даяляопа слозоупотрей-
Предметом исследования является зталчение, описание и нн-венерко-омнгвистичеоноб по^ьиш/ю^ипо структурных закономерностей, л<ь:»1щях в основа $ормириваккя связного текста.
Методологической основой исследования является марксистско-ленинская диалектика, п частности, ученмо о всеобщей связи и взаимозависимости латаний действительности, метод систэм-
а«ялиэар диалектика часта и целого, форм» я содержания. В соответствия с этим объектами исследования являются опяэний текст, его сверх^рааогая структура, синтаксические сверх'разо-2па сеязи, объединяйте отдздыме предложения в сверкфразоьно йдй»ги(|,ы, а гакл'я закономерности раолрвдпл^чип ттотсЕОЙ ин1«р-з тс:;с?а в зависимости от характер ог-о ^рр!.лш.таП струи-
••-■урч.
Мэз-сды исследования включают метод;! шиенгрлой лингшстн-~а 1; якдашсгичбского экеиорямета, метода компонентного ана-лтай, лсгнко-св(.м!Ш1чоскяй и Д'ютр^бугизша \.етоды, а также лчи''шсти«рлкий ггрилотеняя методов теории мнодветя, теории гра-хоз и теории алгоритмов, метода скопоршадтальной пвр.пЦнм-щпх ЭВМ еистьм сверхфразового анздлзд. раэлиинюг типов,
Иовизн°. про до ню г*о исследования зэкгаччется в том, тго а работе впервые зкешнгдаррлтея и формализуются структурна* гаяодеигркссти и лзгя'озиз сродс.-ва» учьствуяв?г в постросгззг овяочого текста, вводятся и обос.човиэайгсд базируемся на ;{ц аеиерно-лингвистическиг крит-ариях понятия "скнтаксйодпкоЯ свЕрхфразовой охшзи* и ''с^охйрацовоГ единицы1/ ¡.мервио лре.чдо-гс2тсл ¿ормалынм одьоэгочйе пооцадури опсщикации структура сайзном текста ь жэдв ориентиров шного росяидоддчного расцво-ченного гра^й, а такье сегментации текста ня составляя!!?!« СЕорхфразовно сди;пл,и, (¡спизна исслуцсьрлмя оаклпчаятоя тан-ж. с то!.;, что изу-кпме оиеп/дйлоячх отпошелн! обращено одсоь нспо^рздстзаннг. к "чм^иерной лингвистике, цругими словами, на л с но по подвинуты:! тсоретичскж;:! положений и раоЧ>ге шмаа&~
ются и реализуются алгоритмы автоматизированной пореработки текста, причем предлагается принципиально новый подход п рояз-нив ряда прикладных задач /автоматическое реферирование, автоматическое фрагметкромкие и т.п./, основанный на формально!: й1сишзо сворхфразоЕОй структуры.
На закату выносятся следующие осиовше положешя;
I. Закономерности построения сиязно''о текста и его структуры мсгут бить эксгшщироваин в рэмках свзрхфразового синтаксиса к в значительной степени поддаются формализации о поморю из то до в инг.онзрно-лингвистического моделирования,
?.. Теория сверхфразового синтаксиса монет базироваться п? понятия "насыщения" предложений в ог;кз;;о:.; тексте, причс« ;:опа» сыченные предложения не могут р.чеква^нп интерпретироваться реципиентом без привлечения лексических элбычлов из бшгаайкого окружающего контекста,
3, В связном тексте с поыо^ю фортльных процедур шгут бнть заявлены эксплицитные синтаксические сверхЯртзоБцв о«яои, т.е. такие связи меуду двумя предложениями. когда одно из них является тс'тчтеч другого кчн в тчнг» внракекчя. та;? и г плане содержатся,
4, Свгрхфразовая структура иояот боть адекватно реконструирована посредством ингоиерио-лккгЕистичзсккх методов в виде ориентированного расположенного рлецвзченного графа, заршиш которого соответствуют предложениях; тс;;ста, а рзбрт. - сиитак-снчес.тии зверхфраэовыы связям мстду предложениями.
5, В результаты алгоритмического анализа реконструированной сворхфразовяй структура т&кс»' ш>»ег- бить однозначно сегмзнтиро -вак нь структурированные составляющие образования /сверхфрагю-
едьпг.ци я единства/.
6, Основываясь на инженерно-лингпистнчезком о штаты сверх.-фрлоьоЛ структуры, можно построить и реализовать на ЭВМ се-рпп систол автоматизирований переработки текс1а, характери-еу*жцихоя более высокой эффективностью пэ сравнение с изазетшми системами благодаря привлечению к анализу дополнительной сворх-фразосой информации.
Теоретическое значэггле работы состоит в то«; что э кзй
- б -
формируются и обосновываются теоретические пояожешгя, совокупность которых мо.жго квалифицировать как теоретическое обобгцзшо и регаение крупной научной проблемы - кюкенврно-ятатюглчеикого ¡зделирования свапх^р&з'овой структур» текста, икауч'.ей важное сомиалько-культуркш значение. В работа излагается и : ст ç н э pi ¡о - ли и г я и с т а ч в с к а я теория и методика эксплика-гул свврхфрзэоЕых связей и единиц текста, а также его отруп-ïypw. Вадышутые теоретические положения могут быть исполь» возьми при разработке ритакеичэских аспектов лингвистики текст», гтри виучонш с Бархударовых структур различных типов •?зкстов и тэкстоп':л разных язнгсх, при дальнейшей разработке тсэртэт воспроизводящих инженерно-лиигвистичесгих моделей сеяэ^го текста,
Ноактстескоз зкяч^_ки* настоящей работы состоит в том, что а процессе создания конкретней технологии здзеь обосновываются и практически апробируются метода звделония основных критериев, связей и единиц сверхфразового уровня, а также разрабатывается экспериментальная методика, с помощью которой могло с бс?м"ой степенью достоверности проверять выдвигаемые гипотеза. В работо олгисшзаютгя метода разработки и реализащи га ЭВМ автоматизированных систем ре ив pu ро ва шя и фрагыентирования, а также подсистемы автоматического ян-деясиротния, основанных на сверхфряяовом анализе, что в определенной степени способствует выполнению социального заказа на соэдажз и совершенствование систем автоматизированной переработка текста различных типоз.
Предлагаемую »летсдику алгоритмической реконструкции свзр/'рразоЕой структур« текста целесообразно использовать в перспективных системах автоматизированной переработки текста, особенно в системах, в которых аналштико-еинтсти-ческой переработке подвергаются полныь тсксты документов-перроисточшгков. Алгоритм различения истинных: и лек-
сических г.ош.ектороь может иметь более «троков применение, р частности, при этализе сньтаксичоскоП структуры предложений. Идой и положения, разрабагпгоаемш в настоящей работе, могут использоваться в пузах при чтении спецкурсов по сип-
таксичеста« аспектам лингвистики текста, автоматической обработке текстовой информации, лекционном курсе теоретической грамматики английского языка.
Апробация работы. "Положения, разрабатываемые в диссертации, докладывались на международных семинара?: по маЕпглпоцу перейду б г. Москве в 1975 и 1983 годах, на Всесоюзных конференциях, симпозиумах и семчнарзх, з том чнслэ таких,как "Автоматическая переработка текста методами прикладной лингвистики" /Кишииеп, 1971, 1977; Шнек, 1382/. "Ссмио?ичоскне проблемы языков наук;;, терминологии и ;;м£орштики" /Москва, 1971/, "Лкнгьисткгл текста" /Москга, 1974/, "Проблэмн синтаксической семантики" /.Москш, 1976/, "Преподавание инострап^ ¡па язшюа с помоцью тох'гачеокюс средств" /Кишиэг, IS7P/, "Вариантность как сродство языковой системн" /Москва, 1922/, "Мзтсдо I! ерздетва обработки слогтой графической информации" /Горький, 1983, 1585, 1988/, "Бионика интеллекта" /Харьков, 1987/, "Психологическая биокика" /Харьков, 1938/, а такае на ряде республикански к региональных конференций,
Структура работы, определяется поетавлоичнм;-; в нзй исследовательскими задачами. Диссертация состоит к? введения, двух частей, включающих пять глаЕ, заключения, списка литературы И ПрИЛОЖЭ№5Й.
Введение ссдерлотт обоснован« актуальности изучаемой проблему, Б нэк кратко излозмэни основныз задачи исследования, положения, ганосишэ на защиту, и результаты, полученные автором, а тапзз указывается, что нового вкосится в исследование проблема. •
Главы первой части "Общелиигвистичзскиз ос:гоьаш:я инженерно-лингвистического моделирования свэрхйра-зоеой структуры текста". 3 первой главе анализируется роль свэрхфразов!£х исследоЕа]ий d современно« языкознании, их исторические корни, рассматриваются основные понятия тингзк-стики текста, объективное место текста s системе коммуникации, в человеко-натинтом общении, роль инженерной лингвистики в процессе моделирования сверхфразовой структура текста, а тпэте некоторые другио прикладные аспактн сшрхфразового анализа.
Во эторой глава исследуются укктаксичоскиз звэрхфразоЕыэ отношения, ососновываетс.1 функционирование ccGpxфразовой стру.гтурн текста, а также практическая возможность инженсрко-дикгвястиччспого 1'одо.пкрор«н;тя данной структуры, На основании пр.п-зпешш критерия насыщения предложений в связном тексто и знэлиза ггснярзткого лзшового материала вводи гея поил тив "син-( таксическоЯ сверхфразовсй связи',' являющееся основоползгаюциы д.1!я инхенерко-лингв'лстического аспекта теории свэрхфразового синтаксиса.
Г л а » а в v о р о й ч а с т к "Формальное описание с^Э'гсфразовой структура и aro использований в систек-ах автоы&-переработки текста". В третьей глане описивачтся орэдетва вчрз-ченил синтаксйчссггих сверхфраз о вах связей, приводятся их характеристики а зависимости от особенностей дистрибуция в ггкстэ, а тагсаэ построэнная на основе всех этих данки типология сверкфразошх связей указанного типа и их маркеров. Б четвертой главз вводятся базирующиеся иа структурных критериях: понятия "евзрефрамвой единкцы" и "сверхфраясвого единства"» расс^лтрп^а^тся еггзг^ицитг^го к :п^гл::цптииз средства Формирования указаниых образевзлкй. Здрсь такгз описцраются форгга чьнне однозначные процедур» представления связного текста 2 еидз ориентированного рас по те.тонного расцвеченного графа:, и сегментацта текста на саергфразовые единица и единства, В пятой главе приводится описание алгоритмов сверх фрр.зовогэ анализа, ппименяешк в cucTeitax бзтоматизирюшнной переработки текста, и рабочие характеристики реализованных систем, paociü.?-р1взегся соотношепкэ ыгяду результатами работы указанных сио-теи и четвертый эвечоа воспроизводящей шпсенерно-лингвистиччс-кой.иоделк связного текста, реализующим обратную связь иегду результатами лингвистического эксперимента и потребителями систем, в результате него подтверждается адекватность ввдзи-вупк творзтнчеспях пояотекий о реальной фуиционироЕггпк в связном тексте синтаксических свврхфразоБы.с отношений и евзрг-фразово'! структур» текста.
В закчючении подводятся краткие итоги исследования, подчеркивается возможности применения егс теорети-
часта к практических положений, намечаются пути дальшйпэ-го изучения структурных аспектов .ттнгзизтики тскста,
В приложении содержится список то;:стов; из которых приьодятся примеры в диссертации, алфавит::^ словари русских и английских лексических коннекторов, образцы гоопроизведонил структуры научнее те 2: с то л я действующих аг-«»уатиэировашаи системах, рабочос описание системы аьгоаати-чгского реферирования, вюгачакцой сверхфразоиый анализ.
СОДЕРАЙШЕ ДИССЕРТАЦИИ
Синтаксический компонент текстообразовашя на «^э^к^^чл-угодна. Основныы объектов изучения лингвистики тзкега /ДТ-язляется езязный текст, в котором имеет место конвергенция . грамматических, семантических, стнлистлчооких, гтрагд&тпчэскш: и Других отношений мееду текстовыми элементами В связи о тш-что изучение свэргсфразовш: отношений в настоящей работе обрч-Е)ЭНО непосредственно к инженерной лингвистике, мы Судом в дет нуйззм исходить из узкого понимания проблештаай ДТ 1» то:л с>шсла, что основной задачей здисо «•гинится прежде всего изу-чешю синтаксического иокпоизяга те::стаобразэкмшЯ.
Работы языковедоп в последние два десятилетия позволили вэдэлить некоторые основные лингвистические закономерности построогая и организации связного текста /Аполлонокая, Арутюнова, Белзцкая, Блох, Богданов, Герд, Гивдин, Зубов, Лойки-на, Москальская, Николаева, Новиков, Откупщикова, Падуче на, Попоскул, Рввзин, Неверовская, Сидоров, Шаляпина, Беллорт, Вайнрих, Ван Дейк, Веябицка, Дреслер, Изенберг, Палек, Хаза.ч, Холадей и др./. В настоящее время перед исследователями ЛТ Смит задача конструктивного описания механизма текстообра-зования на сьеросфразовоы уровне /СУ/ и внявдешя конкретных связей и единиц данного уровня. Это значит, что, пользуясь ьэтодоы экстраполяции, необходимо списать набор сверхфразовых езязой и единиц, разработать формалышэ процедуры сегментаций цзлого текста на составляйте сБорхфразопие единицы, показать структурированность укачаишхх единиц и, наконец, оп-¡адакить штодц реконструкции и описания сверхфразовой сгру::-
туры текста. Решение этик задач относится к компетенции сворхфрззоього синтаксиса, который, будучи разделом ЛТ, одновременно яг.чяется составной частью общей синтаксической теории.
Одной ::g книгагниих характеристик текста являятся его связное?*. Связность тзгсста - зто по сути зависимость одних его предложений от других, ¡картируемая определенными языко-вимя средствами. У«?*?."»«» я йишдарно-лннгвиотичвСЕую направленность частояч'б^о исследозапж, ш обращаем зшмакиэ прэз-да ncsro на форшльшз срсдстта. такого родя. Тс, что ка СУ фор&ольнш» сгяссЛ. несколько отличается
от даркероп синтаксических: связей ка уровне предложения, не деллаи заслонить общей синтаксической природа двух этих типов связей. В качество сходны;: черт двух разновидностей синтпяг-юоккх отгаеЧ моичо назвать наличие формальных экв-•■пяш&тшх иар:;ерс2; ограниченность при определенных условиях зоны дв".стрил со О Т К'ЭiCTv.^«';« сияз&Й !' однотипная ПрйНИ-
ла закономерной сочетаема«! яикгбиоткчэскчх здннкц/ /Ср. прклокзкко ъ-епряи снчтаксичрсгак валентностей к СУ/.
Вадел.т.т сходжз "ерты синтаксических смэей на СУ и на уровне предложения; ;г~ль?я, з то пв Bpei:;:, их о-нощсашуг^. Одним и о важных показателей различия двух г.; поп cu;iaaiV 'является тот факт, что дш предяоления в составе сложного пуй определенных условиях могут меняться местами, что обычно ¡го-до пуотиш для двух следующих друг за другом саиостс.тгзлышх предложений из-за сч-рого фиксированней позиции етссорс ггенпо-иента и кэсткости сгорхфраэовой конструкции, нарупечкз которой ведет к искажению передаваемого смысла.
Пример I
Besides the function juct mantion»d archaic *»orda aad phrase0 have ether functions found in other otylea. S-,. The» ere, first of ell, frequently to Ъо found in ottsej? ctylan of official docunanta.
Если в тексте из примера I поменять местами прадлогзния( те заместитель "tiny4 окаяогся перед антецедентом "archaic words", что протйЕорета-í правила« построения сеязксго текста. ¡Сромз того, в результата перестановки будет нарушена еззрх-фразовая связь первого предложения с однт" но «рздгчс'гвукзра; предложений текста, обозначенная маркеров "¿uet -ícstioued"
Отмечая сходство к различия синтаксических характеристик продложегмя и re кет«; гам^им. что далеко га все пзккоъыо П2» ленип можно вдокгатга и; гг о рпре ти рзгагь z рамках отдельного предложения. Так, баз пркслечошя ояерхфрааогой ::нфср;.а1г.гл нельзя ¡¡расильчо íipoüii»jí4>jHpoB&'ífc текстовые функця'-: аргиксвй, дэйкгических элскзнтос, лглошй анафэри и катафри, прешки-пализапт;. аллшсиса, порядка слов в продлокзюгл к некоторда
ДРУГИХ ЯЗЫКОВЫХ ЯЕЛ01ИЙ И 0ЛЭКЗКТ0В, Т. 3, ¡-ПГОТО9 fopwajibi.-j
локаличовашио в предложении язтговыо реалии i:; илут биг'ъ интерпретированы в соответствии с эагдгелом автор" бег анализа оаерхфрпзсзюс отношений меаду крэдложншямл текста. Этим прзгде всего объясняог-ся необходимом¡. расширения границ языковедческого анализа и введении в лингвистически» обиход новых объэкгоа и понятий СУ.
Носители языка обычно без труда отличают осмысленный евлзний текст от набора произвольных, не связанных между собой предложений. Следовательно, их компетенция содержит определеннее "устройства", обеспечивлтерт такое разграничат нив, а в связном тексте содержатся пекоторие признаки, обеспечивающие его осуществление. Причиной неудач, имевших место при ввдолении признаков такого рода, на которые ыогла бы опереться теория сворхфрязового синтаксиса, является, на наш взгляд, то, что для огысаиия сверх^разовьк отношений при этом обычно предлагались критерии, ссойственние синтаксису предложения боз специального их переосмысления с точки зрения характера и функций СУ. В качества такого критерия с перо; фразового анализа предлагается использовать критерий насыщения щодпожекий в святим тексте /Гевзин/.
Согласил данному критерию, каждое предложение сечзного текста рассматривается на ¡от окружающих его в кокгексте
- и
прздяоазниС. Под насыщенном данного предложения понимается преобразованное предложение, для которого характерна эксплицитная Емрэгжнноогъ всех предикатов и заполнение мест каждого прздг.г.ата, а тага® названы условия, место, время и участники акта коммуникации и обстоятельства, додающие длйствие юазчотснш /у, е. для прообразованного предложения выполняются требовании когнитивной и ке'влуникатнокой полноты/.
Для того! чтобы спадай такса1 адекватно выполнял свою зсммуншатисцуга функцию, необходимо, чтобы имела месте определенная структурная вэак^аьис.кость есотавлншцих его пред-ложэшй. Обличительной чертой большинства таких азанмооавк-¿'лшк предложений является налитле в та состаэс ыаркороэ зависимости данных предложз;л;Я от контекста. Подобные лредложв-шш называя? нонасмцвкшмИ. Ненасыщб№д:а предложения - это синсааиггичнш предложения с незаполненной свэрхфр&зовьши валвнтноетя«ш, включающие трнерч зависимости данных предложений от других предложения текста, яоторкэ констатируют навозмо;<£ность их адекватной интерпретации в соответствии о замыслом аглорч оеа привлечений в данные предложили определенных токсических эяомонтог из других предложений.
Нзтся!;е.4!юсть значительной пасти прздлсге:г:Я теиста -• это нэотхз.мюжЯ признак его связности. Если ь связном текста 2с» предложения саисшть нх насыщениями. то текст перестает быть связнш, нагс ото видно из примера 2,
Пример 2
&рка "Вымпел" разработала станои "РХ-Ю", Станок "РХ-Ю", разработанный фирмой "Вымпел", увеличил скорость обработки деталей в два разд, Увеличение скорости обработки деталей в два раза, которое обеспечил станок "РХ-10::, разработанный фирлей "Екягел", позволяет значительно повысить производительность труда.
Группа привел«нннх вино предложений не является "правильно построешплл текстом". Здесь каждое предложение, кроме первого, не только вводит ковуи мысль, но и повторяет сказанное ранее. Связные текст;; строят иначе с использованием "недоска-
занности" или нзиасыщенности предложений, и и-леню иа H3iE-сыщежостц предложений покоится ослсеноГ: фвиоьии связного текста.
В работе предлагается различать тр;; типа ^сьцзпия при текстовом анализе: правостороннее /если ненаеьацониоо предчожэ-нио стоит в тексте справа, от предяоййгая, Еключаз^ого ле:;с;;-чоск:з слсиопти, необходимые для наснгрння первого/, ле-осто-ронкео /ссли нонасыцэнше предложение стоит з текста слева от "насытакцого" предложения/ и5 гаионец, двусторонней насыщенна /когда два предаожешя текста взаимно содерянт насш^шцук; ин-■формацию друг относительно друга/. В приыере 3 иллюстрируется наиболее распространенный вид насщекия » правостороннее насыщение.
Припер З1
Xho residues trill usually oonvais. eonu raiioaotiye isotopes tovaoâ as a result of neutron o-pture by ths boab materiaXo, AzwkboT aouroe ot rsatdual auolear radiation la tbo activity induced by aeutroxw capturod An уатАоол blemeuts present in earth..
Сущность явления на.сищгишя предложений ь связном текотз, гак кда«, состоит в том, что большая чисть прдаодеяии не ыожот быть экстрагироьада из него без нарушения структуры евврхфразових связей. Изъятие из текста предложения, г. тему жа, ш могут быть насыщены из окружающего гас контекста и, следовательно, не могут бить адзкватно интерпретированы реципиентом вне текста.
Опираясь на критерий насыщения предложений в связном тэкото, ш сформулируем определение осдавсталагавщего понятия сБОрхфраэового синтаксиса - понятия ''синтаксической сьврхфразовой связи".
Синтаксическая сверхфразовая связь /ССС/ - это такая овязь ыезду двумя предложениями, при которой одно из woe
* В примерах выделяются маркеры ненисивцагеюсти предложений.
язляотоя ¡саскцэниек другого как з плата внратакия, так и в Го,;анэ содержания /эгенлицитко-синтагкпгчоская сзерхфраоовсд связь/ или только г пла;;о содоретипш /пишицитно-оп'ггакипгз-ская сЕзрхфразовая сгязь/.
С понятием "синтаксической сверхфразоаоП связи" тесно связав по!'ч?ие "синтаксической ошркфраоовой овтапоз?::".
Сичтекс^чоская оззрхфразояая связности - это набор снята ксическкк оьзрхфразовнх сппзэй, объединят?« группу прздло-гюнкй, в которой «гысл одного предложил но шяот бить адзп-?дтнс ичт-~рпрлтиров9Н ргцигглсктом вне смысла других продло^з» дай из дакшй rpvima, связанных с первым овзркфразовкми связи-уи 1ЯСЕа;-'ного типа,
В деипьк двух опредолэнилх, :» наш взгляд, фпгсируется свлзь »гс;хяу синтаксисом и сбшнтяясЯ яа своркфразсвом урогно.
Синтаксические срерзсфрдзокго связи, как к вояниз сиктаг.-сическиэ ссязи, является формалько-сжсловимл. Главной задано й с верх фразового синтаксиса в связи с этим должно быть БН-лэлетв полного набора указало« связей, ¡выяснение их смысловой нагрузки j а тат'лз их рели npsî объединении продлог.зний э спорхЖразовыо адшици и при формировании срзросфразопой отруя-турк текст?..
Одной из задач синтаксической теории является опкегдапв ограничений, накладываемых на сочетаемость синтаксичвег.;к единиц, На СУ такие ограничения также имеют место, т, е. :га структуру, длину,-предао^ений, порядок слов, употребление реляционных элементов и на ряд других характеристик прздяожэ-ний накладываются ограничения, обусловленные закономерностям* дистрибуции предложений з тексте и их связями друг с другой, причем эти ограничения по своой сути на только смысловые, семантические, да и формально-смысловые, синтаксические и позтому также должна изучаться в рамках сЕэрхфразового синтаксиса. Предметная область сверх.'фазового оинтаномоа в связи с этим представляется весьма обширной.
Центральное положение понятия "синтаксической сверхфразовой связи" в сверхфразовом синтаксисе определяется тек, что одной из его основных задач является описание лкнойной
грамматической свяэиоетет нвзду предложениями в текста. Од:а-ко рыявлеже сьлгсП указанного тип?, нэ является самоцели. Око необходимо для реализация нкжанврво-ячкгвтетичзсг.^го гз>» дзлпропания сгэрхфразоБОй струтгтурк те.сс'А'а£ а тапяо ^гл алгоритмической 0КСПЛЧКОЦИИ сворхфразопых одпмц, протакугоч-нш ¿юаду предяояэниок и собственно токогоа.
ЛкнгЕястнчэа:мй аппарат .овотсайрезоеоуо ннэжяр.. ОдгпП ks разновидностей дз ко v: по - • г ражат;г: с cfr,сртдстп,- рсздкау» гарк линейиу» грамматическую связность, лгляэтоя sapscpa ССС, которыо олнэврбм&нш »аступгада с рэ*й показ&голоГ; кз:а-» сидвншсти прздлоязглй, FeccKot-p;'.!.' коояоськс ггегкикц-згаак прадюшний, а котсрах шдздвг-гг «аскеры ¡гэгГ.с^;^к;;сст:-; различных типов г
»тот во про о стоял третьи:; р. погостко дня.
Re clso Доас.
Bn they doi«'-t like tbjc one,
Potar hod
fopKopu кз только сигналиоирувт о факте нодасктекности ггред-ломаки^ но к содэршт сведения о наличии в предшествуй:; либо последумцкх предложениях смысловой информация, необходимой для насыщения указанны. прзддожснкЯ. Маркера типа "этот'', "he". "aleo':, "eu", "fchsy", "this" является грамматикализованными детсичаскиш алчизптакч и обозначают анафорические отношения, триеры "one", "do" яплнетск грамматическим» за-ивститоллм;п, и наконец, форма Past Terfact "hod соао" таля-ется показателем грамматического зреыего;, отенлаияцим рецигшон-та в одно из прпдтеотвугацих предп .жениП к глаголу в форне Рев% Ipdeflulto, с которой связана порфзктная фэрда.
Исследовании показали, что маркерами синтакоичесхих cBcprtiJpasoBUX связей s научных текстах могут быть следующие яэыкохма элементы:
- некоторые мор^олого-сиктаксические категории, в частности, ncpfSKTHUQ времена ь английском языке;
- грамюти'^скио заместители;
- синтаксический эллипсис;
- отделыпю знаки щепинания;
- Iö -
- rpp.'i:а?1!яализоаа!;шм лекелческие элементы. IL'iTb перечисленных типов языковнх элементов достаточно разнородны по суп ой сути и почти н° пересекаются на уровне предложения. На СУ ;ге отп< образуют единый разряд па основание, общности их сверзфразошй характеристики, состоящей з оксплицировашш ненасыщенности предложений и речдиэе-т^щ линейной СЕерхфразоэоЙ связности.
Нэ все типы тркеров с одинакоэоП степенью регулярности употребляйся в научных текстах. В частности, перфэктнцо «луш а аш'лийслэы лзннэ /Ср. ллюснвадяер$ект в немецком/ в y^i'.sauinc: то::атгх встрзчаютоя довольно родяо, Тс .;:з :.га:.;но скч".ять и об употреблении в связуюцзй свэрхфразовоД ;5уп:;:р:и знаков прэгшнашя» Члсло граматачееких заместителей в aitr-лкйскси пзкк« негзликое a s русское язгаю ъоабс.е отсутствует дажкй тип кархорэв. Вместе с тем, как показали исследования научных текстов, ио.ибояее рогулярикиа ш;жараш1 моиаемцонкз-. оти ярлястся граимвтикадизоватка лексические элементы, ко-ториэ в результата употребления в течете в связуют/эй еверх-Ф^язо^й пригоротяот сзсйст"?. гри.:.;.™тлчсс1:их рглятэ-
рор, сосгояшио предде вочго и экеялшеитности, формальности а у!Е1Есрср-лы:ости.
Tai: ::a:r главной зо.п/»»ей настоящей работы является разработка методов игекэнерно-лингзисткческого моделирования оьэрхфрьизотюП структуры токста, его сверхфразовых связей и единиц, целесообразно с точки эриния простоты разрабатнва-емт елгоритм^в и дальности их реализации попытаться свести пять перечисленных типов шриеров и одному наиболее рс-Х'уяйрному их типу - граммн/гикализэвниньчг лексическим адокгн-твм, С этой нельм предлагается транс}ормацяи, с поморю ко-горж иожг.'о свести ¡ларкор« пяти типов к наиболее регулярному Six типу. Приведем примера ДЕух таких трансформация.
Пример 4
гц1п 195*> VanleIii оя-1 Adam poiuted out that the htsd occupied in tii« вlirieoe by an erguatorol molecule wee decidedly unjfe»oi'abJa for the h.vdroxjJ group. Уд. sIso a»'/f-eaterl by Uiu*.
- lu -
Здесь паркером ССС выступает форма Paot Perfect "had ъ^еп euggaoted", Б результата трансформации предложения Б в' s последнем появляется грльыатикаяязованньгй лсксшческий вла-цзнг "before /this yosx/i антецедентом которого является предложение Е1. Таким образом, данный ьйзшот как бы подие-•шст или дополняет s связующей сьсрхфраэогой функции форыу ЭргиЭ.Ч1 Tent Periect.
Тгансфзрмащя S2 — Sg / It alco had been euSEsst®d by King before /thin узрг/д
Приизр 5
22is jflcur?3 of tt: Isirrcst rcw -..v.ra tbs дгай ela.bci::;tcly aarvad. S^, Many liars ьйстай. vrf.tix rsciaeesa.
Liapuepou ССС d Sg выступает эллипсис. S результате 'fpanctop-¡¿ацни, связанной о r-o с с га.-ю ьл е m&N эллипсиса "of thea", граыуатякализоЕашшй лексический блошш' "thou" становится ¿¿ipi.epo« синтаксической сворх#шзо1к<й сеязи, ьсмвияя и в то К функции эллипсис.
Трансформаций З^--». Sj>/' Налу of iheu wave adbrnad
ui<tis r.'jGkiaceti,
Рассмотрим ionspi насколько подробное вицелспкнй на-ш и о°1тЛ11ного наиболее ре^ул-трн17** * *п р ^ fCO — гракматикалкаоЕанные лакийчэские аясментн,, Из само" сущности «зава, иа его ко ¡.ыу i ш кати а но й Аунхции шп-акаэ» нзобходкыооть при аоотроонии текста опираться ьа jra изегатнаг, оказанное pause, что, в свои? очередь, кюыЕйз? повторение в тексте од-|£-!Х « тех ко объекгйи чаого з различном льчи.мвсиоы э;-'ракйнп;г. Споциалышв средства при этом обеспечиваю? идеютфикацию пов-iopii-vixoh объектов, утаивают "адрес" равноценна а ты; сто ошриацай информации, ь та:~~о шркируят ССС различного тига.
Приывр
, Ultinsfce solution to Llie close oupjiort lo likely to corae iroffi the Advanced Surface Hlesll« .Чу н t уа ^ £i.,. ':tii О cyntfи Is presently pleinetl to Ъо oapubli of inking 'indir iira
* В прниэрох грамматикализовать лексические алом^тц /лек-
сичэскпэ коннекторы/ подчеркнуты од<*ой чорч'ой. а ьитицедопт п заместитель - даумн.
surface оз wall аз airborne tarRata.
Предложения з,, и c2 здзеь госпришнаются пак один crrmnril текст. Этому способствует лрездо всего употребленио в з^ ямсемы "tnia", которая при малинной переработке текста отенлэет ЭВЧ к предзгестгуацзму коктенсгу /в денном слуга? к предлоге шз с це.чьо экспликации из наго ос-едэкий, кэ-обхадюгих для пас.гцэкик е2 ям дед "расшк£рсвкк" оловосочс-"thio ;jatcc" пз
маркер СОС, подобные карьеру " thiг»из np.ivspa б, относятся к различна чаз^ян рзчи /союза, шетоиконпя, пр:ша~ гр.тсяьшгз, карс'-ащ и т. д./ к ассоциируются друг с другом иоу.-ют.'.телмю по с&оэй осааушзй оаврх^оазовой фугсацш. В дальнейшем кц будем называть подобные лэксичоскимк
коннекторами.
Лскскчбркий коннектор /ЯК/ - это грапматикалиэоэ^ндаЛ лексический элекет, указывается на ненасыщенное?* предлога-нияе в которое он входит, прогнозирующий наличие в округл-татом кеггсаксто качого-то объекта либо ситуации, с призлэчэ-¡cif)!.! которих -.йтсымзиность галет быть сюта.и тем сайда обеспечивающий тоэможносгъ вдэпватной интэрлрзтаци.и предложения реципиентом.
В работе описысаэтся фордальная процедура различения истинных Ж, которые собственно к слудат маркерами синтаксических сверхфразових связей, и ложных Ж, связывающих части одного предложения. Алгоритм различения истинных и ложных лексических коннекторов основан на учете некоторых правил, регулирующих порядок слов в предложениях, на анализе ряда именных групп, дистр^бутивтк характеристик истинных Ж в связном тексте и т.п. Без такой алгоритмической процедуры невозможно выявить реальную картину распределения CCG в тексте и, следовательно, нельзя передать компьютеру функции его анализа.
Лексические коннекторы на срерхфразовом уровне выполняют функции маркеров синтаксических сверх^разовьгх связей, mrpxraWyix аирохиА диапазон емкелозг« отномниЯ между пред-ло.тамями, и это естестзенно ставит задачу разработки типо-
логин CCG, которая позволит но только глубпо проанализировать сверхфразсвую структуру текста, но и построите расцсо-ченшй граф звзросфраровсй структуры, а тают получить оурдеге ветел СЕ-деи?,-, необходиыкэ для выявления закономэрноотзй распределения смысла го й информации ъ ночном тексте, Тппзло-гая ССС етроилаоь га ослзгг агагша характера Ht»насыщенности нрздлогаинм, е тесптоюек.8; значений, которио облачается отдслывдй; сбэрх^тйзоБиия сьлзлш.
Fco. I. Схематическое иредстйг.лэнг:б структуры лексического коннектора
Яогмкоопкй в ' агэфор'ют-катаьорииескггй + логягаеокяЯ коннектор комгювшз гсошонзда
А
отсылает влоео по отошаог вправе по тексту КА2 ИХ? тексту за тоыгрицчй за насгешхцзй :'.:;фор:.:ац;!вП информацией /анафора/ /катафора/
Ватагу» роль при описании синтаксических сверхфразовкх связей игра.тг их маркоры - лексические коннекторы. Структура ЛК охоматичоски представлена на рис. I. Такая реконструкция структуры лексического коннектора пздтверццает важную роль, которую играэт маркеры такого типа в свсрхфргзоЕОм :сшп'ак-сьсе. Действительно, анафэряко-катафоричоекпй компонент как бн"заглядизает" в соседтю предложения с целью поиска лексических плекенгов для насыиртш того предложения, в ко-ropurt входит данный ЛЧ. Наряду с янафорико-катафоркческим компонентом, в структуру ЛК такие входит и логический компонент. J1K, в ко тор!« логический компонент мв играет йвдуа&й роли в формировании CGC, маркируемой данным ЛК /такую ситуации M!J условно обозначили на схеме рис. I символом* MIH 7,
яозсззм Дицотативные ÍÍK сюгналиэирузт о
соотнесении денотатов в предложениях а окота, езлпанш»™ оиитакоичвекйми сверх;]раиовыми связями, причем речь зд«рь шлет кд¥и как об уподоОлвнин, гак и о противопоставлении денотатов /например: "itiic", "other", "такой"/.
С другой сторож, логико-сьтыиловыа лексичеокяс коннекторы^ - это такие коннекторы, структур!- которых, наряду о зН'."Ър'{ко-катауар;1!гзекил ко.етзнз.ттсм, составляет и логииз-ОЖЙ КОМПОНЕНТ, Ш'раЮ^Л ЗД0С1. ВОДуТ^уЮ р:>лъ /См« символ "НЛХ" на схсмз pic. I/ п ¿.-оруироиэлии синтаксической еггрс-фразоиоП Ойяая, маркиру^оП дешшю JLK /например: "thus",
"ояедоватеяьто"/. Дяя раорабатетизъ-к Ав-лкматизиросагомх систем переработки тексте осдамгосес m г.верх^разогэи анализе, дифференциация двиота-гирто: и логико-смнолокос JÍK, а
cocrrsTûTEyiaçnc CGC тк'„т пр;1!щип.;8Льноо значение, так как при их анализе m bbV, используются совершенно различные формальные щхщодурц. В с.адзи со сказан'а-гм гл-.п лге; разработка типологии ССС вое окспяшдатш» сверкйрязопч« связи бюгч раэбитн ira два больших класса: денотатигные к ло-гико-сичслозис ССС, Оба типа синтаксических СБврх^разових ов)ыей могут йыгь как анафорическими, так к кага^грипос?,:;-гй! г оагисикости о? того, в какую сторону по тексту т::рсга::а ззг.аъ. Кроме гогс} - масс* лошко-еьйклойых сейзчй
А Как видим, оппозиция "денотат;:в:гчтз ЛК •» яогико-омнелоя^з ЛК" свидетельствует прежде всего о лрвимуфегмшюы участил одного не двух комлонзктов в формировании гоотвотсгаузо'Тй ССС. Вместе с тем, нужно откэтить, что данная сппозы(ич зьодится по практически« сообррло.чиям, когорт« связаны о суцвстяеш&гии разчичиимч злгорггмоз о (1 работ» ДК и ССС !гз ЗВУ.С к она, конечно, не означает, что у яогиго-счыслогчт «К пет де1»татикэй соотнесенности» а у двиотатич.чнх Ж -слег-оитов логито-сл'сяогой определенности.
выделяется подкласс двусторонних ССС, Подкласса CGC, з обо» очередь, разбиваются ьа подподкласоы, найме но пания котсрж приводятся в таблице I. Б данной таблице пригодится долгий дайор связей указанного щт, шмэшм; в результате исслэ-догашя эксибригакталького массива научный текстов»
В таблице I в первой колонке приводится индекс соответствуя^« сверхфразовэй сгязи. ilepEasi i^toa. индекса обозначает денотативные /I/ либо лсгико-сшсловыо /2/ ССС, вторая цифра -анафорические /I/, катафорические /2/ либо двусторонние /3/ CGC, третья и четверга« цифра - номера псдподклассов CGC. Во второй колонке ириъодился условные обозначении типов GCC, ч четвертой и пятой - примеры английских к русских Л1(, марки-рутул соотвототлуадис связи. Гкшш;! список вздалвнньк ть-:;орои ССС приводится в текста диссертация.
Таблица I
Типология синтаксических смрхфразош*: св«с-ей и их «аркеров
п tii
5'лов. • I Обо- j
; 5снач.!
ГТ~ТГ""}
Тита ССС-
] ПмкерГанпГ{1!р1!:лару рус. | Ж, титру-1 ЛК, ыархиру- « j BiC CGC ' «них OtC I
денотативные
Де.чэтатшпшг ащ^оричзоиие
Денотативно амфорические CGC через уподобление деио-
ïdiOb
¿1II
з Доштатиьнко ана-{о- ¡jivsn, юяп- аналогичный, рические ССС через tionod, aach, цанчай, no.ipô-соотнзсэиис .эаыес- the, -.¡И о ний, такой, о тот титслой с антецо-дентами
Продолжение таблиц
нГг
з
т
112
12
3 3Ï
215
212
212
514
515 216
21V
210 210 21. Ю,
3
Й г
both.ii.,one, он,она..oi:o wlll,do м их Форш
anothsr ,dif-,npyrû8, иней, farent, прочтчЯ ether
tne nc;:t елздующиЛ
$енотативмнз анафорические CCG через пеппсродств. соотнесение объекта с антецедентом через ленсич. и гра;ииат;гч„ заместители
Дгистап.внае ана-Форичоскиз CGC чз-реэ противопоставление денотатов
¿!енатат;:еные ката-Форичосние
Лог:1ко-си!с.чог;ис
.¡!оп*кск'Ш<словче акафоричоскиз
.Пополи.телшче а1со,яог»- вместо t те» , ovcr,t!)îa затем, крике того
Лояалнзирусдно nr-r^ti^ra здесь,там,тут
Перт'р&стируяарз in othsr другими секши, ■»■crds, elisrt '.г^ачо ,:;ороче X/,£3tr.iotly гоьоря .ipùaVj ng
cartuir.ly, indaeù
ПодчЕорядаогон^ Каузатншшя
УСЛОВНЫО
белея voro,
Де('?С ТПИТелГМО
отсода.понтсиу, та::и:.; образен
пр« атом уелч-вш:, тогда
Про?
гелтнэ
Риэультативнио
гргынчтелмие Топора >7!-HtJe
hcncэ.оо, taertjfors
if со,on tiia ooudl-tion
aoverthpl9 9qBiip'j4i4i,iiaoi'o*
on tha cou- рог,однако tra ïy
finnllj, Ч И'ЮГО-.Ц pu-
in total зул1те.те,нтал
ttcaordil>glT,iiHHJini4i'iHO,
Uk.j tliMt точю так*у
гл th# заве s то те зоемя,
t i œ о, s i r,m 1 - одн.'/згт-нио,
tantoobly Тик b|>«Mfnen
Продолжение габлкц&з I
I
Ц
21. II
22 23
Уточняющие
Логико-смысловш кага.$оркчзскиа
логи ко-смкслоbtóü двусторонние
i
íc.r ^sarapljfj
in psxticvs-* lar
ae foliovío
ОГ1 fcjif> Oi"j he..¿d - of tl¡ü o^udí-'narxü
у частности, например, так, примером
следуй?»..' oó -papoy
потпэрзых -Ео-эторы:; -е-тратькх
Обладая теперь аппаратом для реконструкции синтаксических сворсуразосих связей мавду предаоьвкяш!, ш иожсм пзрай-?й к ошсашз •¿иосоСоь предомняенмм и исследования сяорксйра» собой структура текста с помоцьр формальных прсцздур.
Экспликация свзрхфразовай структуры текста и его согмен-татая на CBepxifaagozyg .¿¿^¡ши^ Шсбхслиыость формализации процесса экспликации сверхфразовой структуры темп-а оиродоя-отоя следуицими осковныил причиншли:
1, йормалкзация текстового анализа является фактически единственным способом предложить коннротшо, а главное однояи-ач-
i-so приемы реконструкции сверх фраз о вой структуры и сегментации связного теиста ¡¡з составляйте свархфразошо образосдшщ,
2, ©ор:галиэац[Ш анализа связного токста позволяет задейотво» зать блок обратной связи воспроу.ЗЕодящоЙ «¡ванориэ-лиигБ-.'.сги-чеозоЯ модели /ВШУ текста.
3, Зорьклизаций в процессе оверхфразошго анализа долдна позволить яыиоатшю аыюлкитъ социальная зак&а, состоящий в разработке лингвистического обпсночзнил систем автоматизированной переработки текстов различных типов для нузд современной науки и проиэиодегьа.
Пользуясь введенными вьяло поннтимдьоксилицнруеы алгоритмическим путоы синтаксически« сеорл^разовне связи такст« ИЗ np;:ir¿p¿\ 1 „ а тахг.о его еиерх^разозум структуру.
К
— Ksi ■*
Пр'.шзр 7
S-l» W.<rp*r3V,j»i, ¡rrenfcnj.* fir-ipc'rar and sabila opetfaticr-i" Cav treated ïluid conditions en the batcKiieidf »III an&S tr^L-iididoua dsmands upoa ccnbat support unit'a end' loftisticai ôy£>tir». Bg, Artillery enâ ' oasinssre, for ^xaaplrt« ouot hard ihs capability of wovJne; \fiCli tha aanautli Corra-sSioMS.
л*12£?.£2?'2» '-'-il■bs>i£*30tly nifecfced by спояу efforta,
rax-tio'jlcjri/, mcîoact •ciii.-ijlcvi. egal'nat: frontline troops»
At the оги-» • tfttg's&siS ewaeSnsw «s provide cupp&sd for there Гзгсос. 2Î"»™" ла<»£отс fill So^wiTe protootao
hiCr a, Свэрк^разозак структура текста ;:n пржора 7 E _ G T D
i ~ 3**" 5
Сзэркярсгевую структуру данного fexeva нзтао прздстап::ть a Елдз ор;;гт-йронанного раегюяохэшого раецзочэнного графа, в:слэт2!ж;сго пять пзргзпт. соотзеъ-етвущих пяти предложениям тс^ст'К, ч сетчрех ребер, соответствующих синтакейчаским свер^фразовым- свшягг шзду гградаояенилш и s2 /уточ-ггтжгогСССР ЛК ч£е? oxemplo"/, е^и Sj /каузативная ССС, Ж "therefor?)"/, s^ н S^ /темпоральная ССС, ЛК "st tha eons tims* и, наконец, s,, и /денотатазнал ССС типа з , ЛК "those"/ Вез предложения текста, кроне первого, являются ненасыщенными, синсемантичными и находятся в непоорвдетвеи-ной либо косвенной зависимости от насыщенного, автоса:гап-тичного предложения s^ и друг ст друга. Все предложения, непосредственно связанные ССС, следуют в да: том текста друг за другом.
Смежная синтаксическая сверхфразовая срязь - сто такая ССС, которая объединяет предложения, слодутощие в связном текста непосредственно друг за другом.
Текст, однако, К9 всегда представляет собой цепочку связаншк попарно предложений. Дело в тон, что сам характер шелительного процесса неизбежно привлекает сопутствующие осноешй мысли доводи, пригори, промежуточные выводы и т.п.
Поэтому сылзпый текст часто ссдеркит DCTpoainiu:» и обссг-^хс::-иьа часта, сто спссабстзуот 8озн».«:со«га::э зге»; с;Я по^раш смрхфразоаых отношений. Отсюда фуи^циониро&'дтю а гчшй-й дистантных cKHiaKOiriecKiix срурхфрт.МЕьк озябеП.
Прнхер 3
Eisnfcca'e игЪгп nn.nlycis he« c),ovu 'СюЪ ESUlj^Sl
fit lionts Aluaa fchc» .population of t-'чо setvloairni; prosiasfcsly SO,5oTC^^'pTf^^iTTUI'^roualna iгоfc.--uind tha J-fciloKsSsr wo.ll whTcIi"f;*ood en hi[>il as $ uutoiS« Sj., During jiiia the Scpofccs stain crpaudid Ate poli-
tics! and eaoBon1,*c~iii?luej:c3.
Рйо. 3, Сперхфразоаая структура теиста из г?р;п»ра О /ва графе» ыдагояратноз кокрьггяа - Езрнинн 1-8 J ранг многократного rrasptmw рак;:; I, \>№ ки; в подбрело интервал »ходит одна вершина 2/
G
ь текста из примера 3 чредяожониз s^ связано дистантной С:СС с 31 /ЛН "Win" к оамзотитб^ь "period" в в., впгьле-до:г? "Period II" в S1/.Кроме тогол спязага ССС типа S о si /ЛН "thoî заьзетктоль "«ettlers" в з2, днтоцедэт "the ïopulatioc oi the settlement" в S.,/.Такому миг.ро-токсту о дистантной ССС созтготствуот граф более сложной структуры, чэм гра<]ы со скежлнми связями. В структуре данного текста содержится од:и дистантная п одна смежная ССС, иоршна 2, соответствующая второму предложению, входит в таи наашлешй "подстролочшй интервал'1.
Дистантная си:ггаксич«1ская евврхфразовдя связь - это гаяал ССС, кото [in соединяет два предлолюнкя. между которыми располагается одно ".'.ли болае других предлояониЛ текста.
Г^потррлоччнй H!rr^p?gj - а-х'О npO^OJsyTO.t дгуÎBÎ
гслста, Сезаннами дистантно:* CGC, а ?акяа Йпгдавд грао-а структур» ССС дауду двууя msowjîhkc: зерюна»
Дкзтанкам ССС з тексте соотвотстБук/т структура, кото-риз Ш! r^tuacsM }г,;ого«:рат:аЗД1 покритчягзд, ССС -
сиеужг по.^р.гг'.'.п, ггул:^ рант гяюгсйратшх покр;,~:й спргделк-е?оя тзэг»™ч из ,хэ^одяи^хея э !!одотголоч11си
9«î5pBздс дан;;огч? кногократагтэ nowxsmn.
Пря рзрраЗстй* епго^н^ачзской процэдурл зкотккваь^и осэряфрззомЯ «.Дот ойшружи^-дб-к-.З; что различия
¡s структурной epreîSioaîîLH логяко-сшолопих и денотативная ССС требуют еоздоая спах^^гчвс'^и процедур для dkcwikb&îçm кздогй та вгях типэб сшзей. Tas, в<уш при устаноллгики да» нотатаеют CGC процедура а основном состоит на поиска и оточ-дествжмаш соотсэтству^и:: г-гггзцедешоз и аэа»
л с определения истатк<5'ш ¿эркера аьвркфразовой связи, то при рс'/.зкотрукц^н логико-емкеловых ССС а тексте отсуто-ггуэ?
е^сст::тол:: :: г.::тгцзло;ггц. В ролл а::тс1;сдо;ггС2 s sî-om слу1;-" мзгут выступать целые гродлокения и даже ¿njyii-пы псадлонеш1й. Это внтлакает применять при обработка лог'"-ко-силлсзгх соэрхфразпзж связей и пероятностше процедур/, осдокатшз :;а делйжй локализации подавляющего больишгстез истинна* лексических коннекторов в инчцнялыгоЛ шотч П|»дго-двкий.
На страницах йб-28 пригодится обобщенная бток--охсго алгоритма рэконструицин евзрхфразовой структуры текста, гияз-часщая процедуры обработки различиях типоя ССС, В рчзульт&та работы дак:*оге алгорктис структура связного текста копст
вксплицировягл л продставлет ь виде ориентированного расположенного расцвечено гс rpa$Q>, ках ото кокадоно lui р:с. 2-3.
te сэсрхфрьэозуэ структуру текста, как и на структур}» врэцлювWHj нешедцеда¿тс* опрадслеши«» азшеоеыэ ого&ю.ча-' кия. В работе рассштрисалтсл даэ таккх ограничения, учет ротор;« совершенно необходим пр.; разработке процедур авто-катиг«5рогз!и:сй лврврпЧотаи текста. П-зрвоз огрничение сос-
Ряс,4; Обобщенная f'.ioTt-oxowa алгооитеа рэктютрукшга сазрх^разоьок сгрут у пи текста
П..
;о?
Рис.4, /продолжение/
дбЭЛЬП!!М
дав
й
«.ТОМ
гт
т
Подо*«? колйчестпа ( лайдс?г!Г!»,т с.тсотт:™л »ЕЛ: продло"зкнй /71С/ |
I
Срастание К с- емппрн4 !):] чае!сгг_^дс?ггшм перо- |
Отрез с? обрйбеята
такс??.
Формирование графа спврх'^разовой структур« текста
^ конец ^
конец
Рис.4, /окончание/
стоит в тон, что из-за ограниченного объема оперативной па-нити человека ранг шогоиратпого покртия нэ может прозшить некоторой пороговой ¿.ели^инч. Исследования показали, что при ранге многократного покрытия, прег^аю^ем 5-7, у реципиента возникают затруднения в процессе адекватной интерпретации токста, Здось просматривается аналогия с регрессивним ветвлением ггв.т& структурц предложения. Другоо ограничение, накладываемое та СЕерхфрб.зоито структуру текста, маю сфэрыулкро-вать елепуишм образом-: если графа свсрхфразоеой
структуры; сслтветп'пвухгагте отделышм предложениям текста, расположить па гтряиз." о о с т г. о т с т в V м порядке, а все линии, обозначавшие счнта;;оичзски5 сверкуразовье связи, провести по одну сторону ст этой прямо'!; то их полаю провести без по-рэсечений, т.о. для гра-га езерхатаэовой структуры обычно ьнгюлмйчтея правило проективности.
Урог:г. язшгссоГ. слсто»и вкл-у-иил* единицы трах различных тг'.поп: шниыалызда, проыожуто«н«п и максимальные. Если приложить данное утверздениз к СУ, то ого минимальной единицей шзяно считать прздлоткекпо, а максимальной - собственно текст. Что касается промежуточных медцу прздловоние-м и собственно текстом сверхфрпэоЕьк единиц /ГЕ/, то их существование ыокно доказать лишь фактически пзделив их из связного текста, т.а. разработав одноз^чную процедуру сегментации текста на составляющие 1Е.
Используя полученную с пошило алгоритмической процедуры сверхфразозую структуру текста, ш предлагав« формальное правило, посродствон которого «сжат бить осуществлена сегиен-тация целого текста гл пр-оызяутсчшэ сБерхфраЕовые единицы: промежуточной сьэрхфразовой едтащой в связном тексте является мачочмячьная по длине цепочка предложении ,.. з которой В^ непосредственно либо косвенно связано поерэдетпои сшггаксичэской сверхфразогой связи с 5х+п 119 связано ни с одним из послодузи?« прздложэний текста, т.о. граница меудУ отдельными ПЕ проходит в ¡/эстах обрыва цепочки сверх-фразовше связей.
эо -
Рассмотрим возможности алгоритмической сегментации те ста да ПЕ на примерах.
Пример 9
Hj, Значительное внимание на страница:: зарубежной печати стал-уделяться оперативности применэ!Еш сил и средстг. радиоэлектронной борьба. IL?. От этого б значительней степ«ни зависит ефпвктивность сосредоточенного воздействия на систему управлз иия вооруженными силами противника. ГЬ. Oeoduo тр»бопия предъявляются и оперативности добывания данных у F3C управления войсками и орущей, их сбору, обработке и с&чевраискноыу докладу соответсвующпм должности^.' лицам. П4„ Считается, «о вса эти задачи должны выполняться s масштабе Ербмек:;. 6лпй;соя у реальному. П^. Например,натоискис специалисты полагают, что весь цикл рэшеиия указанных задач дслжзн составлять но боле» 15 секунд.
Pî;c. 5, Сээрхфразосая структура текста из примера 9
f ~"*2' ' ~tf ^ "5
Текст из примера 9 может бить с псмс^ьэ приводонного от прызила сегментирован формальным способом fa две оьпркфраяо-выэ единицы! первая единица включает предложения Ilj ч ib* а вторая - ïïjr IÏ41 Признаком окончания перьой и качана второй свэрхфразрвой единпцн служит обр»je цепочки сварфра» зобых связей в промежутка между По и Г^. Корняш гратов сверх^¡разовых эдиииц являится веремны, соотазтствукщне насы» ценным, автосемантичным предложениям fij- и П^,в юм смысла, что из этих вершин эиходяй "управляйте" стрэлки, и ¡и едка такая стрелка в них не входит. Предложения П^. П^, ilg, соот-гстстаук'диа остальным вераинам графа с во рх фраз о по* структуры, являйтся ненасыще—гши, синсеыанти«нши.
Эксплицитная сиерхфразовая единица /ЭСЕ/ - это такое струхтурироьанное свер!хфразовое образование, которое пред-отавдлвг собой цепочку ио г предложений /п>1/, в которой
пзргае пр-зклокс:лс ясллэтсд насицзнпш, а вт о с е ма! гг , прЕхчэм вершат грайа, соответствующая данному предлоггениэ, гиступает з роли ого корда, а все остальные предложения -ке:йС1Д9никки, сг.нсзцантичка.®, к характеризуется замкнутой структурой съсрхфразовых связей «суду входною! в ее состав продяояэттм,
Кзбор сверх фраз«» вк» блоков, промежуточных нэгду прадко-и цэлым толсто;,!, пэ исчзраизаатся лгль спзрхфразосся! едакицод: указанного типа. При спредвлзкьом характере onops-ф-ьаопой структур:! .»is текста ко гут еькяонятьоя к болоэ с;:аа-кие составллз^з - еверхфрззоБИ® единства»
Сверхфразовое единство /СЗ/ - это тглгаэ эксплицитное < овррхфразовсэ образование, которое содержит в cr-oafi структуре нког-скратноо иокрытио, а такя-л включает более одного as-тосе:.^нтич!гс1'0 предлоло::!.':, причем од;:о из аат'ссемагггнчнкг предиолеляй на относится к пзргг.п'л.;.; из подстрз.тэчного интервала « соответствует корню графа сворхфразовой структуры, a остслмдее ссязанц с Еершкгкк и? подстрслочного интервала.
Пр-.п;ор 10
. The method v/hicb irorolv»e -fcho visa oi autocollimatetos? is doacriS3d~i'a Oofco'ooi? isouo of tho "Tool Engineer", Sp. numerous »irp^i-ineiiba ohawad thai; eomotimea t* ia hard to use an autocoliirsttitcr oopecially when a conyuter ia ru?t! available. 3j. In addition, there is no wey to dsternino whethjr the failuro ox the figure to chock within the lini^fl ic due to an »ггог in calculations. E^. Another method haa beon dcvaloped v.'liich нега simplified mptheioatics.
Piic. 6. Оерхфразовая структура текста из прикгара ГО
d
СЕерхфразовоэ единство, как видим, отличается от сверх фре,-зовой единицы тем, что включает дяа автосе«античнщ предложения и Структура данного текста содержи? многократное покрытие и, следовательно, подстролсчный интервал, в кс-торий входит второе автссе;««.актачноа прздяодссшю в?» Ранг многократного покрытия раве.1 2, так как в подстрелочшй интервал входит ДБа гтредяояения С2 и Б,,
Сравнивал теперь требования, которкэ обычно пгздтлзяя-шея к языковым единицам, с характеристиками выделенных ка-121 свзрхФразовых эдиниц и единогв, отметим, что
- ЗСЕ и СЕ одно значке вычлеитэтея из текста пооредстка описаниях вино процедур}
- ЭСЕ и СЕ структурно организованы благодаря употреблению в составлялся предложениях языкойых ерэдетв, обеспэчк-
их структурное ед^нетто ;; эаБкг!т;,:ость друг от др^га;
- ЭСЕ и СЕ обладает относительной ко^.туиикатквной закон™ чзнностья, так как вычленоше \гг. из контекста ка ыешаут воспринять одтегцц и единства в лачостве смысловых целых
2 работе проанализированы потенциальшо евврвсфразошэ структуры ЗСЕ и СЕ, состоящий из 2, 3 и 4 предложений, к при втом показано, что с ув «л и ч е I с; е и ■ дл и! ш сверхфразосой едшшци либо единства число шгепциальных структур возрастает, на остается конечным. На рчс„ 7 приведены все возможные структуры сЕерхфргзоЕих единиц п единств при длкнэ ТЕ. равной 4 предложениям. Число таких структур равно 9.
Рис. 7. Исчисление потенциальных структур сверсфросаик
единиц и единств при длг.ке 1Е, равной 4 предложвгеш^^^ I 2 3* 4 I I 2 *3 4
I 2
3
4
В результате исследования экспериментального массива текстов был вадвинут ряд предположений относительно су-
'дестБозаппя определенно!» зависимости мэзду характером сверх-фГ*зоьой структура текста и законс;.;зркос:'г;;мп распределение ь нем смысловой лж/ориации /прагматической инкарнации пользователя/ применительно к автоматизированная системам переработки научнкх текстов» Перечислим шкоторие из кыязлек'шх иьаонсиарюотаи, которые на слвдун>({эм эг'ато работы бым использованы при ра^рабстлз алгоритмов сеерхфразового анализа! а/ с:шсе.йалтичи:э предложения, соотпеа'сгв^клцие нвршинам из "одстралочиого 'интервала, раияируотся как наименее информативнее з текста* б/ автосегантичниз прадложония, соотвэтству-крайним терщикам киогократного покротин, ранхирущея как наиболее пКХ^р^гт-'Ные, ьрдчем, ием и*ш ранг многократного похрития, тем зшк информативность данных предложений; з/ п.чрп';2 прздтоданин ЭСй ракнируотся выше, чем ггоследукаие нрндлоьниия причем, чем больше дани ЭСй, тем тдав ранжируются ее первые предложении; г/ перзне предиокении ЭСЕ раютр^адся наравне с крайними иредлодвлияш СЕ с рангом 1 и таге указанных предложений СЕ с большим рангом;
Вили йзучеш! 'способы представлен«* структуры связного текста б виде плоского грййа, а такие ого описа:шя. Построив такой граф, га теы садам полуютам з жня^ентрпрозанноЯ форчз ценные св^дешр о связях, предложений в тексте, а также интор-шдаю о его структурной основе, которые могут быть кспольэо-эааа при теше»;;; широкого спектра, прикладных задач, связанных как о ручной, так и с автомагиэированной переработкой текста. Благодаря этому прл создании систем £оршлизованной обработки текста уже нет необходимости обращаться в процессе анализа непосредственно к тексту первоистошмка. Его замечает соответствующей граф сверхфразоЕой структура с некоторой дополнигель-
- Яак показала последую»^ проверка, вццвинутнэ предположения в значительной степени подтвердились. Проверка проводилась посредством сравнзгия результатов работы система ав-томауического рофгрирования, основанной на описываемых принциыах, с рс-фэратами, составленными профэссиональшдаи референтами, а также с помощью эксперт!щх оценок споиуллне-тоз.
ной информацией, извлеченной из текста в процессе реконструкции указанного гра<|а. Далее ш покатан, как, исполь-ьуя граои СЕзрхфразовоЙ структуру, ¡¿окно решить целнй рад прикладных задач, связанных: со СБаркфразоьш акигпзо«.
Реализация на ЭВМ автоматизированных систем переработки текста, озноданных на оверхфразовом анализе. Одним из наиболее существенных результатов инженерно-лингвястичесхсих п^слздсвапп,'; последко: лет является обшрукение аш-иьимии, протиБОпоставиято?!ей лингвистические теории и их прилошнг>л к язикопому материалу. Многие теоретические идеи п языкознании принимается априорно без предварительного экспериментального изучения. На ннкетаем этапе развития язиковадческоЛ наупи предложена оффзктквная форма реализации и проверки лингвистических теорий, которая заключается а представлении их а еицй воспроизводящих инженерно-лингвистических моделей /Пиотровский/, которка дают возможность лингвистике преодолеть барьеры, отделяйте теорию от яэыкоього материала.
Используя описанные выше, формальные процедуры решл-струкц;;;; структуры елзркфразоадх связ&й юкст, а гака« сведения о закономерностях распределения емнолезой информации в тексте в з^.ви^чмеетч от характера ого структуры, ж проьа" ли лингвистический сксперимент, связанный с построением и реализацией автоматизированных: систем сверхфразового анализа текстов, результаты которых оценивались пользователями систем либо сравшвались с результатам немашинной обработки, в результате чего был сформирован блок обратной связи БЦШ связного тексга.
Грамматика названных систем представляет собой серию ф>1тяиэованяых правил, приложение которых к тексту позволяет Е каадом конкретном случае с достаточной стопзгьа точности ропать вопрос о наличии либо отсутствии синтаксической сверхфразовой связи меаду двумя предложениями.
Программное обеспечение /ГС/ систем можно разделить кг обт.ее программное обеспечение, реализация которого на ЭВМ дает возиож-гасть экслшцирозагь граф сверхфразовой структуры, и частное Ю, состоящее из специальных проце-
дур-анализаторов, посредством которых анализируется граф ССС и реализуется чаотшэ автоматизированное сиатош токстоеого анализа. В процессе внедрения пспргс программного обеспачвния поело ветолнения ряда предБарттелыпк операций систем переходит л выявления) ССС п экепшяации сворх^разово/! структуры текста, При реализации оо'чвго ГО использузотся два словаря: словарь JJK /Ск/ и вспомогательный словарь /Св/. Ск и Cs sила-чавт русскую н английскую чрстк каждый, В С0 лплютанк слова н словосочетания, явяпкщеск сигнальными злэкзнкыи, укагша,-
ка истинность .тлбе ложность ШС. Ск содертат собственно список ЛК, их классификации /См. таблицу I/, условия ¡г: истинности, а также некоторую дополнительную miiopi/ainm. Услоюя истинности формулируются б CR в еидэ логического вкрал-.евдя в дизмяктиешй нормальной фор«г относительно стаедартшх операций под тонсток - процедур. ffe.6op процедур состоит из опк-caiHtii, соед;:нетсг: символами кояъгашецш и дизъюнкции. Результат работы каждой процедуры будет равняться нулю, если условие ис-тиниэеги Ж ие выполняется, либо одшгицо, если условие истинности выполнено.
Система реализуется пакетом програж, вкггвчгкшдим голошгуз прегрешу и секь процедур^ Головная программ. ыцеотает слоду-ic^îb функции:
- анализ тзкстз по прадлсяанням; пщелетв лепсен. их пойся з Ск и проверка на совпадение анализируемой локсичзской единкцц с одним из Ж;
- в случав совпадения акатаскруемой лэдеемы с ЛК - сбралрш:; к соответствующем процедурам, шчьелениз значения логической функции г.о результата!! работы процеди, принятие рзззния об истинности Ж и определение его типа в соответствии о типологией ссс;
- построения сгсрхфразовой структуры текста и занзеошв ее в пачять ЭЕМ т; символичесх'.ой çfpp'ie.
Решаемая посредством внедрения общзго ГО задата экспликации свсрхфразовой структуры текста является базовой задгчоЯ.
* Система реализована на ЭВМ Л.А,Захаровны.
На эе основе могут отроиться различные системы автоматизированной пореработки текста, базирующиеся на сверхфразокш ана=> лизе. Некоторые из систсц такого типа реализованы в настидцзй 1>абота.
В связи с тем- что для осуществления процесса р><фзрирова- \ ния необходимо проанализировать закономерности р»спре,цзлгкйя существенной для пользователя информации именно в целом тонете, а не в 0""1?*ьнж составляющих его предложениях, лрййеь'о-ícis формальных процедур сворхфрарового анализа долга» принести наибольший эффект в парную очаредь при разработке систем автоматического реферирования /АР/. Одна иа сйсуьй a-asoro рода была реализована в настоящей работы. На еыходо системы АР могут получаться реферати различной степени свернутости. Предусмотрен чагта регпш, при котором 2 автоматической рофз-рато, наряду с стобрс-Шпзги алгоритмом предложикиями, ъ раепб»-чатку включается и список тиноз ССО, соединяю!»!* пр&дложожя; ко попавгае о реферат{ с другими предлолыниями рэфврируеиого текста. Это дает возможность потребителю в процоесэ диалога /диалоговая система АР/ запросить к вадзче на Качать дополнительно предлсже1зш либо группы предложешгЯ текста. Поскольку система ДР пока на использует тезаурусной информации, что несколько сникает во распознающую способность, тематика реферируемого документа, для ное не существенна.
Созданная нага на основе разработанных формальных процедур сворхфразового анализа система А.Р характеризуется следу-ocho в*.ими рабочими характеристиками: продолжитглькость реферировании английского текста из 70 предложений - 1,5 минуты работ;; центрального процессора ЭВМ ЕС 1022. Средний коэффициент редукции равен 4. В процессе двух экспериментов II и 13 автоматических квазирефератов были предъявлены для экспертной оценки специалистам - потреб,:ителям системы. D среднем оценка равнялась "4,3" по секиболыюй шкале /оценке "4,0" соответствует слелу&цал характеристика ыапзнпюго реферр.та -"Реферат вполне удовлетворительный, хотя и имеют место некоторое потерт информации"/. Проведен так.*е эксперимент по сравнению поискових образов кпаэнрофератов с поисковой об-
разами рсфзратоз соотвзтотБуингих документов из реферативных курналоз. Я о ¡«дна н в машшпшй ре^ара*»' вошло около 76" клгчэ-ело2 кз тезауруса, шторче состазлчют поисковый сг5раз рв-$йрата дашого документа в р«.£чу>атнвиом журнале. Танмк уир»-зои, полученные на ЭБК рэфарпты вполне коз» использовать и в качества текстов, сворг.угих для индексирования, а автоматизированных ип(^рч1,4ионннк системах. Имеются реальные гозиоягго-отк поскаагая качзетт калит*':: рефэратов за счет раслирэния с&ьпш акг\аи5>!руошй сверх^рагогой информации, подлежащей оО~ раЗоткэ в окотемз, егзелошрогашы» »¡роцссса автоматического рЦ^рарэсагпя, а тап^т за счэт объединения созданной снотб»ц; о известные« спстеуш-н беявь^ного растрирования.
Нар-тду о системой автоматическом растрирования, получены те:кэ алсдувщчэ результате в области шгиизацвд автоматизиро-с'!с'пл** пэрсра^о"**"* тенена.
- фрагманткронание текста з инфорцационньк систзмах посредством его оогипнтацш на состашиацив единицы и единстка, "I-Ю&к&вадо в указашак сиогомох функции уг.ьзатедвй связи;
- ог^^ч-^чичя ьась уличьвых слои при аугоматичасксы индекс;;-гоэаакк с сосстаковдзпкем идентичности ряда лакеем, которез »и.'-'^т осущротал.чться только грл пс:лоци сгср::^.разйвого анаху.за;
~ ^актьос;ьа»г:э виго^гого текста при англо-русском мамняои перевод-,? через «ц&диз с*,1гуыце.1 фунмпи ннтегоркн определенности z эмтлнйскои языке.
Осоо'ов прикладное значение автет-газированных с;;с?аи, и»,теча«цйх оеврхфразойый анализ, соотоит в том, что они должны обееннчигь суи;«сгпенное продвижение в результата* обработки цели* тькстоа за счет привлечения к анализу дололм.ггн.чъкой спэрхфраяовой которая ранее но попользовалась в
подавляющау болыщпил'ва счетом указанного типа. :(ро^а тог^ названные системы шеут без особых затруднений перенастраиваться гл другие при условии построения соотвэтетну-
слоьарей на данных языках', Положительные результаты, полученные благодаря разработке и реализации перечнечанных виэд подсистем автоматизированной переработки целых текстов.во ••шго.ы псдтзе ¡мцяст выдг!инут"э вьш'в теоретически положения,
касающиеся принципов организации сверхфразовой структур« текста.
Итак, применение методов инженерно-лингвистического моделирования к объектам лингвистики текста дает возможность э и о пли цм ро ват ь и достаточно строго описать с верх: фразовую структуру текста, сверхфразовые связи и е,ци;п«цы. С другой стороны, свмантико-синта?:с>1ч-!-.кая природа и счохчость структуры объектов лингвистики текста позюлязт при их бццз-лзкки и изучении проварить объективность ;.;этодлкк ик^он^-око-лингвистического моделирования и разрешающие способности воспроизводя^« пнЕ'Знерно-лингрнстических моделей.
Дальнейшее изучение свархфрязэБсЯ структура текста должно открыть новые перспективы перед конотрук//ивнчй направлением лингвистики текста, а такжз перед инженерной лингвистикой и дать новый импульо для выполнения социального ааказс1 на разработку лингвистического обеспечанля щщиннох систем текстового анализа, Повшшшь практической цонностк данных работ связано с прогрессирующем промышленном освоением систем автоматизированной переработки текстсЕ первоисточников и вводе;аша в оксгщуатацп» пол ¡юте кетовых баа дааддос к оптических читающих автоматов.
Основное содержание диссертации _ отракето а слатповзпг работах автора;
1. Синтаксические СЕеркфразовые сглзи и их инкснерно-л:шг2«> ети«ескоэ модвлиро-оаняе,- Кишинев: Штиннца, 1986,- Т6!3с. П соавторстве с З.М.Доорускиной, лично соискателя - 0. 30-85, 01-144. Л'ец: Ка пути к конструктивной лингвистике текста// Лаучно-техшчсская информация.- Серил '¿,- 2988.- $ I,- С, 3636/.
2. Синтаксические сверхфоазоаыз связи в английском Хьбароъск: Госпединститут, 19В7,» ^с».
3. Автоматическое смысловое езэрттаание на основе анализа еверхфразовнх связей текста // Статистика рочи и автоматический анализ текста-74.- Л,: Наука, 1974,- С. 147-162»
4. Вариантность параметров синтаксической связности евзркфразавоа уровне // Вариантность как свойство язии^во* оиотэма.- У.: Наука, 1982.- С. 38-41.
5, Об нспользэзашя кбкотор'.г' характеристик связности текста при англо-русском «да^нним переводе // Международный семинар но кадмнному переводу: Тарной докладов.- К.; ОЦП, 1979.-С, 75-76. В соавторйтвэ о М.С.Блехианок, лично соискателя - 1с 5, Алтстгачзсяо.' ЧБазярв^орчро'^аккв ® залога пнгло-русского .'.III // Иэядушродкый евмнпрр по шлзшкому переводу! Тезиои дозездсе.- .4.: ВЦП» 1903,- С. 41-43. В соастсрстсз с А.Л.Зо харотздм и др., як^нл соискателя - 1с.
7, "а'соторко епссобн формялийсцлл процесса установлен«» отш» с:>2:.- й-гасисиыости кеяду прздлояэюшмк е связном такс?» //
Нду.?но~.гвян'лчв'>''я~п дн^р;,:ация ЛГО1/.- Серия 1971. - 3.-
с. го-кя.
Э. иб одном подходе к про 5лс:.:а:,г автоматического рзфэрнрова-:тя и автогаткчзскохх» лверт»-тник кндекспруешх твкот-оэ // МШ,- Серия 1971.- № ТО,- С. 16-21.
9. О свойство проек'1'ИЕНости изкка на уровня структура сала-но го текста // ШЯ,~ Сер™. 2,- Т.971.- К? 12,- С. 5-8,
10. Категория определенности как форшльнкй по::азатель сии-то::с!!чйскж сверхфргсомгс сплзей в те?<стз // НГп,- Серил 2,1551.- ¡3 9,- С. 22-26. В соавторстве с М.С.Блзхчаноь-; летне соискателя - Зс»
11. Классификация коннекторов я диглегозае систош
чзского рефэрирттагэтт !/ КТИ.- Сери 2,- 1979.- '»>• II,- С. 1923. Б соавторстве с А.Б.Брайлсзскш, лично соискателя - Со. "(Г;. Рс-атл'»еци п на ЭВМ системы, анализирующей сш.тактп^аоетта сверхфрагоеыс сшзи // ЬТЛ,- Серня 2,- 1984.- № 9." С. 25-31. Б соавторстве с М.С.Блех^аном и др., лично осискатзлл - 2с.
13. К типологии методов автоматического свертывания токста
в ин^ормационшсс системах II Лингвистика текста: Тезисы докладов.- М.: МГШИЯ чм. М.Тореза, - 1974,- С. 74-77.
14. Коннекторы и их роль б организации структура связного текста // Семантические попросьг микро- и макросинтаксиса.-Хабаровск: Госпединститут, 1980,- С.19-29,
15. Связи, единицы и единства сиерхфразошго уровнл языка // Квантитативная лингвистика и автоматический анализ текста. Учение записи! Тартуского университета,- Вып. 683,- 1984.-С. 16-34. В соавторстве с Р.Г.Пиотровским и др., лично соискателя - 7с.
IG. 0 еоняигике синтаксиса связного текста /! Прзбломм синтаксической сенаотики.- М.: МГГСШЯ им. М.Тсрзза, 1976,-С. 74-77.
17с 0 семантической классификации паргадтров сзязкэсти ток-ста П Ронаиспое и гарм?нско- язитозчаниа, Вопросы эксперт ментальной (фонетики и прикладной линг^чстнкп.- Sun. I,- : ЙГШИЯ, IS77.- С. 185-197. В соавторстве о A.D.Зубокг^ лично соискателя - 7с.
18. Грашатич«споа отчета определенности как одчк т acnsi?-7ов Акционирования слова в оздэгаи тексте / «зтодкчеезгзЯ аспэпт / // Контокстуалыад детерминированность лспсироскпс единиц." Хабар: го;;! Го опединститут, 1987.- С. 71-434. В соау-торстЕя о M.G.Eiic-xwwoMi лично соискатпяя - 8з4 10. О кгатодах рзко:;г,?руг.цип «инггксэтоспзП структуры такст?. на осиовз анализа cavpcc фразовых сгязоЗ К Метода к cpstyii'si оОработш! ояожпоструктурироааичой графической информации.-Горький: Госуиивбрсптат, 1903.- С. 8G-07.
20. Soms teoiiniquea icr forma'.isins the ргое&во of a^sbll-siilng tlic. Z--i.el4.ii.uri bekwaisri po»,»«¡icon in f.oimiotsid text // AutuBatio Docmff3ntGti*>n riar;hanatioal LinKulatioa.- V. 5,1971.- E 5.- :■>.
21. An ирргочой to nv-obleins eutomatio obitractiiie and eutOB«fcic te::b o&iitrnosicm // Automatic Docus.'.ii»;st;ion f.nd Katbiieat-ical linstiiaeico.-- V. 5.- 1971.- tl P. 41-21.
22. Cciiiputur ioplep^ritcii.on of s system analyzing sup^roon-ianc® ooimeofcicnn // Autoor.tic ВесавмпЬаИоп end KwthometlCiil UnRuietice.- V. 1G.- 19ЭЛ.- G 5— P. 39-51 /with f1.D.Bleohnt.n ot. al./,
Lineruietlc autoiaate and enginaaring linguistics ff Aufco-ootio DocuBientotion b.nd MathonatAcal bi.ncuiclicec- V. 1%-19Q1H 3.- P. 10S-11C /with E.A.Shingsreva ot. al./.