автореферат диссертации по филологии, специальность ВАК РФ 10.02.15
диссертация на тему:
Грамматические процессы текстовой компрессии (на примере анафорического эллипсиса).

  • Год: 1996
  • Автор научной работы: Романюк, Юлия Витальевна
  • Ученая cтепень: кандидата филологических наук
  • Место защиты диссертации: Киев
  • Код cпециальности ВАК: 10.02.15
Автореферат по филологии на тему 'Грамматические процессы текстовой компрессии (на примере анафорического эллипсиса).'

Полный текст автореферата диссертации по теме "Грамматические процессы текстовой компрессии (на примере анафорического эллипсиса)."

НАЦИОНАЛЬНА АКАЛНМ1Я НАУК УКРАШИ ШГТИТУГ УКРАШСЬКО! МОВИ

На правах рукппису

РОМАНЮК Юл1я ИтолНвна

ГРАМАТИЧШ ПРОЦЁСИ TEKCTOBOÏ KOMI1PECIÏ (ИЛ ПРШСЛАД1 А11ЛФОРИЧНОГО ЕЛ1ПСА)

Спецшп.шсчь: 10 02.15 - загальне мовознавстео

Автореферат дисертацп на здобуття паукового ступени кандидата фшолопчних наук

KHÍB - 1996.

Дисер1ац1ею е рукопис

Роботу виконано у BiflAmi структурно-математично! лЫгвютики !мтпугу мовознавства im. О.О.Потебы HAH Украти.

Науковий кертник - кандидат фшолопчних наук,

ст.н.с. ГрязнухЫа Т.О.

Офиуйж опононти - доктор фтолопчних наук,

професор Викованець I.P.,

кандидат фтолопчних наук, доцент Алешенко Л.А.

Провщна установа - 1нститут юбернотики HAH Укражи

Захист в1'дбудеться " 22 " трааня 1996 року о 14°° годиш нэ зас1цанн1 спесуалЬовано? ради Д.01.94.01 для аохисту дисертацм на здобуття наукового ступени доктора фтолопчних наук при (нституп укражсько! мови HAH Украти {252001 Кшв 1, аул. Грушевського, 4).

3 дисвртацшю можна ознайомитися в б!блютац) 1нститу1у мовознавства ¡м. О.О.Потебж та Ыстичуту укражсько! мови HAH У кражи.

Ав горефорат роэ'юлано " " кв'пня 1996 року.

Учоний оекротар / я

спец1ал1зовано? ради ()Ju.ltiUKJ_

кандидат фтолопчних наук Ажнюк 5,М.

Результатом gil одного з основних мовмих зэконш, як! реал1зуютъся о тексл, а саме закону економП, с анафоричний ел'тс. Це явите неповного веления в реченн! його структурно! схеми викликане необх1днютю лобудови i cTunícTUмного оформления зв'язного тексту. Кожне речення тексту е новом пов'|домленням, але воно обов'язково пов'язуеться з полередшли через певне повторения ¡нформацП. Тому повтор - це необх!дна умова 1снування зв'язного тексту. Однак, не bcí повтори в текст! вербалЬуються. ¡накше Ын Оув би переобтяжений ними i це ускладнювапо б його розумшня. !сиують способи скорочення повторив; p¡3HÍ види субституцП. Одним ¡з спосойв субстигуцп с субституция нулем у паралельних структурах або анафоричний ел'.ос. Саме анафоричний eninc, як n¡Kaee ¡ мало вивчене явище, е об'сктом досл>дження в робот!.

Процес в!дновлення структурно! схеми таких речень, який в1дбуваеться в CBigoMOCTÍ кожного носгя мови, эдяйснюеться за правилами прихованоТ граматики. Прихована граматика - це правила встановлення факту субституцм нулем ¡ в!дноалення антецедента (тобто субституйованого компонента речення). Виявлення цих правил - одне з завдэнь, як) розв'язуклъся у робот). Таке розширення i доповнення граматики залежностей, що е основним засобом досгадження структуры речення, здЮснюеться вперше в украТнському мовознзвета. На ochobí цих правил побудовано алгоритм шдтворення в реченн1 з анафоричним enincoM його повноТ структурно! схеми, що необх1дно для в!дновлення його зм1сту. Отже, алгоритм с засобом об'ективування зм1сту речення. B¡h пропонуе однотипну схему anani3y мовного материалу, встановлення правил приховано! граматики i визначення синтаксичних структур, идо ел;м!нуються. Осктьки кожна мовл вдаеться до eniM¡nauií певних структур за впастивими лише Тй граматичними ссобливостями побудови зв'язаного тексту, запропонований алгоритм може правити за ¡нструмент типолопчного з!ставлення мое. HacnigKOM нашого акагазу е BÍgTBopiOBaHi повн> структура схеми речень з анафоричним ел'шеом, формування ситуативних правил, притаманних украТнсыий мои. Ц| результат важлив! в теоретичному план'| для украТнютики, осмльки вперше описано особливосп актуального членування таких конструкцШ, визначено статус цього явища в mobí Í мовленн!. ïx можна використати у подапьшому тигюлопчному вивченм синтаксичного р1вня кшькох мов. Все це становить теоретичне значения та наукову новизну дисертацШного досгадження.

- J-

Актуальн1сть роботи полягае в тому, що вперше в результат! досл1дження анафоричного eninca на piBHi формально-синтаксичноТ структури речення i як текстового явища субституцП нулем у паралельних конструкциях розроблено методику його ¡дентиф'кацн та в!дновлення лролущених компонента.

Проктичне значения роботи в тому, що вона с частиною автоматичного синтаксичного анату (АСА) тексту, що розробпяетъся у ßigglni структурно-математичноТ лшгшстики. Результати роботи мають важливе значения для систем штучного ¡нтелекту (KOTpi мають справу ¡з розумЫням тексту: автоматичного редагування, машинного перекладу та ¡п.), оск!льки можуть бути використан! для подальших етап!В автоматичного опрацювання текстш, а саме -для семантичного анал1зу.

Мета роботи: gocnigjTu законом1рност) в структур! речень з анафоричним enincoM i в1дтворити для таких конструкций правила приховано! граматики.

Bignoeigno до мети розв'язано так! завдання:

!) описано головн! диференцЙн) ознаки анафоричного eninca;

2) побудовано правила ¡нтерпретацП анафоричного eninca (прихована г раматика для цих речень);

3) запропоновано класиф'|кац!ю цього явища на. ochobi структурних особливостей його eugie;

4) виявлено Heoöxigni i достатн! умови для виникнення цього явища в структур! тексту;

5) створено модель розр!знення таких конструкцЮ в текст! на ochobi формальних сигнал!в, яка оформлена у вигпяд! алгоритму.

Апробац1я роботи. Результати досл!дження обговорювалися на 3acigaHHi Biggmy сфуктурно-математично! лЫгистики 1нституту мовознавства HAH УкраТни. 3 основних положень дисертацЙного досл!дження зроблено gonoöig на м!жнародних конференциях "Проблеми украТн!зац!Т комл'ютер!в" (Льв1в. 1993р.) га "Укрсофт 95" (Льв1в, 1995). За темою дисертацЯ е чотири публ1каци (з них gei статп).

Джерепьною базою досл'!дження е тексти журнагив "Мовоэнаэство", "Допоад! АН УкраТни", книг 'Теоретична фЬика", "Дано тшьки точки...", газет "Голос Укра!ни", "Час (Time)" (1163 речення).

Положення, як! вимосяться на захист.

1. Анафоричний eninc правом1рно розглядати в межах субституцн в текст! як субституцию нулем у паралельних структурах.

2. Анафоринний eninc - це явище, яке одьочасно належить i мовленню, i мои. У mobí закладено íhbapianth¡ абстракт™ схеми i мехашэми в)дноипення тих структур, що за правилами побудови за'яэного тексту ел;м1нуються ¡ прочитуються за зм;стом у левному контекст!

3. Механ1зм ^дтворення формальио-синтаксичноТ структури речемь з анафоричним ел!псом грунтуеться на паралельнссп структур повного га скороченого речень ¡ на дублюванн'1 ядерних компоненпв, яке створюс пеину надмишковкть i потрибуе скороченчя повторюеяних форм. В;н може бути розкритим у межах граматики запежнсстеО, що дозволяе встановити чеоЪл!^ ii та доста-rni умови виникнення tx у текст ¡ гадтеердиш зм1стову екв1валентн1сть структур однаковими деревами залежностей.

4. Синтаксичне скорочення якогось елемен га можливе за умови перебування його на периферн структури речення. У виладку акафоричного eninca у периферЮнЮ поэиц)! олиняються одиниц!, яю повторюються, ию nigi верджуетыя актуальном членуванням таких речень. У сксроченй конструкци часто субоитуюеться нулем присудок, тому uto bíh вже не е nocieM власне рематично? фу:мцм i переходип. на лерифер1ю (¡ели:, ПериферШна позицш дозеопяе субституюваш нулем словоформу, яка в ыи опиняетьия.

5. Синтсжсичний naparien¡3m еизнача^ться за загальною схемою дерена залежностей, форма залежних sig пропущеного компонента (компонента) aiiií сказуе на форму елмнованого слова (сл>в). ЕУдноелення пропущеного компонента у BÍgnoBÍgniCi úoro poní в реченн! можливе завдеки тому, що лозадч нуля у скороченому реченм i антецеденту реченн! контексту однако;«, не порушу югься зв'язки у скороченому реченн! поргеняно з речениям контексту. Залишаеться незмшною ¡ерар'оя цчх зв'яэюв.

6. Експгоковано правила прихованоТ грамашки, за якими Е1дновлюе-и/:я елмноване слово або конструвдя. Вони враховують позишю ¡ валентност! сл!в, зв'язки мок словами.

7. 3даттсть мовноТ ceigoMocri Ыдиовлитат антецедент при анафоричному ел!пс1 об'ективованз в алгоритм!, за котрим будь який i iocm кови може шдгворити в nogiónoMy речешй Оого структурну схему, а це необлдний крок до (иднсалення зм'кту.

Структура роботи. Дисертаьия складаетъся ¡з вступу, двох роздМв, висновюв, б^юграфЛ 1 додатлу.

У вступ! обгруюовуеться вибф теми дисертаци, еизначаетъся П актуапьксть, мета, эавдання I головн! методи роботи, розкриааеться теоретична I практична значимость доотдження, характеризуется фактичний матерал.

У першому роздш! розглядаються питания, пов'язан! з окресленням анафорцчного елшса як типу конструкц*й 1 як яаища в структур! тексту. Визначаеться основний метод досл!дження побудова дерев залежностей I формулюютьея правила репрезентацп досгаджуваних речень. Подаються необх!дн! визнзчення.

Другий ррзслл присвячений досл1дженню особливостей будови коне фукцЙ з анафоричним елтеом, класиф!кац|Т цих структур. Проведений анал1з дозволяе встановити чггку структурну шдмшнгсть речень з анафоричним егапсом в!д 1нших конструкций. Ця В1дмшн1сть виявлясться при лобудеш для кожно! з названия структур дерева залежностей. Узагальненням репрезентацп структуру речення за допомогою дерева залежностей, ззвдяки якому ьезалежно в!д порядку сл>е у реченж вибудовуеться ¡ерарх)я зв'язмв у ньому, е прихована граматика для анафоричного египса, тобто правила е>дноалення антецеденте при субституц!) нулем у ларалельних структура. -- У висновках п>дсумовуютъся результати досл!дження 1 обгрунтовуються положения, як1 виносяться на захист.

У додатку подано блок-схему алгоритму ¡дентифшацЯ елтеа та е/дновлення пронущених компонентов речення.

Основы! положения дисертац)Т.

3 досл!дженнями в галуз! лмгистики тексту пов'язано досить багачо дискусйних питань. Одни/л ¡з них е питания про одиницю тексту. У робот! одиницею тексту названо речений. Речення - це миймальний ядерний ланцюжок з п1дмета I присудка, псширсний чи непоширений другорядними членами речення. Таке визначення речення ц!лком прийнятне, тому що при анафоричному ел1па однаково й.мов1рно, що два речення, гюв'язаш анафоричним зв'язком, у другому з яких е ¿¿нафоричний елтеие, будуть бформлен! окремо 1 будуть об'еднан! в о дне речення. Наприклад:

За цей neptog ц/ни на енергоносп вироспч в 12 раа!в. На стьськогосподарську продукцию, Ыдпошдно, -в3-4рази.

У1994 р. пороняно з 1991 tjinu на промислову продукций виросли майже в 20 тисяч раз/в, а на стьськогосподарську продукцию -лише в 43 гисяч pasiav

Речения розглядаеться в контекст!. Контекст - це фрагмент тексту, який метить вибрану для аналЬу одиницю, необх!дний i достатки для шзначенми П структура. Для речения з анафоричним enirtcoM контекстом е повне гюпередне речення.

У реченн1 як одиншу тексту можна констатувати дю законна тексту, а сам"'

- закону зв'язнос'п:

- закону антагоизму м1ж простою т'ш'йною оргамзацкю тексту та складною семантичною структурою;

- закону повторюваност! смыслу;

- закону надлишковост:;

- закону eKOHOMÍT.

Д1ю bcíx перел1чених законе зв'язного тексту можна побачити у кожному окремому реченнй Речення тексту пои'язан) мок собою, I ней зв'*.*ж выражений р1зними способами. Пеен! smíctobí компоненту rionepetjuboi одиниц! noeuHHi повторюватись, щоб ¡снував текст як комун1кативна ryTnicii.. Л/ie якби eci смыслов! повтори бупи вербал'1Эован!, тобто виражен! словесно, то текст був би переобтяжений ними i втратив би зз'язн;сть. Отжс, зв'язн1сгь реалЬуеться також за рахунок скорочення тексту. Cloro комлресП. Суть цього яоыща полягае у здатносп тексту' передавати 3míct за догюмогою MÍHÍMyMy лексичних засоЙв або нуля. Саме здатмсть речення передавать певний 3m¡ct за допомогою субститута-нуля , е об'ектом нашого вивчення. 3míct, який специально не выражений леисичними засобами, а su водиться змгсту cycigHix речень називають 1мплщитним. Правила, . ям описукль виведення цього зм!сту, називають лрихованою фаматикою. Одним ¡з злвдань дисертацЯ е створення тако! грамзтики, формально! П частини, яке полягае в укладами правил ¡дентиф^каии er.inca та Е!дновг,ення пропущено го компонента. У gaHiü робоп розглядаеться не сам ¡мплщитни. 3míct, а засоби його выражения в реченн!. Завдання вимагае пошук.}

формальних ознак ¡мплпдитного зм!сту i адпоидних методе опису. Такий пошук е важливою метою, оскЬчьки результатом його е позначення рЬних засобш коду&ання цьото зм!сту.

Повтор 3MÍcrry - це необх"|дна умова ¡снування тексту, одна з головних умов, за яких реал1зуеться його зв'язн1сть. Повтор вважають ¡Hogi единою умовою зв'язносп тексту. B¡h здйснюеться у межах субституцп, тобто повторения зм)сту субсти гуйованого елемента в субститут). 3 погляау скорочення (компреси) тексту субститушя - такий cnoc¡6 компресп його структур», при якому 3míct левного BÍgp¡3Ka тексту повторюеться в скороченому портняно з цим BigpijKOM вигляд! за допомогою особливих зассбт у рол! субститутт. У г.опередньому B¡gpÍ3Ky тексту (у межах одного -двох речень) наявний корелят субститута. Тому реципкнт при субституцП po3nÍ3nae smíct скороченого речення, звертаючись до попереднього контексту.

С кшька способ1в субституцП: займенниковий, за допомогою спец1алЬо8аних зясоб'ш (слова типу: згаданий, решта, nogiбний, так, ni); за допомогою cuhohímíb; за допомогою родового гюняття та лексичного повтору.

Cnoeió субституцП, я>;ии с об'ектом вивчення в дисертаци. субституция нулем або eninc - повторения зм'.сту за допомогою нульового знака. Нульовий знак - це тшьки лексичний нуль. Його функцгя визначаеться структурою ¡ семантикою безпосереднього оточення, змгст розгизнаеться на основ! попереднього контексту. € три ochobhí види enincie:

1) eninc у паралельних структурах, наприклад:

Авюморф/зми типу a називають обертаннями, типу б - Ыдбиттями, типу в -трансляц/ями.

2) eninc у непаралельних структурах (в межах одного речення), наприклад.

31 свитом Вас!

3) субституц!я нулем у запитально-дшлолчних сдностях, наприклад:

- Але теперу вас постЮне аитЮське пр'пвище, ¡м'я?

- Тепер постЮне.

В робот! досшджуеться монолог1чний текст, тому третш вид eninca не може буш об'ектом вивчення. Не може ним бути ¡ eninc у непаралельних структурах, тому що в»1неанафоричний. Отже, об'ектом вивчення е eninc у паралельних структурах (рЬновид 1). -

Днафоричний eninc виникае при такому зв'язку м1ж двома речениями, r¡pu якому в' другому з цих речень моститься посилання на перше '|!|:гроспективне посилання), тобто при анафоричному зв'язку. Той

компоненг, на який посилаються, називають антецедентом, а другий (той, який вказуе на антецедент) анафором. При анафоричному cjvnci анафор це нуль. На BigMiHy Big анафоричного зв'язку при катафоричному той елемент. на який лосилаються, с не першим, а другим (проспект иьне посилання), напри клад:

Бойовики gitor.b так. що кож на Тхня випвка не проходить непом/ченою

/ викликж резонанс в британському суслшьств/.

При катафоричному зв'язку дэох найближчих речень субституция ну пси неможлива, але якщо на цьому eugi зв'язку побудована частина тексту, то можливий вппадок, коли два речения в цих межах будуть пов'язан! анафоричним эв'язком, а, отже, в другому з них може в'|дбуп;сь субституция ну/1е:л.

Анафоричний eninc - не явище, яке одночасно належить i моапенмю, i мов!. Moei наслпьки, наск1льки вона дозволяс подобие скорочення i аднорленнч антецеденте. Мои належить механим цього Ыдноалення, формальной 6iK якого ми описусмо. До мовленневих явищ анафоричний eninc нплежи гь безсумн1вно, тому ага BiH еикликаний Heo6xigHicno будувати зв'яэний текст i CTunicTUHHO Оого оформпювати. Водночас, закони, за якими будусться зв'язний текст - mobhi. Однозначно сказа ги про цю конструкцию, як I взагал! про речення, що це яшще мовне чи мовленнсве, неможливо. На piBHi схема ¿бстракцп. механ1зму в1дновлення - мовне, як таке, що викликане контексюн. - мовлемнеье.

Синтаксичне скорочення якогось елеменга можливе ттьки rogi, коли в:>. перебувае на периферП структури речення. У виладку анафоричною ели ¡с а н периферий позицм олиняються одиниц!, яю лонторюються. У скорочеьому ре'>енн| часто субституюеться нулем присудок, якии за традицуйною класиф|кац1ею взноситься до реми. 3 другого боку, скороченню може. п^длягати лльки адома з попередкього коьтексту, повторювана ¡нформ<имя. Це оэначае, що присудок у с короче! юму penehhi вже не с hocicm апасне рематичноТ функцЛ. Але темою його також вважати було б некоректно. Lie ceioMUTb на користь трикатегорЮного членування при onuci комунташвио! структури речення. Отже, в конструкцп з анафоричним ел!псом псвторюваний присудок переходить на периферию реми. Периферийна позищя дозволяс зд!йснитися скороченню i присудок субституюеться нулем. Тут комун!катшне членування i семюлопчний аспект аивчення речення перетинаються, тому що у семюлопчий грима niqi скорочення можливе тНльки для компонента, який займае периферЮну позшию.

Пере творения конструкций' з анафоричнцм елтсом на Тх нееп1гттичний eapiairr, яке hocíü /лови 3g¡CicHioe легко, е дуже важливим для автоматичного анал!зу reKCTÍB. В!дтворення процесу розумжня таких конструадй - i побудова правил шдновлення пролущених компоненте (правил прихованоГ граматики) с важливим теоретичним заеданиям, яке розв'язуеться в робо"п. Для цього no [pífano tu.i«Ru ru закономерное!i будови таких конструкцЮ, визначити Hc-ob*ig»i¡ й достать! умови виникнення анафоричного eninca. Це можливо лпьки 1Ш!яхом репрезентацп структури речения у формал13ованому вигляд, Я'.ий також будуеться за строгими правилами.

Досгйдження анафоричного eninca в робот! здШснюеться на pian! формально-синтакеично! структури речення. Тому при onuci цього явища ми не торкасмося семантичних Ыдношень i спираемося т1льки на формальн! показиики або сигнали в орган!зацп речення, як! вказують на анафоричний eriinc. Таким сигналом е nepegycÍM, тире. ЦеО знак ставиться у скороченому речений Лле тире пол)функц!ональний знак у текста Н.эступним сигналом с паралельнютъ структури повного i скороченого речень. Зеичййно, паралельИ! структури можуть мати i неелштичн! речення. Тому ще одним сигналом е наяшпеть нульових лексем у кореш дерева залежност ей (ДЗ)! (або) вершина гидмета (або частини складеного п'|дмета чи лрисудка).

Дерево залежмостей е способом репрезентзцП структури речення з анафоричним ел!псом, необх!дним для вияапення законом!рностей його будови. Пошук i Бисв;тлення цих законом1рностей дозволяе зробити узагальнення I сформулювати правила приховано! граматики для такого виду конструкций. ДЗ дае можлиасть абстрагувеггись eig порядку сл!в у речени! i оиявити строго iepapxlMHi зв'язки його компонентами. Це уможливлюс лошук зйксном!рностей в 6ygosí пеоного шду речень i встаноапення íii¡jM¡HHOCTi одного виду и!д ¡ншого. Основною законом1рн!стю будови таких конструкций с паралел1зм синтаксичних структур повного ¡ скороченого речень, Ko ipuü t одн!ею з формальних ознак анафоричного ел!пса. У робот! подаються дерева для речень з тире, у яких е Í анафоричний ! неанафоричний eninc, а гакож для речень з тире, що не листать елкка взагат. Дерева залежностей цих Bugie речень суттево В1др!зняються одне шд одного i е своертдними моде^я-ми íx структури. Таким чином, формально встеновлюеться вид консгрукиН з анафоричним египсом i досл^джусться його структура. Ochobhí правила, за як! imu в робот! будуються дерева запежностей, так!:

1. Дерево "росте" "згори до низу". Ксренем дерева с присудок (або ядернпО компонент односкладних речень). Якщо присудок складний, го корень 1 умовно вибираеться носЮ грамагичнсго значения - допом!жне оксяово. Вершину, складов! такого присудка, м(ж собою з'еднуюгься стрижами, як! мають особпии позначки зв'язку м!ж чэстинами лрисудпа. Напри клад.

почав

ширится

2. ГПдмет I присудок ьизпаються р!вноправними компонет.гли предикативного центра речения. Присудок вважасться коренсм ДЗ умовно. с>пч зосрежен;ш строго! крархн га дня зручшс"п репреэемтяин речемь .. безособовим або неозначено-особовим дксловом у рол1 головного член... речения. Тому гидмет зображусться як вершина, крархЫно гидхоренл присудков), але зв'язок, який позначений на »дпошдни"! стр.лц1, - зв'изок координацП.

3. Грула п1дмета зображусться зл'ша, фупа присудка - справа: з/бралася

XX

помчерго.ча X ¡юнеп'пок

сес¡я /»' ж г»

4. Узгоджен1 означен»¡я зсбражуклься зпнза, обстаоинм. додатки > пеузго;]же:.! означения - справа:

зюрлпася

сестУ^ в

позачергова г парламенту понедток

5. Ми будусмо ДЗ поверхнево! (або формально-синтаксично'1) структура

речення, тому прийменники I спопучники е вершинами ДЗ. Вони зобр.чжуюгься як "господарГ словоформ, залежних в|д них. Наприклад:

з'!бралася /

\в нас народу

^ понедшок на того

(>. Вии<е ми виэначили речення як мМмапьний ядерний ланцюжок . Тому дпя ксхного речения, наать якщо два оформлен! в одне, ми будуемо окреме дерево ^/¡ежностеО. Сполучники I сгюлучн1 слова (якщо вони поеднують речення, а не оу;юр!он1 члени, 1 не е ноаями синтаксичноТ функцП) не входять у ДЗ.

7, Заморенна частка, шо стосуеться присудка, зображустъся як п;дпорядков<<на кореню вершина, з'еднана з ни/л окремою стрткою, наприклад: можна

ру\р

не г \було

Р

1 сказати

а. Для зручноел читання ДЗ ва його вершини позначен! в^дпоадними словоформами, як! вони репрезентують. Субституйоваш нулем лексеми нсоннчен! нулем у в!дпов1дч|й вершинк Наприклад: эвЬ1ьнипи О

"-к.

мтцюнерю

9. ДЗ речень з онафоричним елтсом подаються ттьки псряд з ДЗ речень контексту, у яких наявний антецедент нуля.

Це правила, за якими ми будуемо дерева залежностей для речень з тире. Ми так детально зупиняемося на цих правилах, тому то дерево залежностей - це зайб об'ективування структури речення I його зм1сту, умова його однозначного прочигання. Ц) ДЗ дозволяють ¡дентиф^кувати конструкцп з онафоричним елшсом на основ1 формальних ознак 1 знайти в 1х орган!заци закономерности як1 оформлюються у вигляд! правил приховано! граматики для цьсго виду конструкций.

У реченн! тире вживасться не лише при анафоричному ггипа. Воно ставиться у певних випадках М1Ж гадметом I присудксм; госля переп:ку; перед узагальнювапьним словом, що стоТть гнсля однор1дних члегав речення; дпя в1докремлення прикладок; заметь сполучень з прийменниками типу "в^д „. до"; М(ж двома або кшькома власними ¡менами (назва теорн, спортивна пара

-л.

гощо); для видшення вставши слт або вставного речения; при прям(й >к| !нод|, наприклад, у в'|ршуванм'|, тире гадкреслюе паузу. Тире ставиться так«»¡> м!ж речениями при безсполучниксвому зв'язку, У окремих випадках ¿вязку м'1Ж речениями тире ставиться гнсля коми перед словом, яке повторюеться.

Проведений анэпв дозволяе встановити ч^тку структурну ыдмпнн. м !пкич тип!» речень в1д речень з апафоричним ел'тсом. 1Дя BigMiiiiiii.ii виявляеться при побудов! для кожно! з названия структур дерева залежное Розг лянемо там приклади:

(1) Сила сама по соб/ не ¡снус. 17 причиною завжди е певний ма терШшшй < t>( /

- стерепо сила

(2) Через точку В проводимо пряму, паралепьну СО, а через точку О прчл»

Паралепьну СВ. Дерева запежностей них речень с такими:

Р ¡снуе е

к Ар

обЪкjf \ причиною

Л1 a т е/млпьний

1 /! Ill '

певний

1 гоб»

"^джерепо

0)

проводимо

через

; пряму хтсчку \ пряму

1 паралепьну "^В \ парапельну D

'CD /ВС

<2;

При гнзфоричному eninci дерево залежностей скороч^но! конструкцн гюаторюе дере» пойноТ, кршини.. якл мали б займати пропущен! словоформи, позначен! нулем, «ле ы>ни ¡снують. 1ма;,ше кажучи, пасивна облиаторна

валентисть наявних у реченн'| сл1в вказуе на форму, функцш I значения В|дсутн1х у реченн1 сп!в I допомагае Ыдновити зв'язки м!ж ними. Очевидно, що структури непаралельн! у приклад! (1) I паралельм у приклад! (2). Ми розглянули речения з анафоричним елтсом (2) I з прикладкою 0)- У приклад! (1) перше I друге речення е номЫац1ями двох ситуацЙ. Друга доповнюс, поширюе зм!ст перизоТ. У приклад (2) маемо дублювання позначення першим I другим реченням одмеТ, але модифжованоТ ситуаци. Такий висновок ми робимо тому, що у другому реченш скорочуеться мЬимальний ядерний ланцюжок, який в основному описуе ситуац1ю. Таке скорочення можливе ттльки при повторена ¡нформац1Т. ЗмЫюються лише деяк|' характеристики сигуацЯ. Ц) зм!ни 1стотн1 для зм!сту, тому вони обов'язково вербал1зуються в скороченЮ конструкц1Т.

За допомотою дерев залежностей досл1джуваного типу речень ми можемо всгановити види анафоричного ел1пса. У дерев! залежностей певного виду ел!пса нулями позначен! пропущен! компонент, а леерами Л з ¡ндексами - наявн! сповоформи. Л - це лексична основа, а 1ндекс -граматична форма. У паралельних структурах залежн! слова заповнюють однаков'1 валентносп головних членов, а тому мають в аналопчних позиц1ях повного 1 неповного речень однакову фаматичну форму. 1. Ел1пс предикативного центра:

Ля

О

Наприклад: Перше слово називаеться головним. Друге - эапежним.

2. Еп'шс присудка) частики присудка:

Лб

О

Наприклад: Точка е центром, а ЫдрЬок - рад1усом. 3. Елшс головного члена в односкладних конструкциях:

Наприклад: Вл'ту збирають ягоди. восени - /риби.

Eninc Ыдмета. Цей вид релрезентуе таке дерево:

Лв

Лб

Лг

Ла

Лг

Наприклад: Одна кол- -нда зазнас поразки, йшя - соя г ,■:}{; перемогу. Ь. Fjiinc частини гндмета:

Пв

Лв

Ла

о

Н=™р"кля<т 5пас<чж11ртвнйшли. 10 - залии тлись.

О™, можемо зробити так! висновки. Позиц)я компонента, який мае нульове вираження, збер'|гаеться, оскшьки не порушуються зв'язки в реченм'1, що шддаеться сксроченню, Залишаеться незм'1нною ¡срарх!я цих зв'язк1в. Синтаксичний паралел1зм визначаеться за эагальною схемою дерева залежностей, форма запежних Big пропущеного компонента (компоненте) cnia вказус на форму ел1м'1нованого слова (cnie). Все це робить можливим 1ч'|{1нонлення npcnvujenoro компонента у BignoeigHÍü його рол'| в реченш й ifj '-¡'огьк o»<p*íCivj*ni приховану граматикою для анафоричиого ei linca.

! !епоьнотл реченн* з анафоричним 'inincoM очевидна. Контекс т шпомаг:^: и<тл\ fignomiTU Doro ср повного, а ыдновлення н'дбуваеться за перними правилами, як! нам вдалося виявити. Формул.ЮЕЭНия цих правил можш вналаги частно» гдаихованоТ фаматики. Вони ераховують позицж) i валет нос ri сл!в, зв'язки м1ж словами.

нафоричний ел'тс можливий, коли структури речения з субститутом нулем i ¡течения з антецедентом парллепыч, i коли вони с назвамм тИ самы ситуацП. Неповне ргчення називае не Hogy сигуац1ю, а ту саму, що названа повним, т йпьки модифюоеану, Денотгли предикативних час run можуп. •■iijpi3H4TUCb такими характеристиками: 1. При Тотожностп gií i суб'екта гмшюютъся:

а) умови (обстзяини) gií;

б) cnoc¡6 gil;

■-V ,>t;cKT gií;

!) MÍcup gi;

• j jcta^Tepi.cTUKí оуо'гхтг {тпржчад, кишюсна).

При ТОТОЖЯОСТ! Oil ЗМШЮСТЬСЙ суб'схт.

3 При тотожност) суб'екта змшюеться д>я.

НлОчаст^ше деяк! характеристики, зазначен1 в пунк-п 1, зм!нюються одночасно, наприкпад:

(3) Центр гострокутного трикутника лежить всередчш нього, а тупокутного -

поза ним.

Туг зм1нюються характеристика суб'екта {м!сце ф.

(4) Пкр Моруа очолював мун'щилал1тет Шппя, Жак Ширак - Парижа, ПЬр Береговуа - Невера, Ед'п Крессон - Шатепьро.

У приклад! (4) змЫюеться суб'ект, а в приклад! (5) - д!я:

(5) Копи котрась сторона порушувапа угоду, ¡нша - знаходила соб/ нових союзников.

Позначен! в 2 I 3 пунктах зм!ни не обов'язково проходять у паралельних структурах, тут обл!гаторн1'сть зв'язк!в послаблюеться. Можна сказати 11ав!ть, що в цих випадках речения називають да ситуац!!, об'сднан! або д!ею (4), або суб'ектом (5).

Зм!нн! характеристики ми позначимо зм!нними х, у, и та м I |редикативний центр (або той Сю го компонент, який залишаеться ноелйним) - константою С. ЗмЫн! - це лексична основа с л! в, залежних а!д I кдл^ета ! присудка. Граматична форма цих сл!в у певних позиц!ях неповного речення така сама, як форма сл!в в аналог! чн их позиц!ях повного, оск!льки в паралельних Сфук турах реал!зуються однаков! валентное т! головних член!в ^ечення. Тому фаматична форма залежних елт позначаеться !ндексами / та / / -для левого оточення предикативного центра (наОчаст!ше це означення до гпдмета),) - для правого оточення (эдебшьцюго репрезентованого додатком). За Ц1е1 умови структуру неповного речення при анафоричному скороченн! I |редикативного центра можна описати в такий слос!6:

1) х, а У1 -» ц де С1 е {Б,Р}.

При анафоричному скороченн! присудкэ в одн!й з частин складного речення, юбто при змин суб'екта при тотожност1 д!Т:

2) х, С2 у, -> и. - v,, де С2 е {?}.

П|.ч скороченн'| ™дмета(при змМйого характеристики або зм!н! пре<^жата):

3) х, СЗ У] ц - V) де СЗ е {Б}.

Киостанта (С) тут позначае тему ! перифер'ио реми, а зм!нш (*, у, и та v) - рему. 11рисудок у таких реченнях належить до перифери реми. Титьки у конструкциях

-и-

3-го типу вЫ запишаеться ноаем новоТ ЫформацН. Ця формула е узагапьненням репрезентацп структури речення за допомогою дерева залежностей, заваяки якому ми в!двол'|каемося Ыд порядку сгав у реченн! I вибудовуемо ¡ерэрх'ю зв'язюв у ньому. Ттьки в цьому випадку можна предстаьити будову реченнл так: зм!Нна-константа-зм1нна. Зпдно з ¡ерарх1ею зв'язшв у реченш центральне м!сце поадають головн! члени, незалежио в!д Тхньо! позицм, I це в1дображаеться в дерев1 залежностей, яке е унаочненням досхпджуваних структур, 1 одночасно - л:нгв:стичнь'м узагапьненням. Повне реченнл ми репрезентуемо як а: Су. а скорочене - як и - V, де предикативний центр (або його частина) пропущениО, а тире вказуе на цей пропуск. Зв'язок речень а контекст! лозначений як к>нкц(я - V. Отже, речення з субститутом-нулем 1 речення з а1 ггецедентом нуля репрезентовам за допомогою формул:

1) х, С1'у| V и, - v,, де С1 е {Б,Р};

2) х, 02 у( V ц - V). де С2 е {Р};

3) х( СЗ ^ V ц - де О е {5}.

Вони е узагапьненням даних про будову речення, отриманих п!сля побудови дерев залежностей для рЬних тише таких речень.

Правила прихованоТ фаматики, за якими ндновлюсться пропущений компонент, таю:

!) х, С1 у, У ц - V, -> х, С1 у, V ц С1 V) де СП б {Б,Р};

?) х| С2 ^ V и, - v, -> х, С2 У] V и, С2 v,, де С2 е {Р};

3) х, СЗ у, V и, - V, -> х, СЗ у, V ц СЗ V,, де СЗ е {5}. При паралельносп структур збергаеться характер зв'язку 1 позицы елементш оточення й експлщитно виражених, й пропущених гоповних член'т речення. 1накше кажучи, слова, як! позначають злинн! характеристики, мають властив!стъ заповнювати однаков) валентносп головних член1в. У таких реченнях виявляеться ¡хня обл1гатсрна пасивма валентность. Тому змини з ¡ндексами - це узагальнення позицЙ оточення предикативного центру (або його частини).

ПроЫтерпретуемо ц| правила:

1) у реченн1 з анафоричним ел1псом в!дновлюються пропущен! головш. чпени речення, необх1дн1сть яких зумовпена обгмгаторною пасивною. ^алентнютгс залежних член1в.

2) при пропуску р.рисудка, кн адновлюються завднки обл1гаторш'л валентносп годмета 1 пасивн!й валечтност'! залежних в!д присудка словоформ.

3) при пропуску годмета, в!н в!дновлюються завдяки обл^аторнШ вапет носп присудка 1 пасивнШ валентиослп залежних в!д гёдмета словоформ..

Структурна схема речення з анафоричним елтсом идноапюеться, оск1пьки носй мови володйс знаниям потенцЮно! сполучуваност! слш у таю'О конструкц!Т. В1дновлення пропущено го компонента адбуваеТъся завдяки 'нашим знанням про семантико-синтаксичн! валентносп наявних у скороченому реченн> сл!в, а саме - про 1хн1 власти воет! бути залежними в1д !нших от. У нашому досл1дженн! об'ективована здатн!стъ мовноТ сЫсрмосп в!дновлювати антецедент (антецедент) при анафоричному елше! завдяки сформульованим правилам) за якими адтворюеться пропущений компонент, и правила е основою укладеного нами алгоритму для експл1кування в подобному реченн! його структурно! схеми, а це - необх!дний крок до в1дновленкя зм!сту. АналЬ фунтуеться на формальних ознаках, як'| дозволяють зстановити, що в конструкцЛ можливий анафоричний ел!пс. Ними е:

- наявшеть тире;

- субститут нуль у кореш дерева залежностей чи у вершин!-п!дме"п (або субститути-нул/ в обох цих позициях);

- паралельн!сть структур речень: неповного та того, у якому м!ститься антецедент (або антецеденти) нуля (або, в!дпов!дно, нул!в).

Анал1з передбачае в!дновлення не лише головних член1в речення, а й запежних, якщо вони також пропущен! (наприклад, присудка 1 додатка). Формал'оований спис шдтворених нами правил прихованоТ фаматики необх!дний для автоматичного синтаксичного анализу текста.

Всього досл!джено 1163 речення з тире (з наукових та публщистичних текста). Статистичне дзеэтджекня не с нашою метою, тому ми подаемо тшьки так! в!дсотков! сп!вв!дношення:

- частина речень з анафоричним ел!псом в!д загальноТ юлькосИ речень з тире -14.99%;

- частина речень з тире, яке не е ознакою анафоричного елкка - 84.01%. 3 них найбшьше речень з пропущено» зв'язкою (38.91%) та з прикладкою (20.43%). Решта (25.67%) - речення у яких тире сто!ть при однор!дних членах, м'|ж п!дметом ! присудком та ¡н.

Ел!пс предикативного центра становить переважну б!лы_шсть конструкц!й з анафоричним елтеом - 10.62% (гад загально! к!лькос"П речень або 70.8% в!д кшькост! речень з анафоричним египсом). Це пояснюеться . наявнкпо численних односкладних структур у текстах наукового стилю (з головним

членом, вираженим, налриклад, такими особовими giecnoBaMu: "лозначимо", "наэивають '). Eniлс присудю - це 3.98% (або 26.6%), а eninc п|дмета складае: 026% (або 1.73%) (eninc гидмета) та 0.0% (або 0.87%) (eninc частини П1дмета). Менший BigcoTOK субституц|'1 нулем п^дмета в текстах пояснюеться тим, идо для ¡менних частин мови, якими найчаспше иепрезентований гидмет, ©лыи характерными с iHtui види субституцп: займенником, cuhohimom та ¡н.

Проведене досл!дження св!дчить, що представления приховано( фаматики як системи правил, як1 гадлягр.ють формалЬованому onuci при автоматичному синтаксичному аналЫ (алгоритм у вигляд блок-схеми поданий у додатку до дисертац)Т), е новим методом об'ективування формально-синтаксично! структур!) речення. Розроблена методика встановлення повноТ структурно! схеми в реченнях, скорочених за законами зв'язного тексту, мае важливе значения i для машинних експеримеклв, спрямованих на "розумЫня" змюту зв'язного тексту, i для теоретичних студмЗ, зокрема для досл1дження синтаксично! семантики.

Основн) положения роботн викладен! в таких публ1кац1ях:

1. Анал1з ел1птичних конструкц!й е систем! автоматично! обробки украТнського наукового тексту // Проблеми украМзацп комп'ютер^в. Тези gonodigeü 3-Т м1жнародноТ конференци. - Львт, 1993. - С. П4 - ¡¡5.

2. Enimru4ni конструкцм в систем! автоматично! обробки украТнського наукового тексту // Проблеми украТнЬацЯ комп'ютер!в. MaTepiariu 3-Т м!жнародноТ конференцП. Доааток до журн. УОМ. - К.: 1994. - С. 53 - 64.

3. Пошук ел'штичних конструкцй як етап автоматичного синтаксичнсго амал!зу украТнського наукового тексту // Постат! та iget. 3 icTopil украТнського мовознавства. 36. статей. - Kj Наукова думка, 1995. - С. 138-144.

4. Дсяк| фсрмальн! ознаки компресП тексту на приклад! анафоричного eninca // Проблеми украМзацм комп'ютерт. Тези gorioeigeü 5-Т м1жнародноТ конференцН. - Льв1в, 1995. - С.91- 92,

-п-

Romaniuk J.V. Grammatical Processes of Text Compression (the Case of Anaphoric Ellipsis). The thesis is presented as a manuscript for the degree of Candidate of Philology (speciality 10.02.15 "General Linguistics'). Institute of the Ukrainian Language, National Academy of Sciences of Ukraine, Kyiv, 1996.

Thesis deals with the formal-syntactic sentence structure with anaphoric tllipsis as well as the mechanism of the antecedent restoration. Dependence jrammar is an instrument of this analysis. The algorithm of anaphoric ellipsis identification and antecedent restoration is suggested.

Романюк Ю.В. Грамматические процессы текстовой компрессии (на примере анафорического эллипсиса). Диссертация на соискание ученой степени кандидата филологических наук по специальности 10.02.15 - общее языковедение, Институт украинского языка НАН Украины,- Киев, 1996 год.

В работе исследуются закономерности формально-синтаксической структуры предложения с анафорическим эллипсисом, описывается механизм восстановления антецедента. Инструментом исследования является грамматика зависимостей. Построен алгоритм идентификации анафорического эллипсиса и восстановления антецедента.

Ключов! слова: субституция нулем, контекст, анэфоричний enir.c, паралельн'1 структури, антецедент, дерево залежностей.