автореферат диссертации по филологии, специальность ВАК РФ 10.02.19
диссертация на тему: Структурно-семантический и коммуникативный статус заголовков рефератов к патентам в системе автоматической переработки текста
Полный текст автореферата диссертации по теме "Структурно-семантический и коммуникативный статус заголовков рефератов к патентам в системе автоматической переработки текста"
МИНСКИЙ ГОСУДАРСТВЕННЫЙ ПЕДАГОГИЧЕСКИЙ ИНСТИТУТ ИНОСТРАННЫХ ЯЗЫКОВ
На правах рукописи
ДЕТСКША Раиса Владимировна
СТРУКТУРНО-СШАНТИЧВСКИЙ И КОММУНИКАТИВНЫЙ СТАТУС ЗАГОЛОВКОВ РЕФЕРАТОВ К ПАТЕНТАМ В СИСТЕМЕ АВТОМАТИЧЕСКОЙ ПЕРЕРАБОТКИ,ТЕКСТА
Специальность 10.02.19 - теория языкознания
Автореферат
диссертация на соискание ученой степени кандидата.филологических наук'
Минск - 1991
Работа заполнена в "кнеком государственном педагогическое институте иностранных язиков.
Научный руководитель: кангздзт филологических наук,
доцент Т.Я.КАРШЛОВЙЧ
Официальное оштананти: доктор филологических наук,
профессор. Б. А. ФЕШЖКйй
кандидат филологических наук, а.о.профессора Т.С.ГЛУИАХ
Ведущая организация: Тартуский университет
Защита состоятся 1991 г. в
часов ка заседании специализированного совета Д. 056.03,01 по ' присуждению ученой степени доктора филологических наук в Минском государственной педагогическом -институте' 'иностранных языков но адресу: 220034, г.Шнек, ул, Захарова, 21.
С диссертацией шяно ознакомься в библиотеке Минского .государственного педагогического -института иностранных языков.
.Автореферат разослан 1991 г.
Ученый секретарь спёциализйрозаняого совета
доктор филологических наук, * _
■профессор Н. В. ПЕРЕЛЕТА
Реферируемая диссертация представляет собой опыт решения с озиций ведутциг направлений современного языкознания - кошуни-атпзной лингвистики, языковой номинацгга, денотативной сеьинтв-и - общей проблею тики заголовка в его связи с текстом и коя-ретного исследования информативно-коммуникативной значимости емецких заголовков рефератов к патентам по складскому хозяйству
Интерес к вопросам, составляющим проблематику заголовков аучно-технических текстов, стал заметно возрастать. Это объясняется как расширением исследований з области лингвистики такта, так и новими возможностями изучения заголовку, связанными достижениями в области автоматической переработки текста. Ра-т-ущяй спрос па быстрое и массовое информационное обслуживание прежденей и предприятий обусловливает особый интерес к машиной обработке заголовков научных статей, поскольку в них содар-ится ключ к содержанию текста.
Как иззестно, заглавия научных трудов обозначают, как пра-ило, область исследования, общую направленность-или тему рабо-ы, дифференциации смыслового объеш. Эта особенность их семан-ияо-функциональной стороны находится в прямой связи с сутью бработки информации, при которой научные работы тематически дассифпциругатся по содержанию заголовков.
К настоящему времени проведено значительное количество ис-лецований. посвященных аналп-у заголовка как компонента тек-та^. Однако, яри всей актуальности рассматриваемых в них проб-
* Шамелашвили М.А. Функционально-стилистические и лвкоико-рашгатические.особенности газетных заголовков: Автореф. дис. .. канд. филол. наук. -М., 1982. - 24 е.; Пшеничная 1.Э. Мо-ель раскрытия содержания заголовка средствами полного текста зучного-документа // Создание автоматизированных систем инфор-ационного обеспечения научных исследований. - Киев, 1986. -
лем'рид вопросов организация заголовков остается все еще как Ееннк:.".. Так» в частности, не получил достаточного осзелезия I про с о с труктурно-с е;ла ктз че ски х свойствах заголовков научно-: нвческкх текстов, ех связи с общак содержание« ~~кста.
В данной работе выбор объекта исследования как раз и прс диктован указанной причиной, точнее отсутствием общепринятого взгляда на грамматическую природу•заголовка, его структурный сйшнтико-сякгаксачзский статус, специфику связи с текстом определенного ванра научно-технической литературы. Изучение этих аспектов неизбежно выводит в проблематику вопросов, нахс дящихся в центре внимания современных лингвистов: моделирова! предложений; кощуника хивнгя -организация предложения и текст; соотношение предложения, высказывания и текста и др.
Актуальность выполненного исследования ооусловяивается I обходамостыэ раскрытия роли заголовков е коммуникативной стрз туре научно-технических текстов определенного жанра,'потребяс стями разработки алгоритмов анализа речевых единиц как основ! систем автоматической переработки текста.
Материалом исследование явились 5600 заголовков реферат« к патентам на немецком языке по тематике "Организация складского хозяйства и его материально-техническая база" и сами т( с.ты рефератов данной предметной области. Компрессированный г стандартный характер заголовков таког^ рода научно-техничесш документов позволяет представить в виде определенного кснечш го списка структурные и коммуникативные типы исследуемых заг< ловков.
С. 38-45; Чижаковский В.А. Сешотико-кошлуникати^ные аспекты автоматической переработки заголовка научно-технического текста. Автор-зф. дис. ... доктора филол, 'наук. -I., 1989. -31 с..-
ОзайШШ^Ш^ь г/.ссергацкЕ состазлшта разработка г», основе результатов лингвистического анализа отобранного материала ?лго-ръп'л те:.2-р-Э1.ат1!чос::ого члеьеяия заголовков я создание.' экспериментальной спсте?а: немецко-русского машинного перевода (1Ш) заголовков рефератов к патента?,:.
Поставленная цель предполагает решение слэдунцих. конкретных задач.:
1) построение структурно-синтаксических моделей немецких заголовков рефератов к патентам;
2) анализ сешнтико-сштаксической структуры заголовков;
3) изучение роли заголовка в организации коглмуникатЕБЯОЙ структуры текста реферата к патенту;
4) 'изъявление коммуникативных типов заголовков рефератов к патентам и разработка алгоритма их автоматического определения;
5) установление.структурных соответствий немецких заголовков в русском языке;
6) разработка алгоритма и программы немецко-русского МП заголовков рефератов к пат'ентам.
Б работе использованы следующие методы исследования: сопоставительный, контексауалъкый, статистический, семантико-син-таксическкй, логико-семантический 'анализ, а также, кетод моделирования к некоторые частные процедуры.
Научная новизна ¡доведенного исследования заключается в ... том, что икфорлативяо-ноьыунякатавная значимость заголовка реферата к патенту установлена и обоснована ь непосредственной связи с озаглавленный текстом. На базе анализа количественных данных и характера повторов лексических номинаций заголовка я тексте рзф-эрз.та выявлена рати- компонентов семантической структура заголовка в тэш-роштпческой организации всего реферата.
Выявлены также коммуникативныетипы заголовков, обусловленные различной позицией заголовочных предикатов, вводящих е рематический компонент текста рефэрата. С учетои коммуникативных типов заголовков и их маркеров - базовых синтаксических моделей разработан алгоритм тека-рематичеекого членения заголовков, ко торьй могет быть использован в автоматизированных системах информационного поиска и распознавания сшела научно-техняческог текста. •
На основе установленного набора базовых моделей-немецких заголовков, их структурных соответствий в русском языке и диат ностирующих признаков создан алгоритм немецко-русского МП загс ловков, реализованный на перс^я»анои ЭВ'Л.
Теоретическая значимость диссертации связана с тек, что полученные результаты могут способствовать дальнейшей раэрзбо: ке теоретических положений о семантической и.коммуникативной структуре заголовка как неотъемлемого коштанента текста.
Практическая значимость работы заключается в возможности применения созданного алгоритма тема-рематического членения н< мвцких заголовков рефератов к патентам в автоматизированных сз стешх информационного поиска и распознавания смысла научно-технических документов, а также при создании компьютерных обу ющих програж. Разработанная си стека МП заголовков реализован в экспериментальном регшлэ и монет быть исяользоиана дая опер тивного получения сигнальной информации о новых изобретениях.
. На защиту выносятся следующие положения диссертации:
1. Заголовок является предложением особого рода, коьщуни катавное назначение которого состоит в передаче основного содержания текста в кзратроЗ и сжатой форме.
2. Занимая одну из "сальных" позиций текста реферата к г тенту, заголовок конденсирует текстовую информации, которая
уточняется и конкретизируется в реферате.
3. Коммуникативность заголовка как семантического репрезентанта текста реферата к патенту определяется его свойством указывать на тематический и рематический компоненты текста реферата.
4. Основные составляодие семантической структуры заголовка (объект описаний а заголовочные предикаты) принимают различное участие в организации коммуникативной структуры текста реферата. Объект описания, называя главную тему реферата, обеспечивает его семантическое единство и целостность. Заголовочные предикаты, представляйте характеристики объекта описания, входят в рематическую часть реферата, которая охватывает практически весь его Тёкб5, опйсыйающии суть изобретения.
Апробашя работы проводилась на Международном семинаре по машинному пероводу (Тбилиси, 1989); на Всесоюзных конференциях: "Переработка текста методами инЕенэрной лингвистики" (Минск, 1982), "Использование ЗЗЛ в научной и учебной работе гуманитар-, ных вузов" (Минск, 1990), "Актуальные проблемы компьютерной лингвистики'' (Гарту, 1990); на межвузовской научной конференции "Проблемы компьютеризации процесса преподавания иностранных языков в педагогических институтах" (Ульяновск, 1986); во Всесоюзной пколе^-семпнаре "Бионика интеллекта" (Харьков, 1987); на областной конференции преподавателей кафедр иностранных языков "Лексикографические метода в обучении я научных исследованиях" (Иваново, 1988); на итоговых конференциях Минского .'ПИЩ (19801930 гг.).
Структура диссертации определяется целью и задачами исследования. Композиционно диссертация состоит из введения, трех глав, заключения," списка использованных источников и пяти приложений.
Во В Б Э Н ШЗ Да ется обоснование актуа гьности темы, оцреде-
днатся цель а задачи, новизна, теоретическая и-практическая значимость работы, описывается матер;ал исследования, иглагаэт-оя основные иологенвя, выносимые на защиту. '
В.. первой главе теоретически обосновываются положения. на основании которых проводится лингвистический аналнз, ориеитвро-занный на обработку заголовков рефератов к пат'ентам яо складскому хозяйству. В ней получает трактовку семиотическая природа заголовка, дается функционально-коммуникативная характеристика заголовков научно-технических документов, определяется лингвистический статус заголовка.
Во второй главе проводится структурно-семантический анализ заголовков рефератов к патентам по складскому хозяйству, устанавливается роль заголовка в коммуникативной структуре текста реферата на основе анализа характера и способов повторов лексики заголовков в рефератах,.анализируются кореферентЕые связи лексики заголовка, представляющей основные компоненты его семантической структуры, и текста реферата к патенту, определяются коммуникативные типы заголовков, разрабатывается алгоритм выявления коммуникативных,типов заголовков рефератов к патентам В третьей главе описывается процедура формализации основных лингвистических данных, полученных в предыдущих главах: устанавливается структурная типология базовых синтаксических моделей немецких заголовков и их русских соответствий, разраба-тнвзстся общий и детальны* алгоритмы и программа немецко-русского МП заголовков рефератов к патентам по складскому хозяйству.
В заключении излагаются основные результаты исследования, формулируются выводы и" определяются возможные направления дальнейших исследований в области затронутой проблематики.
Приложения содержат конкретный лингвистический материал
дня построения сзстеш неьгацао-русского МП. загпловлоБ рэферЕгов к патентам и результаты практической реализаций пв 33." 131. £0/12.
СОДЕРШИВ РАБОТЫ Современный уровень развитая лингвистической наука позволяет подойти к изучении структурно-функциональных особенностей заголовков в пнрском плана - через сооге сение их роля с общей теорией коммуникации. С таких позиций логично признать несостоятельный отождествление роли заголовков с функцией только "надписей-ярлыков", лишаадев их коммуникативной значимости, т.е. связи с содержанием озаглавленного текста. При подобном отождествлении не учитывается специфика заголовков, а именно тот факт, что они являются частью текста и обладают двусторонней связью как с текстом, так зз с непосредственными объетгтавж действительности , отраааемши з зтом тексте. '
Заголовку как 'компоненту текста присущи два основных признака: номинативный характер, с которым связана способность заголовка к предикации, а значат к сообщению чего-то нового о данном явлении, н информативность, заключающаяся в способности заголовка передавать ядро содержания озаглавленного текста. Оба признака позволяет считать, что статус заголовка как костонен-та текста объединяет в себе называние и передачу основного со-дергания озаглавливаемого текста. Тем самим речь идет о несомненно "сильной погадав".
"Сильная позйцая" предопределяет активное участие заголовка в тзксюобразозаниз и прежде нсаго в том плане, что он содержит в большинстве случаев указаг.'.е на тему и рему текста. В ' заголовке поэтому как бн копденготтатся текстовая информация, -развертывание которой с необходимой степенью эксплицатностл
определяет сам текст. Информируя определенным образом адресата о характере и содержании предваряемого(им текста, заголовок сп собствует формированию у него и соответствующей коммуникативно установки. Возможностью "предсказания" последующего содержания или основной идеи текста детерминируется коммуникативная роль заголовка - своего рода смыслового узла, который стягивает все стороны текста. Можно сказать об этом и иначе: заголовок кода]: ет содержание текста, вбирая его в себя в наиболее общем виде. В целом же правомерно утверждать, что заголовок есть неотъегш мыЗ компонент текста, отмеченный той спецификой, что он предвг ряет текст (или его сегмент) и конденсирует его содержание, Я1 ляясь одновременно графическим маркером его семантической самс стоятельности и структурной завершенности.
Учитывая двойственную природу заголовка - соотнесенность содержанием объективной действительности (через текст).и'со С1 им собственным денотатом (озаглавленным текстом) - можно выделить в характеристике заголовка два аспекта: I) коммуникативность заголовка как семантического репрезентанта текста и 2) коммуникативность заголовка хсак самостоятельного высказывав ния. Эти аспекты подчеркивают двойственный статус заголовка кг компонента текста и как виртуального предложения. Последнее, удовлетворяя требованиям грамматической, сет,антической и логической правильности, не удовлетворяет условиям целенаправли ности и ситуативной соотнесенности.
Однако, репрезентативная функция заголовка проявляется н<
с
только в его стремлении выразить ядро содержания информации, ! и в отражения авторской интенции, что влияет на оценку материальной манифестации заголовка: он информирует даже в случае, если заголовок лродставлен одиночным номинативом. В номинации заголовка, отражаются компоненты концоцтуалъпо-тег.атнческой
основы текста, а это означает, что он совмещает акт номинации (именование текста) и процесс предикации.
Таким образом, наиболее существенным моментом текстообра-зующих свойств заголовка следует считать его участив в формировании и отражении содержания текста, в способности интегрировать отдельные, концептуально-значимые элементы текста, создавая смысловое единство, а также придавать тексту цельнооформленность и выполнять роль того предела, к которому стремится логическое построение текста.
В сфере научно-технической информации заголовок является важной единицей коммуникации, выступая по существу в функции ■ информатора, при этом с ярко выраженной целевой информацией. К ней необходимо привлечь внимание адресата, чтобы заставить его прочесть материал статьи или соответствующего документа и вызвать определенное отношение к описанному объекту. Для этого заголовок должен, в первую очередь, с семантической точки зрения адекватно передавать содержание документа. Тем самым,авторская интенция направлена как раз на то, чтобы отразить в заголовке основные столовые аспекты содержания озаглавливаемого текста. Фактически адресат получает информацию в два приема:» сначала конденсирование с помощью заголовка, а далее развернуто с помощью самой статьи,прочесть которую заголовок его побувдает.
Выше было отмечено, что для,заголовка научно-технического документа характерна одновременная передача и узе известной, и новой информации с опорой на известную. В этом проявляется прагматика заголовка: он сам по себе должен играть роль сокращенного реферата, призванного конденсировать все содержание. Из этого и вытекает смысловая прагматическая сила заголовка - его самостоятельное воздействие на читателя. Все изложенное позволяет сформулировать определенные требования к заголовку: он дол-
жен соответствовать содержанию документа и сочетать в себе мак симальную информационную емкость, краткость, конкретность, чет кость. Эти требования предопределяют ряд функций заголовка, ре зультат взаимодействия которых соотносится с жанровой разнород ностью текстов научно-технических документов. При общей коммуникативной установке различные научно-технические документы (статья, рецензия, доклад, реферат к патенту) выполняют, как и вестно, разные коммуникативные задачи. Так, основной коммуника тивной задачей реферата к патенту, неотъемлемой частью которог является заголовок, служит сообщение новых сведений - научно-технической или технологической информации - потребителю. В не имплицирована также юридическая защита прав изобретателя на па тентное изобретение. Задача решается через взаимодействие двух основных функций заголовка реферата к патенту - номинативной и коммуникативной. Помимо этого, с точки зрения потребителя, заголовок научно-технического документа выполняет," кроме этих двух функций, еще и рекламную, адресную, поисковую. В системах массовой коммуникации заголовок научно-технического документа реализует все эти функции, при том, что всегда доминирует глобальная общекоммуникативная функция - предопределение установки читателя на восприятие основного содержания текста через ти пизируемую в ртражении заголовком ситуацию.
Проведенный лингвистический анализ показал, что заголовок ные конструкции носят в основном именной характер, по структур представляя собой номинативные (назывные) предложения. Основнс единицей номинации в них является существительное, образующее ряд синтаксических моделей в результате препозитивного и пост-позитиьного распространения именного ядра. В работе они именуются базовыми синтаксичоскиш моделям. Базовые модели - этс п-компонентные словосочетания, включающие только полнозначные
слова. Формальными разделителями базовых моделей служат, главном образом, предлоги, союзы, знаки пунктуации, а также отдельные словоформы.
Если исходить из того, что элементы языка обладают определенными сочетательными возможностями, то следует констатировать, что сочетательные особенности различны у элементов, входящих в рассматриваемые базовые синтаксические модели. Имеется в виду, что они различны, с одной стороны, у существительных, с другой стороны - у прилагательных, причастий, местоимений и числа тельных, что диктует образование или невозможность образования определенных группировок элементов.
Простейшей структурой анализируемых заголовков рефератов к патентам является s (существительное). Например: Bandförderer (81Д0.45.3014149)1; Dosierspender"(86,1,45,334412). Однако,частотность примеров, в которых заголовок реферата к патенту представлен одиночным существительным, невелика (10,3$). В подавляющем большинстве случаев ядерное существительное имеет левые и правые распространители и их комбинации.В зависимости от синтаксического типа распространителей и их позиции по отношению' к ядру, выделено 25 структурных вариантов ядерной модели з. Фрагмент таблицы выделенных базовых синтаксических моделей заголовков приведен на стр.12. Структурные варианты ядерной модели могут усложняться за счет однородных членов, вводимых обычно союзами und или oder. Таким способом может расширяться любой из
компонентов выделенных моделей. Например: Krabbelwagen und
\ „ Porderoygtem (88,3,51,354298); Verpaclcunsabehalter und
* В скобках дается источник примера: 1-я цифра.,указывает ' год издания, 2-я - номер журнала, 3-я - номер йыпуска, 4-я -номер патентуемого изобретения. Все примеры взяты из реферативного журнала "Изобретения стран мира".
Таблица I (фрагмент) Базовые синтаксические модели немецких заголовков рефератов к патентам
in Структурные . формулы Примеры Употребительность выделенных моделей в исследуемом массиве заголовков
к-во %
однокомпонентные модели
I. S Bandförderer (81,10,45,3014149) 1436 10,3
деухкомпонентные модели
2. SI+S2 Deckel einer Haushaltgrosspackung (88,5,49,3600465) 444 3,2
3. A+S Silo für feinteilige Schüttgüter (88,3,49,3538782) 3956 28,4
трехкомпонентные модели
4. SI+S2+S3 Vorrichtung zum Auftrennen einer Umreifung eines Rohstoffballens (88,2,49,36317071) 284 2
5. si+a+s2 Reihenanordnung elektronischer Bausteine (88,5,49,3644367) 828 6
6. A+Sj+Sg Vorrichtung zum absatzv/eisen Abziehen einer Packiaittelbahn (86,23,46,235379) 752 5,4
7. A-j.+A2+S Ineinandersteckbarsr, transportabler Container mit Vollring-verschluss (83,11,46,3044302) 450 3,2
четырехкомпонентные модели
8. Sj+Sg+S^S^
Э.Sj+Sg+A+S^
[O.Sj+A+Sg+S^ II-sx+AI+A2+S2
[2.Aj+Sj+A0+S2
Vorrichtung zur Beeinflussung der Laufrichtung des Förder--raittels eines Bandförderers (85,9,47,33I3I09)_ 216 1,6
Anordnung zur Veränderung der Zugkraft einea laufenden Fadens (86,5,47,3403144) 490 3,5
Vorrichtung zun Verlockern der
mren Bogen eines Bogenatapels
,2,45,?9068731_ - 212 1,5
Vorrichtung zur Führung stehender zylindrischer Behälter (86,6,46,225964) 820 5,9
Verfahren und Vorrichtung zum automatischen Einlegen kastenförmiger Säcke (84,3.46,3203071) 358 4
Herstellungsverfahren (86,7,46,3407688).
Анализ массива заголовков показывает, что заголовки рефератов к патентам чаще всего представляют собой комбинации нескольких моделей. Например: (S zum S) - Vorrichtung zum Palettieren (87,15,50,3517049); (S als S) - Papptrommsl ala Haushaltgroaa-packung (88,5,49,3600521).
Сведение всего многообразия синтаксических структур немецких заголовков рефератов к патентам к 25 базовым моделям,представляющее их в обозримом виде, отвечает требованиям формализации лингвистических явлений для их последующей алгоритмической обработки.
Что касается семантической структуры исследуемых заголовочных конструкций, то она коррелируется с их структурными особенностями. При изучении семантической'структуры заголовков рефератов к' патентам мы опираемся на классификацию И.Е.Фроловой,выделяющую три типа номинативных предложений: констативы, директивы и экспрессивы1. Содержанием констагивов, которые в свою очередь делятся на информативы и интродуктивы, является сообщение информации. Анализ нашего материала показал, что исследуемые заголовки моянб отнести к типу констативов, так как они содержат информацию о каком-либо предаете или процессе, что монет быть эксплицировано следующим образом: "Данный патент содержит информацию (сообщает) О____Например: Verfahren und Vorrichtung zur Drabtbefestisung an Spulen (85,16,47,217490) - In der Erfindung handelt es sich um ein Verfahren und eine Vorrichtung zur Drahtbefe3tigung an Spulen.
В падежной грамматике указанное семантическое отношение
* Фролова И.Е. Прагматические и семантические особенности номинативного предлокения з современном английском языке: Авто-реф. дис. ... канд. филол. наук. - Киев, 1988. - 17 с.
обычно обозначается термином "объект" (действия, состояния, отношения). Далее для, обозначения семантической функции ядерного существительного структурной модели заголовка мы будем использс вать термин "объект описания". Под ним понимается наименование устройства или метода, который заявлен как патент и описываете; в реферате к патенту. Все препозитивные и постпозитивные распространители ядерного существительного базовой модели заголов' ка'рассматриваются как различные типы предикатов, иначе говоря они представляют собой различные характеристики объекта описания.
Из изложенного следует, что в целом семантическая структу исследуемых заголовков включает .два основных компонента: объек описания (способ, метод, устройство, процесс) и цредикат(ы),ко торне внутренне дифференцируются. Они именуют: область пршлене ния устройства/метода, назначение (функцию) устройства/метода, качество (свойство) устройства/метода, особенность конструкцш устройства, особенность функционирования устройства/метода, ci соб изготовления устройства, характеристику объекта описания точки зрения используемого материала. Каждый предикат кокет б! вырахен различными структурно-синтаксическими средствами.
В целях установления роли заголовка в кошуникатмвно-сод жательной структуре текста реферата анализу подвергаются хара: тер и способы повторов лексики заголовков в рефератах к патен та?«. В ходе анализа зарегистрированы следующие, типы повторных .номинаций: I) полный лексический повтор; 2) повторение морфол гических форм слов; 3) повторение номинации путем использован однокоренных слов; 4) повторение номинации путем перифраза и контекстуальных синонимов; 5) повторение номинации путем сооз дошения "часть-целое" и "целое-часть"; 6) местоименные замен! 7) вводящий повтор (полный повтор заголовка в первом предлож
нии текста реферата к патенту). По существу данный этап анализа направлен на изучение кореференции.
Рассмотрение кореферентных связей лексики заголовка, представляющей основные компоненты его семантической структуры (объект описания и предикаты), и текста реферата, показал, что в реферате повторяются оба компонента заголовка. Однако, различные типы повторных номинаций объекта описания встречаются гораздо чаще (73$), чем заголовочных предикатов (27%), что может быть проиллюстрировано на конкретном примере (см. рис.1). Учет количественных данных повторных номинаций и анализ участия повторяемых элементов в развертывании содержания текста реферата к патенту позволяют сделать один существенный вывод: объект описания повторяется на протяжении всего текста реферата к патенту, являясь его темой. Благодаря участию разных видов повтора этого компонента семантической структуры заголовка создается так называемое тематическое поле реферата к патенту. Используя иную терминологию, правомерно утверждать, что заголовок и тематическое поле создают так называемую топикальную ражу текста реферата к патенту. В противоположность этому предикаты, которые выносятся в заголовок, выражают, по замыслу создателя текста, наиболее, ванные для реципиента характеристики объекта описания, вводя новую информацию о нем и тем самым образуя рематическую часть текста реферата к патенту.
Соединенно номинативной и коммуникативной функций в заголовке реферата к патенту обусловило наложение его логико-семан-
\
тической и коммуникативной структур. В большинстве анализируемых заголовков объект описания - название патентуемого устройства, процесса или метода - ямяется темой озаглавливаемого реферата к патенту. А предикаты входят в рематическую часть реферата, которая охватывает практически весь текст, содержа-
заголовок
Drehschieber
(объект
описания
"устройство")
1-е предложение реферата
2-е предложение 3-е предложение 4-епредложение реферата реферата реферата
Drehachieber
Schnellschlusa-drehschieber
Materialführungen ( б J-( б )
(предикат ч—^ -^область применения")
Auslaufoffnungen
Ф- /
Materialzufuhrungen
Schuttguter
(предикат "область применения")
(sT
dergl.
-—s
Erfindimg
Material-fluases
(staubförmige oder k'ornige) Schüttgüter
Drehschieber
Drehachieber
Рис.1. Кореферентные связи компонентов семантической структуры заголовка "Drehsohieber
(n Mii(-0i.in1f"hi.imiT0T1 ¥ 4- 4-e-r.ll И ЧЧатгПТЯ ПжГЮПЯТЯ tt TTflTfiHTV
щий описание сути изобретения»
В диссертации проводится мысль о том, что связь заголовка с текстом реферата носит формальный и логический характер.На формальный характер связи указывает лексико-грамматическое сходство. Повторяемость заглавных слов распространяется на весь текст реферата к патенту, приобретая функцию текстовой скрепы и выстраивая формальную (внепшюю) когезию. Логическая когезия обусловлена тем, что заголовок реферата к патенту заявляет о новом изобретении, вводит информацию о нем, тогда как текст реферата ее детализирует. Повествование развертывается от общей информации к более детальной.
Итак, заголовок реферата к патенту, являясь коммуникативной единицей, посредством которой осуществляется обмен информацией и которая содержит относительно законченное сообщение об изобретенном методе или устройстве, оказывается одновременно объектом теории коммуникации и объектом семантического синтаксиса. В свете этого план содержания заголовка предстает как состоящий из пропозиции и так называемой прагматической рамки, причем первая заключает в себе пропозициональные установки, а вторая охватывает реализационные установки на коммуникацию и прагматику.
Заголовок реферата к патенту рассматривается наш в конкретном акте когялуникации, в ходе которого он и обретает актуальность, проступающую в факторе актуального членения. Мы придерживаемся точки зрения тех лингвистов, которые считают тема-рсматическое членение одним из важных компонентов смысловой структуры предложения,'а в данном случае - заголовка со статусом предложения. Именно это членение отражает не только коммуникативную природу предложения, но и познавательную устаношу мыслящего и говорящего субъекта. Соответственно этому принципу и были определены основное компоненты актуального членения за-
головка: исходная информация, т.е. то, что является известным или мояег бить легко понято, и новое, го,что сообщается автором. Исходная информация совпадает с темой озаглавливаемого текста, новое передается предикативными компонентами, образующими в совокупности рематическую часть реферата к патенту. Заголовок и передает новую информацию с опорой на известную.
По результатам анализа семантико-синтаксической структуры заголовков рефератов к патентам и связи ее компонентов с текстов реферата были выявлены следуйте коммуникативные типы заголовков: I) тема-рематический, 2) регла-тематпческий, 3) рема-темз-рематический. 4) тематический. Статистический анализ употребительности различных когшунякативных типов заголовков показал, что наиболее употребительным коммуникативным типом являются тема-рематические заголовки (45,Б%) (см. табл.2).
Таблица 2
Употребительность коммуникативных типов заголовков рефератов к патентам по складскому хозяйству
йй пп Коммуникативный тип заголовка К-во заголовков,построенных по данному типу К-во заголовков в % к общему числу заголовков в исследуемом массиве
г 0-. Теш-'оеглзтйчеснзе заголовки 2788 49, В
2. Рема-тема тическ.:-\о - заголовки 1816 32,4
3. Река-тема-рэматическне заголовки 176 сч со
4. Тематические заголовки . 820 1-г, 6
йтого: 5600 100
О учетом'названных коммуникативных типов заголовков и способов их структурно-синтаксического вцрзжония разработан алгоритм тема-рематвческоро членения заголовка, позволяющий выделить тематический (объект описания) и рематический (предикаты) композиты заголовка; а следовательно, и всего текста реферата.
Этот алгоритм коже? быть использован з эдформашонно-ооисковЕГ системах научно-технических документов, а такзе в систешх автоматического п чимання научно-технического текста. Последнее обусловливается свойством заголовка слугигь семантическим центром реферата к патенту, т.е. указывать на его основные содетт»-тельные аспекты, благодаря чему и обеспечивается возможность оперативного получения сигнальной информации о патентуемых изобретениях. Таким образом, с помощью заголовков в система МП ш-гвт быть реализована важнейшая составная часть всёй поисковой программы, направленной на узназание содержательной сути патентной информации в научно-технической офере.
Результаты исследования немецких заголовков рефератов к ^агентам по складскому хозяйству з плане выявления их секантико-синтакоической структуры, сзязи с текстом реферата к патенту, определения коммуникативных типов заголовков ваяны для.создания системы 1Ш немецких заголовков рефератов к патентам. Для разработанной системы Ж опорой служит лингвистическая ши :рмацаон-ная база, ядерный блек которой образует автоматический словарь (АС) словоформ. Выбор способа представления лексических единиц лингвистической информационной базы в виде АС словоформ обуслот*-лен прежде всего экспериментальным характером разработанной системы немецко-русского МП заголовков, в которой объем памяти для размещения словаря'не игг. чэт решающей рели , а на первое место выдвигается быстродействие системы.
Словарная статья входного (немецкого) и выходного (русского) словников в разработанной системе МП содержит информацию, сгруппированную в четыре зоны: I) зона машинных частей речи; 2) морфологическая зона; 3) леясяко-семантичэская зона; 4) зона переводных соответствий. Организация словарной статьи допускает пополнение информации как в пределах отдельных' зон, так и путем
добавления новых зон.
Принцип разграничения базовых синтаксических моделей немецких заголовков на осново формальных разделителей, а также наличие необходимой информации в АС обеспечивают выделение базовых моделей алгоритмическим путем, что и определяет их использование в разработанной системе МЛ в качестве основных единиц машинного анализа.
Сравнительный анализ немецких заголовков в их русских переводов выявляет отсутствие однозначного соответствия выходных структур дня большинства базовых моделей. При этом наибольшей неоднозначностью характеризуется двухкошонентные базовые модели (см. табл.3).
В целях разрешения структурной многозначности при переводе с немецкого языка на русский выявляются списки диагностирующих признаков, которыми служат конкретные л-тавофорш в определенных позициях базовых синтаксических моделей немецких заголовков.
На осноье-разработанного немецко-русского АС словоформ, типологии базовых синтаксических моделей немецких заголовков, их русских соответствий и списков диагностирующих признаков разработан общий и детальный алгоритмы немецко-русского Ш1 заголовков рефератов к патентам по складскому хозяйству. Ллгории состоит из трех основных модулей: I) выделение очередной базов( синтаксической модели немецкого заголовка; 2) определение стру; туры выходной фразы на основе диагностирующих признаков; 3) выбор русских словоформ из АС с учетом специфики базовых моделей и меямодельных связей.
Програмьз немецко-русского перевода заголовков рефератов к патентам реализована на персональной ЭШ и мояет быть исполъ зована дня оперативного получения сигнальной информации о зару бетах изобретениях по складскому хозяйству. На стр.22 прпведе
Таблица 3
Структурные соответствия немецки;:, двухкомпоноатных базовых моделей в русском языке
ей VI ßeMauwe öaaoBKe ciiHTaxcinoGime worein? ?. ux i/pauepa Структурные №17u русских переводов и их примера
I. sI+s2 Abstütziins eines Verbindun^s- I . S £+32 (.род.и) Опора 0DQJX3 Н.ИТВЛЬНОГО
förderera1 (87,14,50,241058) транспоотерд О J+Srr-; (твгол.) Способ и устройстве*для . управления системой при-
• Verfehren -and Vorrichtung zum Steuern eines Antriebgsyoterng
in einer Verpackui^gs'nasctiiiia (87,15»49,361544-2 ) Tuben- und Flaactiemrerschluss- вода в упаковочной малине" 3. ßp+ (und) + S_ (родл,) Головка дли закупорива-
kooi mit integrierter Seitab-TSUf.uisabe (86,4,47,3403362) ния бутылок и тюбиков с встроенным индикатором времени
2. 1 A+3 Automa tische Yerpaokvn.'r.svovrioh- I. A+S Автоматическое упаковоч-
tung 85,15,47,3426334) Verrichtung «um reihenvveisen Übarfv.iiren von Haschen ное устройство 2. S+A Устройство для транспортировки расположен-
üaucrbacSrwaren (.86,3,47,2.2S229) Diobstahlaichere Packung ных рядами плоских дол-гохранящихся кондитерских изделий 3. s + (,) + А Упаковка, препятствую-
(86,1s 47,3345775} Belndevorrioht'.ing für kaatsnför-mio;? Groasoehälter (85,15,47. 3325454) щая открь: занию посторонними лицами 4. S + Adr Устройство загрузки для большегрузных контейнеров коробчатой «юргла
J- Б приводимых в таблице примерах подчеркнуты не&ецкяе базовые модели w ех русские переводы для каждого из внделенянх типов моделей.
ABSTREICHVORRICHTUNG FÜHR FOERDSRBAEN'DER
ABSTREICHVORRICHTUNG
РАЗРАВНИВАЮЩЕЕ УСТРОЙСТВО
FUER
ДЛЯ
F0ERDER8AENDER ЛЕНТОЧНЫХ КОНВЕЙЕРОВ
РЛЗРАВНИВАЖСЕЕ УСТРОЙСТВО ДЛЯ ЛЕНТОЧНЫХ КОНВЕЙЕРОВ
жжжжжжжжжгжжжжжж* ж ж* ж*»»****.* жжж#*ж*.*жжж*****ж»*жжж*ж»з-
FALETTENBEh'AELTEK AUS KUNSTSTOFF
PALETTENSEHAELTEß
ЕМКОСТЬ С ПОДДОНОМ
AUS
ИЗ
KUNSTSTOFF
СИНТЕТИЧЕСКОГО МАТЕРИАПА
ЕМКОСТЬ С"ПОДДОНОК ИЗ СИНТЕТИЧЕСКОГО МАТЕРИАЛА
DRUCKSCHLEUSE KIT KRAFTKAAGE
DRUCKSCHLEUSE
ШЛИЗОВАЯ КАМЕРА
KIT
с
KRAFTWAAGE СИЛОВЫМИ ВЕСАМИ
ШЛЮЗОВАЯ КАМ£РА С СИЛОВЫМИ ВЕСАМИ
4.ЖЖЖЖЖЖЖЖЖЖЖЖЖЖЖЖХЖЖ?: жж*».**ж:г*жжжж*ж.с***ж**жж3-*ж*жж**ж*
MASCHINE ZUR HERSTELLUNG VON VERPACKUNGSBEHAELTER
MASCHINE
КАШИНА
EUR
ДЛЯ
HERSTELLUNG
ИЗГОТОВЛЕНИЯ
VON
VERPACKUNGSBEHAELTER УПАКОВОЧНОЙ ТАРЫ
МАШИНА ДЛЯ ИЗГОТОВЛЕНИЙ УПАКОВОЧНОЙ ТАРЫ
Рис.2. Фрагмент результатов хаяшкного перевода немецких заголовков рефератов к патентам на русский язык
фрагмент результатов работы программы.
Результаты, полученные в диссертация,.могут способствовать раз в;:?:! и дальнейших лсследазанг-?, связанных с изучение« сешн-тикс-ск.чтаксическсй с коммуникативной структур текста н заголовка как его ванного компонента. Предложенная в работе изтодя-1са анализа соотнесения ззгачовка и текста реферата к патенту на основе -ореферентнкх связей шкет найти признание при изучении взаимосвязи заголовков и текстов другах жанров (научно-технических статей, описаний, монографий), что в своо очередь коае? быть использовано для создания алгоритмов анализа содержательной г коммуникативной структур научно-технического текста.
Основные положения диссертации отрагенк в слгтувдих публикациях:
1. Автоматизированный банк данных электронного устройства-переводчика /'/' Функционирование и развитие языковых систем. Тезисы докладов научной конференции молодых ученых, аспирантов и соискателей по итогам научно-исследовательской работы за 1975-1980гг.-Шшс!., 1981.-С.159-160. 3 соавторстве с Т.В.РкааковоЙ.
2. Пословный и пооборсчый анализ входных фраз в системе электронного мккрокоштьютера-переводгика // Переработка текста -
мето .ами инженерной лингвистики. Тезисы докладов. - Минск,
«
1982. - С.117-1X9.-Ь соавторстве с Н.А.Дюрич, Т.В.Рыжаковс!.-.
3. Структурная типология заголовков-английских патентов как основа алгоритма машинного перевода // Системные характеристики устной и письменной речи. Сб. статей. - Минск, 1985. -С.128-134. В соавторстве с А.К.Бобковым, И.М.Мировым, Т.П.Кар-пилович, Л.В.Шимчук.
4. Обучение пер-ззоду заголовков научно-техничэских тек-
отов с помощью ЭЩ // Проблема компьютеризации процесса преподавания иностранных языков в педагогических институтах. Тезисы докладов межвузовской научной конференции. - Ульяновск, 1985. -С-56. В соавторстве с Т.П.Карпилович, И.М.!.1ировым.
5. О результатах опытной эк плуатации системы машинного йеревода заголовков патентов // Проблемы автоматического и Экспериментально-Фонетического анализа текстов. Об. статей. — Минск, 1685, - С. 157-152. В соавторстве с Т.П.Карпилович, Е.В.Гранозой, И.К.Мировым.
. 6. Моделирование переводческой деятельности в системе ^аз-шинного перевода заголовков патентов // Всесоюзная школа-семинар "Бионика интеллекта". Программа и аннотации докладов. -Харьков, 1987. - С.20. В соавторства с Т.П.Карпилович, Е.В.Гра-новой.
7. Компьютерное обучение грамматике немецкого языка // Лексикографические методы в обучеыаи и научных.исследованиях. Те-бисы докладов областной конференция преподавателей кафедр иностранных языков. - Иваново, 1988. - С.69-70.
8.0 двух системах машинного перевода заголовков патентов // МендународниЗ семинар по казинному переводу. Тезисы докладов. Тбилиси, 1989. -М.: ВЦП. - С.128-130. В соавторстве с Т.П.Карпилович. •
9. Немецко-русский перевод:заголовков патентов на бгге ПЗВ.1 //Актуальные прсблетз компьютерной лингвистики. Тезисы докладов Всесоюзной конференции. - Тарту, 1990. - С.48. В соавторстве с Т.П.Карпилович,
10. Ечформативво-ко1,:муннкатив0ая значимость научных заголовков // Использование ЭН.1 в научной и учебной работе гуманитарных вузов. Тозкоы докладов. -Минск, 1990. - С, 106-1^7.