автореферат диссертации по филологии, специальность ВАК РФ 10.02.19
диссертация на тему: Структура многокомпонентных терминов и создание автоматических словарей
Полный текст автореферата диссертации по теме "Структура многокомпонентных терминов и создание автоматических словарей"
Ш 1« о, 3' &
МОСКОВСКИЙ ОРДЕНА ЛЕНИНА, ОРДЕНА ОКТЯБРЬСКОЙ РЕЗОЛЮЦИИ И ОРДЕНА ТРУДОВОГО КРАСНОГО ЗНАМЕНИ ГОСУДАРСТВЕНЖЙ УНИВЕРСИТЕТ ИМЕНИ М.В .ЛОМОНОСОВА
Филологический факультет
На правах рукописи
МИХАЙЛОВА Валентина Ивановна
СТРУКТУРА ГШОГОКОГШОНЕНГНЫХ ТЕРМИНОВ И СОЗНАНИЕ АВТОМАТИЧЕСКИХ СЛОЗАРЕЯ ( теоретические основы разработки алгоритмов перевода )
10.02.19 - Теория язцкознания
Автореферат диссертации на соискание ученой степени доктора филологических наук
Москва - 1992
Работа выполнена на кафедре общего и сравнительно-
исторического языкознания Московского государственного университета имени М.В.Ломоносова
Официальные оппоненты: доктор филологических наук, профессор П.Н.Денисов доктор технических наук, профессор Р.Г.Котов доктор филологических наук Э.й.Королев
на заседании специализированного о .......
Московском государственном университете им.М.В.Локоносова
Адрес: 119899, Москва ГСП, £-234, Ленинские горн, 1 корпус гуманитарных факультетов, филологический факультет,
С диссертацией можно ознакомиться в Научной бабли
Ведущая организация-Московский государственный лингвистический университет.
Защита диссертации состоится
Ученый секретарь специализированного совета доцент
А.А.Поликарпов
, , ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
"Реферируемая диссертация посиящена исследованию структурных сарактеристик многокомпонентных терминов (ОТ) с целью разработки эснов алгоритмизации их перевода как нового перспективного направ-юния при построении системы автоматических переводных терминологических словарей (АС).
Актуальность темы-работы. Способность применять ЭВМ становится необходимым условием оперативного выполнения бесчисленного множества переводческих функций. "Информационные процессы научно-тех-яяческой революции не могли не отразиться на стиле лингвистического мышления, в котором происходит поворот к изучению коммуникативных процессов порождения и восприятия рочи, функционирования текста, информационного воздействия" (Р.Г.Когов, Н.К. Рябцева, В.Н. ',1арчук). Возрастает интерес исследователей к термину - носителю культуры, что обусловлено широким распространением автоматизированных информационных систем (АИС). Терминология является центральной частью АИС-и входит в состав АС, представляющих ванные модули всех систем автоматической переработки текста. В настоящее чремя распространена практика статичного ввода в АС как однослоышх терминов, так и многословных терминологических наименований, в которых одни и то хз слова многократно повторяются, что ведет к нерациональному хранению и обработке информации. Актуальной представляется проблема построения алгоритма перевода ¡Я, решение которой позволит не только экономить память ЭВМ, отказываясь от статичного ввода в АС ОТ в виде конфигураций, но и расширить поле использования АС при обработке такой открытой области, как терминология: при помощи конечного числа введенных в АС однословных наименований автоматически переводить бесконечное число многословных, в том числе появляющихся новых !,ТГ одноразового употребления.
Здесь следует рассмотреть вопросы "разрешмостй". Различия между "разрешимыми" и "неразрешимыми" проблемами иллюстрируются в специфических рамках теории формального описания языка. Если проблема алгоритмизации перевода 1ЛГ является неразрешимой для всего набора ¡Я различных терминологических подъязыков, то она шкет оказаться разрешимой, если этот набор несколько уменьшать или ограничиться анализом ¡Л1 какой-то определенной специальности Очевидно, что если проблема алгоритмизации может быть разрешима для некоторого класса !»!Г, то она является таковой для любого подмножества этого яе класса. Актуальным в этом -плане представляется создание методики для предмашянной обработки лингвистического обеспечения АС, которая бы позволила выявить такие типы КГ, перо-вод которых молено алгоритмизировать, и найти.причины, срепятствуз щие алгоритмизации перевода всего набора МГ, с-тем, чтобы наметить пути их дальнейшего изучения.
Достоверные выводы о возможных путях автоматической обработки ЫГ не мог^т быть сделаны без исследования сложнейших теоретических проблем языкознания в новом ракурсе под новым углом зрения и использования накопленных в течение столетий результатов работ по теории языкознания. Так, например, учет данных о реконструкции языка далекого прошлого монет оказать помощь при прогнозировании путей развития языка блинайшего будущего. Прогнозирование, в частности, определение перспективности тех или иных способов структурирования терминов, имеет особую важность к^к для выявления закономерных тенденций языкового развития, так и для ориентации на наиболее продуктивные способы образования терминов при подготовке лингвистического обеспечения АС и создании АИС. Актуальным ь этой связи оказывается вопрос о языковедческом обосновании направления работ по унификации и стандартизации МГ
азличннх терминологлче ских .систем при подготовке банков данных, то требует изучения функционирования МГ.
Не получило должного освещения применение существующих линг-истпческкх методик для исследования структурных особенностей тер-инологических подъязыков с целью выявления возможностей алгорит-изации их автоматического пергзода, например такой известной етодики,как анализ "соотношения членимости и производности языко-
ых единиц" (В.С.Кубрлг.оиа). Если в настоящее врем "не удается
%
стойчиво смоделировать на машине переосмысление слов и словосо-
п
етаний (Р.Г.Пиотровский), а также автоматически анализировать вмантические преобразования в ',ГГ при их сокращении и смысловых свитах, то необходимым становится решение проблем стяжения МГ на гнове метонимии, инвентаризации моделей метонимического переноса, ограничения метонимия от смежных явления. При этом актуальным зляется анализ семантических преобразований в МГ на основе уже элучившего признание рассмотрения значения как объекта, который эжно подвергать членению (и . *е1пге1оь , с.Д.Кацнельсон, Ь.Д. хресян, М.В.Никитин). Особую важность имеет исследование экспли-1ШИ имплицитного смысла Ш с точки зрения теории ко^-уникации речевых актов, а также изучение "различных оттенков представ-шия научно-технических понятий разноязычными параллелями" (Л.П. рупин).
Требуется языковедческое обоснование для определения единицы ¡тематического перевода ИГ при построении системы АС. Кроме того, окна методика формализации МГ при создании лингвистического обведения АС. Известно, что даже в языках программирования пока еще I существует средств формализации общего случая самого процесса ¡ревода„ однако имеются л широко используются при реализации 1Ыков программирования средства формализации синтаксического раз-фа. Следует отметить, что . потребность в эффективных языковых
средствах сферы специальных человеко-машинных коммуникаций обусловила поиск разных путей решения языковых проблем. С одной стороны, строится множество искусственных языков и разрабатывав ются способы их трансляции. С другой стороны, углубляется аналг естественных языков и рассматриваются способы их перевода <Р,1 Котов). Представляется актуальным пересечь эти параллельно проводимые исследования, а именно: сделать попытку применить методику формального описания Бэкуса-Наура, которая используется при трансляции искусственного языка на искусственный, к дерево с естественного языка на естественный.
Целью диссертации является разработка основ построения алгоритмов анализа и перевода МГ посредством исследования их стру турных характеристик для лингвистического обеспечения системы А
Сформулированная цель достигается при решении следующих задач: -
1. Выявить на основе прогнозирования.продуктивности различ ных способов образования терминов, является ли путь структурирования многокомпонентных цепочек терминов перспективным способом их образования.
2. Определить возможности алгоритмизации перевода МГ иссле^ дуемых терминологических подъязыков при анализе их структурных характеристик на различных языковых уровнях.
3. Разработать лингвистическую методику, которая оы пoзвoлJ ла выявить такие тины МГ, перевод которых можно алгоритмизирова1 а также найти причины, препятствующие алгоритмизации перевода других типов МГ, и наметить пути их дальнейших исследовании.
4. Выявить методику формального определения Ш для реализации их компьютерного перевода.
5. Построить алгоритмы анализа я перевода МГ.
6. Определить единицу автоматического перевода и обоснован принципы создания системы АС.для перевода МГ.
7. Определить эффективность использозания системы АО в дидактике и информатической деятельности.
Материал исследования. Отбор материала ограничен состоящими 'рех и более компонентов. Из объекта анализа искльчаьтся :..Т, содержащий предлоги, в связи с тем, что нас интересу*/? теоретические и практические проблемы исследования УГ. с точки зрения автоматизации их анализа и перевода. Что касаотея предложных ?.ГГ. то при машинной обработке часто первым этапом являются вычеркивание предлогов и анализ оставшихся беспредложных цепочек слов, который вызывает особые трудности.
Отбор материала подразделяется нг. дзе стадии: I) отбор для анализа; 2) отбор ;ТГ для влода в АС в виде конфигурации и отграничения их от Ш, перевод которых молот быть алгоритмизирован. .Датериалом исследования на первом этапе явилась выборка текстового массива на английском и русском языках объемом 12000000 словоупотреблений, включающего научные журнальные статьи, монографии, рекламную, патентную литературу и т.н. по 12 специальностям (машиностроение, сварка, металлургия, электроэнергетика, электротехника, вычислительная техника, горное дело, химия, ге- ■ нетика, радиоэлектроника, автоматизация, архитектура и строительство). ;,Материалом анализа на второй стадии выступают выделенные в результате сплошной выборки 18317 !.ТГ, встретившихся в тексте три и более раз и сопоставленных с УГ, содержащимися в словарях, ГОСТах и АИС.■
Обиий аппарат измерений. В связи с тем, что подготовка современных АС требует проведения вычислений я экспериментов высокой точности, отбор 1»ГГ проводится .на материале, обеспечивающем надежные результаты. Для достижения научно;! достоверности выводов оценивается воспроизводимость МГ в тексте и проводится проверка статистических данных, исходя пз того, что некоторое разумное
равновесие, "некоторые пределы несомненно существуют для численного роста языковых инвентаре!!" (Ю.А.Тулдава).
При отборе текстового массива используется понятие термино-логичности, которое рассматривается как функция от встречаемости в тексте терминов.
Методика. При исследовании структурных характеристик йТ и создании системы АС, включающих алгоритмы перевода МГ, перед нами стояли четыре главных препятствия. Во-первых, необходима была лингвистическая методика для сведения анализируемого набора 1.ГГ, крайне разнообразных по структуре и значению, в однородные группировки; во-вторых, требовалась методика отбора ОТ, перевод которых можно алгоритмизировать; в-третьих, нельзя было обойтись без выявления методики формального описания МГ; в-четвертых, была нужна методика оценки экономического эффекта от внедрения результатов диссертационного исследования в языковой дидактике и практике создания АИС.
На преодоление первых двух препятствий нас натолкнуло оригинальное разграничение лингвистических парадигм К.Н.Караулова. Он отмечает, что вместе с накоплением новых знаний о языке и появлением различных парадигм ( исторической, психологической, системно-структурной и социальной ) происходит гилостазпрование одного из свойств языка - на разных этапах развития лингвистики меняется девиз, написанный на ее знамени: "Язык нзсквозь историчен, психологичен, социален". В данной работе предпринимается попытка, не гипостазируя те или иные методы анализа, разработанные в пределах каждой из лингвистических парадигм, параллельно использовать методику каждой из них для всестороннего исследования МГ. При этом привлечение, например, диахронкых данных для периодизации развития терминологии позволяет определить, является
ли путь структурирования многокомпонентных цепочек продуктивным в настоящее время и перспективным способом'образования терминов. Системно-структурный подход к сопоставительному анализу Г.ГГ дает возможность скрупулезно изучить их разноуровневые структур-то характеристики л тем самым подготовить предпосылки для поиска основы систематизации АС. Плодотворным оказалось исследование соотношения членимости и словообразовательной производности компонентов !,7Г при построении алгоритмов их автоматического перевода в отдельных подъязыках. Что касается психологического подхода, то с его помощью легко проследить включение эмоциональных /
составляющих коммуникативного процесса в собственно информационные составляющие, например при анализе функционирования МГ в рекламном тексте, и выяснить причины, препятствующие алгоритмизации их перевода при эксплицировании имплицитного смысла 'П1. Социальный подход иллюстрирует появление в семантической структуре МГ преобразований, 'вызванных прагматикой речевой деятельности, что проливает дополнительный свет на выбор пути дальнейших исследований МГ, связанного с их систематизацией на основе "иллокутивных индикаторов, пли максим" (П.Гране). При изуч«л.:и технология сенного распределения а структуре _МТ проведено пространственное моделирование функциональной перспективы сем, основанное не на линейном, а на их сферическом представлении, и тем самш создана лингвистическая методика, для классификации МГ, именуемая автором стервосеыантической. Применялся метод контекстуального анализа; " выявление контекстуальной обусловленности значимых для перевода признаков и единиц необходимо для построения соответствующих алгоритмов " (С.Н.Марчук). Использовался также аппарат грамматики зав;.сиг.остей. Аппарат грамматики непосредственно оэета'влякилх привлекался в основном для сравнения.
Предполагается, что при переходе от грамматики зависимостей к грамматике непосредственно составляющих для МГ действуют те же правила, что и для любой .синтаксической структуры (Е.З.Падучева).
Так были преодолены первые трудности и достигнуты неплохие результаты в создании надежной "усилительной" методики»
Наибольшую сложность представляло преодоление третьего препятствия. Формальное описание Г.1Г не могло быть осуществлено без логико-лингвистического метода. Анализ МГ. основывается на типологии суждений формальной логики, применена в известной мере символическая и математическая логика в силу специфики.материала» Дело в том, что формализация МГ базируется на символической логике, а сам принцип алгоритмизации анализа и перевода имеет.в ■ своей основе математическую логику. Предпринятое далее автором . изучение методик формального описания искусственных языков, используемых при анализе и переводе с искусственного языка на ис- . кусственный, обнаружило'широко применяемые в области программирования формулы Бэкуса-Наура, структура которых почти однозначно отражает структуру 1<ГГ.
Что касается расчета экономического эффекта от внедрения результатов диссертационного исследования, то он определялся на основе методики ассоциативного эксперимента, предлоазнной К.Г. Юнгом.
Процедура исследования МГ приведена схематично в таблице.
' Новизна исследования заключается в следующем:
- доказано на основе прогнозирования продуктивности различных способов образования терминов, что процесс порождения МГ есть один из наиболее перспективных путей создания терминов;
- выявлены универсальные диахронические закономерности в периодизации развития терминологии;
- разработана новая лингвистическая методика, предусматриваю-
и
N
«
о Я) <а р.
со М
К . О
г)
к ■ Э о
3
И п
£
Формальное представление единиц перевода
¡а 1
ЕЧ
Я
а.
о е<
I »
к
т ■
о «
о
А
X
я я
Я £ ■1
I
о ш
о Э
т ¡я о и ч ®
О V
Выделение единиц автоматического перевода
Деятельноетннй' подход
щая раскрытие системно-структурной организации МГ и особенностей терминологических подъязыков;
- получена новая классификация МГ, позволяющая не только отграничить .'.¡Г, перевод которых может быть алгоритмизирован, от LIT, подлежащих вводу в АС в виде конфигураций, но и выявить причины невозможности алгоритмизации перевода некоторых типов МГ и наметить пути их дальнейшего изучения;
- осуществлен перенос методики, используемой применительно к языкам программирования, на естественные языки; впервые были использованы формулы Бэкуса-Наура для формального описания МГ;
- определена единица автоматического перевода;
- предлагается система АС, построенная по единому основанию;
- созданы алгоритмы автоматического перевода некоторых типов
МГ;
- разработаны приемы использования АС и определена их эффективность при реализации предлагаемой динамической модели механизма мотивированного обучения м'Г.
Положения, внноопмне на заститу
I. Развитие терминологии может быть представлено как взаимодействие параллельно происходящих доятелыюстных процессов, активность каждого из которых меняется в различные периоды. Выдвижение той или иной ведущей деятельности в определенный этап формирования терминологических подъязыков может быть положено в основу построения периодизации развития терминологии. Прогнозирование продуктивности различных способов образования терминов на основе обнаруженных диахронических закономерностей универсального характера свидетельствует о перспективности построения МГ 'как продуктивного опособа порождения терминов.'
. П. Разработанная лингвистическая методика выявления в концептуальной структуре Ml места, значимости и направления даиже-
ния сем путем их пространственного представления в смысловом объеме МГ 'дает возможность заглянуть во внутренний'мир семантических преобразований и изучить технологию сенного распределения в речевой деятельности. Подобное стереосемантическое моделирование функциональной перспективы сем позволяет: а) определить Iff, перевод которых подлежит алгоритмизации, и отобрать МГ для ввода в АС в виде конфигураций; б) выявить причины невозможности алгоритмизации перевода некоторых типов МГ и наметить пути их дальнейших исследований; в) изучить структурно-семантические осо-Зенности терминологических систем,-
Ш. Получена классификация ИГ: I) метонимические МГ; 2) гап-юлогические (с- опущенными компонентами); 3) плеоназмы, в которых используется больше компонентов, чем это необходимо для передачи отражаемых понятий; 4) МГ - изомеры, совмещающие различные зеляции; 5) МГ, форма и позиция составляющих компонентов которых юсут информацию о распределении семантических признаков в их се-гантической структуре.
Перевод МГ последнего типа может быть алгоритмизгрован.
г *
лассификация позволяет наметить пути поиска возможностей алгорит-изапии перевода МГ, вводимых в АС в виде конфигураций. Так, ка-ример, для метонимических ail - это исчисление моделей ыетоними-еского переноса, для гацлологичесютх МГ - инвентаризация илло-утивных индикаторов, или максим, и•экспликация имплицитного мысла ОТ при их нарушении.
1У. Лингвистической предпосылкой к созданию алгоритмов пере-ода МГ является уровневый характер языка; Каядый из уровней редоставляет сридотва для алгоритмизации персязрда МГ. Единицы эжъязыкового поуройнвзого соответствия МГ ( от морфемы до пово-)четания ) определены как предельные единицы автоматического пе-' Термин "реляция" заимствован из работ Б.Ю. Городецкого.
ревода, что послужило единым основанием для создания системы АС, вклотавдих алгоритмы перевода МГ.
У. Перенос методики формального описания языков программирования и их.трансляции, а именно формул Бэкуса-Наура, на формализацию анализа и перевода 1.ТГ с естественного языка на естественный оказывается эффективным и позволяет относительно легко реализовать компьютеризированный перевод некоторых типов МГ.
Теоретическое значение исследования состоит в интерпретации фактов и обосновании научных положений, совокупность которых представляет собой новое, перспективное направление при исследовании терминологических подсистем современных языков - создание алгоритмов перевода МГ для системы АС. Проведение данного исследования должно способствовать консолидации работ сходной направленности, углублению изучения языка в новом ракурсе под новым углом зрения, уточнению представлений о системе сходств и различий в естественных и искусственных языкэх,явиться основой для поиска универсалий в языках науки.'Разработанная стереосеыантическая методика может быть использована применительно к другому языковому материалу в исследованиях по общему, сопоставительному и типологическому языкознанию, а также по теории перевода. Экспликация имплицитного смысла ОТ при акализе их функционирования в конкретных типах и сферах общения представляет важность для изучения логики языка. Определение единицы автоматического перевода, построение системы АС по единому, основанию имеют особую значимость для теоретической разработки культуры АИС и АС. Перенос методики фор. мального описания искусственных языков на естественные важен . для построения теории формального описания естественных языков.' Что касается созданных алгоритмов перевода МГ, то они представля-
ют научный интерес, выходящий за пределы лингвистики, связывающий ее со многими другими науками. ^
Предлагаемая динамическая модель Ю при помощи АС представляет научный интерес с точки зрения обоснования психолингвисти-ческшс экспериментов, а такие разрешения теоретических проблем дидактики, связанных с использованием новых технологий обучения, при помощи компьютера.
Практическая ценность работы заключается в том, что она редоставляет универсальные возможности использования итоговых .иссертационных данных как в языковой дидактике, так и в янфор-атической деятельности. Причем внедрение результатов исследо-ания в каждой из различных областей, объединенных посредством С, гарантирует получение экономического эффекта. Так, например, спользованпо разработанной методики предмашинной обработки МГ алгоритмов их перевода при создании лингвистического обеспе-ения АС, позволяет экономить память 331.!, отказавшись от нераш-яального ввода и хранения излишней информации; эксплуатация редлагаемой системы АС с цолыо автоматизации рабочего Члеста пе-зводчика ведет к повышению производительного его труда. Любо-лно, что учет разработанных рекомендаций по овладению методи->й и техникой пользования АС как обучающими лингвистическими зтоизтами позволяет не только эффективно нагружать все виды 1мяти обучаемых, но и экономить их усилия путем увеличения фун-шоналыгого веса непроизвольного запоминания. Что касается ре-'льтатов анализа особенностей, тенденций,и движущих сил разви-[я терминологических подъязыков, то их применение позволяет основашю подходить к остя'даэыш процедур, оя>шнних со стан-.ртизацивК а унн^лка?..::'. "•«рышосистем и содержащих их АИС.'Ис-о'юшше лексической динамики коиггояеьтов Ш представляет
большой интерео для лексикографии, т.к. имеет самое- непосредственное отношение к проблеме их словарной репрезентации. Особую , значимость имеет возможность экономии интеллектуальных и временных затрат при использовании полученных данных О' количественных, качественных и причинных характеристиках МГ для разработки курсов преподавания общего языкознания, сравнительной типологии и истории языка, лексикологии, прагматики текста, лингвостилистики, риторики, теории перевода, информатики» а таете для- подготовки лексических минимумов, банков•данных и т.д.
Отдельные идеи работы нашли применение при разработке учебного пособия к спецкурсу "Структура МГ химии и их перевод о английского языка на русский" и создании учебного курса на машинных носителях ( Ленинград, 1991 ).• . *
Апробация работы. Реализация основных результатов исследования осуществлена в'31 опубликованной научно! работе- общим объемом 40 печ. л.; среди них - монография, учебное пособие к спецкурсу с приложением компьютеризированного учебного курса, изданного в виде дискеты, содержащей АС и программу для работы пользователей с персональным компьютером в диалоговом режиме.
Основные положения,, разработанные в-диссертации, освещались в докладах на заседаниях кафедры общего и сравнительно-исторического языкознания МГУ им. М,В.Ломоносова ( .1988, 1991 ), а также кафедры прикладного языкознания МГУ им. М.Б.Ломоносова ( 1988 ), на международном конгрессе в Москве ( 1990 ), международных научных конференциях в Ташкенте ( 1991 ),.Черновцах ( 1991 ), заседании международного круглого стола в Омска ( 1991*), всесоюзных конференциях в Твери ( 1991 ), Вологде ( 1991'), всесоюзных симпозиумах в Кишиневе ( 1979 ), Ленинграде ( 1985, 1988, 1990 ), Герценовскях чтениях в Ленинграде ( 1979 ), всесоюзных научных
конференциях в Москве ( 1979, 1990 ), конференции молодых научных работников в Москве ( 1939 ), республиканском семинаре-совещании в Магнитогорске ( 1980 ), научно-практических конференциях в Харькове < 1984 ), Москве ( 1938 ), Горьком ( 1989 ), Ленинграде ( 1990 ), Воронене ( 1991 ), зональных конференциях в Челябинске ( 1977, 1979, 1978, 1938, 1939, 1990 ), заседаниях школы-семинара в Кипинезе ( 1979 ), Москзе ( 1979 ).
Специфика объекта исследования, цель и задачи анализа обусловили структуру диссертации. С учетом того, что компьютерная реализация дает возможность установить значимость тех или иных языковедческих идей, оценить степень доказательности рассуждений, достоверность выводов и сразу же проверить их, диссертация строится таким образом, чтобы представить как теорию, так и приложение к теории. Так, если в первых пяти главах дается все более углубленное рассмотрение теоретических проблем языкознания, связанных со структурными характеристиками 1.ГГ и построением системы АС, то в двух заключительных главах представлены разработанные на основе полученных результатов алгоритмы автоматического перевода МГ и изложен опыт автора по созданию лингвистического обеспечения АС и их использования в языков о'' дидактике и инфоркатичес-коГ: деятельности.
Диссертация состоит из введения, семи глав, заключения, библиографических замечаний и списка литературы,
В первой главе "МГ в общем и сопоставительном терминоведении" эпределяется понятие МГ, ведется прогнозирование на основе синхронных и диахронных данных продуктивности различных способов обра-?эвання терминов и выявляется место МГ в периодизации развития терминологии. Здесь же приводится процедура лредмашинноИ обработ-ш МТ л намечаются пути поноса основы для построения системы АС.
Зо второй глазе "Функционирование МТ" рассматриваются Крите-
рии определения границ МГ и особенности их распределения в тексте..
• В третьей главе "Структурные характеристики МГ" ведется поиск возможностей алгоритмизации перевода МГ, из различных терминологических подъязыков при их исследовании на лексико-грамма-тическом, морЬеыном и словообразовательном уровнях, а также при изучении соотношения членкмости и производности компонентов ИГ.
Содержанием четвертой главк "МГ в стереосемантике" является разграничение МГ, перевод которых может быть алгоритмизирован, и МГ, подлежащих вводу в АС в качестве конфигураций. При этом предлагается методика стереосемантического моделирования функциональной перспективы сем в смысловом объема МГ, которая позволяет не только разграничить разнопорядковые явления, например такие как метонимия и гаплология, но и наметить направления дальнейшего изучения МГ, обнажая причины невозможности алгоритмизации перевода их некоторых типов в настоящее время. Этой же цели подчинен приведенный в данной главе анализ иыплицитности МГ в прагматической парадигме.
В пятой главе "Управление переводом 'И в АС" определяется единица автоматического перевода на основе построения граммат/кя перевода МГ и предлагается система АС.
В шосго;"* главе "Ачгоритмы автоматического перевода '!Г" д^на методика формального описания МГ и представлены алгоритмы и л. перг вода.
В седьмой гладе "Опыт практического применения результатов : лиза МГ и использования системы АС" показана э^ектнзпэать праки ческой реализации предлагаемо!' системьгАС I; алгоритмов перевода 1 как в дидактике, так и в икфорыаткческои деятельности.
Результаты исследования представлены в заклх.чении.
Основная цель приведенных далее библиографических г-амечанлЕ
указать направления, в которых развивается теория естественных и искусствэнных языков, равно как дать сонеты по конкретным . связанны;.! с текстом диссертация вопросам, которые могут заинтересовать псследоватетя.
Библиографический список представляет 351 наименование, включая лишь те работы, на которые даются ссылки. Многие из перечисленных в списке книг содержат обширную библиографию.
С0ДЕШНИ2 РАБОТЫ , Зо введении обосновывается актуальность темы исследования, формулируются цели и задачи, положения, выносимые на защиту, и дзется аннотация того нозого, что режется автором в данной проблематика.
В первой главе рассматрив?ются различные подходы к определению термина в современном языкознании.на основе экскурса в историю развития терминоведения, указываются причины появления МГ. Прогнозирование продуктивности и перспективности структурирования многокомпонентных цепочек как способа образования терминов ведется с опорой на диахронные данные при построении периодизации развития терминологии.
В ходе анализа отмечается, что если современное терминоведе-ние развивается под влиянием бурного развития АИС, то в 30-50-е гг.. оно носило нормативный характер, и поэтому к термину предъявлялось нормативное требование однозначности вне зависимости от
того, в каком виде деловой прозы используется термин. Речь шла о
\
нормализации терминологии и создании терминов стандартов. Под этим утлом зрения писали свои работы Е.Вюстер и Д.С.Лотте. Их суждения отразились в курсах по общему языкознанию и стали нормой понимания терминов как языкового явления. Многие ключевые проблемы терминологии казались в то время простыми z более быотро раз-
решимыми, чем случилось б действительности. В 60-е годы, когда началось массовое построение АИС, бшга отмечена "специфическая сигнкфккативность термин^" (А.А.Санкин). Дальнейшие исследования обнажили фактическую сложность положения дел в нормализации терминологических подъязыков (А.С.Герд, Ю.В.Рождественский, Б.Ю. Городецкий, В.М.Лейчик и др.). Информатика показала, что в некоторых случаях проблема стандартизации терминов оказывается несостоятельной. По терминированности стандарт не укладывается в тезаурус Соблюсти стандартный термин в информационной системе не всегда удается: ни один стандарт не исчерпывает все области применения терщика, а информатика исчерпывает. Появляется двойная терминация - стандартный термин и термин в информационной системе, что ведет к возникновению новых противоречий в развитии терминосистем, разрешить которые призваны АИС и АС. Подчиняясь многообразным видам деятельности (производственной, коммерческой, учебной и т.п.), АС могут иметь не только отраслевую, но к ведомственную принадлежность. Состав АС постоянно пополняется как переосмысленными старыми терминами,, так и новыми, используемыми при переназывании, . например, научных понятий химии в торговле и т.п. В данной работе при отборе терминов для лингвистического обеспечения АС понятие "точность" термина дополняется понятием "отличительность". '
Точку зрения, основывающуюся на результатах исследования реального состояния функционирующих, терминов, мы относим к дескриптивному подходу, при котором отмечаются такие характеристики термина, как "семантическая нечеткость, прагматичность, динамичность и зависимость от структуры подъязыка" (Б.Ю.Городецкий). При отборе материала используется определение термина в дескриптивном плане. При этом учитывается подход к определению термина с точки зрения прескриптивного терминоведения, а именно тот факт,
что термин соотносится с определенной единицей соответствующей логико-понятийной системы в плане содержания" (А.С.Герд). Подходом, объединяющим дескриптивную и прескриптивную точки зрения, является определение А.Я.Шайкевяча, в котором отмечается,- что термины должны реально противопоставляться друг другу независимо от того, имеются у них дефиниции или нет, а терминологией считается совокупность словесных средств различения понятий или объектов специфической всегда деятельности. Однако в данном случае не учтена возможность терминаиди понятий при помощи метаязыковых средств, играющих важную роль в терминологических подъязыках в различные периоды их развития. Более полным оказывается определение А.С.Горда, в котором метаязыковые средства учитываются. Оно явилось- базовым при создании АС.
Коренной проблемой,'от разработки которой зависят прогнозирование путей развития терминосистем и стратегия построения принципов их унификации, считается выявление движущих сил лз-ленения терминологии. Границы периодов обычно выделяются в соответствии с кризисными явлениями в развитии науки, когда на поверхность выходят скрытые противоречия. Подобная периодизация позволяет выделить формальные границы, диктуемые практикой, однако отсутствие теоретических обоснований мешает решению вопроса о двиауцих силах развития терминологических подъязыков.
Деятельвоитнкй подход к периодизации позволил представить .развитие терминологии как взаимодействие одновременно происходящих доятельаостннх процессов, активность каждого из которых меня- ■ ется ь различные периоды развития терминологии. При этом учитывается, что процессы, происходящие в терминологии-, связаны не просто с речевой деятельностью какого-то определенного профессионального коллектива, а "с внутренней организацией процесса общен;:л, и'.нп'ПЧи'ого как одна из сторон социального взаимодействия людей"
(А.А.Леонтьев).
Наиболее ярко прослеживается активность тех или иных процес-. сов при анализе вариантности. Поиск этапов"разрешения вариантности" (Г.Ю.Князесва) поззоляет выявить отражение ведущей деятельности в большей активности варьирования одних лингвистических, средств по сравнению с другими. В настоящее время ведущей деятельностью организации общения оказывается нивелирование языковых различий между термдносистемами одной и той же специальности независимо от языковой принадлежности. Ее действие в терминологии настолько сильно, что отражается на'развитии систем языков. Так, например, важным показателем тенденции языка к аналитизму являются изменения в синтаксических связях, вызванные сдвигами в построении МГ, что ощущается-в русском языке: "изменения в области сильного управления выражаются в замене беспредложных конструкций предложными" (В.А.Белоиапкова, Ы.й.Откупщикова), Б. английском языке предложные конструкции заменяются беспредлогными, что особенно ярко проявляется при варьировании ОТ. Диспропорция между возрастающим числом аовых понятий и ограниченностью ресурсов языка усиливает развивающуюся тенденцию построения ОТ. ' '
При прогнозировании продуктивности различных способов образования терминов обнаруживается, что наиболее перспективным является структурирование составных наименований. Силышыл оказываются тенденции семантического и аббревиациошюго ¡развития терминов, что необходимо учитывать при подготовке АИС и АС.
Вторая глава. Чтобы иметь возможность выявить МГ в.текстовом массиве, рассматриваются способы определения их границ. Исследование функционирования. ИГ^ под которым, понимается изучение "частотности, деривационной активности и сочетаемости исследуемых единиц в речи" (Г.Ю.Князева), позволяет получить данные о заключенных в МГ потенциях, необходимые при подготовке лингвистического обеспе-
чения АС.
Лингвистическое обоснование определения границ г.ГГ для решения вопроса об автоматической расшифровке конструкций дается при разработке приемов соединения нескольких компонентов в один МГ на основе семантического, репродукционного и синтаксического критериев, а также сведения терминологических цепочек к моделям с меньшим числом компонентов. Подобные процедуры "склейки" нескольких компонентов или "дробления" исходной цепочки не всегда оказываются релевантншли для перевода, но при отборе материала для создания АС позволяют выявить наиболее частотные модели МГ и сократить количество вводимых в ЭВМ единиц.
Особый интерес вызывают частотные характеристики МГ. В литературе отмечается, что статистические исследования научно-технических текстов с точки зрения распределения терминов, проведенные К.Г.Еектаевым, обнаруживают"странную закономерность: тематически важные термины упорно не показкзаат ни нормального, ни пуассонов-ского, ни логнормалыюго распределений" (Р.Г.Пиотровский). Анализ нашего материала свидетельствует о том, что появление МГ в текстовом массиве не совсем случайно, но в некоторой степени'предсказуемо, если в соответствующем тексте обнаруживаются тематически важные термины.. Таким образом, распределение МГ не может рассматриваться как распределение вероятностей непрерывной случайной величины. По своей сути термины вообще не могут показывать нормального распределения, не могут подчиняться действию вероятностной схемы, которой подчиняются другие лексические единицу языка. Они Функционирует не только под влиянием самопроизвольно протекающих лингвистических процессов, регулирующих равновесие языковой системы. На функционирование терминоз оказывают воздействие экстралингвистические процессы, связанные с упорядочением терминологических систем, с влиянием созданных и создаваемых АИС и т.п.. Иными
словами, указанная закономерность не является "странной": следует отличать способы анализа распределения'в научно-технических текстах общеупотребительных слов от способов исследования функционирования терминологической лексики. С этой точки зрения не представляется целесообразным, например, исследовать одинаковы}.! образо! и служебные слова, и тематически важные термины. Тем не менее, "тест Бектаева" заставляет нас обратить пристальное внимание на природу случая в семантико-коммуникативном построении текста" (Р.Г.Пиотровский). .
Термины, не подчиняясь действию вероятностной схемы, создают особые характеристики текста, выявление которых может помочь найти меру отклонения в поведении лингвистических единиц терминолога ческого характера от указанных законов. Такая оценка основывается на определении статистического коэффициента терминологичности как отношения количества терминов в рассматриваемом фрагменте текстового массива к общему количеству слов. Чем больше единиц терминологического характера используется в тексте, тем выше коэффициент терминологичности, тем меньше распределение МГ в этом тексте подчиняется действию вероятностной схемы. В данной работе текстовой массив бал исследован на коэффициент терминологичности. Для анализа функционирования МГ использовалась выборка как текстов, терминологический коэффициент которых оказался высоким, так и текстс с более низким коэффициентом терминологичности. Различие в распре делении МГ в зависимости от текстовой принадлежности учитывалось при корректировке результатов отбора частотных МГ для ввода в АС,
МГ обладают высокой деривационной способностью, выражающейся в их готовности выступать в качестве производящих единиц для более сложных МГ.' Наиболее распространенными способами деривации являются: нанизывание компонентов, соположение двух или более
терминов, вклинивание однословного или составного термина в ЭТ.
Факторы, регулирующие сочетаемость компонентов, включают разнородные явления,, затрагивающие разные уровни языка, что необходимо учитывать при построении алгоритма анализа и перевода МГ в АС.
В третьей главе ИГ рассматриваются как в одноязычной, так и двуязычной ситуациях. Инвентаризация морфемных составляющих, словообразовательных средств, моделей лексико-грдмматической принадлежности Ш1, выявление особенностей их структурных характеристик и определение номенклатуры разновидностей межъязыковых соответствий на морфемном, словообразовательном и лексико-грамматическом уровнях проводятся с целью поиска возможностей для использования предельных единиц дашшх языковых уровней в качестве основы при построении алгоритмов перевода МГ.
Определение },ГГ в терминах констптуентов морфемного, словообразовательного и лексико-грамматлческэго уровней позволило описать модели морфемной, словообразовательной, лексико-грамматичес-кой структур как набор стереотипов для создания некоторого обобщенного, системного образа LIT в поисках рационального подхода к классификации их межъязыковых соответствий.
Раскрыт волновой характер структуры ИГ, основанный на чередовании в одном и том же 1.ГГ аффиксальных и корневых компонентов, сложных по словообразовательной структуре и простых компонентов. Наряду с частотными элементами в состав компонентов одного и того же МГ входят и нечастотные. С целью изучения удельного веса МГ, содержащих морфемы разной частотности, была проведена их дифференциация с точки зрения частоты встречаемости в терминологии в целом и в МГ отдельных терминологических подъязыков. Оказалось, •что наиболее широко представлены МТ, включающие компоненты с чередованием частотных и нечастотнкх элементов.
Результаты поиска однозначного соответствия между разбиениями ?ЛГ различных терминологических подъязыков- на множество морфем и множество семантических признаков свидетельствуют о возможности автоматического перевода химических Ш на основе исследования синхронного соотношения членимости и производности входящих в их состав компонентов, идентификации словообразующих основ, формантов, а также определения направления словообразовательной производности. .
Систематизация разноязычных эквивалентов Ш1 на основе особенностей их мотивированности позволяет отобрать !<1Г с различными мотивировочными признаками в различных языках, которые подлежат вводу в АС в вице конфигураций. Результаты выявления МГ с референцией к лексическим системам классических языков, используемых термино--логами при стандартизации терминосистем, могут бить полезны при создании АС словообразовательных средств.
В двуязычной ситуации выделены частотные типы соотношения моделей; отражающих лексико-грашатическую принадлежность компонентов МГ, причем каждый из этих типов широко представлен в различных тершносисте»чах. Специализация некоторых межъязыковых соответствий связана с отраслевой принадлежностью МГ.
Сопоставление частотных моделей эквивалентных МГ с точки зрения их изоморфности/неизоморфности в различных языках обнаружило, в основном, случаи неизоморфности, что свидетельствует о невозможности ориентации только на лексико-грамштичрскую принадлежность компонентов Ш в поиске путей построения алгоритмов их анализа и перевода, но требует анализа их значения, чему и посвящена следующая глава диссертации.
,В четвертой главе предлагается методика предмашинной обработки МГ на основе пространственного представления их значения. При
этом отмечается, что зажно расположить все семантические признаки, входящие в семантическую структуру МГ, не просто в линейном поряд-кб, но в объемном измерении, чтобы наглядно представить происходящие в них семантические процессы. Объемное моделирование функциональной перспективы сем, именуемое автором стереосекантичс-ским, дает возможность проследить направление дэихенид сем, учесть варьирование их удельного веса и значимости при семантических преоб- . разовакпях в МГ. Пространственное представление значения строится на общепризнанном в современной семасиологии факте иерархичности распределения семантических признаков в лексическом значении' и на понятиях "интёнсионала" и "имплякацпонала" (М.З.Никитин), достаточно широко распространпнных в современно": лингвистике* однако в кашей работе категория концептуальной структура компонента МГ соотносится не с рядом лексико-семантических вариантов, не просто с отдельным терминологическим значением при учете иерархии сенного распределения, а с иерархически упорядоченным их множеством з многослойном семантическом пространстве, представленном для наглядности в виде сферы, в центре которой расположены ядер-;ныэ семы, удертазающие семы имшшкационзльные.
Изучение распределения стереосемантических признаков лексического значения компонентов МГ в их'многослойной пространственной структуре вызвано тем, что не только иерархическая.упорядоченность сем имеет значение при семантических преобразованиях, но и удаление сем от ядра,- т.к., стремясь занять позицию,, близкую к ядру, сеш могут переходить из слоя в слой как в пределах одного и того ^е компонента МГ, так и различных компонентов, объ-
Никятин 1,1.3. Основы лингвистической теории значения.-М.: ;Высш.шк.,-1938.-С. 61.
единяясь с другими семами либо вытесняя их на другие слои. Динамика семантических процессов в МГ обусловливается тем, что сущность. имшшкационаяа, предстаздянцего "силовое ноле" (М.В.Никитин) семантики каждого из ко.чпонентов терминологического композита, яд шш не оказывать злияния на другие его компоненты и не подвер- • гаться их воздействию при речевой деятельности, которая, разыы-
- вая градшз: между одними слоями семантической структуры компонентов 1!Г, далгег более жесткими границы между другими слоями. Се-ыаяаичесвие преобразования в структуре iff могут приводить к смысловым сдвигай, сокращению МГ на основе метонимии и т.п., когда ■ нарушается существующие связи между компонентами МГ, что вызыва- . ет их перестановку, единение или утрату.
Пространственное представление семноГ: структуры позволяет, наглядно проследить динамику семного движения при сокращении МГ. Тассмотриы МГ ught orange diazoi colorant со значением "краситель диазол светло-оранжевый", при сокращении которого образован ЯГ «Цаго1 light orange . Се^а каузации в полной семантической структуре "диазол, каузирувдий светло-оранжевый" становится пшосеаой компонента atazol , переходя в его интенсионал. Компонент ooioxaat выступает в виде донора, отдавая сему кауза-
- дш другому компоненту ИГ и исчезая при согдзащении. Сема, устремляясь к ядру компонента , пере двигается через иыгошка-циональные слеш его семантической струетуры в интенсиональные. В
сокращенном варианте МГ посылка каузации эксплицитно не выражена, но каузальная связь легко восстанавливается.
- Процесс технологии метонимических преобразований приводится на схеме.
. Рассмотрим МГ oeionic eeter coejound со значением "малоновый эфир". Перед наш плеоназм, т.к. используется больше компонентов, чем это несводим для выражения обозначаемого МГ понятия.
Технология метонимических преобразовании ИГ
bight orange diazol colorant-
I.
Light orange dia sol
Родовая сема "соединение" представлена как в ядре последнего компонента conpound , так и в компоненте ester . Сокращение рассматриваемого МГ путем отсечения последнего компонента является снятием тавтологии: вместе с опущенным компонентом из МГ уходит одна из идентичных родовых сем, предетавленных з различных компонентах, но вызывая переориентации сем в пространственной структуре МГ. Наиболее представительную группу составляют сокращенные МГ, образованные от плеоназмов, опущенный компонент которых оказывается именем существительным с признаком "обобщенное название предмета или понятия", как в приведенном выше примере. Данное явление по-
зволяет дать объяснение тому факту, что часто "при сокращении-выпадают компоненты, не включающие словообразовательные морфемы" (Е.Г.Пыриков): чаще всего существительные с признаком "обобщенное название предмета или понятия" типа веаш , goods , опускаемые при сокращении, не имеют словообразовательных морфем. Следует отметить, что в отсечении компонентов с указанным выше признаком при сокращении Î.7T существует вероятность ошибки. Так, например, уже рассмотренный нами ЫГ maionlo ester compound ы0_ кет функционировать со значением не "малоновый эфир", как в вы-вепркведеЕНом случае, а со значением "соединение, в состав которого входи? малоновьй эфир". Компонент compound в этом случае не может быть опущен, т.к. данный '¿Г не является плеоназмом.
Некоторые .'.С можно назвать неполными, имея в вицу семантическую неполноту вследствие выпадения каких-либо компонентов, в том числе обозначающих действия, а также предлогов, которые', как известно, оформляют структуру !.Г? и выполняют важную семантическую йунхцию, уточняя характер межкомпонентных семантических отношений. Б качестве примера приведем steaa iron hydrogen со значением "водород, получаемы:- расположением водяного пара над железом',' в котором явно проявляется смысловая келолнота. В данном случае -мы имеем дело с гаплологией, очень характерной для английских Ш? в силу высокой степени компрессии, свойственной английскому языку. Ке всегда просто подобные гаплологические LIT развертываются в их полные зарианты с экешштно выраженными межкомпонентными отпоившими» Высокой функциональной нагруаенностыа обладают сокращенные МГ, образованные на основе контракции. Контракция в других языках, например в русском языке, вызвана высокой продуктивностью морфологического словосложения. Широко распространены сокращения, образованные одновременно п;тем контракции и гаплоло-
л
гии. Примером комбинации этих различных способов монет послужить вариант disuiphamld. соответствуэдий 1.ГГ disulphonio sold amid.
Таким образом, исследование корреляции между сокращенными ОТ и их полными вариантами позволило разграничить разнопорядковые явления. При этом выделяется сокращенные терминологические композиты, в основе образования которых лежат метонимические преобразования, связанные с перераспределением сем в семантическом пространстве; гаплологические IIP,'смысловая неполнота которых, обусловленная отсутствием каких-либо компонентов, не ведет к перераспределению сем; МГ, полученные при устранении плеонастичности; контракции и др.
Очертить круг перевод которых может быть алгоритмизирован, определить МГ, подлежащие вводу в АС в виде конфигураций, выявить причины невозможности алгоритмизации их перевода в настоящее время и наметить пути дальнейших исследований позволяет следующая классификация, полученная при исследовании распределения стерео-семантических признаков в 'ÎT:
I. ;Летошшческие JJT (переориентация семантических признаков, при которой в интенсионал одного из компонентов переходит сема опущенного компонента ,МГ): light orenge diezcU З.Плеошзмы (одна и та же сема представлена в двух или нескольких компонентах) : nalo-гЛо eater compound.3. Г апологические wiT (опущение компонента приводит к имплицитностя, но на вызывает переориентации сем или сокращения объема совокупного значения ;.ГГ) : steam iron hydrogen ,
4. "joyepu (совмещение з ;,!Г различных межкомпонентных отношений)— circulation flow degasing! a) f s дегазация в циркуляционном потоке; б) цуркуляциокноэ закуумирование патока.
5. ;.ГГ, ^юрма и позиция составляющих компонентов которых несут кн--зоршцкк о распределении семантических признаков в их семантичес-
кой структуре: ыг cooling device - устройство, охлаждающее воздух, sir oooiea device - устройство, охлаждаемое воздухом. Перевод .МГ последнего типа может быть алгоритмизирован.
Что касается трудностей алгоритмизации перевода метонимических UT, то их преодоление связано с разработкой моделей метонимического переноса, которая должна основываться на анализе всего множества самых различных случаев смысловых сдвигов, происходящих в МГ. "Нельзя просто придумать метонимический перенос или схему образа, чтобы интерпретировать единичный случай" (Д.д.ЛакскЙу). Следует подчеркнуть, что регулярность и однотипность характерных для терминологии метонимических переносов, оснозанных на реальных связях между явлениями действительности, делает вероятной возможность ах исчисления.
Исследование шеонастичных и гаплолологическйх МГ с точки-зрения логики языка позволяет проследить пути материализации изменений метрики языкового пространства коммуникативной прагматикой • речевой деятельности, которая делает МГ фигурами структурирования мысли, ориентированными на отражение личностных факторов языкового общения. Так, например, гаплологические МГ как риторические фигуры умолчания позволяют обеспечить сокрытие секретов новой , технологии. Этой же цели может служить и плеонастичнкЯ 1.!Г, который, вызывая видимость развернутости предъявляемой .¡щормации путем многокомпонентное^ при передаче несущественных признаков выражаемого понятия, отвлекает получателя информации от тонкостей •технологии производства. На выполнение определенного коммуникативного задания могут быть ориентированы и МГ-лзомеры. Так, например, возможность различных толкований МГ radial anode eiectro-lyticai batn может стиадутирозать контакт получателя информации с ео "предъявителем, управляя поведением получателя информации путем включения эмоциональных состава "зощих коммуникативного процео-
са в собственно информационные.
Изучение проблемы имплицитности МГ с точки зрения теории коммуникации и речевых актов, экспликация имплицитного смысла плеона-стичных, гаплологических и изомерных МГ позволили выявить причины затруднений, возникающих при попытках алгоритмизации их перевода. Автоматическая обработка исследуемых конструкций оказывается в настоящее время невозможной, т.к. их интерпретация требует включения механизма поиска нужной информации при помощи пресуппозиции, опыта коммуникантоз и других внеязыковых факторов. Дело в том, что использование плеонастичных, гаплологических и изомерных МГ часто связано о нарушением эксплуатации "иллокутивных индикаторов,- или максим" (П.Грайс), таких,например, как максимы недвусмысленности и прозрачности, которые являются коммуникативными правилами речевого поведения, служащими для достижения взаимопонимания в процессе общения. Поиск путей возможности алгоритмизации перевода МГ данных типов связан с инвентаризацией случаев нарушения различных иллокутивных индикаторов.
В пятой главе рассмотрение культуры слозареЯ основывается на результатах разработки теоретических и практических проблем лексикографии, изложенных в работах Л.П.Ступина и широко используемых в практике классификации традиционных словарей. При этом отмечается, что появление АС ознаменовало собой осуществление мечты многих поколений лексикографов о доступе к корректировке словаря не"только в период его создания, но и в течение всего времени эксплуатации.
Для всех АС и АИС характерно "свойство динамичности как способности постоянно изменять количество введенных в память ЭВМ слов" (И.И.Убин). Отличительной чертой АС различных типов может выступать их способность переводить конструкции из этих же слов, т.е. автоматически обрабатывать большее число единиц, чем в них
заложено. Предлагаемое в данной работе единое основание для создания системы АС учитывает нэ только свойства компьютера, но и носит.лингвистический характер. Этим основанием слуаит единица автоматического перевода, соответствующая предельной единице языкового уровня.
Построение грамматики перевода МГ в рамках контрастивной лингвистики показало, 'что каздый из существующих подходов к сопоставлению сосредоточен на выявления различий, принадлежащих какому-либо одному языковому.уровню или одновременно нескольким. Данная черта, а именно уровневая ориентация, и положена нами в основу сопоставления МГ. При выявлении возможностей создания алгоритма перевода МГ обнаружилось, что каждый из рассмотренных языковых уровней предоставляет лингвистическое средство для построения алгоритма анализа и перевода МГ, а именно предельную единицу соответствующего языкового уровня (от морфемы до словосочетания) .
. Шестая глава посвящена созданию алгоритмов перевода МГ, для чего используется аппарат и результаты исследований различных СЗластей лингвистики, логики и искусственных языков. Компьютер рассматривается как чисто вспомогательное средство, которое в руках создателя АС выполняет операдаи анализа и перевода разноязычных лингвистических единиц, начиная от морфемы и заканчивая словосочетанием. При этом предельная единица, подлежащая автоматическому переводу в соответствующем типе словаря, определяет его место в предлагаемой системе АС (см.таблицу).
Алгоритмы перевода МГ на основе их морфемного и словообразовательного аьрлиза создаются на материале химической терминоло-. Ак:. Нормальное опраделечке Щ при построении графа в виде дерева аав>сшюсто:' с учетом перзрхич^^оП структуры МГ, соответствующей а .«.н.»'- иерархической системе химического подъязьпа, характориву-
,ет АС, в которых единицами автоматической обработки являются морфемы и форманты. АС данного типа имеют непосредственное отношение как к составлению структурных формул химических 'ЯГ, так и к подбору их иноязычных эквивалентов. Они' могут быть использованы о целью реферирования, аннотирования и перевода химических текстов, при изучении химического подъязыка в целом, а также при построении АС словообразовательных средств.
При переходе к изложению результатов подготовки и эксплуатации АС, основанных на алгоритме пословного дереводз, отмечает- . ся, что разработчика систем машинного перевода должно насторожить мнение лингвистов о роли, которую играет лексика в языке. Так, например, учитывая факт "отнесения лексики к периферии системы языка" (О.С.Широков), можно прогнозировать, что стратегия пословного автоматического перевода окажется алгоритмом с серьезными недостатками.
Изучение множества сшибок, допущенных ЭВМ при машинном переводе МГ в результате эксплуатации информационно-поисковой системы пословного перевода, заставляет отказаться от этой стратегии перевода МГ. Однако можно эффективно использовать АС, в которых слово является единицей переводз, если в них статично заданы'частотные МГ в виде конфигураций.
Стереосемантическая ориентация при построении алгоритма перевода МГ требует выявления, во-первых, некоторого набора категориальных и дифференциальных семантических признаков, во-вторых, взаимоотношений между компонентами, наконец, стереосемантических комбинаций интенсионально-импликационных признаков зависимых, доминантных и шорпшс компонентов ИГ. Если использовать еще и ' сведения о сочетаемости стереосемантических признаков, раскрывающие одновременно содержательный характер этой сочетаемости, то
появляется возможность получения смысловой записи на основе соотнесения признаков и их комбинаций с реляциями, что может ¿ыть положено в основу построения алгоритмов перевода.
При ориентации на уровень словосочетаний основная идея осно-• вывается на формальном определении !.ГГ с помощью формул Бэкуса-Наура, знакомых профессиональным программистам, но до сих пор не применя-еШх в рассматриваемой нами области. Можно использовать любой лз видов формального определения языков программирования (синтакси- ■ ческие диаграммы, графы, специализировашше средства описания искусственных языкоз и т.п.), однако., формулы Бэкуса-Наура являются наиболее удобными: их преимуществом является строгая формализация
(
и почти однозначное отражение структуры некоторых типов 1.JT. Воспользуемся следующими метасимволами: вертикальная черта J обозначает "либо-яибо" символ ::= показывает, что понятие приводится слева от него, а дефиниция этого понятия дается справа;"то, что находится внутри скобок {" j может повторяться нуль и более раз, например: ^ ав J обозначает множество всех цепочек, содержащих айв, т.е. авва, ав, ва, авав и т.п. Формула вида А ::= В J есть просто сокращенная запись рекурсивного, по существу, правила: А ::= ( пусто)» | АВ. В качестве примера реали-" зации формул Бэкуса-Наура приведем алгоритм анализа и перевода МГ "сущезтвительноб| + причастие ^ существительное,," (н тРы2):
air oooiing device —устройство, охлаждающее воздух
_ И1Р1Н2 — СС°щееС1' eir oooiea devioe —устройство, охлаждаемое воздухом • Bjl^, — C2°,:ooCI . _ ¿орм&льное описаш.,: ангда'ских ?.ГГ: Г.ГГ : := Н -^Р^
I. МГ : ;= H
MT : := (vrord1)<%ord27<tror£l3>
Hj ::= имя существительное
Шля существительное : := |~буква £ буква ^ Буква :':= A j В | С ... | г ^nord-,^ ¡1= Pj
pj ::= основа глагола + ins
Основа глагола + ing ;| буква £ буква J
^nord^ *:= " 2
н2 ::= имя существительное
г.- мг- »-^РцЯ'г
МГ ::= ^wordj') <word2,><}Tord3>
(TTordi)> •• :=И J
И j ::= иш существительное Имя существительное : := |буква { буква Буква : := A j В j С ;.. | 2 { word 2): := % Рд ::= основа глагола + еа Основа глагола +ed . : :=t ^ буква буква ^
(word 3)
и 2 ::= имя существительное Данное формальное описание МГ рассматриваемых типов струк-?уры пригодно для компьютеризированного синтаксического разбора IT, на основе которого моает быть решена задача перевода МГ рассматриваемых типов на русский язык.
- зе -
Формальное ошханио русских эквивалентов Случай Pj Случай PJ£
С2 ís- t ín2),
гдеí - функция перевода английского слова в русский эквивалент«' *1» *2 - анишйакиа существительные;' Pj - лрлчастае настоящего времени; Pjt- - лрэтастие дродедаего времени; Cjr и - русские существительные; С- — в жнггедъаом цадаге J Cg — в творительном кздаке;
О ::= *
О ::= 'ОД
fí?n)
З-селкта* глазп доказана эффективность практической реализации системы АС с алгоритмами перевода ИТ в дидактика и инфорыатической да^тЕлышста. При этом подчеркивается, что в теории и практике обу-чр.тан часто ориелтгруггся ва произвольную {преднамеренную) память и не хсдохьзухз? а полной ыерё ззкокоаерности непроизвольного (не -прадкашрэнвого) задзюнания. Отсутствие дифференциации данных яв-дгешй грдтйстат к упрощенной трактовке понятая "память". Так, напри* мер, в следржш определена: "память- ато побочный продукт обра-4йатЕи хв^оршаш*. иэ-виданоцу, смеемся в виду лишь один Из состав дЕпиагт наш» хцюцессов» a именно непроизвольное запоминание..
* |*»«« fpt* XA*, Кап В ^ Стратегия пониманий связного текста // Яэяов а ■ИНга.-сстсе.Ч*.; Лрограсо, Í939.45. Г75.
Обработка информации, на наш взгляд, является приемом воздействия на непроизвольную память.
С целью поиска возможности экономии интеллектуальных усилий обучаемых, связанной с сосредоточением функциональной нагрузки на непроизвольном запоминании, предлагается динамическая модель механизма мотивированного обучения (Ш), которая позволила разработать приемы обучения МГ с помощью АС. В основе модели лежит цикл взаимодействия произвольных и непроизвольных процессов памяти, константа которого есть функция мотивированности. МО изменяет свойстза и состояние системы основных процессов памяти - запоминания, воспроизведения и забывания, что ведет к нарушению ее равновесия, выражающегося в реактивности, т.е. необходимости перераспределения функциональной нагрузки между составляющими системы. Рост функциональ^ ной цагруленности произвольных процессов запоминания и воспроизведения вызывает снижение удельного веса забывания, который входит . в состав непроизвольных процессов. Уменьшение функционального веса процесса забывания влечет за собоР сосредоточение основной функциональной нагрузки на непроизвольных процессах запоминания и воспроизведения. Таким образом, нейтрализация реактивности происходит за счет компенсации произвольных процессов непроизвольными. Ш, непосредственно усиливая произвольные процессы памяти, опосредованно ;приводит к повышению функциональной нагруженностп непроизвольных процессов запоминания и воспроизведения за счет снижения удельного веса процесса забывания. Обнаруживается обратная зависимость между степенью мотивированности и интенсивностью забывания. Ниже приведены некоторые из разработанных наш приёмов МО-с помощью АС: I) Если Ш проводится под контролем АС, то это позволяет использовать прием снятия ограничений поисковых возможностей памяти. 2) АО как инструмент в заинтересованном подходе к профессиональному общению дают возможность вызвать у пользователя потребность в переводе МГ
и немедленно удовлетворить ее, тем самым применить прием создания "ловушки для памяти"(В.Г.Костомаров, 0.Д.Митрофанова). Механизм действия этого приема объясняется сдвигом всей функциональной нагрузи на процессы запоминания и воспроизведения непосредственно в цикле непроизвольных процессов памяти, что исключает протекание процесса забывания. 3) Если АС служат средством перевода, то и тогда обучение на базе АС отличается по своей сути от традиционных методов обучения с помощью "бумажных" словарей, т.к. позволяет использовать прием снятия ограничений кратковременной памяти и, связывая с помощью кореференции лежащие в основе МГ понятия с соответствующими понятиями предшествующей пропозиции, мгновенно установить локальную связанность МГ. Проверка эффективности новой технологии изучения МГ с помощью АС проводилась по- методике, специально подобранной для выявления непроизвольно усвоенного материала. Была создана такая ситуация, при которой от испытуемых не.требовалось целенаправленных логических депствий, связанных с установкой на воспроизведение изученных МГ. Исследование проводилось под видом проверки скорости речи. Ставилась задача: "Перечислите как мо..-сно быстрее двадцать каких угодно словосочетаний'.1 Предполагалось, что из индивидуального словарного запаса испытуемых, выявленного •при ассоциативном эксперименте, будет отсеян слабо изученный материал.
Эффективность разработанных приемов обучения МГ с помощью АС оказалась настолько высокой, что экспериментом свободного припоминания не удается онять их присутствие, в свободном ассоциативном потоке.
!
Анализ результатов реально4 эксплуатации АС как в дидактике, и в 1<нфор1<атическо1; деятельности позволяет заключить,' что на-' иболее ачонопичннми лнлчютс! АС с ориентацией на уровень словосо-
четания, 1 лторые включают алгоритмы анализа и перевода МГ на основе их формального определения при помощи доступных для компьютерной реализации формул Бэкуса-Наура. Пословный перевод МГ с ориентацией на лексико-грш.матическую принадлежность входящих в их состав компонентов является алгоритмом с серьезным! недостатками. В связи с этим следует заметить, что изучение признлковос-ти вытесняет прежний интерес лингвистов к словам как к частям речи. Перспективной является стереосемантическая ориентация при построении алгоритмов перевода ЭТ. Недостаток этого способа состоит в том, что он связан с колоссальным объемом работы. Следует подчеркнуть,однако, что хотя скрупулезный анализ пространственного представления семантики !.ГГ оказывается-трудоемкой и сложной процедурой, затраты на его проведение окупаются, когда результаты стереосемантических изысканий привлекаются для обобщения ис-еледований на других уровнях анализа: почти все возникающие при анализе 1Я на различных уровнях трудности связаны с архитектоникой сем и особенностями их распределения.
В заключении подводятся итоги исследования, обобщаются основные выводы л результаты анализа по главам, а также опрэделяют-:я перспективы дальнейшего изучение рассыатрнзаег.их проблем.
Особо подчеркивается внимание, уделяемое обществом культуре ■ловарей. 3 качестве примера приводится тот факт, что"работа над ¡ольшям Оксфортсг.'т 1 сотрем бича сзоего рода национальным пред-* [риятпем, т.е. получила исключительно шрокук поддержку ученых и .нглиПской общественности" (Л.П.Ступкн). Отмечается также, что в вязи с развитие:,1 коыпытердаго дела зозраставт роль АИС и АС, траааввдх терминологическую культуру. Проблемы терминология тре-увт сзоего решршш з гонтексто» цн/орматии:, включаице1 и нередко оэмещзющей все виды словесности. Компьютерная реализация этих ре-
шений отражается на составе АС и сопровождается значительным увеличением количества вводимых в ЭВМ терминов, в той числе и многокомпонентных. Будучи удобным средством компрессивной передачи информации, МГ получают настолько ишрокое распространение, что установка на их статичный ввод в АС должна быть дополнена поиском путей алгоритмизации их перевода. -
Разработка алгоритмов перевода ;,ГГ при создании системы АС является новым перспективным направлением, имеющим внход-в практику и комплексностью своего исследования удовлетворяющим ряд потребностей теоретического и компьютерно-оряентировзнного языкознания. Лингвистической предпосылкой к созданию алгоритмов перевода ИГ является урозневый характер языка. Выявленные закономерности сходств и различий изучаемых терминологических систем, теоретическое обоснование методики предыашшной обработки !.ГГ, обнаруженные средства алгоритмизации их перевода и методика формального описания, определение единицы автоматического перевода, служащей в качестве единого основания для классификации АС, разработанная стереосемантическэя методика и полученные на ее основе новые результаты являются теоретическим продуктом исследования Построенная система АС с созданными алгоритмами перевода :.ГГ, лингвистическое.обеспечение АКС, пскхолингвистические и дидактические рекомендации являются прикладным продуктом.
Результаты проведенного исследования способствуют дальнейшей разработка вопросов, связанных с проблемами номинации, экспликации имплицитного смысла !Я, их аналлза в коммуникативно-функциональном и когнитивно-семантическом аспектах в русле деятельно-стной парадигмы. При дальнейших исследованиях может быть проведена йроверка разработанной методики ъ.л другом материале.
Основные положения диссертации отражены в следующих публикациях: Монографи"
1. Структурные харак'1'ерист«:и1 многокомпонентных тормтюэ и проблема алгоритмизации их перевода с английского языка на русский. - Л.: РГПУ им. А.К.Герцена, 1991. - 483 с. - Деп. в ИНВДН АН СССР, 28.06,91. й 4485Э. - Бюллетень "Новая советская литература по общественным наукам. Языкознание".-!,;., 1ЭЭ2.-Й I.-С. 33.( 22 печ. л. )
Учебное пособие к спецкурсу
2. Структура многокомпонентных терминов химии и их перевод с английского языка на русский: Учеб. пособие к спецкурсу. - Л.: РГПУ им. А.И. Герцена, 1Э91. - 83 с. ( 5,5 печ. л. ) Компьютеризированный учебный курс
3. Перевод составных терминов: Приложение на машинных носителях к учеб. пособию по спецкурсу "Структура многокомпонентных терминов химии и их перевод с английского языка на русский" для самостоятельной работы пользователей с персональным компьютером в диалоговом режиме. - Л.: ШЕГ им. А.Я.4 Герцена, 1991. (Программа на языке СИ написана К.Г.Зороновым)..( 5 печ. л. ) Статьи:
4. Структурные особенности и Функционирование лексико-морфологических вариантов терминов ( на материала химической терминологии современного английского языка) // Исследования семантической структуры английских слов. - ГЛ.: МГПИ им. В.И. Ленина, 1975. - С.232-265. ( 1,4 печ. л. )
5. Русские, английские, немецкие и французские термины метизного и прокатного' производства в патентной литература // Теория и практика производства метизов. - Свердловск: УПИ,
1979. - С. 141-148. ( 0,3 печ. л. )
6. Варианты химических терминов как компоненты словообразовательного гнезда // Структурно-семантические особенности отраслевой терминологии. - Воронеж: 31У, 1982. - С. 93-98. ( 0,3 печ. л. )
7. Варианты терминов и отражение их функционально" нагру-женности в одноязычных словарях // Теоретические проблемы семантики и ее отражения в одноязычных словарях: Сб. ОЛЯ АН СССР,-Кишинев: "Штиинца", 1982. - С. 240-242. ( 0,2 печ. л.)
8. О структурных характеристиках реалий // Аспектология
и контрастизная лингвистика. - Калинин: КГУ, 1988. - С. 84-90. ( в соавт.с Е.Г.Гурьяновой ).( 0,3 печ. л. )
9. Об отборе многокомпонентных терминов для учебного словаря по специальности // Квантитативные методы отбора учебного материала по иностранному языку для неязыкового вуза. - Свердловск: Ур1У, 1990. - С. 59-68. ( ,0,4 печ. л. )
' 10. Метонимические преобразования в многокомпонентных терминах // Актуальные проблемы сетсиологии.. - Санкт-Петербург: ' РГПУ им. А.И.Герцена, 1991. - С. 165-171. ( 0,3 печ. л. )
11. О правилах' функционирования вариантов терминов .-Магнитогорск: Ш51, 1982. - 8 с. - Деп. в ШШН АН СССР 29.09.82.
У* 11275. - Бюллетень "Новая советская литература по общественным наукам. Языкознание".-!,!., 1982.-.') 3.( 0,3 печ. л. )
12. К вопросу о вариантности термина и нетермина ^Магнитогорск: ичГгМ, 1982. - II с. - Деп. в ШШН АН СССР 12.03.82.
•К 9611. - Бюллетень "Новая советская литература по общественным наукам. Языкоьяанпе".-М., 1382,-9. ( 0,5 печ. л. )
13. Многокомпонентные термины в патентной литературе,— Магнитогорск: МР.И, 1982. - 8 с. - Деп. в ШИОН АН СССР 29.09.82. .' 1а0-74. - Бюллетень 'ЧЮвая советская литература по обществен-
ним наукам. Языкознание";-!,!., 19333. ( я соавт. с В.Г. Ручкиной, Л.В.Черновой ). ( 0,3 печ.л. )
14. ^ вопросу о создашш лингвистического обеспечения автоматических словарей .-Магнитогорск: МГШ, 1988. - 14 с.,-Деп. в НИИЗШ 15.12.87. !Ь 132874. - Бюллетень "Содераанзе, формы и методы обучения в выспей школе". ШЗС.-Д 4. ( 0,6 печ.л.)
15. О разработке многокомпонентных.терминов и их йункцио-нированиигМагнитогорск: МГЖ, 1988. - 23 с. - Деп. в ИНИОН АН
СССР 28.04.88, И 33566. - Бюллетень "Новая советская литература по общественным наукам. Языкознание".-М., 1938.-.'ё 3 ( в соавт. с И.Смысловым )« ( I печ. л. )
16. Сопоставительный анализ английских и русских многокомпонентных тержкоз методом бинарны:: оппозиций.-!,!агнитогорск: ЬСТ, 1988, - 9 с. - Деп. в КШОК АН. СССР 28.04.80. Л 33668. - Бюллетень "Новая советская литература по общественным наукам. Языкознание".193810. ( 0,4 печ. л. )
17. О структуре многокомпонентных терминов.-Магнитогорск:
Мта, 1988. - 9 с. - Деп. в ИНИОН АН СССР. ,28.04.88. Л 33667. й 10. ( 0,4 печ. л. )
18. Предг,шинный анализ многокомпонентных терминов // Лингвистические данные - основа интенсификации учебного процесса по изучению иностранных языков. С. 90-101.—М.: ШКГГ, 1991.- - II с. - Деп. в НИИ ВО 18.12.91. Г" 804/91,- Бюллетень " Депонированные рукописи по проблемам высшего образования ". М., 1992. Зып. 4. ( 0,5 печ. л. )
Тез. мвкдунар. конф.
19. О приемах мотивированного обучения русскому языку с использованием автоматических словарей//УП Междунар. конгресс МАПРЯЕ: Тез. докл. и сообщ. В 2-х ч.-ЧЛ. - М.: Русский язык, 1990.-С. 341-342. ( 0,1 печ. л. )
20. О переводе словосочетаний с помощью алгоритма // Вопросы стандартизации, интернационализации и автоматизации перевода терминологических единиц: Тез. докл. междунар. научн. конф, -Черновцы: ЛО ИЯ АН СССР ЧТУ, 1991 .-С. 91. ( 0,1 печ. л. )
21. Алгоритмизация перевода составных терминов с английского языка на тюркские // Иностранные языки в научной деятельности специалиста: Тез. докл. междунар. конф. - Ташкент: ТГУ, 1991 .—С. 194. ( ОД печ л. ) -
22. Многокомпонентные термины в деловом письме // Терминология и перезод в политическом, экономическом и культурном сотрудничестве: Тез. докл. междунар. круглого стола. - Омск: ОШМ, 19Э1.-С. 37-38. ( 0,1 печ. л. )
Тез. Всесоюзн. и зональных конф.:
23. О периодизации развития терминологии // Проблемы истории индоевропейских языков: Тез. докл. и сообщ. Всесоюзн. конф. В 2-х ч. 4.1 - Тверь: ЛО ИЯ АН СССР ТГУ, 1991 г С. 55-56.
( 0,1 печ. л. )
24. О способах перевода многокомпонентных терминов с помощью ПЭВМ // Лингвистические проблемы искусственного интеллекта: Тез. дога. У1 симпоз.-Л.: ЛГШ им. А.И.Герцена, 1990.-С. 20.
( в соавт. с К.Г.Вороновым ). ( 0,1 печ. л. )
26. О формализации алгоритма перевода терминологических словосочэтаний // Научно-технический перевод и информационное ожесточение научно-технического прогресса? Тез, докл. У научно-
гпракт. конф. - Воронен: ВГП1, 1991. - С. S7-G8. С 0,1 сеч. л. )
2С. Сопоставительный анализ многокомпонентных терминов английского языка с их русскими эквивалентами и создание автоматических словарей // Проблемы научно-технического перевода: Тез дота, научно-практ. кокф. - Горький: ГР ВЦП, 1989. - С. 43. ( 0,1 печ. л. )
27. Частотная лексика в практике обучения переводу // научно-технический прогресс и проблем перевода научно-технической литературы и документации: Тез. докл. и сообщ. зонального семинара. - Челябинск: УДКТП, 1977. С. 37 ( в соавт. с РЛ. Зучковой ) ( 0,1 печ. л. )
28. О различиях между терминологическими и нетерминологи-часкики единкцзма // Вопросы качества перевода: Тез. докл. и сообщ. зональной конф. - Челябинск: УДКТП, 1978. - С. 31.
( ОД печ. л. )
29. Перевод вариантов термина в рекламных текстах // Офор-шение и перевод внешнеторговой промышленной рекламы: Тез. доха, и сообщ. зональной кокф. - Челябинск: УЖГП, 1979. - С, 54.-
( 0,1 печ. л. )
30. Эффективность введения терминов и некоторые пути ее повшлеюш // Школа-семинар по оптимизации преподавания иностранных языков с помощью технических средств: Тез. докл. и сообщ. - Кишинев, 1979. - С. 27. ( 0,1 пэч. л. )
31. Многокомпонентные термины в автоматическом словаре // Пути повышения эффективности речевого воздействия в условиях деловой коммуникации: Тез. докл. научно-практ. конф. - Челябинск: УДНГП, 1990. - С. 88-89. ( 0,1 поч. л. )
j/L
одписано в печать 20.01.92. Фотмат 60x64 Г/16 Бумага тип. № 2 [лоская печать Усл.печ.л. 2,0 Тишзя 100 экз.,
¡аказ 87 Бесплатно
455000, Магнитогорск, пр.)>нина, 38