автореферат диссертации по филологии, специальность ВАК РФ 10.02.21
диссертация на тему: Анализ и синтез многокомпонентных одноэлементных именных групп в действующей системе лексического машинного перевода и повышение её эффективности (на материале английского микроподъязыка антенно-фидерных устройств)
Оглавление научной работы автор диссертации — кандидата филологических наук Ионов, Анатолий Иванович
СОКРАЩЕНИЯ И УСЛОВНЫЕ ОБОЗНАЧЕНИЯ.
ВВЕДЕНИЕ.
ГЛАВА I. ПУТИ И СПОСОБЫ ПОЭТАПНОГО ПОВЫШЕНИЯ ЭФФЕКТИВНОСТИ СИСТЕМ МАШИННОГО ПЕРЕВОДА И УЛУЧШЕНИЯ КАЧЕСТВА МАШИННЫХ ПЕРЕВОДОВ.
Часть I. Этап лингво-статистического и инженерно-информационного моделирования исследуемого подъязыка
Часть П. Машинные словари в системах машинного перевода
Раздел I. Машинные словари действующих систем машинного перевода.
1.1. Автоматические словари МАОС
1.2. МС в системе бинарного МП Чимкентского пединститута
1.3. МС в системе МП АМПАР.
1.4. МС системы МП НЕРПА
1.5. АС ВЦП "Мультилекс"
Раздел 2. Машинные словари экспериментальных и проектируемых систем машинного перевода
2.1. Лингво-техническая система
2.2. МС системы МП АМПАР
2.3. Система МП ФРАП.
2.4. АС системы ЛИНФОРАН.
2.5. АС с нежесткими связями
2.6. МС системы ЯРАП.'.
2.7. Система лексико-синтаксического МП научно-технических текстов.
2.8. Многоцелевой автоматический словарь русского языка в системе универсальной структуры БАНК.
2.9. МС системы МП СИМПАР.
Часть Ш. Алгоритмы систем машинного перевода
3.1. Алгоритм синтаксического анализа и синтеза группы "Статистика речи"
3.2. Алгоритм семантико-синтаксической переработки предложения в системе немецко-русского №
3.3. Алгоритм поиска синтаксических связей
3.4. Алгоритм семантико-синтаксического МП
3.5. Алгоритм семантических моделей
ВЫВОДЫ
ГЛАВА П. АНАЛИЗ И СИНТЕЗ МНОГОКОМПОНЕНТНЫХ ОДНОЭЛЕМЕНТНЫХ ИМЕННЫХ ГРУПП В ДЕЙСТВУЮЩЕЙ СИСТЕМЕ ЛЕКСИЧЕСКОГО МАШИННОГО ПЕРЕВОДА.
Раздел I. К постановке проблемы
Раздел 2. Структура автоматизированного машинного комбинированного словаря АМКОС.
Раздел 3. Двухкомпонентные одноэлементные именные группы микроподъязыка "Антенно-фидерные устройства".
3.1. Перевод именных групп и + и2 типа stone y/all
3.2. Особенности переработки именных групп с " ing " формами
3.3. Именные группы с переводной схемой и2+ Рг +
3.4. Именные группы, требующие описательного перевода
3.5. Особые виды именных групп.
Раздел 4. Особенности анализа и синтеза трехкомпонентных одноэлементных именных групп микроподъязыка "Антенно-фидерные устройства"
4.1. Именные группы с переводной схемой щ + и2 +
4.2. Именные группы с переводной схемой ц + Adjq+ Ng • •
4.3. Именные группы с переводной схемой Adj2+ N^.
4.4. Именные группы с переводной схемой Adj2 + +
4.5. Именные группы с переводной схемой + + " ^
4.6. Именные группы с переводной схемой Adj +
4.7. Именные группы с переводной схемой + + Н
4.8. Именные группы с переводной схемой + Prep +
Adj1 + N
4.9. Именные группы с переводной схемой и + ы2 + Prep +
4.10.Именные группы с переводной схемой N + N
4.11. Именные группы с переводной схемой + Prep + n2 +
4.12.Именные группы с переводной схемой N + Prep + N. + U
4.13.Именные группы с переводной схемой Adj2 +
4.14.Именные группы с переводной схемой Ad^ +
4.15.Именные группы с переводной схемой Adj^ + + П2 .97 4.
§.Именные группы с переводной схемой Ad^ + N
4.17.Именные группы с переводной схемой Adj^ + N2 + N
4.18.Именные группы с переводной схемой pi2 + N^ +
4.19.Категории именных групп, представленные одним употреблением
Раздел 5. Переработка четырехкомпонентных одноэлементных именных групп микроподъязыка "Антенно-фидерные устройства"
ВЫВОДЫ.ПО
Введение диссертации1983 год, автореферат по филологии, Ионов, Анатолий Иванович
В документах ХХУТ съезда КПСС, ноябрьского (1982 г.) Пленума ЦК КПСС содержится комплексная программа развития экономики, повышения ее эффективности, ускорения научно-технического прогресса во всех отраслях народного хозяйства.
Машинная переработка научно-технической информации, включая машинный перевод, призвана в значительной степени способствовать решению узловых вопросов научно-технического прогресса в важной сфере, как механизация, автоматизация и научная организация управленческой деятельности в масштабе всей страны Г 153,8 D. Партия наметила целый ряд мер по совершенствованию управления, главными из которых являются следующие: улучшение планирования, контроля и учета, дальнейшее укрепление и развитие материально-технической и информационной базы управления tl, 67-693. По этим основным направлениям осуществляется и дальнейшее совершенствование управления в военной области, причем на данном этапе важнейшим условием эффективности управления войсками выступают широкое внедрение научной организации труда и активное использование современной вычислительной техники [2,12-133.
Умелое использование средств автоматизации способствует повышению боеготовности и боеспособности войск, увеличивает эффективность боевого применения оружия и техники, значительно сокращает объем ручного труда должностных лиц органов управления и соответственно расширяет возможности для творческой деятельности командиров и штабов.
Электронно-вычислительная техника позволяет значительно сократить время прохождения информации, облегчает выполнение необходимых оперативно-тактических расчетов, обеспечивает своевременное нанесение ударов по наиболее важным объектам противника, уточнение боевых задач подчиненным войскам, поддержание тесного взаимодействия между разнородными силами и различными видами оружия.
Применение АСУ позволяет повысить эффективность борьбы со средствами массового поражения, обеспечить быстрый сбор информации и ее оперативную переработку 12,133.
Актуальность исследования. Как отметил ХХУ1 съезд КПСС, решение целого ряда стоящих перед экономикой страны задач предусматривает " . нацеленность на экономию, на более полное и рациональное использование того, чем располагает страна, требует нового подхода ко многим вопросам хозяйствования" £1,561.
В практике военного дела одно из главенствующих мест занимает своевременный сбор, обработка и передача текстовой информации, извлекаемой в ходе переработки различных материалов военно-специального характера, в том числе и научно-технических текстов [129,241. Основным направлением поиска способов оптимизации процесса автоматизированного извлечения текстовой информации в двуязычной ситуации является создание систем машинного перевода (СМП), которые могли бы осуществлять этот процесс с использованием минимума машинных программ и подпрограмм и оперативной памяти ЭВМ [129,33.
Необходимость минимизации количества интерпретируемых ЭВМ программ обусловлена тем, что зачастую военным лингвистам и инженерам приходится решать ту или иную задачу лингвистического и инженерного (математического) моделирования систем МП, предназначенных для эксплуатации в условиях различных ограничений на объем используемой оперативной памяти ЭВМ и на машинное время. Выходом в таких условиях эксплуатации ЭВМ является разработка систем МП, органично сочетающих принципы экономичности, автономности и компактности.
На нынешнем этапе развития отечественного МП с английского языка на русский военно-специальных, военно-технических и научно-технических текстов наиболее полно этим принципам отвечают автономные информационно-лингвистические системы (АИЛС) MA0C-I и МАОС-2, созданные Л.Л. Нелюбиным (см. [773, [1263, 11273, [1283, [1293 , [1303).
Данное исследование выполнено в рамках разработанной Л.Л. Нелюбиным стратегии построения систем ограниченного МП документов и текстов, ориентированных на конкретный подъязык, которая в наибольшей степени соответствует теории и передовому опыту инженерной лингвистики у нас в стране и за рубежом ( ср. Г135,53).
Цели и задачи исследования. Цель работы заключалась в разработке действующей системы МП с английского языка на русский текстов микроподъязыка антенно-фидерных устройств . С учетом прагматики конкретного заказчика (один из ввузов) и исходя из необходимости вести разработку системы, предназначенной для работы в условиях ограничений на объем оперативной памяти ЭВМ и на машинное время, было решено строить систему МП на основе машинного словаря АМКОС (автоматизированный комбинированный машинный словарь) и одного алгоритма анализа и синтеза без использования в системе других алгоритмических процедур.
В ходе достижения цели исследования ставились и были решены следующие основные задачи: I) реализовать в эксплуатационном режиме систему МП с английского языка на русский текстов специального микроподъязыка антенно-фидерных устройств,для чего: а) составить на основе данных информационно-статистического и инженерно-лингвистического обследования ограниченного корпуса письменных текстов данного микроподъязыка машинный словарь словоформ и не-калькируемых многокомпонентных одноэлементных именных группа типа N-] + N2+.Nn (т.н. "готовых форм", (ср. Г1603); б) создать алгоритм анализа и синтеза калькируемых многокомпонентных одноэлементных именных групп (МОИГ) микроподъязыка и использовать его в качестве базового в системе МП; в) обеспечить эффективную эксплуатацию системы в условиях ограничений на объем используемой оперативной памяти ЭВМ за счет применения в выходной части АМКОС русских графических сокращении; г) разработать программное обеспечение системы; 2) дать краткий обзор путей и способов повышения эффективности отечественных систем МП в различных условиях эксплуатации ЭВМ; 3) рассмотреть этапы моделирования систем № с целью выявления и учета тех факторов, которые способствуют достижению высокой эффективности проектируемых систем МП и обеспечивают хорошее качество машинных переводов в различных режимах эксплуатации ЭВМ.
Материал и предмет исследования. Материалом исследования послужили письменные тексты микроподъязыка антенно-фидерных устройств который является составной частью базового подъязыка радиотехники и радиоэлектроники. Он характеризуется устойчивостью основных понятий и, соответственно, терминологии, его структура отличается четкостью, ясностью, логичностью С130,Ш.
Объем выборки составили 150000 словоупотреблений. Обследование проводилось на ЭВМ ДОС/ЕС 1020 по методике, принятой в группе "Статистика речи", и по программам , составленным автором.
Общий частотный список для всего обследованного корпуса составили 4371 словоформа. Покрываемость вероятностных рабочих текстов исследуемого микроподъязыка составляет 0,91, что с практической точки зрения обеспечивает получение машинных переводов такого качества, которое удовлетворяет информационным запросам конкретного потребителя.
На лексическом уровне тексты микроподъязыка антенно-фидерных устройств отличаются насыщенностью отраслевой терминологией (терминами являются 64% частотного списка словоформ, из них 65% - отраслевые) (ср. П35, 1043). Микроподъязык характеризуется широким использованием в нем цифр, сокращений, условных обозначений, формул и эпонимов (ок. 21% всех словоупотреблений; ср. [135, I08-II03)
Основное терминологическое ядро микроподъязыка составляют имена существительные и именные группы, в основном одноэлементные типа n + Nn (13% объема выборки), которые наряду с их переводными схемами на русский язык и являются основным предметом данного исследования. При моделировании системы МП на основе базового алгоритма анализа и синтеза многокомпонентных одноэлементных именных групп (МОИГ) типа и +и2+ . л>гп мы исходили из того, что любой английский научно-технический и военно-специальный текст носит номинативный характер, а основными единицами номинации в нем вместе с существительными выступают свободные и связанные терминологические субстантивированные словосочетания типа к +и2+ .и . В одной из двух [343, [1973 специальных работ, посвященных проблематике автоматизированного анализа и синтеза английских терминологических субстантированных словосочетаний (именных групп) указывается на то, что в семантической структуре английских препозитивных словосочетаний типа ц +ж2+.ип наблюдается определенная регулярность ( [197,433). На основе учета особенностей структурно-семантической и синтаксической компоновки таких образований нам удалось практически реализовать универсальный алгоритм их анализа и синтеза.
Имеется ряд теоретических исследований (напр.: [341, [791, [891, [1121, [1191, CI351, [1531), в которых обосновывается возможность создания универсального алгоритма анализа и синтеза различных именных групп. Однако предлагаемые варианты таких алгоритмов основываются на использовании громоздких и емких с точки зрения памяти ЭВМ семантико-синтаксических процедур, в связи с чем они практически не применяются в действующих отечественных системах МП.
Предложенный наш алгоритм ориентирован на переработку ИГ типа N + ы2+#.и по одной (для каждого вида ИГ этого типа) переводной схеме с частичным использованием на этапе переноса исходного текста на машинный носитель информации и его сегментации процедуры пермутации компонентов, конституирующих именную группу.
Задача разработки универсального алгоритма анализа и синтеза МОИГ (УААС МОИГ) повлекла за собой необходимость осуществления анализа микроподъязыка антенно-фидерных устройств для выделения ИГ типа n1 + U2+. Nn . Из обследованного корпуса в 150000 с/у выделено 5138 таких ИГ. Данные их распределения по количеству компонентов приведены в таблице I.
Таблица I
Распределение ИГ по числу компонентов
Количество и % от общего числа Число компонентов
2 3 4 5 6
4551 470 56 7 2
89,3!: % 9,20% 1,395 Б 0,12% 0,04%
Научная новизна и практическая ценность работы.
До настоящего времени вопросы повышения эффективности систем Ш и улучшения качества машинных переводов рассматривались либо как частные при решении глобальных теоретических проблем МП, либо изолированно для отдельных этапов моделирования систем МП (ГШ, Ш23, Ш9], П493, [1623 , 11743, П933). По имеющимся у нас сведениям, пока нет ни одной специальной работы, посвященной детальному описанию методики поэтапного достижения высокой эффективности лексических систем Ш на примере действующих систем. Данная работа призвана в определенной степени восполнить этот пробел.
На сегодняшний день в целом уже наметились основные тенденции дальнейшего совершенствования отечественных систем МП, главными из которых следует считать разработку систем МП для ограниченного МП документов и достижение семантико-синтаксического уровня машинных переводов (ср. [323, Г343 , Г823 , [893, [135], [1493 , CI553, [1693 , [1973). Тем не менее на современном этапе развития МП актуальными остаются и вопросы повышения эффективности уже созданных действующих систем лексического МП. Здесь основные возможности лежат в области дальнейшей формализации процедур анализа и синтеза именных групп. Об этом свидетельствуют результаты и выводы, содержащиеся в исследованиях и публикациях, в той или иной мере касающихся проблем автоматизации переработки различных типов именных групп, функционирующих в реальных научно-технических текстах (см., напр.: [93, ГШ, CI43, [323, t823, [1143, П583, [1683 , [1983).
В данной работе впервые предлагается строить действующую систему МП на базе универсального алгоритма анализа и синтеза многокомпонентных одноэлементных именных групп типа ^ + и2+. Nn« Реализация этого алгоритма становится возможной и эффективной благодаря использованию в системе МП особо организованного машинного словаря АМКОС. Словарь АМКОС, продолжающий традицию машинных словарей МАОС, представляет собой автоматизированный словарь комбинированного типа, в котором такие лексические единицы, как словоформы и словосочетания, располагаются в одном блоке. Впервые в практике отечественного МП в состав словаря введен АС т.н."готовых форм" микроподъязыка (по терминологии 1135,161-1623 некалькируе-мых ИГ), который выступает в качестве "внешнего" АС системы МП.
Также впервые в выходной части АМКОС применена система русских графических сокращений, что обеспечивает возможность осуществления автоматизированной переработки текстов без использования грамматических алгоритмов синтеза.
Новым является также и материал исследования, выбор которого был определен практическими нуждами заказчика.
Некоторые исследователи (1263, [793, [129], [1973) считают, что действующая система МП может создаваться исключительно на базе особо организованных машинных словарей, которые позволяют свести к минимуму процедуру морфологического, синтаксического и семантического анализа и синтеза. Однако следует отметить, что несмотря на появившуюся с внедрением в повседневную жизнь ЭВМ третьего поколения возможность создавать и реализовывать МС различных типов и назначений, их объем будет всегда обусловливаться конкретными условиями эксплуатации ЭВМ. Практика говорит о том, что лишь в некоторых случаях в распоряжении военного лингвиста-разработчика той или иной СМП будет находиться вся ЭВМ. В условиях всякого рода ограничений на режим ее эксплуатации на первый план выступает фактор максимального учета прагматики потребителя. Это положение не раз - высказывалось в лингвистической литературе (см.: [253, [873, [1123,
1293, [1523, [1533), однако в попытках создать "идеальные" системы МП многие специалисты, увлеченные теоретическими аспектами МП, не уделяют ему должного внимания. В нашей работе предпринимается попытка показать, что максимальный учет прагматики потребителя на всех этапах моделирования системы МП обеспечивает возможность повышения ее эффективности.
Практическая значимость и достоверность результатов исследования заключается в том, что в итоге лингво-статистического и инженерно-информационного обследования микроподъязыка антенно-фи-дерных устройство создана модель текстов данного микроподъязыка, послужившая основой для создания действующей системы МП, работающей в эксплуатационном режиме в одном из ввузов.
Материалы алфавитно-частотного словаря микроподъязыка и словаря МОИ, а также фрагменты обследованных текстов с реально функционирующими в них переводными схемами ИГ используются в преподавании курса военно-технического перевода в ВКИ. Они могут эффективно применяться для составления тезаурусов по антенно-волновод-ной технике.
Методика исследования определялась задачами работы, ее в основном практической направленностью, конкретностью предмета исследования. На разных этапах использовались различные методы и способы исследования, среди которых основными были метод "личного опыта", опрос информантов-специалистов, функционально-коммуникативный, структурно-организационный и системный анализ предмета исследования, а также методика количественных и качественных оценок. В работе учтены данные обратной связи между разработчиками системы и потребителем.
Основные теоретические положения, выносимые на защиту, заключаются в следующем:
1. Наиболее эффективно лексические системы МП английских научно-технических текстов на русский язык строятся по методике,разработанной Л.Л.Нелюбиным и реализованной в принципах М/ЮС. Система МП создается для обслуживания конкретного подъязыка, который должен удовлетворять требованиям полноты, конечности и формальной ограниченности, предъявляемым к малым лингвостилистическим подсистемам (микроподъязыкам).
2. Создание любой системы МП требует максимального учета специфики и прагматики заказчика и потребителя МП. Учет этих факторов позволяет построить систему МП, успешно функционирующую в различных режимах эксплуатации ЭВМ.
3. Система лексического МП с английского языка на русских научно-технических текстов может создаваться на базе одного алгоритма и, в частности, на основе универсального алгоритма анализа и синтеза многокомпонентных именных групп типа н + и2 + . Nn.
4. Эффективная работа универсального алгоритма и всей системы МП обеспечивается использованием в системе машинного словаря, в выходной части которого применена система русских графических сокращений. В условиях ограничений на режим эксплуатации ЭВМ и на объем ее памяти сокращения позволяют многократно уменьшить потребный для решения переводческих задач объем оперативной памяти ЭВМ, отказаться от применения в системе МП грамматических и синтаксических алгоритмов, обеспечивая тем самым экономную эксплуатацию ЭВМ при удовлетворительном качестве машинных переводов.
5. Основным средством расчлененной номинации в английском научно-техническом тексте выступают свободные и связанные терминологические именные группы типа и + n2 + . . Качество машинных переводов в значительной мере определяется характером процедур переработки именно этих ИГ. Для повышения эффективности системы № и улучшения качества машинных переводов необходимо использовать АС некалькируемых ИГ этого типа, функционирующих в микроподъязыке .
6. На современном этапе развития МП большая роль в обеспечении эффективности систем МП принадлежит человеку, и в первую очередь редакторам. Долю их участия в функционировании системы МП можно снизить за счет использования процедур перегруппировки элементов исходного текста, и в частности МОИГ, на этапе переноса ИГ на машиночитаемый документ. Для этого на этом этапе следует использовать лингвистов-перфораторщиков.
Структура работы. Композиционно диссертация состоит из введения, двух глав, заключения и приложений.
Заключение научной работыдиссертация на тему "Анализ и синтез многокомпонентных одноэлементных именных групп в действующей системе лексического машинного перевода и повышение её эффективности (на материале английского микроподъязыка антенно-фидерных устройств)"
выводы
Структурно-компонентный и смысловый анализ особенностей английских и русских МОИГ в исследованном подъязыке позволил нам прийти к следующим выводи:
1. Основным "ядерным" материалом МОИГ типа + и2 + исследованного подъязыка "Антенно-фидерные устройства" являются двухкомпонентные ИГ вида + n2.
2. Тот факт, что двухкомпонентные ИГ вида служат основой для ИГ с большим числом компонентов, диктует необходимость самого тщательного их изучения и рассмотрения с точки зрения понимания механизмов и закономерностей их образовани и функционирования в реальных научно-технических текстах.
3. Определенная регулярность в семантической структуре Иг вида k.j+n2 позволяет при строгой ориентации всей системы бинарного МП на удовлетворение специфических запросов потребителя значительно упростить и облегчить их переработку за счет применения специальной алгоритмической процедуры, обеспечивающей хорошее качество переводов в условиях ограниченного объема памяти ЭВМ и недостатка машинного времени.
4. С этой целью нами предложен и реализован универсальный алгоритм анализа и синтеза многокомпонентных одноэлементных именных групп (УААС МОИГ), универсальность которого заключается в том,что все ИГ той или иной категории перерабатываются по одной переводной схеме. ИГ вида N.j+:isr2 перерабатываются по схеме Ng+ir^ , вида 1\Г1 + n2 + по схеме + Ni+1T2 ' виДа Ni+N2+1T3+N4 по мо~ дели + + Nr> . ИГ с большим числом компонентов перерабатываются вручную.
5. Особенностью предложенной СШ является использование в ней особого автоматизированного словаря - АС "готовых форм". АС "готовых форм" по своему функциональному предназначению не отличается от традиционных АС оборотов, однако он включает лишь те двухкомпонентные ИГ вида i^+Ng , которые не могут быть переработаны прямым приложением УААС МОИГ. Включенные в АС "готовых форм" получают в системе статус существительного и перерабатываются как одно словоупотребление.
6. Реализация универсального алгоритма анализа и синтеза МОИГ была бы затруднена без использования в нашей СМП широкой системы русских графических сокращений. Применение сокращений в выходном тексте позволяет в несколько раз сократить объем потребной для записи JIE оперативной памяти ЭВМ. Оно позволяет отказаться от использования в системе МП грамматической информации (за исключением данных о принадлежности к тому или иному грамматическому классу) , что дает дальнейшую экономию памяти ЭВМ.
7. В созданной нами СМП машинный словарь АМКОС, состоящий из нескольких блоков - МС общеупотребительной и специальной лексики , АС "готовых форм", благодаря своему объему и качеству сам является инструментом синтаксического и семантического анализа. Учет в МС большинства актуализированных значений терминологических единиц исследованного подъязыка позволил включить в выходную часть МС лишь один конфронт для каждой входной ЛЕ. Отказ от применения в СМП семантико-синтаксической информации еще более повышает ее эффективность, практически не сказываясь на качестве получаемых машинных переводов.
8. К недостаткам разработанной СМП можно отнести то, что значительная роль в ней отводится человеку. Процесс оптимизации речевого сообщения в системе начинается на этапе переноса исходного текста на МНИ (перфокарту). СШ предназначается для использования в специальных условиях эксплуатации, поэтому у обслуживающего ее персонала появляется ряд дополнительных функций. Во-первых, перенос исходного текста на перфокарты осуществляется специалистом-лингвистом, имеющим полное представление о всех процедурах переработки информации в СШ. На данном этапе в его задачу входит сегментирование текста, т.е. выделение (пробелами) "готовых форм" (на базе распечатки АС "готовых форм"). Им же осуществляется "выбраковка" тех элементов исходного текста, которые являются плеонастическими с точки зрения перевода. Во-вторых, на этапе интер-и постредактирования у редактора появляется дополнительная обязанность "расшифровки" и "доводки" сокращений.
9. Созданная нами СШ ориентирована на потребителя, владеющего английским языком в степени, достаточной для того, чтобы проследить основные синтаксические связи входного текста.
Нами делается допущение о том, что, являясь носителями русского языка, потребители смогут быстро преодолеть те трудности, которые в некоторых случаях может представлять расшифровка сокращений в выходных текстах.
10. Общая ориентация нашей СШ на переработку главным образом МОИГ, являющихся основным средством номинации в английских научно-технических текстах, предопределила выбор в качестве предмета данного исследования различные типы выделенных в обследованном корпусе ЛЕ подъязыка одноэлементных ИГ (вида ). В этой связи мы считаем целесообразным включить в содержание выводов те количественные характеристики, которые были выделены в ходе процесса категориальной атрибуции той или иной группы ИГ.
1) Основным переводным соответствием исходным ИГ вида является переводная схема N2+it1 (3812 ИГ, 85,41%). Перевод остальных ИГ этого вида (729) осуществляется по 9 другим схемам. Несмотря на это, благодаря использованию в выходной части АМКОС графических сокращений к большинству из этих ИГ также может быть приложен УААС. Получаемые конфронты вполне удовлетворяют информационные запросы специалистов. В результате структурно-компонентного анализа выделено 1,93% двухкомпонентных ИГ, по тем или иным соображениям подлежащих включению в АС "готовых форм".
2) Базовой переводной схемой МОИГ "вида N^+Ng+N^ является в нашей СМП модель N^+N-j+Ng , по которой из 470 выделенных в подъязыке ИГ вышеуказэнного типа перерабатываются 4,74% ИГ. Кроме того, еще 21,06% ИГ, перерабатываемых по схеме Ad^+N^+Ng , можно отнести к этой же категории, так как использование сокращенной записи ЛЕ практически не позволяет дифференцировать субстантивированные прилагательные, выступающие в роли ^ . Остальные ИГ этой категории перерабатываются по 25 различным переводным схемам. Их машинная переработка с применением УААС МОИГ становится возможной за счет осуществления в ходе их переноса на перфокарты той или иной процедуры трансформации (в основном трансформации пер-мутации с использованием предлога " of ", 43,23% именных групп).
Машинную переработку целого ряда именных групп типа l^+i^+lT^ в значительной мере облегчает применение в выходной части МС графических сокращений. Так, благодаря им становится возможным прямое приложение универсального алгоритма анализа и синтеза многокомпонентных именных групп еще к 29,75% ИГ.
Помимо использования в трансформациях предлога "of в 3 случаях отмечается необходимость применения в трансформации предлога " for а в одном случае - " in" (0,70%).
С привлечением АС "готовых форм" перерабатывается 2,44% ИГ, 0,7Э%требуют редакторской доводки.
3) Рассмотрение четырехкомпонентных одноэлементных именных групп типа W-j+ltfg+H^+H^ говорит о том, что за исключением 3,61% ИГ, остальные представляют собой комбинацию из двух двухкомпонентных ИГ типа N+N . При их переносе на машинный носитель информации требуется осуществление трансформации пермутации конституирующих их двухкомпонентных ИГ с использованием предлога "of ". В этом случае переработка 50,0 ИГ этой группы осуществляется непосредственным приложением универсального алгоритма анализа и синтеза; при машинной переработке 39,29% ИГ необходимо обращение к АС "готовых форм".
4) Именные группы с большим числом компонентов обрабатываются вручную.
ЗАКЛЮЧЕНИЕ
Проблематика машинного перевода как составной части глобальных проблем инженерного приложения языкознания характеризуется возрастанием интереса к созданию практических систем машинного перевода, способных осуществлять семантический Ж. Основу таких систем МП должна составить единая база лингвистических и экцип-лопедических данных с элементами ее управления. На этом пути МП по своим возможностям будет более и более сближаться с такими кибернетическими системами, как всякого рода автоматизированные диалоговые системы и лингвистические автоматы (ЛА), в той или иной степени моделирующими мыслительно-познавательную деятельность человека.
Практическая реализация семантико-синтаксических систем МП предполагает решение не только разнообразных технологических задач, сложность которых находится в прямой зависимости от того уровня МП, на достижение которого ориентируется СМП, но и целого ряда общетеоретических проблем, связанных в первую очередь с такими содержательными аспектами языка, как асимметрия языкового знака. Такие СМП будут представлять собой сложные многоуровневые образования со строго иерархическим размещением модульных переводческих блоков. С расширением эвристических возможностей ЭВМ эта система будет пополняться все новыми лингвистическими и экстралингвистическими данными, которые повлекут за собой дальнейшее усложнение СМП, потребуют все новых и больших объемов памяти ЭВМ. Сложность такого естественного образования, как человеческий язык, позволяет предположить, что процесс совершенствования существующих и будущих систем МП с одного ЕЯ на другой имеет непрерывный характер.
Наряду с общеметодологическими проблемами в ходе создания действующих СМ решаются частные задачи, связанные с передачей в ведение ЭВМ таких трудоемких процессов человеческой деятельности, как перевод научно-технической литературы с одного языка на другой. Подчас этот аспект МП представляет собой большие трудности, чем построение общих лингвистических моделей, направленных на теоретическое обоснование преимуществ того или иного подхода к решению проблем МП.
Избрав путь рассмотрения тех практических задач, которые неизбежно встретит исследователь-лингвист в процессе создания действующей лексической СМП, мы стремились по мере наших возможностей охарактеризовать те трудности, которые црисущи тому или иному этапу этого процесса, взяв за основу опыт, накопленный создателями отечественных лексических СМП. На примере СМП, ориентированной на автоматизированную переработку оперативной научно-технической литературы и документации английского подъязыка антенно-фидерных устройств в условиях ограничений на машинное время и объем памяти ЭВМ, мы стремились показать, что самый тщательный учет таких факторов, как требования и прагматика потребителя, его языковая.компетенция, позволяет за счет максимальной формализации процедур перевода и использования тех или иных лингвистических приемов повысить эффективность всей СМП и добиться хорошего качества машинных переводов.
В этих целях был проведен анализ тех путей и способой, которые используются на этапах моделирования отечественных СМП с целью обеспечения их высокой эффективности и хорошего качества машинных переводов, рассмотрены те факторы, которые играют решающую роль в дальнейшем улучшении этих параметров систем МП, описаны основные действующие и некоторые экспериментальные СШ с точки зрения демонстрации конкретного воплощения в них тех приемов и способов, которые ведут к улучшению эффективности и качества, представлены алгоритмы синтаксического и семантического анализа, которые предполагается использовать в системах семантического Ш. В качестве основной мы видели свою задачу в том, чтобы обосновать возможность использования при машинной переработке английских ИГ вида •. Жп универсального алгоритма их анализа и синтеза. Нами показана практическая реализация этой возможности в виде созданного и апробированного универсального алгоритма анализа и синтеза многокомпонентных одноэлементных именных групп подъязыка антенно-фидерных устройств.
В отличие от ранее проводившихся исследований, в данной работе впервые приводятся результаты практического приложения вышеуказанного алгоритма к реально функционирующим в научно-техническом тексте ИГ вида U<j+1T2+. .и . Эта задача потребовала выявления таких образований. С этой целью была обследована генеральная совокупность текстов подъязыка объемом в 150000 с/у. В результате обследования нами было выделено 5138 ИГ вида x^+Hg+nyt-. .ип, в том числе двухкомпонентных - 4541, трехкомпонентных - 470, че-тырехкомпонентных - 56, пятикомпонентных - 7, шестикомпонентных -2.
Практическая реализация универсального алгоритма становится возможной в значительной степени благодаря использованию в выходной части МС системы графических сокращений со скобочными элементами. Например, из 729 двухкомпонентных именных групп, перерабатываемых по переводным схемам, отличным от базовой и2 + ^ > лишь 1,93% подлежат включению в АС "готовых форм".
Как уже говорилось, основу нашей системы МП составляет машинный словарь АМКОС, продолжающий собой традицию автоматизированных словарей МАОС* Также указывалось, что он включает в свой состав несколько МС, в том числе и АС "готовых форм". На самом же деле словарь состоит из двух блоков, один из которых представляет собой внутренний МС системы, предназначенный для записи в память ЭВМ и в котором словоформы и "готовые формы" (в общей сложности их 93) представлены в алфавитном порядке, и внешний АС, представляющий собой распечатку "готовых форм" микроподъязыка и предназначенный для использования в качестве справочника при переносе именных групп исходного текста на машинный носитель информации (перфокарты) .
Возможность переработки именных групп как одного словоупотребления обеспечивается наличием в современных ЭВМ ЕС специальных режимов для обработки лингвистических данных (напр., режим List ), а также достаточным форматом перфокарт, где для записи лингвистической информации используются 72 позиции.
Основным лингвистическим приемом повышения эффективности систем МП мы считаем использование в выходной части машинного словаря русских графических сокращений. Применение сокращений позволяет обойтись в системе МП минимумом морфологической информации, приписываемой входным единицам, а именно лишь указанием на принадлежность той или иной лексической единицы к определенному грамматическому классу слов. В нашей системе МП для этого используются натуральные числа от I до 8.
Алфавитное размещение в МС таких разноуровневых ЛЕ, как словоформы и словосочетания, их объединение в одном МС позволяет использовать АМКОС в качестве основного инструмента семантико-син-таксического анализа, осуществляемого в нашей системе МП,
Результаты нашего исследования позволяют нам сделать следующее заключение:
1. Основными факторами, обеспечивающими повышение эффективности лексических СМП и улучшение качества машинных переводов, являются: ориентация СМП на переработку текстов узкой преметной области; знание лингвистами тех ограничений, которые накладываются на ЕС при использовании ЭВМ для его переработки; учет прагматики потребителя, и я первую очередь определение того уровня синтаксической и семантической информации, который должен сохраняться в конфронтирующем тексте; использование оптимальных процедур в ходе лингво-статистической инвентаризации единиц того подъязыка, на который ориентируется система МП; максимальная формализация всех процессов алгоритмического этапа создания СМП, комбинированный способ представления словарных единиц машинного словаря; применение уже апробированной и закрепленной в ЕЯ системы графических сокращений в выходной части МС системы МП, осуществляющей перевод на русский язык; формирование и использование в системе словаря такого объема, который позволяет ему выступать в роли основного инструмента семантико-синтаксического анализа системы МП; открытость создаваемой системы, возможность ее пополнения, коррекции и исправления ошибок в МС.
2. Использование конкретных путей и способов оптимизации речевого сообщения с целью повышения эффективности систем МП и улучшения качества машинных переводов зависит от тех условий, в которых предусматривается эксплуатация ЭВМ.
В условиях ограничений объема выделяемой памяти ЭВМ и машинного времени система МП с английского языка на русский должна создаваться на базе специально организованных узкотематических МС с обязательным использованием в их выходной части русских графических сокращений. Дальнейшей оптимизации таких систем МП служит выявление "готовых форм", т.е. таких словосочетаний исследуемого подъязыка, которые не могут быть переработаны приложением к ним базового алгоритма СШ.
Базовый алгоритм лексической системы МП с английского языка на русский должен быть ориентирован на переработку ИГ вида ж ^ +и2+ + . .Nn, являющихся основным средством расчлененной номинации в английских научно-технических текстах. Именно такие ИГ вследствие сложности их семантической структуры представляют наибольшие трудности в переводе. Широкий диапазон их дистрибутивных моделей затрудняет возможность использования для их переработки единого алгоритма анализа и синтеза. Как свидетельствует наш опыт, такая возможность может быть реализована в том случае, если МС системы Ш строится на комбинированной основе, а в выходной его части используются русские графические сокращения.
Мы полагаем, что данное исследование может оказаться полезным дри упорядочении лексики и составлении возможно более полного словаря антенно-волноводной и антенно-фидерной терминологии (на основе созданных нами частотных и машинных словарей), при составлении учебных пособий по разделу "Радиоэлектроника" ■ в целях оптимизации процесса преподавания английского языка в ввузах, в различных пособиях по теории и практике военно-технического перевода.
Прикладной аспект работы заключается в том, что описанная в диссертации система МП практически реализована и используется в эксплуатационном режиме в одном из ввузов для переработки рабочих текстов подъязыка антенно-фидерных устройств.
Список научной литературыИонов, Анатолий Иванович, диссертация по теме "Прикладная и математическая лингвистика"
1. Отчетный доклад Центрального Комитета КПСС ХХУ1 съезду Коммунистической партии Советского Союза и очередные задачи партии в области внутренней и внешней политики. М., 1981, с.56, 67-69.
2. Коммунист Вооруженных Сил СССР, 1983, № 10, с.12-13.
3. Абдуллаева П.А., Джилкибаева Г.М.,Москвина В.М. и др. Организация АС для машинного перевода. В кн.: СТОПИЛ, с.36.
4. Александров Г.П., Белоногов Г.Г. и др. Система автоматического синтаксического анализа русских текстов. НТИ, сер. 2, 1975, № 3, с.30.
5. Алексеев Д.И. Аббревиация в русском языке. АДД, Воронеж, 1977. - 32 с.
6. Алексеев Д.И. Сокращенные слова в русском языке. Саратов, 1979. - 328 с.
7. Алексеев П.М. Семантические частотные словари. В кн.: СТРААТ. Л., 1973, с.234.
8. Алексеев П.М. Квантитативная типология текста. АДД, Л., 1977. - 34 с.
9. Алянская Э.Я. Свертки и терминологические субституты многокомпонентных определительных терминологических словосочетаний. -АКД, Л., 1977. 20 с.
10. Андрклценко В.М., Бухштаб Д.А., Травкина Е.В. Автоматизированная система для получения двуязычных словарей и конкордансов duplex . В кн.: МСМП, с.40.
11. Аникина Н.В., Билан В.Н., Боркун М.Н. Об одном алгоритмесемантико-синтаксического машинного перевода. В кн.: МСМП, с.72.
12. Ануфриева И.А. и др. О формальном представлении лексических единиц в автоматическом словаре. В кн.: СПНТЛД, сЛ10.
13. Аполлонская Т.А., Иванова Н.М., Королева Т.Н. и др. Алгоритмы синтаксического анализа и синтеза текста в группе "Статистика речи". В кн.: МСМП, с.73-75.
14. Аполлонская Т.А. Семантико-синтаксический анализ именных словорм во французском языке. В кн.: Проблемы слова и словосочетания. Л., 1980, с.34-45.
15. Ахманова О.С. К вопросу об использовании электронно-вычислительных машин в лингвистическом исследовании. В кн.: Вопросы оптимизации естественных коммуникативных систем. М., 1977, с.151-199.
16. Ахманова О.С. 0 разграниченности слова и словосочетания. -АДЦ, М., 1954. 37 л.
17. Балабан М.А. Интерактивный МП как инструментальный комплекс для обучения языку. В кн.: МСМП, с.16-18.
18. Балашова Ю.Г. и др. Восходящий и нисходящий подходы при построении систем автоматизированной переработки текста (АПТ) в машинном переводе. В кн.: СПНТЛД, с.170.
19. Баранников А.П. Краткая грамматика хиндустани (урду). Ч. I. Морфология и словообразование. Л., 1926. - 112 с.
20. Баррон Д. Введение в языки программирования. М., 1980,с.17.
21. Бархударов Л.С., Колшанский Г.В. К вопросу о возможностях машинного перевода. ВЯ, 1958, № I, с.42.
22. Бархударов Л.С. Очерки по морфологии современного английского языка. М., 1975. - 156 с.
23. Бархударов I.С. Язык и перевод. Вопросы общей и частной теории перевода. М., 1975. - 239 с.
24. Бектаев К.Б., Бел оцерков екая Л.И., Борисевич А.Д. и др. Статистическое выделение русских машинных оборотов и построение двуязычных автоматических словарей. В кн.: СТРААТ, 1973, с.Ю7-130.
25. Бектаев К.Б., Садчикова П.В. Опытно-промышленная система лексического машинного перевода. В кн.: МСШ, с. 18.
26. Бектаев К.Б. Стратегия промышленного МП в чимкентской группе "Статистика речи". В кн.: ПТМИЛ, с.93.
27. Бектаев К.Б., Беляева Л.Н., Королева Т.Н. и др. Опыт машинного перевода английских и японских научных текстов. НТИ, сер. 2, 1981, № 5, с.29-31.
28. Белоногов Г.Г., Григорьев В.И., Котов Р.Г. Автоматическое лексическое кодирование сообщений. ВЯ, I960, № 4, с.НО.
29. Белоногов Г.Г., Пиотровский Р.Г. 0 машинном переводе. -Филол.науки, 1964, № I, с.26.
30. Белоногов Г.Г., Котов Р.Г. Автоматизированные информационно-поисковые системы. М., 1968. - 182 с.
31. Белоногов Г.Г. и др. Морфологический анализ слов на основе словаря словоформ. НТИ, сер.2, 1975, № 9, с.29.
32. Беляева Л.Н. Формальный анализ семантики составных терминов. В кн.: СТОПИЛ, с.41-47.• 33. Березин Ф.М., Головин Б.М. Общее языкознание. М., 1979, с.279-292.
33. Билан В.Н. Семантико-синтаксическое распознание английских двухномпонентных именных словосочетаний. АКД, Минск,1975.-.26 с.
34. Билан В.Н., Боркун, М.Н. Семантико-синтаксические аспекты МП. В кн.: АПТМПЛ, 1977, с.55.
35. Борисевич А.Д., Гончаренко В.В., Гречишкина В.И. и др. Кодирование грамматической информации в машинном словаре. В кн.: СТ, т.И. Автоматическая переработка текста. Минск, 1970, с.332-394.
36. Борисевич А.Д. Автоматический перевод английских строительных текстов. В кн.: ЛААТ, с.279-285.
37. Борисевич А.Д. Разрешение проблемы межъязыковой идиома-тичности при автоматической переработке текста. В кн.: ЛААТ, с.266-278.
38. Борисов В.В. Акронимия в современном английском языке.-ИЯВШ, 1970, № 6, с.63.
39. Борисов В.В. Аббревиация и акронимия. М., 1972. - 320 с.
40. Валуйцева И.И., Шахмайкин A.M., Рогова Л.И. О разрешении омографии и проблемах синтаксического анализа в системе МП АМПАР.-В кн.: ПТМИЯ, с.97-99.
41. Вертель В.А., Вертель Е.В., Крисевич B.C. и др. Автоматические словари в системе бинарного вероятностного МП. В кн.: Инженерная лингвистика. Уч. зап. ЛГПИ им. А.И. Герцена. Т. 458, чЛ, Л., 1971, с.4-16.
42. Вертель В.А. Выбор типа выходного автоматического словаря. В кн.: ЛААТ, с.383-392.
43. Виноградов В.В. Понятие внутренних законов развития языка в общей системе марксистского языкознания. ВЯ, 1952, № 2,с.33.
44. Власов А.Н. и др. О структуре немецкого АС смешанного типа для немецко-русского МП. В кн.: АПТМПЛ, 1977, с.66.
45. Власов А.Н., Марчук Ю.Н., Сильников А.Н. и др. Немецкий машинный словарь СМП НЕРПА и морфологический анализ. В кн.: МСМП, с.77.
46. Власов А.Н. и др. Грамматический анализ после перевода в системе НЕРПА. В кн.: СПНТДЦ, с.172.
47. Волошин Е.П. Аббревиатуры в лексической системе английского языка. АКД, М., 1967. - 26 с.
48. Вопросы терминологии. М., 1961, с.73.
49. Герасимов В.Н., Марчук Ю.Н. Машинный перевод в системе научно-технического перевода. В кн.: МСМП, с.4.
50. Гиляревский Р.С., Пробст М.А. Научные коммуникации, текст, перевод. В кн.: МСМП, с.21.
51. Головин Б.М. Язык и статистика.-М., 1971, с.19-24.
52. Гончаренко В.В. и др. Англо-русская морфологическая неадекватность и кодирование грамматической информации в АС. В кн.: АПТМПЛ, 197I, с.40.
53. Гончаренко В.В. Лексикографические, лингвостатистические и инженерно-лингвистические вопросы построения автоматического словаря. АКД, Кишинев, 1972, с.9-19.
54. Гончаренко В.В., Крисевич B.C. Системный подход к решению проблемы МП. В кн.: АПТМПЛ, 1977, с.16-19.
55. Гончаренко В.В., Король И.А., Котельникова Н.М. и др. Система лексико-синтаксического машинного перевода научно-технических текстов. В кн.: ПТМИЛ, с.109.
56. Городецкий Б.Ю., Раскин В.В. Методы семантического исследования ограниченного подъязыка. М., 1972. - 414 с.
57. Городецкий Б.Ю., Актуальные проблемы прикладной лингвистики. В кн.: Новое в зарубежной лингвистике. Вып. ХП, М.,1983,с.5—22.
58. Гущина Т.В., Колушева Л.П., Руднев Е.А. АС для семантического перевода и совершенствование АС для МП. В кн.: ПТМИЛ, с.121-123.
59. Гяч Н.В. Вопросы лексической аббревиации.-АДЦ,.Л., 1971.- 28 с.
60. Добрускина Э.М. и др. Автоматическая переработка машинных оборотов при немецко-русском МП. В кн.: АПТМПЛ, 1977, с.45.
61. Добрускина Э.М. и др. Автоматическое выделение группы сказуемого в немецком предложении. В кн.: АПТМПЛ,1977, с.49.
62. Драмбян Л.В., Тихомиров Б.Д., Семенова Е.К. и др. Структура программного обеспечения и режимы работы системы АМПАР. В кн.:'МСМП, с.44-45.
63. Ежов А.С., Кулешова О.Д., Матюшенкова Н.Н. и др. Лингвистические основы морфологического синтеза в системе машинного перевода АМПАР. В кн.: МСМП, с.89-91.
64. Звегинцев В.А. Теоретическая и прикладная лингвистика. -М., 1968. 336 с.
65. Звегинцев В.А. Язык и лингвистическая теория. М.,1973.- 248 с.
66. Здорных Т.А., Смирнова Н.А., Убин И.И. Отбор лексики и структура словарной статьи автоматического словаря (АС). В кн.: МСМП, с.136-137.
67. Земская Е.А. Современный русский язык. Словообразование.-М., 1973. 304 с.
68. Зубов А.В. Обработка на ЕС ЭВМ текстов естественных языков. Минск, 1977. - 173 с.
69. Зубов А.В. АС для решения интеллектуальных задач. В кн.:1. АПММПЛ, 1977. с.64.
70. Зубов А.В. Программирование лингвистических задач на языке ПЛ/1. Шнек, 1978. - 120 с.
71. Зубов А.В. Автоматический словарь с нежесткими связями.-В кн.: МСМП, с.138.
72. Ингве В.Г. Синтаксис и проблема многозначности. В кн.: Машинный перевод. М., 1957, с.281-304.
73. Караулов Ю.Н.,Молчанов В.И., Афанасьев В.А., Михалев Н.В. Анализ метаязыка словаря с помощью ЭВМ. М.,1982. - 96 с.
74. Карпилович Т.П. Автоматический анализ технического текста путем построения семантических моделей. В кн.: МСМП, с.94.
75. Карпилович Т.П. Автоматическое порождение предложений на основе детерминированных и вероятностных правил. В кн.: СТОПИЛ, с.76.
76. Клюкин А.Н.,Нелюбин Л.Л. Структурная организация и принципы работы МАОС-2. В кн.: Методы анализа текстов. М., 1975,с. 109.
77. Клюкин А.Н. Основные принципы построения АИЛС МП. В кн.: АПТМПЛ, 1977, с.20.
78. Клюкин А.Н. Автономная информационно-лингвистическая система обработки информации в условиях двуязычной ситуации. -АКД, М., 1978. 21 с.
79. Колгушкин А.Н. Лингвистика в военном деле. М., 1970.179 с.
80. Кондаков Н.И. Логический словарь. М., 1971, с.24.
81. Кондратьева Ю.Н. О применении семантики для выбора структуры перевода именных словосочетаний на материале английских текстов по вычислительной технике. В кн.: СТОПИЛ, с.81-83.
82. Коровина Т.И. Синтез русских именных словоформ с помощью ЭВМ. НТИ, сер. 2, 1975, № 3, с.22-28.
83. Котов Р.Г. Прикладные лингвистические задачи в информационном и специальном математическом обеспечении автоматизированных систем управления (АСУ). В кн.: Всесоюзная конференция по теоретическим вопросам языкознания. М., 1974, с.239-243.
84. Котов Р.Г. Лингвистика и современное состояние машинного перевода. ВЯ, 1976, № 5, с.37, 49.
85. Котов Р.Г. Лингвистические аспекты автоматизированных систем управления. М., 1977. - 167 с.
86. Котов Р.Г. Машинный перевод в системе научно-технической информации. В кн.: МСМП, с.25.
87. Котов Р.Г., Якушин Б.В. Языки информационных систем. -М., 1979. 304 с.
88. Котов Р.Г., Марчук Ю.Н., Нелюбин Л.Л. Машинный перевод в начале 80-х годов. ВЯ, 1983, № I, с.31-38.
89. Кравец Л.Г. Именные словосочетания в английских специальных текстах. АКД, М., 1964. - 19 с.
90. Крисевич B.C. Организация и работа автоматического словаря для машинного перевода. В кн.: СТ, ч.П, с.314-330.
91. Крисевич B.C., Борисевич А.Д., Гончаренко В.В. Автоматические словари в системах АСУ и ИПС. В кн.: Лингвистическое обеспечение автоматизированных систем управления и информационно-поисковых систем. Тюмень, 1974, с.64-66.
92. Крисевич B.C., Лепешинский Н.А., Совпель И.В. Математическая модель системы МП и ее реализация. В кн.: МСМП, с.48.
93. Кулагина О.С. Исследования по машинному переводу. М., 1979. - 320 с.
94. Курбаков К.И. Кодирование и поиск информации в автоматическом словаре. М., 1968. - 248 с.
95. Латыпов Ч.Я. Атрибутивные словосочетания с номинативными компонентами в современном английском языке. АКД, М.,1968.- 18 с.
96. Лингвистические проблемы научно-технической терминологии.- М., 1970. 231 с.
97. Лингвостатистика и автоматический анализ текстов. -Шнек, 1974. 460 с.
98. Леонтьева Н.Н. Семантический компонент системы ФРАП. -В кн.: МСМП, с.100.
99. Леонтьева Н.Н., Никогосов С.Л. Принципы организации и основные компоненты системы ФРАП. В кн.: МСМП, с.102-104.
100. Ловцкий Е.Е., Коростылев Л.Ю. Графовые грамматики в прикладной лингвистике. В кн.: МСМП, с.104.
101. Ловцкий Е.Е. Словарь оборотов в системе АОТ. В кн.: СТОПИЛ, с.89.
102. Лукьяненков К.Ф. Об одном способе автоматического выявления лексической неоднородности текста. В кн.: ЛААТ, с.325-338.
103. Малевич О.Б., Кудряшов И.М., Коростелев Л.Ю. Реализация синтактико-семантического анализа в системе ФРАП. В кн.: ПТМИЛ, с.102.
104. Мартемьянов Ю.С., Смирнов И.П. Виды переводческих трудностей и типы автоматического перевода. В кн.: МСМП, с.26-30.
105. Марчук Ю.Н. Вычислительная лексикография. М., 1976.- 184 с.
106. Марчук Ю.Н., Власов А.Н. Основные принципы построения системы немецко-русского МП "НЕРПА". В кн.: АПТМПЛ, 1977,с.30-32.
107. Марчук Ю.Н. Лингвистические основания системы машинного перевода по переводным соответствиям. АДЦ, М., 1979. - 44 с.
108. Марчук Ю.Н., Власов А.Н. Основные принципы перевода в системе немецко-русского МП НЕРПА. В кн.: МСМП, с.НО.
109. НО. Марчук Ю.Н. Синтактико-семантический анализ в системе МП АМПАР. В кн.: МСМП, с.8.
110. Марчук Ю.Н. Лингвистическое обеспечение системы англорусского машинного перевода АМПАР-2. В кн.: СПНТЛД, с.188.
111. Марчук Ю.Н. Проблемы машинного перевода. М., 1983. - 233 с.
112. Матвеева Н.Н. Сопоставительный анализ атрибутивных словосочетаний с N и предлогом " of " в современном английском языке. АКД. Л., 1965. - 21 с.
113. Маторина Л.В. Использование словаря тезаурусного типа при переводе английских именных терминологических словосочетаний. -В кн.: СТОПИЛ, с.91-96.
114. Медникова Э.М., Шеляховская Л.А. К типологии аббревиатур. В кн.: Вопросы оптимализации естественных коммуникативных систем. - М., 1971. - с.107-123.
115. Мирам Г.Э., Петрова М.Б., Совпель И.В. О двух системах МП. В кн.: ПТМИЯ, с.ПО.
116. Михайлова И.В. Переработка ЕЯ с помощью фукнционально- ' матричной грамматики. В кн.: АПТМПЛ, с.29-32.
117. Михлин Г.З., Пиотровский Р.Г., Фрумкин В.А. О некоторых методах получения свернутых кодов слов. В кн.; ЛААТ, с.286-295.
118. Мкртчян Г.А. Исследование путей автоматизации специального словарного обеспечения перевода документации по вооружению ивоенной технике с русского на иностранные языки на материале русско-английского перевода. КД, М., 1978. - 190 л.
119. Мкртчян Г.А. 0 словарно-терминологическом обеспечении перевода. В кн.: МСМП, с.141.
120. Мкртчян Г.А., Нелюбин JI.JI. 0 некоторых особенностях научно-технической терминологии. В кн.: МСМП, с.143.
121. Могилевский Р.И. Аббревиация как лингвистическое явление. АКД, Тбилиси, 1966. - 32 с.122а. Монастырский И.М. Информационно-поисковая система. -М., 1983, с.51.
122. Морозов Н.Ф., Нелюбин JI.JI. Об одном алгоритме статистической обработки лингвистической информации. В кн.: Иностранные языки, № 9, М., 1973, с.56.
123. Нелюбин JI.JI. Порождающие трансформационные правила и модель компрессии на различных уровнях. В кн.: Проблемы моделирования языка. Ученые записки ТТУ, т.З, 2, № 228, Тарту, 1969,с.86.
124. Нелюбин JI.JI. Некоторые Т-правила порождения Н- и Д-фраз. В кн.: Иностранные языки, № 5. М., 1969, с.5-21.
125. Нелюбин JI.JI. Статистическое обследование лексики ограниченного военного подъязыка. В кн.: JIAAT, с. 178-190.
126. Нелюбин JI.JI. Частотный словарь словоформ подъязыка американских штабных документов. В кн.: ЛААТ, с.191-205.
127. Нелюбин JI.JI. Частотный англо-русский военный словарь -минимум. М., 1974. - 224 с.
128. Нелюбин JI.JI. Информационно-статистические и инженерно-лингвистические особенности языка и текста в условиях спецкоммуникации. ДЦ, М., 1974.-425 с.
129. Нелюбин Л.Л. Информационно-статистические и инженерно-лингвистические особенности языка и текста в условиях спецкоммуникации. АДЦ, Л., 1975. - 42 с.
130. Нелюбин Л.Л. Инженерно-лингвистическое моделирование ограниченного подъязыка. В кн.: АПТМПЛ, 1977, с.24.
131. Нелюбин Л.Л. Частотный русско-английский военный словарь-минимум. М., 1977. - 172 с.133'. Нелюбин Л.Л., Клюкин А.Н. МАОС-3 в комплексной системе АИЛС. В кн.: СТОПИЛ, с.24.
132. Нелюбин Л.Л. Перевод и формализующие характеристики текста. В кн.: СПНТЛД, с.17.
133. Нелюбин Л.Л. Перевод и прикладная лингвистика. М., 1983. - 208 с.
134. Никогосов С.Л., Ловцкий Е.Е., Коростылев Л.Ю., Ребец-кая Н.А. Программное обеспечение анализа в системе ФРАП. В кн.: МСМП, с.53.
135. Николаева Т.М. Синтез форм русских слов при машинном переводе. ПК, вып.5, 1961, с.263.
136. Новиков А.И. Содержательный анализ текста как один из этапов проектирования систем машинного перевода. В кн.: МСМП, с.118.
137. Овчаренко В.М. Формально-семантическая структура анлий-ских научно-технических терминов. АКД, М., 1966. - 20 с.
138. Окулич Н.Е. Немецко-русский автоматический словарь общеупотребительной лексики. В кн.: ЛААТ, с.354-382.
139. Павлов В.Г. Функционирование сокращений в современном немецком языке. АКД, М., 1970. - 21 с.
140. Пауль Г. Принципы истории языка. М., I960. - 499 с.
141. Пиотровский Р.Г. Размещение информации в слове. М., 1961. - с.16.
142. Пиотровский Р.Г. Информационно-статистические параметр ры языка. В кн.: Проблемы языкознания. -М., 1968. - с.105.
143. Пиотровский Р.Г. Информационные измерения языка. -Л., 1968, с.103.
144. Пиотровский Р.Г. От статистики текста к его автоматической переработке В кн.: ЧСАПЛТ, с.4.
145. Пиотровский Р.Г. Экстралингвистические и внутрилингви-стические вопросы при переработке текста в системе "человек-машина-человек". В кн.: Вопросы социальной лингвистики. Л., 1969, с.15.
146. Пиотровский Р.Г. Машинный перевод. В кн.: Проблемы структурной лингвистики, 1971. М., 1972, с.528.
147. Пиотровский Р.Г. Текст, машина, человек. Л., 1975. -327 с.
148. Пиотровский Р.Г., Бектаев К.Б., Пиотровская А.А. Математическая лингвистика. М., 1977. - 383 с.
149. Пиотровский Р.Г. Инженерная лингвистика и лингвистические автоматы. Вестник АН СССР, 1978, № 9, с.ПЗ-115.
150. Пиотровский Р.Г. Машинный перевод в группе "Статистика речи": результаты и перспективы. В кн.: МСМП, с.5.
151. Пиотровский Р.Г. Инженерная лингвистика и теория языка.- Л., 1979. 112 с.
152. Пиотровский Р.Г. Лингвистические аспекты "искусственного разума!! ВЯ, 1981, № 3, с.36.
153. Пиотровский Р.Г. Щерба Л.В. и прикладное языкознание.- В кн.: Теория языка, методы его исследования и преподавания.1. Л., 1981, с.187-191.
154. Потиха З.А. Лингвистические основы изучения русского словообразования в средней школе. АКД, Л., 1972. - 44 с.
155. Правила русской орфографии и пунктуации. М., 1956, § 116.
156. Приходько Л.П., Садчикова И.Н. Структура составных химических терминов в англо-русской переводной ситуации. В кн.: СТОПИЛ, с.108.
157. Пустовойтова Л.А. Статистическое моделирование лексики и семантики английского и русского«научно-технического текста. -АКД, Л., 1979. 19 с.
158. Резникова С.В. 0 некоторых видах именных групп в современном английском языке. АКД, М., 1972. - 23 с.
159. Розентулер И.В., Садчикова П.В. Структура группы подлежащего в англо-русской переводной ситуации. В кн.: СТОПИЛ, с Л12-113.
160. Рябцева Н.К. Автоматизация перевода и критерии его оценки. В кн.: СТОПИЛ, с.117-118.
161. Санкин А.А. Конструкция "прилагательное + существительное" в английской технической литературе. АКД, М., 1952. - 21 л.
162. Санников В.З. Очерк восточнославянской сравнительно-исторической лексикологии. М., 1975. - 65 с.
163. Сегаль М.М. Аббревиация и аббревиатуры в современном английском языке. АКД, Л., 1965. - 24 с.
164. Селищев A.M. Избранные труды. М., 1968. - 640 с.
165. Сердюков П.И. Оптимизация алгоритма поиска синтаксических связей. В кн.: МСМП, с.123-125.
166. Славина Л.А., Каменева З.М. Алгоритм перевода на русский язык одного типа английских терминологических сочетаний. -В кн.: JIAAT, с.339-353.
167. Славина JI.A. Математическое обеспечение семантических алгоритмов машинного перевода технических документов. В кн.: МСМП, с.59.
168. Скороходько Э.Ф. Вопросы перевода английской научно-технической литературы. Киев, 1963. - 91 с.
169. Смирницкий А.И. Очерки по сопоставительной грамматике русского и английского языка. М., 1975. - 378 с.
170. Совпель И.В. 0 компрессии информации в системах МП. -В кн.: АПТМПЛ, с.69.
171. Соколова Е.Г. Синтаксический анализ в системе ФРАП. -В кн.: МСМП, сЛ27.
172. Соколова С.В. Способ оценки качества работы системы автоматического перевода. В кн.: СТОПИЛ, с.121.
173. Тарасова Е.С., Хажинская М.С. Сопоставление некоторых принципов номинации в разноязычных терминосистемах. В кн.: СТОПИЛ, с.130-132.
174. Тихомиров Б.Д., Марчук Ю.Н., Убин И.И. Программная реализация интерредактирования в системах №. В кн.: АПТМПЛ, с.71.
175. Тихомиров Б.Д., Драмбян Л.В., Семенова Е.К. и др. 0 двух подходах к организации входных словарей в системах машинного перевода. В кн.: МСМП, с.63.
176. Тихомиров Б.Д. Особенности использования машинного перевода в системе научно-технической информации. В кн.: СТОПИЛ, с.132-134.
177. Тихонова Л.Н. Принципы создания проблемно-ориентированного тезауруса. АКД., Л., 1980. - 19 с.
178. Тихонова Н.Г. Использование синтаксическогю управления при грамматическом анализе в системе машинного перевода. В кн.: МСМП, с.129.
179. Трибис Л.И. Асимметрия языкового знака и автоматическая переработка текста. В кн.: ЛААТ, с.41-49.
180. Убин И.И., Тихонова Н.Г. Вспомогательные лексикографические работы при построении промышленных систем МП. В кн.: АПТМПЛ, 1977, с.62.
181. Убин И.И. Принципы построения многоязычного автоматического словаря. В кн.: МСМП, с.150-151.
182. Убин И.И. Тихонова Н.Г., Здорных Т.А. Автоматизированная система лексикографического обслуживания СЛОК. В кн.: МСМП, с.151-153.
183. Филлмор Ч. Дело о падеже. В кн.: Новое в зарубежной лингвистике. Вып. 10. М., 1981, с.369-495.
184. Хажинская МвС. Тезаурусное распознавание смысла научно-технических текстов. АКД, Л., 1978. - 24 с.
185. Хайлова И.М., Шаляпина З.М. Сегментация и морфологический анализ японского текста. В кн.: ПТМИЛ, с.67.
186. Цибахашвили Г.И. Морфологическая и синтаксическая аббревиация в русском и грузинском языках. АДЦ, Тбилиси, 1970.с. 39.
187. Циткина Ф.А. Некоторые особенности перевода и переводи-мости текстов подъязыка математической логики. КД, М., 1978. -213 с.
188. Чапник Е.И. Атрибутивные сочетания типа stone wall в современном английском языке. АКД, М., 1953. - 21 л.
189. Черных П.Я. Происхождение русского литературного языкаи письма. М., 1950. - 40 с.
190. Чижаковский В.А. Фразеология и машинный перевод. АКД, Кишинев, 1971. - 17 с.
191. Шаляпина З.М. 0 записи и организации лингвистической информации в связи с задачей синтаксического анализа текстов. -В кн.: АПТМПЛ, 1977, с.43.
192. Шевенко С.М. Лингвистические особенности японских научно-технических текстов. В кн.: МСМП, с.37.
193. Шингарева Е.А. Синтаксис, семантика и прагматика информационного языка объектно-признакового типа. АКД, Л., 1979. -21 с.
194. Шингарева Е.А. Алгоритм анализа и синтеза при машинном переводе. В кн.: СТОПИЛ, с.134-137.
195. Эмдина Ю.М. Автоматический анализ и перевод английских именных групп (на материале патентных текстов). КД, М., 1973.321 л.
196. Ярцева В.Н. Развитие национального литературного английского языка. М., 1969. - с.286.
197. Ястребова С.В. Словарь общеупотребительной лексики английского языка. В кн.: СТ, т.2, Шнек, 1970, с.615-640.
198. Bourne С.P., Ford D.P. A study of the Statistics of Letters in English Words. Information and Control, 1961, v.4, llo 1, pp.48-67.
199. Bruderer H. The Present State of Machine and Machine-Assisted Translation. OLB. V. 1, p. 529-556.
200. Chandioux J. Creation of a Second Generation System for Machine Translation of Technical Manuals. OLB. V. I, pp. 613-621.
201. Cooper W. The Storage Problem. MT, 1958, No 2, pp. 74-83.
202. Dostert B.H, User's Evaluation of Machine Translation. Calif., In-t of Technology, 1973. Юб p.
203. Frantz D.G. PL/1 Program to Assist the Comparative Linguist. Communications of the ACM, 197О, v. 13, No 15» PP. 353-356.
204. Garvin P.L. Language and Machines. In: International Science and Technology. 1967, pp. 66-67.
205. Harper H.E. Dictionary Problems in Machine Translation. Santa Monica (Calif.) Band Corp., 1961, pp. 6-15.
206. Hays D.G. Research Procedures in Machine Translation. Santa Monica (Calif.) Rand Corp., 1961, p. 52.
207. Hays D. G. Linguistics and the Future of Computation. -AFIPS Conf. Proc., 1973, v. 42, pp. 1-7.
208. Jordan S.R., Brown A.F., Hutton F.C. Computerized Russian Translation at ORNL. Journal of the American Society for Information Science, 1977, Jan., pp. 26-33.
209. Lon S.C., Kong L. Computer Translation of Chinese Scientific Journals. OLB. V. 1, pp. 631-645.
210. Pfafflin S.M. Evaluation of Machine Translation by Reading Comprehension Tests and Subjective Judgements. Mechanical Translation, I965, v. 8, No 2, pp. 2-8.
211. Sankoff D. Dictionary Structure and Probability Measures. Information and Control, 1971» v. 19, No 2, pp. 104-113.
212. Troike R. The Future of MT. American Journal of Computational Linguistics. Microfishe 51. The Finite String. 1976, Bd. 50, pp. 158-164.