автореферат диссертации по филологии, специальность ВАК РФ 10.02.21
диссертация на тему:
Трансфер в современных системах машинного перевода

  • Год: 2001
  • Автор научной работы: Новиков, Виктор Алексеевич
  • Ученая cтепень: кандидата филологических наук
  • Место защиты диссертации: Москва
  • Код cпециальности ВАК: 10.02.21
450 руб.
Диссертация по филологии на тему 'Трансфер в современных системах машинного перевода'

Оглавление научной работы автор диссертации — кандидата филологических наук Новиков, Виктор Алексеевич

Введение.

Глава 1. Типология СМП и место трансферных систем в классификациях СМП.

1.1 Трансфер и основные концепции машинного перевода.

1.2 Системы прямого перевода.

13 Трансферные системы.

1.4 Системы других типов.

1.4.1 Системы фразеологического перевода.

1.4.2 Системы смешанного типа.

1.5 Семантические СМП.

1.6 Характеристики трансфера.

1.6.1 Трансфер в мультиязыковых системах.

1.6.2 Модульность трансфера.

1.6.3 Связь трансфера с другими компонентами СМП, межэтапные интерфейсы.„

1.7 Новые технологии разработки программного обеспечения применительно к системам машинного перевода трансферного типа.

Выводы к главе 1.

Глава 2. Уровни трансфера.

2.1 Лексический трансфер.

2.1.1 Организация трансферного компонента.

2.2Синтаксический трансфер.

2.3 Типология переводных соответствий и трансфер.

Выводы к главе

Глава 3. Оценка трансфера в современных системах машинного перевода.

3.1 Методика оценки трансфера в современных СМП.

3.2 Причины ошибок.

3.3 Ошибки лексического трансфера.

3.4 Ошибки синтаксического трансфера.

Выводы к главе 3.

 

Введение диссертации2001 год, автореферат по филологии, Новиков, Виктор Алексеевич

Настоящая работа посвящена анализу и сравнительно-типологическому описанию современных систем машинного перевода в контексте наличия, способов организации и функционирования в них трансферного компонента, его характеристик.

Системы машинного перевода по праву считаются одним из основных приложений теорий искусственного интеллекта, его неотъемлемой частью. Они представляют собой один из многих способов устранения естественного языкового барьера наряду с классическим подходом к переводческой деятельности, созданием искусственных универсальных языков (например, Эсперанто). Однако машинный перевод обладает рядом черт, отличающихся от других способов преодоления языкового барьера. Машинный перевод превосходит остальные методы преодоления межъязыковых границ в оперативности и количестве информации, обрабатываемой за относительно короткое время. Что касается качества выполненных переводов, то классический перевод значительно превосходит в этом аспекте перевод автоматический. Несмотря на значительное превосходство по качеству, классический немашинный перевод стоит дороже перевода машинного в пересчете на единицу времени, что становится заметным фактором при переводе больших текстовых массивов.

Очень часто машинный перевод подвергается критике (иногда справедливой) за дороговизну исследований и разработки систем, кроме того, процесс создания системы достаточно долгий и кропотливый, где, как и при создании любого программного обеспечения, основные трудности возникают не на этапе теоретических исследований, моделирования, выработке концепций, а на этапе отладки системы, обнаружении ошибок и сбоев. При этом забывают, что подготовка квалифицированного переводчика — также процесс небыстрый и трудоемкий. Ведь недостаточно просто хорошо владеть родным и иностранными языками, чтобы осуществлять полноценную переводческую деятельность.

Значительное влияние на разработку систем машинного перевода оказывает и развитие коммуникационных технологий, и рост глобальной сети Интернет. Наряду с развитием сетевых технологий увеличиваются объемы и потоки информации, причем с ростом глобальных сетей (прежде всего Интернет) увеличиваются потоки разноязычной информации, подлежащей переводу. Кроме того, помимо лингвистических и информационных проблем современных СМП в данной работе проводится исследование новых тенденций в развитии лингвистического, математического и программного обеспечения современных СМП.

Выбор темы данного исследования обусловлен в первую очередь недостаточной степенью исследованности трансфера, одного из ключевых понятий архитектуры СМП, что в свою очередь, говорит об актуальности рассматриваемых в работе задач.

Научная новизна работы заключается в комплексном подходе к проблеме трансфера, с учетом его лингвистических, архитектурных и машинных характеристик. Впервые также осуществлен анализ СМП с количественной и качественной оценкой трансферных характеристик системы. Проанализированы СМП трансферного типа, работающие с русским, немецким и английским языками.

Целью работы является исследование компонента трансфера в современных СМП, его характеристик, способы разработки, эффективность, влияние качества работы трансфера на суммарную эффективность системы.

Дня достижения поставленной дели потребовалось разрешение следующих задач: изучение эволюции понятия «трансфер» с момента его появления по настоящий момент; изучение типологических описаний С МП, содержащих в своей основе признаки трансфера; выявление характеристик трансфера и их теоретическое обоснование; разработка методов составления трансферного компонента; анализ и типология трансферных ошибок, их связь с ошибками других типов, методы их прогнозирования и устранения; комплексный анализ трансфера в современных С МП.

Теоретический аспект данной работы заключается в определении лингвистических характеристик трансфера на двух этапах: машинном и предмашинном. Теоретическая значимость данного исследования заключается в возможности использования результатов исследования при разработке систем, содержащих трансферный компонент в явном виде. Также предполагается создание лингвистических программных инструментов для создания и дополнения трансферных словарей, на основе полученных результатов. В рамках исследования рассматриваются основные концепции и модели машинного перевода: перевод с интерлингвой, модель переводных соответствий и их разновидности. Предполагается рассмотреть все технологии машинного перевода, проанализировать их архитектурные и лингвистические особенности, выявить их взаимосвязь с трансфером, а также возможности комбинирования различных подходов к моделированию машинного перевода.

Практические задачи исследования направлены на разработку методов реализации теоретически обоснованных критериев создания и функционирования трансфера. Практическая ценность данной работы заключается в том, что на основе трансферных исследований можно воспользоваться методами отбора и составления переводных соответствий, методами архитектурного конструирования системы, а также более эффективно сочетать лингвистическое и программное обеспечение С МП, используя современные технологии проектирования и программирования, сетевых и коммуникационных технологий.

Исследование имеет два аспекта: исследование текстов на русском, немецком, английском языках, их анализ для организации трансфера, и сопоставительный анализ современных действующих трансферных систем машинного перевода. Материалом исследования стали более 200 небольших текстов на русском, немецком, английском языках, общим объемом около 30 ООО слов. Тематика текстов— общенаучная, компьютерные технологии, подъязыки компьютерных технологий: сети, микропроцессоры, операционные системы, базы данных, языки программирования, спецификации аппаратного обеспечения и программных протоколов и интерфейсов. Источником языкового материала послужила специальная литература, технические спецификации и документации, руководства по эксплуатации, а также тексты аналогичной тематики иноязычных ресурсов глобальной сети Интернет. Кроме того, объектом исследования стали действующие доступные системы машинного перевода: Promt, Stylus, Socrat, Power Translator, Systran, Transit, Спринт, Retrans, Ertrans.

Методами исследования послужили сопоставительные исследования лексики, принцип «черного ящика», метод аналогии, типологическое сопоставительное описание, разработана методика отбора из текстов переводных соответствий и методика количественно-качественной оценки эффективности трансфера.

На защиту выносятся следующие положения:

1. Трансфер в самом общем определении этого понятия применим практически к любой системе машинного перевода, если он представляет собой машинный перенос значения единицы входного языка на соответствующие единицы.

2. В основе трансферных СМП лежит модель переводных соответствий, трансфер осуществляет поиск и установление переводных соответствий.

3. Важную роль в разработке эффективных СМП играют новые компьютерные, коммуникационные и информационные технологии, новейшие технологии проектирования, разработки и распространения программного обеспечения. Особенно сильное влияние на развитие технологий машинного перевода оказывает глобальная сеть Интернет, ставшая также средой для разработки, тестирования и распространения систем машинного перевода.

4. Трансферный компонент СМП взаимодействует с другими этапами обработки текста при переводе, его эффективность зависит от корректного функционирования всех уровней анализа.

5. Ошибки, допускаемые системами машинного перевода на этапе трансфера, существенно влияют на суммарную эффективность лингвистического обеспечения системы машинного перевода.

 

Заключение научной работыдиссертация на тему "Трансфер в современных системах машинного перевода"

Выводы к главе 3:

Трансферные ошибки можно выделить в отдельный класс ошибок С МП, однако, отделить их от ошибок анализа и синтеза с большой долей вероятности без доступа к схемам и алгоритмам системы практически невозможно;

Ошибки трансфера также происходят на лексическом и синтаксическом уровнях;

Во всех видах соответствий допускаются ошибки и происходят сбои. Полная классификация трансферных ошибок:

1. Ошибки лексического трансфера в эквивалентных соответствиях; Причины: отсутствие данного соответствия в статическом описании, отсутствие соответствующей терминологии в выходном языке, как правило, эквивалентные соответствия представляют собой термины и их производные. Способы устранения: дополнение словарей, в том числе специализированных, приемы транслитерации, составление специальных терминологических словарей аббревиатур, и т.д.;

2. Ошибки лексического трансфера в вариантных соответствиях; Причины: недостаточная степень распознаванием СМП контекста, осложняется тесной взаимосвязью контекстов. Способы устранения: Более полное описание всех возможных случаев употребления данной структуры, исследование её поведения во всех микроконтекстах и смежных контекстах;

3. Ошибки лексического трансфера в трансформационных соответствиях.

Причины: недостаточная полнота или мотивированность описываемой трансформации.

Способы устранения: Всесторонне исследование необходимости, полноты и мотивированности данной трансформации;

4. Ошибки синтаксического трансфера в эквивалентных соответствиях;

5. Ошибки синтаксического трансфера в вариантных соответствиях;

6. Ошибки синтаксического трансфера в трансформационных соответствиях.

Заключение.

В результате проведенного исследования трансфера в современных системах машинного перевода можно сделать следующие выводы.

Трансфер является компонентом системы машинного перевода, выполняющим передачу значения формализованных структур входного языка формализованным структурам выходного языка. Трансфер взаимодействует с другими компонентами машинного перевода, получая данные о структуре языковой единицы входного языка и после цепочки преобразований передает необходимые данные и метаданные на последующие этапы синтеза. Для повышения структурированности СМП трансфер следует разделять на уровни:

Лексический трансфер;

Синтаксический трансфер.

Выделение морфологического трансфера и семантического трансфера в отдельные уровни не представляется целесообразным, так как оба эти уровня тесно связаны с уровнем лексики и синтаксиса, гораздо эффективнее передавать результаты морфологического и семантического анализа непосредственно на уровень лексического трансфера.

В основе концепции трансферных систем машинного перевода лежит модель переводных соответствий разного уровня и различной степени глубины. Основная задача этапа трансфера — алгоритмическое нахождение и установление этих соответствий в определенной языковой паре. Помимо бинарных трансферных пар возможна такая организация трансферного компонента, при которой перевод может быть осуществлен одновременно в рамках нескольких языков. Разработка и отладка мультиязыкового набора переводных соответствий, особенно эквивалентного типа, гораздо менее трудоемкая процедура по сравнению с разработкой отдельных бинарных пар.

Благодаря многочисленным преимуществам архитектуры трансферных систем по сравнению с системами других типов, трансферные СМП занимают на сегодняшний день лидирующие позиции в осуществлении автоматического перевода. Основными преимуществами трансферных систем по сравнению с системами прямого перевода: относительная гибкость лингвистического обеспечения, возможность добавления в систему новых правил, не нарушая структуру всей системы; более высокое качество перевода, достигающееся за счет применения более развитых формальных грамматик; более четкое регламентирование операций, выполняемых каждым этапом перевода.

Основные преимущества трансферных систем перед СМП с интерлингвой: более простая отладка системы; ориентация на прагматическое описание естественных языков, и, как следствие, относительно приемлемое качество перевода;

СМП с трансфером работают уже сейчас, они являются промышленной продукцией и коммерческим товаром, в то время, как СМП с интерлингвой остаются на уровне экспериментальных разработок и не дают сколько-нибудь внятного результата. Была разработана методика количественной и качественной оценки трансфера и получены практические результаты оценки трансфера в современных СМП.

 

Список научной литературыНовиков, Виктор Алексеевич, диссертация по теме "Прикладная и математическая лингвистика"

1. Андрейчикова О.Н. Разработка интеллектуального программного обеспечения для синтеза и анализа технических решений.// Математическое моделирование. — 2000. Т. 12 №6. С.56-61.

2. Апресян Ю.Д. Идеи и методы современной структурной лингвистики. М.: Просвещение, 1966, — 302 с.

3. Апресян Ю.Д. Лексическая семантика. Избранные труды Т.1. М.:Школа "Языки русской культуры", 1995. 472с.

4. Апресян, Ю.Д., Богуславский И.М., Иомдин, Л.Л., Лазурский, A.B., Митюшин, Л.Г., Санников, В.З., Цинман, Л.Л. Лингвистический процессор для сложных информационных систем. Москва. Наука, 1992, 256 с.

5. Бакулов А.Д., Леонтьева 1I.IL, Шаляпина З.М. Отечественные системы машинного перевода. В кн.: ИИ-90: Искусственный интеллект/ Справочник:/ Книга 1. Системы общения и экспертные системы. —М.: Радио и связь. — 1990. с. 248-261.

6. Белоногов Г.Г, Гиляревский Р.С, Егоров В.С, Хорошилов Ал-др.А, Шогин A.II. Системы фразеологического машинного перевода RETRANS и ERTRANS в сети Интернет.// Научно-техническая информация, серия 2, ВИНИТИ, №3, 2000.

7. Белоногов Г.Г, Зеленков ЮТ, Новоселов АЛ, Хорошилов Ал-др.А, Хорошилов Ал-с&й А. Метод аналогии а компьютерной лингаистике.// Научно-техническая информация, серия 2, ВИНИТИ, №1, 2000.

8. Боброва В.Я. Системы машинного перевода. Итоги Науки и техники. Сер. Информатика. — М.: ВИНИТИ.— 1990.—^Т.14.—с. 149178.

9. Бондарко A.B. Грамматическая категория и контекст.— М., 1971.

10. Вашунин B.C. Субстантивные сложные слова в немецком языке. М: Высшая школа, 1990. 184с.

11. Войнов В .К, Блехман М. С. Состав, методики разработки и эффективность действующих систем машинного перевода.—Харьков, ХГУ, 1987, 125 с.

12. Войнов В.К, Блехман М.С. Подсистема машинного перевода заголовков английских патентов но теме «Организация сельского хозяйства и его материально-техническая база». Минский Государственный Университет Иностранных Языков.

13. Есперсен О. Философия грамматики. М., 1924.

14. Зеленецкий А.Л, Монахов П.Ф. Сравнительная типология немецкого и русского языков.—М., «Просвещение». 1983, 240с.

15. Иомдин, JI.JI., Цинман, JI.J1. Лексические функции и машинный перевод. Труды Международного семинара Диалог'97 по компьютерной лингвистике и ее приложениям. Ясная Поляна, 10-15 июня 1997 г. Москва. 291-297с.

16. Капанадзе О.Г. Современные зарубежные системы машинного перевода.— М.: ВЦП,— 1989.— 102 с.

17. Когаловский М.Р. Систематика коллекций информационных ресурсов в электронных библиотеках.// Программирование. НомерЗ, май-июнь, 2000, с.31-52,

18. Королев Э.И. Промышленные системы машинного перевода.— М.: ВЦП, 1991.—100с.

19. Котов РТ\, Марчук Ю.Н., Нелюбин Л.Л. Машинный перевод в начале 80-х годов// Вестник языкознания.— 1983.—№1.— с.31-38.

20. Кузнецов A.M. Основания для сравнения в контрастивной семасиологии.— в кн.: «Методы сопоставительного изучения языков».— М,, Наука, 1988

21. Кулагина О.С. Исследования по машинному переводу. — М,:Наука.— 1979.— 320с.

22. Кулагина О.С. Машинный перевод: современное состояние// Семиотика и информатика.— М.,1989.— Вып. 29.— с. 5-33

23. Латышев JI.K. Курс перевода: эквивалентность и способы её достижения.— ML, Международные отношения, 1981.— 248 с.

24. Марчук Ю.Н. Об автоматизации составления схем перевода многозначных слов. Научно-техническая информация, ВИНИТИ АН СССР, №9,1964.-с.35-38.

25. Марчук Ю.Н., Моторин Ю.А. Основные принципы автоматизации перевода с английского языка на русский. Вопросы радиоэлектроники, серия ЭВТ, вып. 7, 1970.-—с. 11-19.

26. Марчук Ю.Н. Синтактико-семантический анализ в системе машинного перевода АМПАР. В кн. Международный семинар по машинному переводу (под ред. Марчука Ю.Н.). Тезисы докладов, М.:ВЦП, 1979,—с 8-9.

27. Марчук Ю.Н. Проблемы машинного перевода.— М.:Наука.— 1983.— 201с.

28. Марчук Ю.Н. Контекстологический словарь для машинного перевода многозначных слов с английского языка па русский.— М., ВЦП, 1976. Часть 1 с.264: часть 2, 256 с.

29. Марчук Ю.Н. Методы моделирования перевода, — М,: Наука. — 1985.—233 с.

30. Марчук Ю.Н. Математические методы в языкознании/ Обзор материалов конференции COLING-88.— М.:ИНИОН.—1990.-46с.

31. Марчук Ю.Н. Проблемы компьютерной лингвистики; Модель "текст-текст" и переводные соответствия в теории машинного перевода. Сборник научных статей. Минск 1997.— С.21-29.

32. Марчук Ю.Н. Основы компьютерной лингвистики. М.: Народный учитель.— 2000,— 227с.

33. Мельчук И.А. Русский язык в модели "смысл-текст". Москва-Вена-Школа "Языки русской культуры", 1995.— 682с.

34. Москалева И.П. Соотношение эксплицитных и имплицитных средств выражения модальных значений в немецком и русском языках.

35. Нелюбин JI.JI. Перевод и прикладная лингвистика. М.: Высшая школа, 1983.—207с.

36. Нелюбин Л.Л. Компьютерная лингвистика и машинный перевод. М.: ВЦП, 1991. — 152с.

37. Нелюбин Л.Л., Хухуни Г.Т. История и теория зарубежного перевода. Учебник, М.: МПУ, Издательство Сигнал, 1999.— 144с.

38. Нелюбин Л.Л., Хухуни Г.Т. История и теория перевода в России. Учебник, М.: МПУ, Издательство Сигнал, 1999.— 144с.

39. Новиков А.И. Применение денотатной структуры текста для перевода научно-технической литературы. — В кн.; Психолингвистические аспекты грамматики. М.- 1979.

40. Прохоров A.A. PROMT представляет новое поколение переводчиков. // Мир ПК, №9, 2000.

41. Рецкер Я.И. О закономерных соответствиях при переводе па родной язык. Теория и методика учебного перевода.— М.; 1950.

42. Рябцева НК, Текст как объект содержательного анализа и проблемы формализации перевода// Текст и перевод.— М., 1988.— с. 101-113.

43. Савосина Л.М Трансформационная парадигма предложения и её соотнесенность с актуализационной парадигмой. //В опросы языкознания, Наука, 2000.

44. Семенов А.Л. Контекстологический словарь основных терминов маркетинга.— М., ВЦП, 1994, 122с.

45. Супрун А.Е. Принципы сопоставительного изучения лексики, в кн.: «Методы сопоставительного изучения языков».— М., Наука, 1988

46. Убин И.И. Автоматический переводной словарь. Принципы построения. —М., ВЦП, 1989

47. Фефилов А.И. Основы конфронтационного анализа лексики немецкого и русского языков.

48. Хорошилов А.А Автоматизация составления и ведения словарей для систем фразеологического машинного перевода текстов с русского языка на английский и с английского на русский.

49. Шамис В. А. С++ Builder 3. Техника визуального программирования.—

50. Экспертные системы. Решение неформализованных задач в диалоге с ЭВМ. М.:Наука, 1987.— 288с.

51. Batori I., Weber H.J. Neue Anstze in Maschineller Spmchubersetzung: Wissenreprasentation und Textbezug. Niemeyer: Tuebingen, 1986.

52. Boitet K. Twelve Problems for Machine Translation // International Conference on Current Issues in Computational Linguistics University Sains Malaysia, Pengang, Malaysia, 1991 Proceedings,pp. 45-47.

53. Brown R. Example-Based Machine Translation in the Pangloss System. In Proceedings of the 16th International Conference on Computational Linguistics (COLING'96), 1996

54. Brown, D.R., Frederking, R. Applying Statistical English Language Modelling to Symbolic Machine Translation. Theoretical and Methodological Issues in Machine Translation. 1995.

55. Brown, P.F., Lai J.C., and Mercer, R.L. Aligning Sentences in Parallel Corpora. Proceedings of the 29th Annual Meeting of the ACL. 1991.

56. Brown P, Cocke J.; Delia Pietra S., Deila Pietra V, Jelinek F., Mercer R.L. and P.S. Roossin. A statistical approach to language translation, Computational Linguistics. 1990, vol 16, pp.79—85.

57. Carl M, A constructivist approach to Machine Translation. Proceedings ofNeMLaP3/CoNLL98. Sydney. 1998. Pp.247-256.

58. Carl, M., Iomdin, L.L., Streiter, О. Towards dynamic linkage of example-based and rule-based machine translation. ESSLLI '98 Machine Translation Workshop, Saarbrucken. 1998a.

59. Carl, M., Schaible, J., Pease, C. Enhancing translation memory (TM) technologies with linguistic intelligence. MULTI-DOC Deliverable D4.1. Commission of the European Communities, Luxembourg. 1998b.

60. Dorr B.J. Machine Translation. A View from the Lexicon. Cambridge, MA, MIT, 1993, 432p.

61. Dorr B.J. Machine Translation Divergences. A Formal Description and Proposed Solution. Computational Linguistics 20 (4), 1994,pp. 597-633.

62. Dorr В J. Large-Scale Dictionary Construction for Foreign Language Tutoring and Interlingual Machine Translation 12(4), 1997, pp. 271-322.

63. EAI: Encyclopedia of Artificial Intelligence.— New York: A Wiley Interscience Publication, 1990, 1200p.

64. ELL: Encyclopedia of Language and Linguistics.— Oxford — New York — Seoul — Tokyo. 1994, 5644p.

65. Gale, W. and K. Church. Identifying word correspondance in parallel text. 1991. Proceedings of the DARPA NLP Workshop.

66. Jones, D. 1992. Non-hybrid example-based machine translation architectures. Proceedings of TMI-92. Montreal. Pp.163-71.

67. Lenat, D. and R. Guha. 1990. Building Large Knowledge-Based Systems. Reading, MA: Addison-Wesley.

68. Goodman K., Nirenburg S, The KBMT Project: A Case Study in Knowledge-Based Machine Translation. San Mateo, CA, Morgan Kaufmann, 1991.256p.

69. Hauenschild C., Heizmann S., Machine Translation and Translation Theory. Berlin, New York: Mounton de Gruyter, 1997, 263p.

70. Hogan C., Frederking R.E. An Evaluation of the Multi-Engine MT Architecture. In Lecture Notes in Artificial Intelligence , Berlin, Heidelberg, New York: Springer Verlag, 1998, pp. 113-123

71. Hutchins W.J. Machine Translation: Past, Present, Future. —New York, 1986,382p.

72. Hutchins W.J. Recent Developments in Machine Translation. A Review of the Last Five Years. New Directions in Machine Translation/ Conference Proceedings.-Budapest.- 1988. Pp.7-62.

73. Hutchins W.J., Somers H.L. An Introduction to Machine Translation. London: Academic Press, 1992. 280p.

74. Lehrberger J., Bourbeau L. Machine Translation — Linguistic Characteristics of MT systems and general methodology of evaluation. Studies in French and General Linguistics. Amsterdam, Jon Benjamins, 1988, 240p.

75. Levin B., Pinker S. Lexical and Conceptual Semantics. Cognition Special Issues. Cambridge, MA, Blackwell, 1992.

76. Levitt J.R. KANT Mapper Specification. Carnegie Mellon University, Center for Machine Translation, 1993.

77. Luckhardt H.D. SUSY: Capabilities and Range of Application. Multilingua 1(4), 1982, pp. 213-219.

78. Maas H. D. Das Saarbruecker Uebersetzungssystem SUSY. —Sprache und Datenverarbeitung 2(1), 1978, pp. 43-61.

79. Maas H.D. SUSY 1 und SUSY 2,— Verschiedene Anaiysestrategien in der Maschinellen Übersetzung. —Sprache und Datenverarbeitung 5(1/2), 1981, pp. 9-15.

80. Makoto Nagao. Shinsuke Mori. "A New Method of N-gram Statistics for Large Number of n and Automat8ic Extraction of Words and

81. Phrases form Large Text Data of Japanese". Proceedings of the 15th international Conference on Computational Linguistics, Coling'94, Kyoto, Japan, August 5-9, 1994. Pp 611-615.

82. Tanaka T., Matsuo Y., Ooyama Y.— Automatic Acquisition of Japanese-English Machine Translation Rules from an on-line English-Japanese Dictionary (in Japanese), IPSJ SIG Notes, 1997, pp. 97-104.

83. Tanaka T., Matsuo Y., Ooyama Y.— Extraction of Machine Translation Rules from Non-ahgned Corpora (in Japanese), Proa of The 4th Annual Meeting of The Association for Natural Language Processing, 1998, pp. 594-597.

84. McLean, I. 1992. Example-based machine translation using conncctionist matching. Proceedings ofTMI-92. Montreal. 1992. Pp.35-43.

85. Stein, Gees C.5 Lin, Fang, Bruce, Rebecca, Weng, Fuliang,and Guthrie, Louise. 'The Development of an Application Independent Lexicon: LexBase." CRL Technical Report. 1993.

86. Maruyama, H. and H. Watanabe. 1992. Tree cover search algorithm for example-based translation. Proceedings of TMI-92. Montreal. Pp. 173-84.

87. McLean, I. 1992. Example-based machine translation using connectionist matching. Proceedings of TMI-92. Montreal. 35-43.

88. Sato, S. and M. Nagao. 1990. Towards memory based translation. Proceedings of COLING-9G, Helsinki, Volume 3, 247-52.

89. Sadler, V. 1989. Working With Analogical Semantics. Dordrecht: Foris.

90. Somers, iL 1992. Interactive multilingual text generation for a monolingual user. Proceedings of TMI-92. Montreal. Pp.151-61.

91. Sumita, E. and H. Iida. 1991. Experiments and prospects of example-based machinetranslation. Proceedings of 29th ACL Meeting. Berkeley.

92. Watanabe, H. 1992. A similarity-driven transfer system. Proceeding of COLING-92, Nantes, 770-6.

93. Wilks, Y., Fass, D., Guo: C., McDonald, J., Plate, T. and B. Slator. 1990. Providing Machine Tractable Dictionary Tools. Machine Translation, Volume 5, Number 2, 99-155.

94. Brown, D.R. (1996) Example-Based Machine Translation in the Pangloss System, COLING-96. The 16th International Conference on Computational Linguistics. Proceedings.

95. Brown, DR., Frederking, R. (1995) Applying Statistical English Language Modelling to Symbolic Machine Translation. Theoretical and Methodological Issues in Machine Translation.

96. Brown, P.F., Lai J.C., and Mercer, R.L. (1991) Aligning Sentences in Parallel Corpora. Proceedings of the 29th Annual Meeting of the ACL.

97. Carl M. (1998) A constructivist approach to Machine Translation. Proceedings of NeMLaP3/CoNLL98. Sydney. 247-256.

98. Carl, M., Iomdin, L.L., Streiter, O. (1998a) Towards dynamic linkage of example-based and rule-based machine translation. ESSLLI '98 Machine Translation Workshop, Saarbrucken.

99. Carl, M., Schaible, J.s Pease, C, (1998b) Enhancing translation memory (TM) technologies with linguistic intelligence. MULTI-DOC Deliverable D4.1. Commission of the European Communities, Luxembourg.

100. Carl, M., iomdin, L.L., Pease, C., Streiter, O. (1999) Towards a dynamic linkage of example-based and rule-based machine translation. Machine Translation (to appear).

101. Fung, P. (1995) A pattern matching method for finding noun and proper noun translations from noisy parallel corpora. 33rd Annual Meeting of the Association for Computational Linguistics.

102. Jung, Han-Min; Yuh, Sanhwa; Sim, Chul-Min; Kim, Taewan; and Park, Dong-I. (1998) A domain identifier using domain keywords from balanced web documents. First International Conference on Language Resources & Evaluation. Granada.

103. Heyn, M. (1996) Integrating Machine Translation into Translation Memory Systems. European Association for Machine Translation -Workshop Proceedings. ISSCO, Geneva. 111-123.

104. Lorenz, Konrad. (1973) Die Rückseite des Spiegels. Versuch einer Naturgeschichte menschlichen Erkennens. R. Piper & Co. Verlag. München.

105. Nubel, R. (1997). End-to-end evaluation in Verbmobil I. MT Summit. San Diego.

106. Somers, H. L. (1998) "New Paradigms" in MT: The state of play now that the dust has settled. ESSLL1 '98 Machine Translation Workshop, Saarbrucken,

107. Streiter, O. (1996) Linguistic Modeling for Multilingual Machine Translation. Berichte aus der Informatik Series. Shaker Verlag, Aachen.

108. Streiter, 0. (1998) A semantic description language for multilingual NLP. Papers presented at the Tuscan Word Centre Institut fur Deutsche Sprache Workshop on Multilingual Lexical Semantics, 19-21 June 1998

109. Streiter, 0.3 Iomdin L.L, Munpyo Hong, and Ute Hauck. Learning, forgetting and remembering: Statistical support for rule-based MT. Paper submitted to TMI'99 conference.

110. Karttunen, L. 1986. D-PATR A Development Environment for Unification-Based Grammars. Report No. CSLI-86-61, Center for the Study of Language and Information, Stanford University.

111. Grishman, R. and M. Kosaka. 1992. Combining rationalist and empiricist approaches to MT. Proceedings of TMI-92. Montreal. 263-74

112. Jones, D. 1992. Non-hybrid example-based machine translation architectures. Proceedings of TMI-92. Montreal. 163-71.

113. Lenat, D. and R. Guha. 1990. Building Large Knowledge-Based Systems. Reading, MA: Addison-Wesley.

114. Maruyama, H. andH. Watanabe. 1992. Tree cover search algorithm for example-based translation. Proceedings of TMI-92. Montreal. 173-84.

115. McLean, I. 1992. Exampie-based machine translation using connectionist matching. Proceedings of TMI-92. Montreal. 35-43.

116. Nagao, M. 1984. A framework of a mechanical translation between Japanese and English by analogy principle. In: A. Elithorn and R. Banerji (eds.) Artificial and Human Intelligence. NATO Publications.

117. Nomiyama, H. 1992. Machine translation by case generalization. Proceedings of COLING-92, Nantes, 714-20.

118. Sato, S. and M. Nagao. 1990. Towards memory based translation. Proceedings of COL1NG-90,1 lelsinki, Volume 3, 247-52.

119. Sadler, V. 1989. Working With Analogical Semantics. Dordrecht: Foris.

120. Smadja, F. 1991. From N-Grams to Collocations: An Evaluation of Xtract. Proceedings of 29th ACL Meeting. Berkeley.

121. Somers, H. 1992. Interactive multilingual text generation for a monolingual user. Proceedings of TMI-92. Montreal 151-61.

122. Sumita, E. and H. Iida. 1991. Experiments and prospects of example-based machine translation. Proceedings of 29th ACL Meeting. Berkeley.

123. Watanabe, H. 1992. A similarity-driven transfer system. Proceeding of COLING-92, Nantes, 770-6.

124. Wilks, Y., Fass, D., Guo, C., McDonald, J., Plate, T. and B. Slator. 1990. Providing Machine Tractable Dictionary Tools. Machine Translation, Volume 5, Number 2, 99-155.

125. Tanaka, T. , Matsuo, Y. and Ooyama, Y.: Automatic Acquisition of Japanese-English Machine Translation Rules from an on-line English-Japanese Dictionary (in Japanese), JPSJ SIG Notes, 97-NL-l 19, pp. 97-104 (1997).

126. Tanaka, T. , Matsuo, Y. and Ooyama, Y.: Extraction of Machine Translation Rules from Non-aligned Corpora (in Japanese), Proc. of The 4th Annual Meeting of The Association for Natural Language Processing, B5-8, pp. 594-597 (1998).

127. Rumi Zajac and Mark Casper, "The Temple Web Translator". 1997 AAAI Spring Symposium on Natural Language Processing for the World Wide Web, March 24-26, 1997, Stanford University.

128. Michelle Vanni and Rémi Zajac. "Glossary-Based MT Engines in a Multilingual Analyst's Workstation for Information Processing". To appear in. Machine Translation, Special Issue on flew Tools for Human Translators.

129. Riimi Zajac, 1996. "Towards a Multilingual Analyst's Workstation: Temple". In Expanding MT Horizons Proceedings of the 2nd Conference of the Association for Machine Translation in the Americas, AMTA-96. 25 October 1996, Montreal, Canada. pp280-284.

130. Frederking, R., D. Grannes, P. Cousseau, and S. Nirenburg. "An MAT Tool and Its Effectiveness." Proceedings of the DARPA

131. Human Language Technology Workshop, Princeton, NJ, 1993.

132. Guthrie, Louise, Guthrie, Joe, Wilks, Yorick, Cowie, Jim,

133. Farwell, David, Slator, Brian, and Bruce, Rebecca. "A research program on machine-tractable dictionaries and their application to text analysis," CRL Technical Report MCCS-92-249. 1993.

134. Guthrie, Louise, Rauls, Venus, Luo, Tao, Bruce. Rebecca. "LEXI-CAD/CAM, A Tool for Lexicon Builders." CRL Technical Report MCCS-93-259. 1993.

135. Johnson, R.L. and P. Whitelock. Machine Translation as an Expert Task. In S. Nirenburg, (ed.), Theoretical and Methodological1.sues in Machine Translation, Cambridge, Cambridge University Press, 1987, pp

136. Kay, M. "The Proper Place of Men and Machines in Machine Translation". Xerox PARC Technical Report CSL-80-11. October 1980.

137. Macklovitch, Eliot. "An Off-the-Shelf Workstation for Translators". Proc. of the 30th American Translators Conference,

138. Washington D.C. 1989. CRL, USC 1ST and CMU CMT. April 1995. Stein et al. 93. Stein, Gees C., Lin, Fang, Bruce, Rebecca, Weng, Fuliang,

139. Adriaens G. The LRE SECC Project: Simplified English Grammar and Style Correction in an MT Framework, in Proceedings of Linguistic Engineering Convention, Paris, July 1994.

140. Alonso} Juan A. and Jörg Schütz, Mid-Term Review Report on Project MLAP93-11 GramCheck, April 1995.

141. Crouch R. A prototype ALEP Constraint Solver, SRI International, Cambridge Research Centre, February 1994.

142. Pulman, S. G. (ed.) EUROTRA ET6/1: Rule Formalism and Virtual Machine Design Study, SRI International, Cambridge Computer Science Research Centre, © Commission of European Communities, 1991.

143. Forte, G. The Generic Benefits of CASE, in Introduction to CASE: The best of CASE Outlook, Vol. 3. CASE Consulting Group, Inc. March 1990.

144. J. Durand, P. Bennett, V. Allegranza, F. Van Eynde, L. Humphreys, P. Schmidt, E. Steiner, The Eurotra Linguistic Specifications: an overview, In: Machine Translation 6, Kluwer, Dordrecht, 1991, pp. 103-147

145. Adriaens, G. (1994) "Simplified English Grammar and Style Correction in an MT Framework: The LRE SECC Project". In proceedings of the 16 th Conference on Translating and the Computer.

146. Baker, K., Franz, A., Jordan, P., Mitamura, T., Ny-berg, E. (1994). "Coping with Ambiguity in a Large

147. Bernth, A. (1998). "EasyEnglish: Preprocessing forMT". In proceedings of the Second International Workshop on Controlled Language Applications (CLAW-98).

148. Kamprath, C,, Adolphson, E., Mitamura, T. and Ny-bergs

149. E. (1998). "Controlled Language for Multilin-gual Document Production: Experience with Caterpil-lar Technical English". In proceedings of the Second International Workshop on Controlled Language Ap-plications1. CLAW-98).

150. Mitamura, T. and Nyberg, E. (1995). "Controlled English for Knowledge-Based MT: Experience with the KANT System". In proceedings of the 6 th Interna-tional Conference on Theoretical and Methodological Issues in Machine Translation (TMI-95).

151. Mitamura, T„ Nyberg, E. and Carbonell, J. (1991)

152. An Efficient Interlingua Translation System for Multi-lingual Document Production1'. In proceedings of the Third Machine Translation Summit.

153. Nasr, A, Rambow, O., and Kittredge, R. (1998) "A Linguistic Framework for Controlled Language Sys-tems"1. proceedings of the Second International Workshop on Controlled Language Applications (CLAW-98).

154. Nyberg, E. and Mitamura, T. (1996). "Controlled Language and Knowledge-Based Machine Translation: Principles and Practice". In proceedings of the First International Workshop on Controlled Language Ap-plications (CLAW-96),

155. Nyberg, E, Mitamura, T. and Kamprath, C. (1996).

156. The KANT Translation System: From R&D to Large-Scale Deployment". LISA Newsletter, Vol. 2:L March.

157. Shirai, S., Ikekaha, S., Yokoo, A. and Ooyama, Y.1998) "Automatic Rewriting Method for Internal Expressions in Japanese to English MT and Its Ef-fects". In proceedings of the Second International Workshop on Controlled Language Applications (CLAW-98).

158. Shirai, S.f Ikehara, S„ and Kawaoka, T. (1993) "Ef-fectsof Automatic Rewriting of Source Language within a Japanese to English MT System". In pro-ceedings of the Fifth International Conference on

159. A. Raw, F. van Eynde, P. ten Hacken, H. Hoekstra & B. Vandecapelle (1989), An introduction to the Eurotra machine translation system

160. G. van Noord (1989), The decidability of natural language grammars

161. P. van der Eijk (1989), Linguistic analysis in the Mimo translation system

162. G. van Noord (1989), BUG: A directed bottom-up generator for unification based formalisms

163. H.A. Ruessink (1989), Two-level formalisms

164. P. ten Hacken (1989), Reading distinction in machine translation

165. G. van Noord (1990), Reversible unification based machine translation

166. J. Dorrepaal (1990), A linguistic account of discourse anaphora

167. F.G. Droste (1991), Natural language processing and the innateness hypothesis

168. D. Heylen (1991), Proof tables for the Lambek calculus

169. L. De Wachter & J. Provoost (1993), A computational interpretation of compounds