автореферат диссертации по филологии, специальность ВАК РФ 10.02.19
диссертация на тему:
Категория определенности-неопределенности как проблема перевода

  • Год: 2001
  • Автор научной работы: Попова, Татьяна Владимировна
  • Ученая cтепень: кандидата филологических наук
  • Место защиты диссертации: Москва
  • Код cпециальности ВАК: 10.02.19
Диссертация по филологии на тему 'Категория определенности-неопределенности как проблема перевода'

Оглавление научной работы автор диссертации — кандидата филологических наук Попова, Татьяна Владимировна

Введение.

Глава 1 Проблема перехода от скрытой категории определенности-неопределенности (КОН) к ее грамматическому выражению в языке с артиклями.

§1. Определенность-неопределенность как грамматическая и как скрытая функционально-семантическая категория.

§2. Используемая терминология.

§3. Проблема перевода значений скрытой категории одного языка в граммемы соответствующей грамматической категории другого языка.

3.1. Разные подходы к определению перевода.

3.2. Типы расхождений между исходным текстом и текстом перевода.

3.3. Проблема перевода скрытых категорий одного языка в граммемы другого для систем автоматического перевода.

3.4. О проблемах организации словаря.

§4. Специфика перевода научно-технической литературы.

Выводы.

Глава 2 Контексты реализации значений функционально-семантической КОН в русском языке и грамматической КОН в английском языке.

§ 1, Методологические подходы к решению проблемы адекватной интерпретации "скрытой" КОН в русском языке при переводе на английский.

§2.Факторы, позволяющие локально фиксировать значения ФСКОН для русского языка.

2.1. Прямые лексические показатели.

2.2. Косвенные семантико- синтаксические показатели:.

2.3. Актуальное членение предложения как косвенный показатель КОН.

2.4. Косвенные грамматические показатели.

2.5. Косвенные лексические показатели.

2.6 Механизмы формального описания факторов локального фиксирования значения ФСКОН для русского языка.

§3. Поддающиеся формализации факторы выбора артикля в английском языке.

3.1. Употребления, обеспечиваемые словарем (или грамматической характеристикой лексемы в словаре).

3.2. Формализуемые употребления нулевого артикля.

3.3. Формализуемые употребления определенного артикля.

3.4. Формализуемые употребления неопределенного артикля. 106 Выводы.

Глава 3 Статистический анализ поведения КОН в исследуемом тексте.

§1.0 методике проведения анализа исследуемых текстов.

§2. Анализ детерминации предметной лексики в научном тексте

2.1. Словарь текстовых операторов.

2.1.1 Семантические классы текстовых операторов.

2.1.2 Примеры численных соотношений по отдельным текстовым операторам.

2.2. Анализ заголовков.

§3. Статистический анализ контекстов, влияющих на выбор детерминатора именной группы в английском тексте.

§4. Правила предпочтения выбора артикля на основе статистических данных.

4.1. Система правил.

4.2. Трудности и противоречия, связанные с анализируемыми контекстами.

§5 Эксперимент по проверке адекватности полученной системы правил.

Выводы.

 

Введение диссертации2001 год, автореферат по филологии, Попова, Татьяна Владимировна

Исследования категории определенности-неопределенности (КОН) как в морфологическом, так и функционально-семантическом аспекте, поднимают широкий пласт теоретических проблем, связанных с референцией, семантикой артиклей в артиклевых языках, типами соответствия одноименных артиклей в разных артиклевых языках (например, каковы семантические различия между определенным артиклем во французском и в английском языке), а также типами соответствия между проявлениями скрытой категории определенности-неопределенности в безартиклевых языках и ее грамматическими показателями (детерминаторами) в артиклевых. Именно этот последний аспект будет находиться в фокусе внимания данной работы. В качестве исследуемой пары языков были выбраны русский (исходный язык, безартиклевый) и английский (язык перевода, артиклевый).

Кроме теоретического аспекта (изучение поведения КОН на всех уровнях описания языка: фонетическом, морфологическом, синтаксическом, семантическом, логическом, прагматическом), в исследованиях такого рода существует еще и прикладной аспект. Он связан с поиском алгоритма осуществления грамматически (и, по возможности, семантически) адекватного перевода с безартиклевого языка на артиклевый в системах автоматического (машинного) перевода, а также с построением правил употребления артикля в процессе обучения артиклевому языку как иностранному людей, для которых родным является безартиклевый язык. Тестирование существующих систем машинного перевода показывает, что результат расстановки артиклей в тексте нельзя признать удовлетворительным, что делает решение данной задачи важным и актуальным. В нашем исследовании мы в первую очередь сосредоточимся именно на прикладном аспекте.

В рамках теоретических исследований, посвященных КОН, и шире, проблемам референции, накоплен богатый материал для сопоставительного анализа, имеющего прикладную ориентацию. В связи с этим возникает вопрос, нельзя ли при помощи довольно простых с лингвистической точки зрения, механизмов повысить качество перевода уже существующих систем автоматического перевода, не перерабатывая радикально их идеологию. Возможно несколько способов улучшить результат:

1) Дополнить синтез блоком, обеспечивающим отслеживание тождественных референтов по всему тексту

2) Дополнить словарь системы специально разработанным множеством помет, помогающим выставить правильное значение категории определенности-неопределенности в тексте перевода, а также построить систему правил продукции вида "Если X, то У", основанную, с одной стороны, на всех теоретических описаниях поведения категории как в языке исходного текста, так и в языке перевода, а с другой, на статистической регулярности ее выражения при именных лексемах в тексте.

С нашей точки зрения, наиболее реалистичен второй способ. Следует сделать оговорку о том, что тип систем перевода, рассматриваемый в данной работе, не строит семантическое представление всего текста, но проводит его морфологический анализ (полная атрибуция словоформы в тексте) и синтаксический анализ (в частности, система умеет вычленять именные группы и определять их синтаксическую вершину). Некоторые семантические сведения предусмотрены в структуре словарной статьи словаря системы, который является одним из важнейших ее компонентов. Однако речь идет не только об улучшении перевода, выполняемого машиной, но и об облегчении процесса порождения текста на иностранном языке человеком. Поскольку наивная картина мира носителей артиклевого и безартиклевого языка по-разному фиксирует в языке определенность-неопределенность, то, по всей видимости, нельзя говорить о полном постижении смысла этой категории в иностранном языке. Поэтому заранее согласившись с тем, что ошибки при расстановке артиклей неизбежны, мы ставим перед собой в данном исследовании задачу выяснить вопрос о том, возможно ли руководствоваться некоторыми статистическими характеристиками при переводе текста с русского языка на английский с целью повышения качества перевода и насколько высокой будет цена неизбежных при этом ошибок. В качестве подъязыка, который предположительно обслуживается системой автоматического перевода, выбран подъязык научных текстов (или, немного шире, подъязык научно-деловой прозы). Материалом исследования послужили русский текст и перевод на английский язык книги А.Е. Кибрика "Методика полевых исследований" ([Кибрик 1972] и [Kibrik 1977]). Исследовалась детерминация в первую очередь предметной (тематической) лексики (т.е. лексики, формирующей смысловое пространство данного текста), а также общенаучной лексики (являющейся своего рода логической предикатной сеткой, "цементирующей" текст). При обработке данных использовалось лингвистическое программное обеспечение (конкордансы, компьютерные словари), созданное компаниями ABBYY Software House, МедиаЛингва, Информатик, New Media Generation, Polyglossum. Для тестирования систем машинного перевода (Socrat версии 2.0 и Stylus версии 2.5.1), данные которого приводятся в разделе "Приложение 4" использовались тексты научно-популярных статей по компьютерной тематике. Для выявления контекстов употребления артиклей в английском языке использовались авторитетные грамматики и словари английского языка, список которых приводится в соответствующем разделе Библиографии.

Практическое применение результатов данного исследования может осуществляться в трех направлениях:

1) Улучшение качества перевода, выполняемого существующими системами машинного перевода.

2) Оптимизация правил употребления артикля при обучении английскому языку как иностранному

3) Улучшение качества текста, порождаемого человеком на английском языке как иностранном (например, при написании научной статьи на английском языке).

Значительная часть данного исследования была выполнена в рамках проекта типологического описания языков компании ABBYY Software House.

 

Заключение научной работыдиссертация на тему "Категория определенности-неопределенности как проблема перевода"

Выводы

1. Как показывает анализ материала, в научном тексте выделяется особенный функциональный пласт лексики, называемый нами "текстовыми операторами". Основные их свойства можно сформулировать следующим образом: 1) они устанавливают отношения между элементами предметной области текста; 2) по умолчанию они не могут являться темой, "основным персонажем" научного текста; 3) некоторые группы текстовых операторов в подавляющем большинстве случаев имеют какое-либо одно значение КОН.

2. Последнее свойство текстовых операторов можно использовать для улучшения результатов автоматического перевода. Это возможно следующим образом: при лексеме, являющейся текстовым оператором, в словаре хранится информация о семантическом классе, к которому она принадлежит (почти все классы имеют определение, согласно которому в них могут добавляться новые лексемы)23; о том, какое "Вероятностное значение категории определенности" ему соответствует, а также для

23 Поэтому в конце каждого из списков, приводимых в разделе 2.1.1 параграфа 2 главы 3 предполагается "многоточие", означающее возможность пополнения класса. данного конкретного слова численное значение вероятности появления при ней соответствующего артикля,

3. Анализ описания артикля в грамматиках английского языка, а также употребление артиклей в текстах позволяет выявить такие контексты, которые с наибольшей (по сравнению с другими) вероятностью приводят к появлению того или иного артикля.

4. Описанные в главе 2 контексты, в которых значение КОН определяется более или менее однозначно, а также вероятностные значения, посчитанные для некоторых из этих контекстов, позволяют смоделировать алгоритм расстановки артиклей в тексте.

5. Как и в любой теории, основывающейся на вероятностных предположениях, в построенном алгоритме возможны некоторые огрубления и игнорирование каких-либо закономерностей языка, а также некоторые контексты могут вступать в противоречие. Однако, возвращаясь к промышленным системам автоматического перевода, данный алгоритм представляется мне более эффективным, чем существующие в этих системах, что и показывает пример использования системы правил.

6. Если все знания о поведении ФСКОН в русском языке помыслить себе как оконное стекло, то реальные знания о ней, освещенные на сегодняшний день в литературе, могут выглядеть как небольшой мазок кистью. Но тем не менее даже такой объем информации позволяет сформулировать правила приписывания значений КОН, приводящие к повышению результатов перевода.

7. Даже при скептическом отношении к идее автоматического перевода вообще и его применении к множеству научных текстов в частности нельзя не признавать практическую полезность существующих в настоящее время коммерческих систем с их достаточно простым программным обеспечением. Небольшой дополнительный блок, радикально не меняющий лингвистическую идеологию программ, контуры которого намечены в данном исследовании, может привести к ощутимому улучшению результатов их работы.

Заключение

Проделанное исследование позволяет сделать следующие выводы:

1. При переводе с русского языка на английский основная сложность состоит в том, что КОН в русском языке является "скрытой", а в английском - грамматической. В связи с этим для осуществления адекватного перевода необходимо учитывать как факторы, позволяющие локально фиксировать признаки КОН для русского языка, так и факторы выбора артикля в английском языке.

2. Если правила употребления артикля в английском языке -область научных исследований с большой историей, то изучение влияния различных языковых параметров на тип детерминации именной группы в русском языке - область, еще ожидающая глубокого, фундаментального и последовательного описания. Поэтому на данном этапе закономерности, наиболее четко и ясно описывающие тип РС ИГ базируются на свойствах лексических классов слов. Нам представляется, что "лексически ориентированное" направление таких исследований может дать еще много практически применимых результатов.

3. Проблема интерпретации русской "скрытой" КОН при переводе на английский язык также актуальны и для практического приложения теории перевода - машинного перевода. Понятно, что сколько-нибудь полное и адекватное решение указанной проблемы требует разработки модели поддержания референции в дискурсе. В теоретическом плане подобная задача в принципе решаема. Но применение такой модели в системах автоматического перевода на данной стадии их развития практически нереально. Более того, проблема правильной расстановки артиклей практически никак не решается в современных промышленных системах АП. В связи с этим мы разработали правила расстановки артиклей, базирующиеся только на тех факторах, действие которых может быть отслежено в рамках отдельно взятого предложения. Характеристики, используемые в алгоритме, носят вероятностный характер. Хотя это и предполагает заранее возможность постановки неправильного артикля в определенном проценте случаев, но по крайней мере, снижает процент ошибок по сравнению с фактически произвольной расстановкой артиклей в нынешних коммерческих системах автоматического (машинного) перевода. Более того, даже если алгоритм не учитывает всего множества факторов, определяющих значение ФСКОН в русском языке и КОН в английском языке, становится понятно, какую информацию учесть нельзя, а какую можно, но при выполнении дополнительных условий. Если диагностика ошибки понятна и предсказуема, ее легче устранить, чем в случае большого количества произвольных разнородных ошибок.

4. Исследование поведения категории определнности-неопределенности в текстах научного подъязыка показало одну яркую тенденцию в развитии этого жанра. Научные тексты, создаваемые на английском языке, а также переводимые на него, все больше и больше отдаляются от того, что мы собственно привыкли считать английским языком (будь то British English или American English). Применение "вероятностного подхода" к проблеме расстановки артикля стало возможно именно потому, что сейчас в процессе развития находится практически новый язык. Это в некотором роде "искусственный" язык, создаваемый на базе английского, но функционирующий по своим законам и правилам (которые, в частности, касаются и расстановки артиклей).

5. В научном тексте выделяется особенный функциональный пласт лексики, называемый нами "текстовыми операторами". Одно из примечательных их свойств состоит в том, что некоторые группы текстовых операторов в подавляющем большинстве случаев имеют какое-либо одно значение КОН. Это сделало возможным ввести понятие "Вероятностного значения КОН", используемого при описании текстовых операторов, а также при построении алгоритма расстановки артиклей. Следует отметить, что особенности поведения тех или иных групп текстовых операторов могут быть использованы не только в системах МП, но и в бумажных словарях, предназначенных в помощь человеку, создающему текст на иностранном языке,

6. Если говорить о возможных перспективах в исследовании данного вопроса, то исследование интересно было бы продолжить в нескольких направлениях. Первое направление - совершенствование словарного обеспечения систем АП. Разнообразные данные (как описанные в литературе, так и исследуемые в работе) показали, что есть два пласта лексики, которые в словаре могут быть снабжены пометой, помогающей при расстановке артиклей в тексте на английском языке; с одной стороны, это глаголы различных семантических классов, накладывающие ограничения на значения КОН своих актантов, а с другой, - это именные лексемы, для которых в работе использовался термин "текстовый оператор". Второе направление - это проверка "вероятностных" правил на других, наиболее актуальных для современных систем автоматического перевода подъязыках (например, юридические тексты, тексты деловой прозы).

7. Среди теоретических проблем особенный интерес представляет изучение влияния синтаксических, коммуникативных и дискурсивных характеристик высказывания на тип детерминации ИГ и поиск возможностей их алгоритмической реализации. Они представляют собой второй (после лексических характеристик), более высокий по сложности уровень взаимодействия с ФСКОН в русском языке.

 

Список научной литературыПопова, Татьяна Владимировна, диссертация по теме "Теория языка"

1. Кибрик 1972 Кибрик А.Е. Методика полевых исследований, М. 1972 Kibrik 1977 - Kibrik А.Е. A methodology of field linguistics, Mouton de Greuter, Paris 1977 Литература

2. Апресян 1974 Апресян Ю.Д. Лексическая семантика M., 1974

3. Апресян 1986 Апресян Ю.Д. Интегральное описание языка и толковыйсловарь // Вопросы языкознания №2, M., 1986, с. 57-70

4. Апресян 1989 Апресян Ю.Д. и др. Лингвистическое обеспечение системы ЭТАП-2. М., 1989

5. Апресян 1995 Апресян Ю.Д. Лексическая семантика., М. 1995

6. Арутюнова 1976а Арутюнова Н.Д. Референция имени и структурапредложения. // Вопросы языкознания №2 с.24-35

7. Арутюнова 19766 Арутюнова Н.Д. Предложение и его смысл. М., 1976

8. Арутюнова 1977 Арутюнова Н.Д. Номинация и текст // Языковая номинация,1. М., 1977

9. Арутюнова 1998 Арутюнова Н.Д. Язык и мир человека. М., 1998 Бархударов 1975-Бархударов Л.С. Язык и перевод. М., 1975 Беллерт 1978 - Беллерт И. Об одном условии связности текста // Новое в зарубежной лингвистике, Вып. 8, М.,1978, с. 172-207.

10. Бреус 1998 Бреус Е.В. Основы теории и практики перевода с русского языка на английский. М., 1998

11. Ванников 1984 Ванников Ю.В. Типы научных и технических текстов и их лингвистические особенности. М., 1984

12. Гуревич 1983 Гуревич В.В. О семантике неопределенности // Филологические науки №1, 1983, с. 54-60

13. Каушанская 1963 Каушанская В.Л., Ковнер Р.Л., Кожевникова О.Н., Прокофьева Е.В., Райнес З.М., Сквирская С.Е., Цырлина Ф.Я. A Grammar of the English Language (под ред. Ильиша Б.А.), Л.,1963

14. Качалова 1995 Качалова К.Н., Израилевич Е.Е. Практическая грамматика английского языка. М., 1995

15. Керо Хервилья 1999 Керо Хервилья Энрике Федерико. Сопоставительное изучение категории определенности / неопределенности в русском и испанском языках. Автореф. диссертации на соискание ученой степени кандидата филологических наук. М., 1999

16. Кибрик 1997 Кибрик A.A., Плунгян В.А. Функционализм // Фундаментальные направления современной американской лингвистики. Сборник обзоров. М., 1997, с. 276-340

17. Кобозева 1989 Кобозева И.М. О семантической трактовке кумулятивного отрицания в русском языке. // Проблемы структурной лингвистики 1984. М., 1989, с. 80-94.

18. Комарова 1990 Комарова Э.П. Исследования композиционной структуры текста и перевод. // Вопросы теории и практики перевода научно-технической литературы. Пенза, 1990, с. 5-9

19. Кронгауз 1984 Кронгауз М.А. Тип референции именных групп с местоимениям все, всякий и каждый II Семиотика и информатика, Вып. 23 М., 1984, с. 107-123

20. Крылов 1997 Крылов С.А. Детерминация имени в русском языке: теоретические проблемы // Семиотика и информатика, Вып. 35, М.1997, с. 244271.

21. Кулагина 1979 Кулагина О.С. Исследования по машинному переводу, М. 1979 Лингвистический энциклопедический словарь. М., 1990

22. Маккьюин 1989 Маккьюин К. Дискурсивные стратегии для синтеза текста на естественном языке // Новое в зарубежной лингвистике, вып. 24 М., 1989, с. 311 -356

23. Маркелова 1990 Маркелова И.Ю. Стилистические аспекты перевода специальных текстов. // Вопросы теории и практики перевода научно-технической литературы. Пенза, 1990, с. 11-12

24. Мельчук 1995 Мельчук И.А. Русский язык в модели "Смысл Текст" с. 3-17, М., 1995

25. Николаева 1979 Николаева Т.М. Акцентно-просодические средства выражения категории определенности-неопределенности // Категория определенности-неопределенности в славянских и балканских языках М. 1979, с. 119-174

26. Падучева 1974 Падучева Е.В. О семантике синтаксиса: материалы ктрансформационной грамматике русского языка. М., 1974

27. Падучева 1985 Падучева Е.В. Высказывание и его соотнесенность сдействительностью (референциальные аспекты семантики местоимений). М.,1985

28. Пумпянский 1965 Пумпянский А.Л. Введение в практику перевода научной и технической литературы на английский язык. М., 1965

29. Рахилина 1998 Рахилина Е.В. Когнитивная семантика: история, персоналии, идеи, результаты. // Семиотика и информатика. Вып.36, М. 1998, с.274-323 Ревзин 1964 - Ревзин И.И., Розенцвейг В.Ю. Основы общего и машинного перевода. М., 1964

30. Ревзин 1973 Ревзин И.И. Некоторые средства выражения противопоставления по определенности в современном русском языке. // Проблемы грамматического моделирования. М., 1973, с. 121-137

31. Рябцева 1996 Рябцева Н.К. Теоретическое и лексикографическое описание научного изложения: межъязыковой аспект. М. 1996

32. Селегей 1999 Селегей В.П. Электронные словари и компьютерная лексикография // Труды Международного семинара Диалог'99, Том 2, Таруса 1999

33. Селезнев 1985 Селезнев М.Г. Функционирование механизмов определеннойреференции в процессе синтеза текста. // Автореф. диссертации на соисканиеученой степени кандидата филологических наук. М., 1985

34. Селиверстова 1964 Селиверстова О.Н. Опыт семантического анализа словтипа все и типа кто-нибудь // Вопросы языкознания № 4,1964, с. 80-90

35. Серль 1986 Серль Дж.Р. Что такое речевой акт? // Новое в зарубежнойлингвистике, вып.17. М., 1986, с. 151-169

36. Слокум 1989 Слокум Дж. Обзор разработок по машинному переводу: история вопроса, современное состояние и перспективы развития. // Новое в зарубежной лингвистике, вып.24. М„ 1989, с. 357-406

37. Сосинский 1990 Сосинский А.Б. Машинный перевод препарированных математических текстов. //Сб. статей под ред. В.П. Маслова "Проектирование интеллектуальных систем (экспертные системы и системы МП)", М., 1990. С.59-87

38. Сосинский 1994 Сосинский А.Б. Как написать математическую статью по-английски, Минск, 1994. 136 с.

39. Талми 1999 Талми Л. Отношение грамматики к познанию. // Вестник МГУ, серия филология, №№ 1 (с. 91-115), 4 (с. 76-104), 6 (с. 88-121), М. 1999

40. Тимонина 1990 Тимонина А Л, Авторский стиль как проблема научно-технического перевода // Вопросы теории и практики перевода научно-технической литературы. Пенза, 1990, с. 12-17

41. Толдова 1994 Толдова С.Ю. Структура дискурса и механизм фокусирования как важные факторы выбора номинации объекта в тексте. // Автореф, диссертации на соискание ученой степени кандидата филологических наук. М., 1994

42. Федоров 1983 Федоров A.B. Основы общей теории перевода. М., 1983 Федорова 1994 - Федорова О.В. Типология средств интродукции референта. Автореф. диссертации на соискание ученой степени кандидата филологических наук. М., 1985

43. Шаляпина 1988 Шаляпина З.М. Текст как объект автоматического перевода. М., 1988

44. Шмелев 1996 Шмелев А.Д. Референциальные механизмы русского языка. Тампере 1996.

45. Штеллинг 1996 Штеллинг Д.А. Грамматическая семантика английского языка. Фактор человека в языке М., 1996

46. Baker 1989 Baker С. English Syntax, Cambridge 1989, с. 141-147

47. Blokh 1994- Blokh M.Y. A course in theoretical English grammar M., 1994

48. Christophersen 1939 Christophersen Paul, The Articles. A study of the theory anduse in English. Copenhagen, Munksgaard, London, Milford 1939

49. Collins 1994 Collins Cobuild English Grammar, HarperCollins Publishers, London1994

50. Kramsky 1972 Kramsky J. The article and the concept of definiteness in language. The Hague, Paris, 1972

51. Sorensen 1959 Sorensen Holger Steen. The function of the Definite

52. Article in Modern English. // English Studies, 40,1959

53. Thomson 1986 Thomson A.J., Martinet A.V. A practical English grammar, Oxford University Press 1986

54. Wierzbicka 1999 Wierzbicka A. A semantic basis for linguistic typology. II В сб. Типология и теория языка. От описания к объяснению. М., 1999 с.26-35 Словари

55. Апресян 1994 Апресян Ю.Д., Медникова Э.М., Петрова А.В. и др. Новый большой англо-русский словарь. М., 1994

56. Гальперин 1972 Гальперин И.Р. Большой англо-русский словарь. М., 1972

57. Мюллер 1978 Мюллер В.К. Англо-русский словарь, М., 1978

58. Денисов 1978 Денисов П.Н., Морковкин В.В., Сафьян Ю.А. Комплексныйчастотный словарь русской научной и технической лексики. М., 1978

59. Рябцева 1999 Рябцева Н.К. Научная речь на английском языке. Словарьоборотов и сочетаемости общенаучной лексики. М., 1999

60. Webster's New World Dictionary, New York 1982

61. BBC English Dictionary, London 1993