автореферат диссертации по филологии, специальность ВАК РФ 10.02.21
диссертация на тему:
Латышско-русский машинный перевод в системе социальной коммуникации

  • Год: 2010
  • Автор научной работы: Горностай, Татьяна Александровна
  • Ученая cтепень: кандидата филологических наук
  • Место защиты диссертации: Санкт-Петербург
  • Код cпециальности ВАК: 10.02.21
450 руб.
Диссертация по филологии на тему 'Латышско-русский машинный перевод в системе социальной коммуникации'

Полный текст автореферата диссертации по теме "Латышско-русский машинный перевод в системе социальной коммуникации"

На правах рукописи УДК 81*33:8 Г32

0О4602142

ГОРНОСТАЙ Татьяна Александровна

ЛАТЫШСКО-РУССКИЙ МАШИННЫМ ПЕРЕВОД В СИСТЕМЕ СОЦИАЛЬНОЙ КОММУНИКАЦИИ

Специальность: 10.02.21 - прикладная и математическая лингвистика

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата филологических наук

2 0 2910

Санкт-Петербург 2010

6И1С1СС

004602142

Работа выполнена на кафедре прикладной лингвистики государственного образовательного учреждения высшего профессионального образования «Российский государственный педагогический университет им. А. И. Герцена»

Научный руководитель: доктор филологических наук, профессор

БЕЛЯЕВА Лариса Николаевна

Официальные оппоненты: доктор филологических наук, доцент

ЯГУНОВА Елена Викторовна

кандидат филологических наук, доцент ВИЛАНДЕБЕРК Анна Арнольдовна

Ведущая организация: Государственное образовательное

учреждение высшего профессионального образования «Пермский государственный технический университет»

Защита состоится « М.» 2010 года в Я часов 00 минут

на заседании совета по защите докторских и кандидатских диссертаций Д 212.199.17 при Российском государственном педагогическом университете им. А. И. Герцена по адресу: 191186, г. Санкт-Петербург, наб. р. Мойки, д. 48, корп. 14, ауд. 314.

С диссертацией можно ознакомиться в фундаментальной библиотеке Российского государственного педагогического университета им. А. И. Герцена по адресу: 191186, г. Санкт-Петербург, наб. р. Мойки, д. 48, корп. 5.

Автореферат разослан «73 » Лхй—2010 года.

Ученый секретарь совета по защите докторских и кандидатских диссертаций доктор филологических наук, профессор

Л А. Пиотровская

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Исторические события 1 мая 2004 года, когда Европейский Союз принял в свои члены десять новых стран-участниц, остро поставили вопрос о необходимости разработки средств поддержки социальной коммуникации в условиях обмена электронной информацией на глобальных и национальных языках. В качестве одного из таких средств может рассматриваться система машинного перевода. В реферируемом диссертационном исследовании изучается круг проблем, связанных с созданием системы машинного перевода с латышского на русский язык, предназначенной для поддержания социальной коммуникации. Следует отметить, что именно данное направление перевода приобрело сегодня особую важность как минимум по двум причинам:

- русский язык по-прежнему является вторым (после латышского) языком общения в латвийском обществе;

- значительная часть русскоязычного населения не владеет государственным латышским языком на должном уровне, достаточном для осуществления социального взаимодействия.

При решении задачи создания системы латышско-русского машинного перевода для поддержания социальной коммуникации следует учитывать существование практических систем, предоставляющих возможность перевода текстов с латышского языка и на латышский язык. Руководствуясь лингвистическими и кибернетическими принципами построения лингвистических процессоров, принципами модульности архитектуры и открытости системы (Ю. Д. Апресян, Л. Н. Беляева, Р. Г. Пиотровский), проектируемую систему можно создавать как модуль действующей системы машинного перевода (МП), как одну из основных составляющих автоматизированной компьютерной системы - лингвистического автомата (ЛА).

Таким образом, актуальность темы реферируемой работы продиктована:

- необходимостью разработки и совершенствования средств поддержания социальной коммуникации в многоязычном обществе;

- целесообразностью создания системы латышско-русского машинного перевода для поддержания социальной коммуникации в Латвии;

- насущными потребностями прикладного языкознания (в частности машинного перевода и компьютерной лингвистики), связанными с тем, что латышский и русский языки недостаточно изучены с точки зрения перевода, сопоставительного языкознания и мало изучены с точки зрения их представления в системах машинного перевода.

Теоретической базой исследования послужили положения:

- теории коммуникации: об объеме и соотношении понятий «коммуникация» и «общение» (В. В. Дрыбин, В. П. Конецкая, А. С. Нариньяни, В. Н. Переверзев, А. В. Соколов, Р. С. Цаголова), о структуре модели коммуникации и ее компонентах (В. Б. Кашкин, Г. Лассуэлл, Р. Г. Пиотровский, В. Н. Переверзев, А. В. Соколов, К. Шеннон, Р. Якобсон);

- теории речевых актов: о структуре речевого акта (Дж. Л. Остин, Дж. Р. Серль) и стратегии речевого поведения (Г. П. Грайс);

- теории перевода: об особенностях процесса перевода как части процесса коммуникации (Е. В. Бреус, В. С. Виноградов, В. Н. Комиссаров, А. А. Паршин, Г. М. Стрелковский);

- компьютерной (инженерной) лингвистики: о принципах построения лингвистических автоматов (Л. Н. Беляева, К. Р. Пиотровская, Р. Г. Пиотровский);

- машинного перевода: о стратегиях реализации систем машинного перевода, способах описания лингвистических алгоритмов и словарных баз (Ю. Д. Апресян, Л. Н. Беляева, И. М. Богуславский, Д. Ву, Л. Л. Иомдин, М. Карл, Ф. Коэн, Ю. Н. Марчук, С. Ниренбург, Р. Г. Пиотровский, И. И. Убин, X. Ушкорайт, Дж. Хатчинс).

Гипотезой исследования является предположение о том, что система латышско-русского машинного перевода может:

- создаваться на основе имеющихся в структуре многофункционального лингвистического автомата модулей автоматической переработки текста на государственном (латышском) языке;

- использоваться как средство поддержания социальной коммуникации в латвийском обществе, позволяя пользователю, не знающему или плохо знающему государственный язык, преодолевать языковой барьер.

В соответствии с этим целью исследования является установление принципов выбора и модификации системы машинного перевода с государственным языком и встраивания систем машинного перевода, предназначенных для поддержания социальной коммуникации, в структуру лингвистического автомата.

Сформулированная цель диктует постановку и решение следующих задач:

- исследование особенностей и параметров социальной коммуникации, разработка модели социальной коммуникации при использовании системы машинного перевода в качестве посредника;

- изучение общих принципов работы систем машинного перевода и выявление специфики системы машинного перевода для поддержания социальной коммуникации;

- анализ существующих типов лингвистических автоматов и практических систем машинного перевода с латышским языком, выбор прототипической системы для встраивания латышско-русского модуля;

- рассмотрение архитектуры прототипической системы машинного перевода и определение особенностей реализации латышско-русского модуля;

- исследование структурных и языковых особенностей оформления текстов, функционирующих в социальной коммуникации, на латышском языке;

— разработка и реализация в прототипической системе процедуры машинного перевода текстов, функционирующих в социальной коммуникации, с латышского языка на русский;

- экспериментальное апробирование и предварительная оценка эффективности использования разработанного модуля.

Цель и задачи определили ход, материал и методику исследования.

Объектом исследования является система машинного перевода в структуре лингвистического автомата, предназначенная для поддержания социальной коммуникации.

Предметом исследования являются особенности организации системы машинного перевода, предназначенной для поддержания социальной коммуникации, в структуре лингвистического автомата.

Основным материалом исследования являются системы машинного перевода, тексты на латышском языке, функционирующие в социальной коммуникации, практические грамматики латышского и русского языков.

В ходе диссертационного исследования применялись методы лингвистического анализа языкового материала (метод оппозиций, методы словообразовательного, грамматического, стилистического, дистрибутивного, структурного анализа), сопоставительного анализа систем машинного перевода и грамматик латышского и русского языков, методы и приемы компьютерной лингвистики.

На защиту выносятся следующие положения:

1) система латышско-русского машинного перевода для поддержания социальной коммуникации может быть встроена в структуру многофункционального лингвистического автомата, поддерживающего функцию машинного перевода для государственного (латышского) языка;

2) система машинного перевода для поддержания социальной коммуникации отличается от других типов систем машинного перевода по цели, с которой получатель вступает в процесс коммуникации, и типу текстов, для перевода которых предназначена;

3) система латышско-русского машинного перевода может рассматриваться как необходимый компонент процесса социальной коммуникации в латвийском обществе, позволяя пользователю, не знающему государственный (латышский) язык, преодолевать языковой барьер.

Научная новизна результатов исследования заключается в следующем:

1) установлены принципы выбора, модификации и встраивания систем машинного перевода с государственным языком, предназначенных для поддержания социальной коммуникации, в структуру лингвистического автомата;

2) разработана модель социальной коммуникации при использовании системы машинного перевода в качестве посредника;

3) определены общие и частные требования, которым должна соответствовать система машинного перевода для поддержания социальной коммуникации;

4) определены типы морфологических и синтаксических преобразований, необходимых при латышско-русском машинном переводе;

5) разработан и реализован в системе латышско-русского машинного перевода комплекс правил для реализации процедур синтаксического трансфера и согласования.

Теоретическая значимость исследования заключается в том, что:

1) установлена необходимость и целесообразность создания системы машинного перевода для поддержания социальной коммуникации, что способствует дальнейшему развитию теории машинного перевода и вносит вклад в переводоведение;

2) определены принципы и методы выбора, модификации и встраивания систем машинного перевода с государственным (латышским) языком для поддержания социальной коммуникации, что служит основой дальнейших лингвистических исследований по созданию систем машинного перевода с латышского языка на другие национальные языки, а также с других государственных языков;

3) разработан комплекс правил для реализации процедур синтаксического трансфера и согласования в модуле латышско-русского машинного перевода, что способствует дальнейшему развитию алгоритмов парсинга для машинного перевода.

Практическая значимость результатов диссертационного исследования определяется тем, что созданная система латышско-русского машинного перевода может использоваться в качестве средства поддержания социальной коммуникации жителями Латвии, которые не владеют государственным языком, для преодоления языкового барьера. Разработанный модуль может использоваться стационарно на компьютере пользователя, а также в дальнейшем может применяться на сайтах социально-политических институтов Латвии. Комплексное описание типологии лингвистических автоматов в соответствии с типами коммуникации способствует дальнейшему развитию и применению многофункциональных лингвистических автоматов.

Достоверность и научная обоснованность теоретических и практических результатов исследования обеспечивается:

- использованием в качестве теоретической базы фундаментальных исследований отечественных и зарубежных авторов по теоретической и прикладной лингвистике;

- адекватностью технологий, которые используются для решения поставленных задач (готовые модули автоматической переработки текста на латышском и русском языках входят в структуру лингвистического автомата Tildes Birojs и используются в различных пользовательских приложениях в его составе);

- предложенной автором системой верификации качества работы модулей машинного перевода.

Таким образом, в ходе работы получены достоверные теоретические и практические результаты, на основании которых сделаны основные выводы исследования.

Рекомендации об использовании результатов диссертационного исследования. Основные результаты исследования могут быть использованы в курсах лекций по решению лингвистических задач с помощью компьютера, по лингвистическим автоматам, проблемам передачи информации при переводе, машинному переводу и автоматической переработке текста, а также при разработке спецкурсов для студентов бакалавриата, обучающихся по профилю «Иностранный язык и компьютерная лингводидактика», и магистратуры, обучающихся по профилю «Информационные технологии в филологическом образовании».

Апробация результатов исследования состоялась на международных конференциях «Human Language Technologies» (Каунас, Литва, октябрь 2007 г.), «Прикладная лингвистика в науке и образовании» (Санкт-Петербург, Россия, март 2008 г.), «Диалог» (Бекасово, Московская область, Россия, июнь 2008 г.), аспирантских семинарах по машинному переводу в Nordic Graduate School of Language Technologies (Гетеборг, Швеция, октябрь 2008 г., январь 2009 г.), заседаниях кафедры прикладной лингвистики Российского государственного педагогического университета им. А. И. Герцена, собраниях коллектива отдела языковых систем компании Tilde (Рига, Латвия, 2005-2009 гг.). По теме диссертации опубликовано 5 работ общим объёмом 2,65 п. л.

Объем и структура диссертации. Работа состоит из введения, двух глав, сопровождающихся выводами, заключения, списка использованной литературы, включающего 285 наименований, в том числе 130 на иностранных языках, списка использованных словарей, включающего 5 наименований, и глоссария. К диссертации прилагается список географических названий (Приложение 1) и список имен и фамилий (Приложение 2), включенных в двуязычный латышско-русский переводной автоматический словарь, а также тестовый корпус, созданный для проведения экспериментов по предварительной оценке эффективности использования системы на материале текстов на латышском языке, функционирующих в социальной коммуникации. В состав тестового корпуса вошли двести латышских предложений, их ручные и машинные переводы (Приложение 3). Общий объём работы составляет 262 страницы печатного текста: основное содержание работы изложено на 202 страницах, 60 страниц занимают приложения.

ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ

Во введении дается общая характеристика работы: обосновывается актуальность и указывается теоретическая база исследования, формулируются гипотеза, основная цель и необходимые для ее достижения конкретные задачи, определяются объект и предмет исследования, описывается материал и

основные методы исследования, определяется научная новизна, излагаются положения, выносимые на защиту, описывается теоретическая и практическая значимость полученных результатов, даются рекомендации по их использованию.

В главе I «Система машинного перевода для поддержания социальной коммуникации» определяется понятие «коммуникация», исследуются особенности и параметры социальной коммуникации, разрабатывается модель социальной коммуникации при использовании системы машинного перевода в качестве посредника; изучаются общие принципы работы систем машинного перевода, возможные стратегии построения таких систем, выявляется специфика системы машинного перевода для поддержания социальной коммуникации и требования, которым должна отвечать такая система; проводится анализ существующих практических типов лингвистических автоматов и практических систем машинного перевода с латышским языком, выбирается прототипическая система для встраивания латышско-русского модуля.

Под коммуникацией в реферируемой работе в самом общем виде понимается взаимодействие между субъектами коммуникации, опосредованное объектом такого взаимодействия, а под общением - конкретный тип взаимодействия. При этом под взаимодействием понимается процесс, состоящий из двух этапов: передачи объекта отправителем и приема объекта получателем. Под социальной коммуникацией (СК) в диссертации понимается особый тип общения социально-политических институтов конкретного государства с жителем этого государства.

В качестве прототипа модели СК в работе выбрана элементарная модель коммуникации, состоящая из двух дискретных единиц - субъектов и объекта коммуникации (В. Б. Кашкин, В. Н. Переверзев, Р. Г. Пиотровский, А. В. Соколов). В качестве субъектов СК рассматриваются:

1) отправитель - государство, а именно: социально-политические институты конкретного государства (министерства, инспекции, службы, канцелярии, политические партии, правительственные информационные агентства, научные центры и институты);

2) получатель - человек, житель конкретного государства. Социальная коммуникация характеризуется по следующим параметрам:

— по способу отношений между субъектами СК представляет собой систему коммуникации между людьми в отличие от:

^ технических коммуникационных систем (К. Шеннон, В. В. Дрыбин), ^ зоологических коммуникационных систем (В. В. Иванов,

А. Д. Кошелев, В. С. Фридман, Т. В. Черниговская),

^ смешанных коммуникационных систем (Ф. И. Шарков);

— по типу отношений между субъектами СК является личностно-групповой коммуникацией, а именно: коммуникацией между группой и человеком;

— по типу взаимодействия между субъектами СК представляет собой социальное общение и противопоставляется профессиональному

(производственному) общению, с одной стороны, и неофициальному (бытовому) общению - с другой;

- по способу взаимодействия между субъектами СК является линейной и однонаправленной;

- по форме взаимодействия между субъектами СК является электронной, базовым признаком которой является электронный (цифровой) канал взаимодействия.

В качестве средства взаимодействия между субъектами СК в диссертации рассматривается персональный компьютер, подключенный к сети Интернет, в качестве инструмента взаимодействия - информационные порталы социально-политических государственных институтов.

Объектом СК в реферируемой работе является текст, функционирующий в социальной коммуникации (текст СК), в его традиционном понимании как «произведение речетворческого процесса, обладающее завершенностью, объективированное в виде письменного документа, произведение, состоящее из названия (заголовка) и ряда особых единиц (сверхфразовых единств), объединенных разными типами лексической, грамматической, логической, стилистической связи, имеющее определенную целенаправленность и прагматическую установку»1. В качестве текстов СК в диссертации рассматриваются:

- нормативные акты, например закон, акт, кодекс, устав (правила), указ, конституция, распоряжение, постановление и т. п.;

- информационные сообщения.

В диссертации не рассматриваются поддерживающие навигацию по сайту элементы интерфейса (заголовки рубрик и закладок, расписаниями др.) информационных порталов социально-политических институтов.

Эффективность СК предполагает успешную реализацию основных целей, с которыми выступают ее субъекты. Основной целью государства как отправителя в этом случае является распространение (публикация) текстов СК с помощью инструментов взаимодействия. Успешная реализация основных целей получателя подобных текстов определяется извлечением необходимой ему информации. Для этого требуется не только наличие канала связи для обоих субъектов, но и совпадение кодов отправителя (код 1) и получателя (код 2). В рассматриваемой в диссертации ситуации кодом 1 является государственный (латышский) язык, кодом 2 - язык национального меньшинства (русский язык). В случае несовпадения кодов 1 и 2 успешная реализация основных целей субъектов коммуникации невозможна. В такой ситуации для эффективности СК необходим посредник - преобразователь текста в коде 1 в текст в коде 2. В качестве такого преобразователя может использоваться система машинного перевода для поддержания социальной коммуникации (МП-СК), которая переводит текст с государственного языка на

1 Гальперин И. Р. Текст как объект лингвистического исследования / И. Р. Гальперин ; отв. ред. Г. В. Степанов ; АН СССР, Ин-т языкознания. - М.: Наука, 1981. - С. 18.

язык национального меньшинства и позволяет получателю, не знающему государственный язык, преодолевать языковой барьер.

В ходе исследования была разработана и описана модель социальной коммуникации, реализуемая при использовании системы МП-СК в качестве посредника. Основными компонентами такой модели являются:

- субъекты (отправитель и получатель);

- объект (текст СК);

- электронный канал связи, по которому объект передается отправителем и принимается получателем (компьютер, подключенный к сети Интернет);

- код 1 (код отправителя) - государственный язык;

- код 2 (код получателя) - язык национального меньшинства;

- шум (незнание государственного языка получателем);

- преобразователь (система МП-СК).

В результате изучения общих принципов организации и работы систем машинного перевода различных типов была выявлена специфика системы МП-СК и определены общие и частные требования к такой системе. Так, проектируемая система должна соответствовать следующим общим требованиям, которые предполагают:

- открытость, модульность и иерархичность организации;

- использование лингвистической стратегии трансфера.

Проектируемая система должна удовлетворять следующим частным

требованиям:

- к количеству языков - бинарная система, работающая с государственным языком в качестве входного языка и языком национального меньшинства в качестве выходного языка;

- к назначению и качеству перевода - приблизительный (грубый) перевод текста СК, достаточный для извлечения и понимания информации получателем, не знающим государственного языка;

- к степени автоматизации - система, работающая в полностью автоматизированном режиме.

В соответствии с этим для проектирования системы МП-СК была решена задача выбора прототипа такой системы по двум параметрам:

- функциональному - исследована типология существующих лингвистических автоматов в структуре автоматизированных рабочих мест с точки зрения типов коммуникации и выполняемых функций автоматической переработки текста и определены такие их типы как:

V профессиональное автоматизированное рабочее место и

профессиональный ЛА в его структуре,

^ домашнее автоматизированное место и домашний ЛА в его структуре, что, в свою очередь, позволило выделить особый тип социально-ориентированного автоматизированного рабочего места и социального ЛА, в структуру которого должна встраиваться проектируемая система;

- прагматическому - изучены основные этапы развития машинного перевода в Латвии и рассмотрены существующие экспериментальные, а также практические (онлайновые и стационарные) системы МП с латышским языком с точки зрения удобства их пользовательского интерфейса и возможных настроек.

В результате в качестве прототипической системы для встраивания в нее системы латышско-русского МП-СК был выбран лингвистический автомат, входящий в структуру автоматизированного рабочего места Tildes Birojs с системой МП Tildes Tulkotajs для государственного языка. Выбор этого прототипа определяется следующим:

- рассматриваемый ЛА представляет собой открытую систему с модульной иерархической организацией, способной к развитию и адаптации к потребностям пользователя;

- в него уже встроена система англо-латышского МП, в которую, в свою очередь, может быть встроен латышско-русский модуль;

- наличие системы МП для государственного языка в рассматриваемом ЛА позволяет использовать готовые компоненты (словари и алгоритмы) и избежать дублирования данных при добавлении нового направления перевода в существующую систему.

Тем самым задача выбора прототипической системы для встраивания латышско-русского модуля была решена.

В главе II «Разработка системы латышско-русского машинного перевода для поддержания социальной коммуникации» детально рассматривается архитектура прототипической системы МП, определяется набор готовых и необходимых компонентов для проектируемой системы; определяются особенности реализации латышско-русского модуля; исследуются структурные и языковые особенности оформления текстов СК на латышском языке; определяется набор необходимых модификаций словарного обеспечения прототипической системы для создаваемого модуля, определяются типы необходимых морфологических и синтаксических преобразований при латышско-русском машинном переводе и рассматриваются примеры разработанных правил для реализации процедур синтаксического трансфера и согласования; описываются проведенные исследовательские эксперименты по предварительной оценке эффективности использования разработанной системы.

Архитектура прототипической системы англо-латышского МП основана на лингвистической стратегии трансфера и организована в виде набора отдельных модулей, каждый из которых отвечает за определенную процедуру на конкретном уровне реализации. Анализ архитектуры прототипической системы позволил выделить:

- готовые модули, которые могут использоваться при проектировании системы латышско-русского МП (модули фрагментации входного текста, морфологического анализа латышского языка, синтаксического трансфера,

лексического трансфера, морфологического анализа / синтеза русского языка, синтеза выходного текста);

- набор необходимых дополнительных компонентов для реализации процедуры латышско-русского МП (модуль парсинга для латышского языка, комплекс правил для модуля синтаксического трансфера, двуязычный латышско-русский переводной автоматический словарь (АС), комплекс правил для модуля согласования).

В соответствии с архитектурой прототипической системы процесс перевода с латышского языка на русский моделируется как многоуровневый иерархический процесс преобразования латышского входного текста в русский выходной текст с помощью рассмотренного лингвистического обеспечения и реализуется как последовательность следующих процедур:

- фрагментация входного латышского текста на предложения;

- морфологический анализ словоформ латышского предложения;

- синтаксический анализ латышского предложения;

- синтаксический трансфер входной структуры функционального сегмента латышского предложения в эквивалентную ей выходную структуру русского предложения;

- лексический трансфер латышских лексических единиц в единицы русского языка;

- синтез выходного текста на русском языке:

морфологический анализ русских переводных эквивалентов;

^ согласование двух лексико-грамматических кодов для корректного

синтеза русских переводных эквивалентов и приведение таких кодов к

единому формату - лексико-грамматическому коду для синтеза;

^ морфологический синтез русских переводных эквивалентов; оформление результатов перевода.

Для определения необходимых модификаций словарного обеспечения латышско-русского модуля и разработки комплекса правил синтаксического трансфера и согласования были рассмотрены структурные и языковые особенности оформления текстов СК на латышском языке на материале наиболее типичных представителей - текстов законов Латвийской Республики. Такие тексты обладают нежесткой (полужесткой) структурой и типизированным языковым оформлением, т. е. являются моделированными текстами. Обязательными компонентами текста закона Латвийской Республики являются:

- заголовок;

- дата принятия, провозглашения и вступления в силу закона;

- основная часть, состоящая из статей, разделов и частей;

- правила перехода закона, которые отменяют силу действия предыдущего закона.

Необязательными (факультативными) компонентами структуры такого текста являются:

- глоссарий (определение используемых в законе терминов);

- сфера действия закона;

- условия (указание на лица или объекты, на которые не распространяется действие закона, к которым действие закона применяется иначе или к которым применятся действие другого закона);

- приложение.

Для эффективности CK при машинном переводе таких текстов необходимо полностью сохранять структурные особенности их оформления.

С точки зрения лексических особенностей оформления в рассматриваемого типа текстах не используются:

- заимствования, за исключением следующих выражений латинского происхождения: de iure, defacto, inter alia;

- сокращения, за исключением общепринятых сокращений, например: и. с. - un citi (и др. - и другие), utt. - un tä täläk (и т. д.- и так далее)-,

- синонимы в рамках одного текста, за исключением некоторых взаимозаменяемых слов, например: ceturksnis - kvartäls {четверть - квартал), ieteikt - rekomendét (советовать - рекомендовать), ievedums - imports (ввоз -импорт) (В. Круминя, В. Скуиня).

В текстах CK используются:

- эмоционально неокрашенные лексические единицы, т. е. нейтральная общая лексика;

- стандартизированные словосочетания (клише), например: sastädit aktu (¡составить акт), ieprieks minetais (вышеупомянутый);

- специализированная терминологическая лексика, например: tresä persona (третье лицо), vélesanu komisija (избирательная комиссия)',

- имена собственные (географические названия, названия организаций, имена и фамилии людей) (В. Круминя, В. Скуиня).

Лексические особенности текстов CK определяют лексический состав словарного обеспечения системы. В то же время такие тексты на латышском языке не обладают разнообразием форм (И. Ванцане, В. Круглевскис, В. Круминя, В. Скуиня) и синтаксических конструкций. В результате рассмотрения наиболее общих структурных и языковых особенностей оформления текстов CK на латышском языке на материале нормативных актов был выявлен ряд общих правил их создания, которые должны учитываться при проектировании системы МП-СК. Так, в результате проведенного исследования состав словника двуязычного латышско-русского переводного АС общей лексики был проверен и модифицирован:

- добавлены лексические единицы латинского происхождения;

- откорректированы словарные статьи синонимов;

- включены паронимы с соответствующими русскими переводными эквивалентами.

Однако при машинном переводе текстов CK особые трудности могут вызывать лексические единицы, проанализированные на этапе

морфологического анализа, но не вошедшие в двуязычный переводной АС из-за:

- низкой частоты лексических единиц или отдельных словоформ, определяющей нецелесообразность их включения в словарь системы МП;

- орфографических ошибок в исходном (включенном в автоматизированное рабочее место Tildes Birojs) словнике латышско-русского переводного АС общей лексики.

Причиной таких ошибок являются неточности результатов сканирования традиционных лексикографических источников и некорректность последующей обработки отсканированных материалов в электронной форме, возникшие в то время, когда создавался этот словарь.

Для решения задачи перевода низкочастотных лексических единиц/ словоформ был создан дополнительный модуль, включающий специально разработанные грамматические и словообразовательные правила их преобразования. Для исправления орфографических ошибок в словнике АС с помощью модуля автоматизированной проверки орфографии для латышского и русского языков были проверены все лексические единицы обоих языков, входящие в его состав. Кроме того, по материалам справочных изданий в этот словник были включены следующие списки:

- список географических названий, принятых на территории Латвии и других стран (около 600 лексических единиц) (полный список приведен в Приложении 1);

- список имен и фамилий, выявленных по материалам текстов СК, опубликованных на информационном портале издательства «Diena»2 и новостного информационного портала «Delfi»3 (более 400 лексических единиц) (полный список приведен в Приложении 2).

Таким образом, словарное обеспечение АС в создаваемой системе было модифицировано и адаптировано для целей реферируемого исследования.

Для корректного перевода частотных форм латышских лексических единиц на русский язык, а также наиболее частотных синтаксических конструкций в текстах СК на латышском языке был создан и апробирован комплекс правил для модулей синтаксического трансфера и согласования. Для этого были решены следующие задачи:

- проведен сопоставительный анализ морфологических и синтаксических характеристик латышского языка и особенностей их перевода на русский язык4;

2 <www.diena.lv>.

3 <www.delfi.lv>.

4

Поскольку представительного латышско-русского параллельного корпуса текстов СК не существует, то сопоставительный анализ морфологических и синтаксических характеристик латышского языка и особенностей их перевода на русский язык проводился на материале практических грамматик латышского и русского языков, а также на базе исследований по сопоставительной грамматике обоих языков.

- определены типы морфологических и синтаксических преобразований, необходимых при латышско-русском машинном переводе;

- изучены функции, разработанные и используемые в правилах синтаксического трансфера и согласования в прототипической системе;

- разработан комплекс правил, необходимых для реализации выявленных типов грамматических преобразований в создаваемой системе.

В реферируемой работе основные грамматические характеристики латышского языка и особенности их перевода на русский язык рассмотрены на примере сопоставительного анализа систем грамматических категорий латышского и русского существительных. В результате исследования был определен набор необходимых преобразований для перевода латышского существительного на русский язык. Потенциал разработанных правил для реализации необходимых преобразований представлен на конкретных примерах латышско-русского машинного перевода существительного. Так, специальная трансформация необходима при переводе латышского существительного в форме местного падежа на русский язык. Это связано с тем, что беспредложная форма местного падежа в латышском языке не соответствует форме предложного падежа в русском языке, которая всегда употребляется с предлогом, например, латышское существительное da[a {часть) в синтаксической конструкции panta pirmaja da\a (в первой части статьи). В данном случае необходима трансформация добавления нового компонента синтаксической конструкции (предлога) к русскому существительному в форме предложного падежа. Такая трансформация проводится с помощью разработанного правила с использованием следующих функций:

- функция Target.Case для проверки значения местного падежа латышского существительного (locative) и присвоения значения предложного падежа русскому существительному (prepositional);

- функции insert_leftmost и NewNode.TargetSpelling для добавления нового компонента (NewNode - V) к русскому существительному (Target) и установления связи между ними (рсотр);

- функция NewNode.POS для присвоения новому компоненту (NewNode) значения характеристики части речи (PREP - предлог).

В результате выполнения описанных выше действий в момент формирования русского перевода к существительному в форме предложного падежа добавляется предлог в. Следует отметить, что латышское существительное в форме местного падежа может переводиться на русский язык также существительным с предлогом на, что зависит от синтаксических и семантических характеристик конкретной лексической единицы (глагола или существительного), с которой предлог сочетается. Так как семантические характеристики лексических единиц, а также их управление не описываются в АС системы, то в ее первой версии реализована возможность перевода латышского существительного в форме местного падежа на русский язык с предлогом в.

В русском языке ограниченная группа слов мужского рода 1-го склонения образует вторую форму предложного падежа в единственном числе в пространственном значении с флексией -|у|, например в порту. Соответственно, для данной группы слов необходимо синтезировать именно вторую форму предложного падежа (локатив) русского переводного эквивалента, которая будет соответствовать форме местного падежа в латышском языке. Для этого системе МП были переданы знания о том, какие существительные в русском языке могут иметь вторую форму предложного падежа. Список таких существительных русского языка с дополнительной характеристикой locative_2 был составлен и добавлен в отдельный словарный файл в систему латышско-русского МП. Для корректного синтеза второй формы предложного падежа таких существительных было разработано специальное правило, в котором используется функция Analyze.KindOf, реализуемая в прототипической системе МП. С помощью данной функции проверяется принадлежность конкретного русского существительного к списку с характеристикой locative_2. Если русское существительное принадлежит к такому списку, то в результате выполнения разработанного правила для него синтезируется вторая форма предложного падежа. Далее с использованием описанных выше функций к русскому существительному добавляется предлог в. На рисунке 1 приведены примеры перевода фрагментов предложений латышского языка с существительными da¡a (часть), Satversme (конституция) и osta (порт) в форме местного падежа на русский язык в форме предложного и второго предложного падежей соответственно в результате выполнения описанных выше правил в разработанной системе.

iL Tildes Tulkotajs : 1 Tutet] No 1 а ЬЬЫи j Uz | * bteu J Ш I A" I Л ©1

@i«l«n« JgNoSrH щ i I 8'

panta pirmaja daja Latvljas Satversms bQvniecTba Rigas osta

lUHMiiSÄ _xj

8 первой части статьи 1 В Конституции Латвии строительство в порту Риги

Рисунок 1. Пример машинного перевода латышских существительных в форме местного падежа на русский язык

Для реализации перевода латышского существительного на русский язык были также проанализированы основные типы синтаксических конструкций с существительным - именные синтаксические конструкции. Было установлено, что особую сложность для МП на русский язык представляют именные генитивные конструкции (adnominalais genitlvs). При латышско-русском МП именных генитивных конструкций приходится прибегать к изменению порядка слов в выходной структуре русской именной группы. Дело в том, что в латышском языке в группе существительного все падежные формы следуют за существительным в генитиве, т. е. в латышской двухкомпонентной именной генитивной конструкции определяющее существительное в форме генитива находится в препозиции к определяемому существительному в другой падежной форме.

Рассмотрим подобную трансформацию на примере латышской двухкомпонентной именной генитивной конструкции ministru kabinets (N'ge,, N2)), в которой существительное в форме генитива ministru является зависимым по отношению к существительному в форме именительного падежа kabinets. Для успешного синтеза русской именной группы необходима синтаксическая трансформация изменения порядка слов в исходной структуре латышского языка gen- Такая трансформация проводится с

помощью специально разработанного правила, при выполнении которого с использованием функции move_to_right латышское существительное в форме генитива ministru будет перемещено в постпозицию по отношению к ядру латышской именной генитивной конструкции kabinets, соответственно, в момент формирования русского перевода порядок слов будет правильным. На рисунке 2 приведены примеры латышско-русского МП таких конструкций.

Tildes TulkDtajs

Tjífef ¡ Но J 5! latvrssjjJ t'z j * k'ievujJ

Ш A"

glelTmé; ^ÉjJfíoSni

Ministro Kabinets veietaju skaits bsrnu tiesJbas

%Kopé: iMSiitS

Кабинет Министров число избирателей праза детей

Рисунок 2. Пример машинного перевода латышской двухкомпонентной именной генитивной конструкции

на русский язык

В результате сопоставительного анализа грамматических характеристик существительного в латышском и русском языках были выявлены следующие типы грамматических преобразований, необходимых при латышско-русском машинном переводе существительного:

- замена или присвоение значения морфологической или синтаксической характеристики;

- удаление или добавление компонента синтаксической конструкции;

- изменение порядка слов в структуре входной синтаксической конструкции.

Аналогичным образом анализ проводился для остальных частей речи, набор которых совпадает в обоих языках, и разрабатывались правила для их перевода. Результаты исследования были экспериментально апробированы в созданном модуле латышско-русского машинного перевода. Разработанные правила позволяют внести изменения в грамматическую информацию для отдельной лексической единицы или в структуру конкретной латышской синтаксической конструкции для успешного их синтеза на русский язык на последнем этапе машинного перевода.

Для предварительной оценки эффективности использования системы латышско-русского МП-СК были проведены три исследовательских эксперимента по оценке качества машинного перевода, получаемого в результате применения разработанного модуля. Эксперименты организованы автором реферируемой работы и проведены с использованием трех методов:

1) автоматического измерения качества машинного перевода с использованием таких автоматических систем, как BLEU и NIST;

2) лингвистического анализа ошибок машинного перевода, проведенного автором исследования;

3) ручной оценки качества машинного перевода, проведенного с участием потенциальных пользователей системы.

Для проведения экспериментов на материале текстов CK на латышском языке был создан тестовый корпус. В состав тестового корпуса вошли двести предложений на латышском языке (общим объемом 3 144 словоупотребления) (полный список приведен в Приложении 3). Латышские предложения были выбраны методом случайных чисел из текстов CK (нормативные акты Латвийской Республики и информационные сообщения, опубликованные на информационных порталах социально-политических государственных институтов) и переведены на русский язык профессиональным переводчиком, работающим в этой предметной области. Кроме того, латышские предложения были переведены с помощью созданного модуля. Таким образом, тестовый корпус для проведения экспериментов по оценке качества машинного перевода представлял собой параллельный массив, включающий три составляющие:

1) латышские предложения - исходные предложения;

2) ручной перевод латышских предложений на русский язык - эталонные предложения;

3) машинный перевод латышских предложений на русский язык.

Для проведения первого эксперимента использовались две наиболее известные и активно используемые автоматические системы - BLEU и NIST. Процедура автоматического измерения качества машинного перевода с использованием выбранных систем представляет собой процесс сравнения машинных переводов входных предложений с их ручными эталонными переводами. Критерием оценки является степень соответствия машинного и ручного перевода, а методом оценки - сопоставление компонентов предложений. Основная идея такой процедуры в самом общем виде состоит в следующем: чем больше соответствий обнаруживается в сравниваемых предложениях, тем ближе машинный перевод к профессиональному. Средние количественные показатели автоматического измерения качества латышско-русского перевода, проведенного по результатам исследования с использованием разработанного модуля, для всех предложений тестового корпуса составили 15,56 (BLEU) и 5,08 (NIST) из 100 (BLEU) и 10 (NIST) соответственно. Для контроля тот же анализ был проведен по результатам использования системы статистического МП Google5 на материале созданного тестового корпуса. Количественные показатели для этой системы составили 14,39 (BLEU) и 4,06 (NIST), т. е. более низкие, чем для разработанного модуля, что позволяет прийти к выводу о том, что для целей поддержания CK созданная система демонстрирует лучшие результаты и является потенциально более качественной.

В целом полученные показатели не являются высокими, однако этого недостаточно для объективной комплексной оценки качества машинного перевода. Автоматические системы не выявляют причин конкретных ошибок, возникающих при машинном переводе, и их влияния на понятность текста. Кроме того, в эксперименте участвовали два языка с высокоразвитой флективной организацией и свободным порядком слов, что не учитывается автоматическими метриками. Для получения более объективных результатов были организованы еще два эксперимента - лингвистический анализ и ручная оценка. Полученные результаты автоматического измерения были установлены в качестве базовых, которые в дальнейшем могут использоваться для сравнения следующих версий созданного модуля.

Для выявления причин ошибок, возникающих при машинном переводе, был проведен специальный сопоставительный анализ ста первых предложений тестового корпуса на латышском языке (общим объемом 1413 словоупотреблений), их ручных и машинных переводов на русский язык. В ходе анализа была создана иерархическая классификация ошибок, возникающих при латышско-русском машинном переводе с использованием созданного модуля:

- 109 лексических ошибок, заключающихся в том, что в тексте машинного перевода зафиксированы:

5 <http://translate.google.com>.

53 непереведенные лексические единицы, что связано с недостаточным объемом переводного АС, а также с ошибками, возникшими в результате морфологического анализа;

^ 12 непереведенных или неправильно переведенных оборотов; 44 неправильно переведенные многозначные лексические единицы6;

- 52 морфологические ошибки, возникшие в результате:

^ неправильного результата морфологического анализа латышской лексической единицы (17 ошибок), что связано с несовершенством алгоритмов морфологического анализа, например отсутствием процедуры снятия морфологической многозначности, возникающей, как правило, в результате конверсионной омонимии;

^ нулевого результата морфологического анализа конкретной лексической единицы латышского языка (в тестовом корпусе зафиксирована одна ошибка), что связано с тем, что данная лексическая единица отсутствует в АС модуля морфологического анализа;

^ неправильного синтеза конкретной формы русской лексической единицы, что связано с неточностями в правилах согласования (25 ошибок);

неправильного синтеза конкретных форм лексических единиц в составе оборота, что связано с отсутствием дополнительного модуля для корректного перевода оборотов в первой версии системы (9 ошибок);

- синтаксические ошибки, возникающие в результате некорректного анализа всего предложения или его частей на уровне групп / функциональных сегментов (36 ошибок), что, в свою очередь, в большинстве случаев связано с отсутствием алгоритмов снятия синтаксической неоднозначности в системе,

- 5 пунктуационных ошибок в переводе;

- одна орфографическая ошибка в исходном латышском предложении. Для устранения выявленных типов ошибок в дальнейшем необходимо

провести исследование и определить набор модификаций алгоритмов и объем пополнения словарного обеспечения системы, что приведет к улучшению качества машинного перевода.

Оценка эффективности использования созданной системы проводилась также методом анкетирования потенциальных пользователей - жителей Латвии, которые не владеют латышским языком. В эксперименте участвовало десять человек различного возраста и уровня образования. В ходе опроса для оценки понятности текста им предлагались 25 предложений на русском языке -результаты машинного перевода, отобранные из тестового корпуса (каждое восьмое предложение из тестового корпуса). Основным критерием оценки являлась понятность содержания конкретного предложения, которая оценивалась по специально разработанной для этого исследования пятибалльной шкале. Высший балл «5» соответствует полному пониманию

б „

В первой версии созданного модуля латышско-русского машинного перевода не реализованы процедуры снятия лексической, морфологической и синтаксической неоднозначности.

информации, содержащейся в предложении, а низший балл «1» соответствует полному непониманию информации, содержащейся в предложении. Среднее значение оценки составило 3,3 балла, т. е. выше среднего. Такие результаты позволяют сделать вывод о приемлемости текстов машинного перевода в целом и о потенциальной эффективности использования системы.

Результаты проведенных экспериментов свидетельствуют о том, что созданная система может служить интересам пользователей - жителей Латвии, которые не владеют латышским языком, для ознакомления с содержанием текста СК и успешной реализации их целей в процессе социальной коммуникации. Следовательно, подход к организации системы МП-СК, описанный в реферируемой работе, позволяет создать продукт, дающий возможность человеку, не знающему или плохо знающему государственный язык, преодолевать языковой барьер: извлекать информацию из текста на иностранном языке и поддерживать СК с ее помощью.

ЗАКЛЮЧЕНИЕ

Реферируемое диссертационное исследование о возможностях выбора и модификации системы машинного перевода с государственным языком и встраивания системы МП-СК, позволило прийти к следующим выводам.

Во-первых, социальная коммуникация в соответствии с особенностями и основными параметрами, исследованными в диссертации, может быть охарактеризована как:

- коммуникация между людьми;

- личностно-групповая коммуникация;

- социальное общение;

- линейная и однонаправленная коммуникация;

- электронная коммуникация.

Инструментом взаимодействия между субъектами СК являются информационные порталы социально-политических государственных институтов, включая средства массовой информации, а средством взаимодействия - персональный компьютер, подключенный к сети Интернет.

Основными необходимыми компонентами модели СК являются: субъекты, объект, электронный канал связи, код 1, код 2, шум, преобразователь.

Во-вторых, изучение общих принципов работы систем МП и специфики системы МП-СК позволило:

- выделить параметры, по которым система МП-СК отличается от других типов систем с точки зрения назначения и дальнейшего использования перевода;

- установить общие и частные требования, которым должна отвечать такая система для обеспечения эффективности СК.

К параметрам МП-СК, по которым такая система отличается от других типов систем, относятся:

- цель, с которой получатель текста СК вступает в процесс коммуникации;

- тип текстов, для перевода которых предназначена система.

Общие требования к системе МП-СК можно сформулировать в виде основных принципов организации такой системы:

- открытость, модульность и иерархичность организации;

- лингвистическая стратегия трансфера в качестве основного подхода к процессу перевода.

Система МП-СК должна отвечать следующим частным требованиям:

- по количеству языков - бинарная система, работающая с государственным языком в качестве входного языка и языком национального меньшинства в качестве выходного языка;

- по назначению перевода - получение грубого перевода текстов СК, достаточного для извлечения и понимания социальной информации пользователем, не знающим государственного языка;

- по степени автоматизации - система, работающая в полностью автоматизированном режиме.

Машинный перевод текстов СК должен быть достаточным для извлечения и понимания социальной информации пользователем, не знающим государственного языка.

В-третьих, с функциональной и прагматической точек зрения система МП-СК должна встраиваться в социальный ЛА, поддерживающий функцию машинного перевода для государственного языка. Анализ существующих практических типов ЛА и практических систем МП с латышским языком позволил выбрать прототип такого ЛА, который должен представлять собой открытую систему с модульной и иерархической организацией, способную к развитию и адаптации к потребностям получателя текста СК. Прототипическая система должна отвечать требованиям, определенным для системы разрабатываемого типа.

В-четвертых, детальное рассмотрение архитектуры прототипической системы позволило определить особенности разработки и реализации в ней процедуры машинного перевода текстов СК с латышского языка на русский, которые состоят в следующем:

- архитектура встраиваемого модуля должна разрабатываться в соответствии с архитектурой прототипической системы;

- для создания встраиваемого модуля могут использоваться готовые модули автоматической переработки текста на государственном языке, входящие в структуру прототипической системы;

- для реализации нового направления перевода в прототипической системе необходимо модифицировать ее словарное обеспечение, а также разработать комплекс правил для модулей синтаксического трансфера и согласования.

Модификация словарного обеспечения прототипической системы проводилась в соответствии с требованиями, установленными в результате изучения лексических особенностей текстов СК на латышском языке, к которым относится использование нейтральной общей лексики, стандартизированных словосочетаний (клише), специализированной

терминологической лексики, имен собственных (географических названий, названий организаций, имен и фамилий людей). Для текстов СК не характерно использование заимствований (за исключением отдельных выражений латинского происхождения), сокращений (за исключением общепринятых), синонимов в рамках одного текста (за исключением некоторых взаимозаменяемых слов).

В результате словник латышско-русского АС был модифицирован:

- добавлены лексические единицы латинского происхождения;

- откорректированы словарные статьи синонимов, а также включены паронимы с соответствующими русскими переводными эквивалентами;

- разработан дополнительный модуль для перевода низкочастотных лексических единиц;

- исправлены орфографические ошибки;

- включены списки географических названий, принятых на территории Латвии и других стран, а также имен и фамилий, выявленных по материалам текстов СК.

Разработка комплекса правил для модулей синтаксического трансфера и согласования проводилась:

- на основе исследования структурных и языковых особенностей оформления текстов СК на латышском языке, позволившего установить, что имеется ряд общих правил, которые соблюдаются при создании таких текстов и позволяют отнести тексты СК к моделированным текстам с нежесткой структурой и типизированным языковым оформлением, а также должны учитываться при проектировании системы МП-СК;

- на основе сопоставительного анализа грамматических характеристик латышского языка и особенностей их перевода на русский язык (на материале практических грамматик латышского и русского языков), в результате которого были выявлены типы грамматических преобразований, необходимых при латышско-русском машинном переводе;

- на основе изучения разработанных в прототипической системе функций, которые использовались для реализации установленных типов преобразований и разработки правил синтаксического трансфера и согласования в латышско-русском модуле.

Результаты исследования были экспериментально апробированы в созданном модуле. Для объективной комплексной оценки качества машинного перевода с использованием созданного модуля были проведены три исследовательских эксперимента: автоматический анализ сопровождался лингвистическим анализом и ручной оценкой. Полученные результаты автоматического измерения были установлены в качестве базовых, которые в дальнейшем могут использоваться для сравнения следующих версий созданного модуля. Была также разработана иерархическая классификация ошибок, возникающих при латышско-русском машинном переводе с использованием созданного модуля, и намечены возможные направления

исследования в дальнейшем для улучшения качества машинного перевода, а именно: определение набора модификаций алгоритмов и пополнения словарного обеспечения системы. В результате проведения экспериментов была установлена потенциальная эффективность использования созданной системы.

Таким образом, были решены основные задачи и достигнута цель исследования. Гипотеза о том, что система латышско-русского МП может создаваться на основе имеющихся модулей анализа государственного языка и использоваться как средство поддержания CK в латвийском обществе, позволяя пользователю преодолевать языковой барьер, была подтверждена.

По теме диссертации опубликованы следующие работы.

1. English- / Russian-Latvian Machine Translation System / Raivis Skadiijs, Inguna Skadina, Daiga Deksne, Tatiana Gornostay // The Third Baltic Conference on Human Language Technologies : Proceedings (October 4-5, 2007, Kaunas, Lithuania) / Vytauto Didziojo Universitetas ; Lietuviii Kalbos Instituías ; ed. Frantisek Cermák, Rüta Marcinkeviciené, Erika Rimkuté, Jolanta Zabarskaité. -Vilnius: [s. п.], 2007. - P. 287-294 (0,75 п. л., доля автора - 0,25 п. л.). - ISBN 978-9955-704-53-9.

2. Горностай Т. А. Латышско<->русский машинный перевод: история, проблемы, решения / Т. А. Горностай // IV междунар. научно-практ. конф. «Прикладная лингвистика в науке и образовании», 27-28 марта 2008, Санкт-Петербург. - СПб. : [ЛЕМА], 2008. - С. 39-45. - (0,6 п. л.). - ISBN 978-598709-087-9.

3. Горностай Т. Система машинного перевода Tilde Translator: новый этап в развитии англо- / русско-латышского машинного перевода / Т. Горностай // Компьютерная лингвистика и интеллектуальные технологии : по материалам ежегодной Международной конференции «Диалог» (2008) = Computational Linguistics and Intellectual Technologies : Papers from the Annual International Conference "Dialog" (2008) : периодич. изд. - [Жуковский : Люкс-Принт], 2008. - Вып. 7(14). - С. 109-115 (0,9 п. л.). - ISBN 978-5-7281-1022-4.

4. Горностай Т. А. Архитектура латышско-русского модуля системы машинного перевода для поддержания социальной коммуникации / Т. А. Горностай // Известия Российского государственного педагогического университета им. А. И. Герцена : научный журнал. -СПб., 2009. - № 110 [июль]. - С. 177-181 (0,5 п. л.). - ISSN 1992-6464.

5. Горностай Т. А. Грамматические трансформации при латышско-русском машинном переводе / Т. А. Горностай // Известия Российского государственного педагогического университета им. А. И. Герцена : научный журнал. - СПб., 2009. - № 111 [июль]. - С. 169-173 (0,4 п. л.). -ISSN 1992-6464.

Подписано в печать 12.04.2010 г. Формат 60x84 1/16. Бумага офсетная. Печать офсетная. Усл. печ. л. 1,4. Тираж 100 экз. Заказ № 1585.

Отпечатано в ООО «Издательство "ЛЕМА"»

199004, Россия, Санкт-Петербург, В.О., Средний пр., д.24, тел./факс: 323-67-74 e-mail: izd_lema@mail.ru http://www.lemaprint.ru

 

Оглавление научной работы автор диссертации — кандидата филологических наук Горностай, Татьяна Александровна

ВВЕДЕНИЕ.

ГЛАВА I Система машинного перевода для поддержания социальной коммуникации.

1.1 Вводные замечания.

1.2 Особенности социальной коммуникации при машинном переводе.

1.3 Система машинного перевода для поддержания социальной коммуникации - общее и специфическое.

1.4 Система машинного перевода для поддержания социальной коммуникации как модуль лингвистического автомата.

1.5 Системы машинного перевода с латышским языком.

1.6 Выводы по главе 1.

ГЛАВА II Разработка системы латышско-русского машинного перевода для поддержания социальной коммуникации.

2.1 Вводные замечания.

2.2 Архитектура прототипической системы англо-латышского машинного перевода.

2.3 Структура и состав латышско-русского модуля машинного перевода

2.4 Особенности оформления текстов на латышском языке, функционирующих в социальной коммуникации.

2.5 Реализация машинного перевода текстов, функционирующих в социальной коммуникации, с латышского языка на русский.

2.6 Оценка эффективности использования системы латышско-русского машинного перевода для поддержания социальной коммуникации.

2.7 Выводы по главе II.

 

Введение диссертации2010 год, автореферат по филологии, Горностай, Татьяна Александровна

Одним из важных аспектов развития современного общества является взаимодействие народов и их культур и перевод как средство его осуществления. Машинный перевод представляет собой область компьютерной лингвистики, которая занимается теорией и практикой применения компьютера к задаче перевода текста с одного естественного языка на другой. Сегодня машинный перевод является перспективным направлением с почти 200 действующими практическими системами машинного перевода [Compendium. 2009], которые применяются как средство извлечения знаний в научной и технической сфере, а развитие переводческих технологий имеет научную, политическую, экономическую и социальную значимость.

Актуальность темы исследования. Исторические события 1 мая 2004 года, когда Европейский Союз принял в свои члены десять новых стран-участниц, остро поставили вопрос о необходимости средств поддержки социальной коммуникации в условиях обмена электронной информацией на глобальных и национальных языках. Под термином «социальная коммуникация» в диссертации понимается особый тип общения социально-политических институтов конкретного государства с жителем этого государства. В качестве одного из средств поддержки социальной коммуникации может рассматриваться система машинного перевода.

В настоящем диссертационном исследовании изучается круг проблем, связанных с созданием системы машинного перевода с латышского на русский язык, предназначенной для поддержания социальной коммуникации. Именно данное направление перевода имеет особую важность. Это связано с тем, что в Латвии возрастает конкуренция русского языка с другими языками международного общения, которым отдается предпочтение, во-первых, при выборе иностранного языка для изучения в сфере среднего образования, во-вторых, для коммуникации в сфере высшего образования. Однако и сегодня русский язык по-прежнему является вторым (после латышского) языком общения в латвийском обществе. При этом Латвия является страной с почти половиной русскоязычного населения, значительную часть которого составляют жители среднего и старшего возраста, а также мигранты, не владеющие латышским языком на должном уровне, достаточном для обеспечения социального взаимодействия. В силу названных причин особую актуальность приобретает задача разработки и совершенствования системы латышско-русского машинного перевода для поддержания социальной коммуникации.

При решении этой задачи следует учитывать, что уже созданы практические системы машинного перевода, предоставляющие возможность перевода текстов с латышского и на латышский язык. Руководствуясь лингвистическими и кибернетическими принципами построения лингвистических автоматов, принципами модульности архитектуры и открытости системы [Беляева 2001: 9; 2007 а: 26; Пиотровский 2002: 21; 2005; Beliaeva 2003: 195; Лингвистические ресурсы. 2004: 22-23; Работа лингвистического автомата. 2004], систему латышско-русского машинного перевода для поддержания социальной коммуникации можно создавать как модуль действующей системы машинного перевода, как одну из основных составляющих автоматизированной компьютерной системы -лингвистического автомата.

При этом для реализации латышско-русского модуля машинного перевода необходимо, во-первых, изучить возможность встраивания латышско-русского модуля в существующую систему машинного перевода, во-вторых, исследовать особенности обоих языков и выявить языковые структуры, представляющие особые сложности для машинного перевода. Необходимо учитывать тот факт, что латышский и русский языки недостаточно изучены с точки зрения перевода и сопоставительного языкознания, а также мало изучены с точки зрения их представления в системах машинного перевода.

Теоретической базой исследования послужили положения:

• теории коммуникации — об объеме и соотношении понятий «коммуникация» и «общение» (В. В. Дрыбин, В. П. Конецкая,

A. С. Нариньяни, В. Н. Переверзев, А. В. Соколов, Р. С. Цаголова), о структуре модели коммуникации и ее компонентах (В. Б. Кашкин, Г. Лассуэлл, Р. Г. Пиотровский, В. Н. Переверзев, А. В. Соколов, К. Шеннон, Р. Якобсон);

• теории речевых актов - о структуре речевого акта (Дж. JI. Остин, Дж. Р. Серль) и стратегии речевого поведения (Г. П. Грайс);

• теории перевода - об особенностях процесса перевода как части процесса коммуникации (Е. В. Бреус, В. С. Виноградов,

B. Н. Комиссаров, А. А. Паршин, Г. М. Стрелковский);

• компьютерной (инженерной) лингвистики - о принципах построения лингвистических процессоров (Ю. Д. Апресян, JI. Н. Беляева, К. Р. Пиотровская, Р. Г. Пиотровский);

• машинного перевода - о стратегиях реализации систем машинного перевода, способах описания лингвистических алгоритмов и словарных баз (Ю. Д. Апресян, JL Н. Беляева, Д. By, JI. JI. Иомдин, М. Карл, Ф. Коэн, Ю. Н. Марчук, С. Ниренбург, Р. Г. Пиотровский, И. И. Убин, X. Ушкорайт, Дж. Хатчинс).

Гипотеза исследования: система латышско-русского машинного перевода может:

• создаваться на основе имеющихся в структуре многофункционального лингвистического автомата модулей автоматической переработки текста на государственном (латышском) языке;

• использоваться как средство поддержки социальной коммуникации в латвийском обществе, позволяя пользователю, не знающему или плохо знающему государственный язык, преодолевать языковой барьер.

В соответствии с этим целью диссертационной работы является установление принципов выбора и модификации системы машинного перевода с государственным языком и встраивания систем машинного перевода, предназначенных для поддержания социальной коммуникации, в структуру лингвистического автомата.

Для достижения поставленной цели необходимо решение следующих задач:

• исследование особенностей и параметров социальной коммуникации, разработка модели социальной коммуникации при использовании системы машинного перевода в качестве посредника;

• изучение общих принципов работы систем машинного перевода и выявление специфики системы машинного перевода для поддержания социальной коммуникации;

• анализ существующих типов лингвистических автоматов и практических систем машинного перевода с латышским языком, выбор прототипической системы для встраивания латышско-русского модуля;

• рассмотрение архитектуры прототипической системы машинного перевода и определение особенностей реализации латышско-русского модуля;

• исследование структурных и языковых особенностей оформления текстов на латышском языке, функционирующих в социальной коммуникации;

• разработка и реализация в прототипической системе процедуры машинного перевода текстов, функционирующих в социальной коммуникации, с латышского языка на русский;

• экспериментальное апробирование и предварительная оценка эффективности использования системы латышско-русского машинного перевода для поддержания социальной коммуникации.

Цель и задачи диссертационной работы определяют ход, материал и методику исследования.

Объектом исследования является система машинного перевода в структуре лингвистического автомата, предназначенная для поддержания социальной коммуникации.

Предметом исследования являются особенности организации системы машинного перевода, предназначенной для поддержания социальной коммуникации, в структуре лингвистического автомата.

Материал исследования. Системы машинного перевода, тексты на латышском языке, функционирующие в социальной коммуникации, практические грамматики латышского и русского языков.

Методы исследования. В ходе диссертационного исследования применялись методы лингвистического анализа языкового материала (метод оппозиций, методы словообразовательного, грамматического, стилистического, дистрибутивного, структурного анализа), сопоставительного анализа систем машинного перевода и грамматик латышского и русского языков.

Научная новизна исследования заключается в следующем:

• установлены принципы выбора, модификации и встраивания систем машинного перевода с государственным языком, предназначенных для поддержания социальной коммуникации, в структуру лингвистического автомата;

• разработана модель социальной коммуникации при использовании системы машинного перевода в качестве посредника;

• определены общие и частные требования, которым должна соответствовать система машинного перевода для поддержания социальной коммуникации;

• определены типы морфологических и синтаксических преобразований, необходимых при латышско-русском машинном переводе;

• разработан и реализован в системе латышско-русского машинного перевода комплекс правил для реализации процедур синтаксического трансфера и согласования.

На защиту выносятся следующие положения:

• система латышско-русского машинного перевода для поддержания социальной коммуникации может быть встроена в структуру многофункционального лингвистического автомата, поддерживающего функцию машинного перевода для государственного (латышского) языка;

• система машинного перевода для поддержания социальной коммуникации отличается от других типов систем машинного перевода по цели, с которой получатель вступает в процесс коммуникации, и типу текстов, для перевода которых предназначена;

• система латышско-русского машинного перевода может рассматриваться как необходимый компонент процесса социальной коммуникации в латвийском обществе, позволяя пользователю, не знающему государственного (латышского) языка, преодолевать языковой барьер.

Теоретическая значимость исследования заключается в том, что:

• установлена необходимость и целесообразность создания системы машинного перевода для поддержания социальной коммуникации, что способствует дальнейшему развитию теории машинного перевода и вносит вклад в переводоведение;

• определены принципы и методы выбора, модификации и встраивания систем машинного перевода с государственным языком для поддержания социальной коммуникации, что служит основой дальнейших лингвистических исследований по созданию систем машинного перевода с латышского языка на другие национальные языки, а также с других государственных языков;

• разработан комплекс правил для реализации процедур синтаксического трансфера и согласования в модуле латышско-русского машинного перевода, что способствует дальнейшему развитию алгоритмов парсинга для машинного перевода.

Практическая значимость исследования заключается в том, что созданная система латышско-русского машинного перевода может использоваться в качестве средства поддержания социальной коммуникации жителями Латвии, которые не владеют государственным языком, для преодоления языкового барьера. Комплексное описание типологии лингвистических автоматов в соответствии с типами коммуникации способствует дальнейшему развитию и применению многофункциональных лингвистических автоматов.

Рекомендации об использовании результатов исследования. Основные результаты диссертационного исследования могут быть использованы в курсах лекций по решению лингвистических задач с помощью компьютера, по лингвистическим автоматам, проблеме передачи информации при переводе, машинному переводу и автоматической переработке текста, а также при разработке спецкурсов для студентов бакалавриата, обучающихся по профилю «Иностранный язык и компьютерная лингводидактика», и магистратуры, обучающихся по профилю «Информационные технологии в филологическом образовании».

Апробация работы состоялась на международных конференциях «Human Language Technologies» (г. Каунас, октябрь 2007 г.), «Прикладная лингвистика в науке и образовании» (г. Санкт-Петербург, март 2008 г.), «Диалог» (Московская область, июнь 2008 г.), аспирантских семинарах по машинному переводу в Nordic Graduate School of Language Technologies (Гетеборг, Швеция), заседаниях кафедры прикладной лингвистики Российского государственного педагогического университета им. А. И. Герцена, собраниях коллектива отдела языковых систем компании Tilde. По теме диссертации опубликовано 5 работ общим объёмом 2,65 п. л.

Объем и структура диссертации. Работа состоит из введения, двух глав, сопровождающихся выводами, заключения, списка использованной литературы, включающего 280 наименований, в том числе 130 на иностранных языках, списка использованных словарей, включающего 5 наименований, и глоссария. К диссертации прилагается список географических названий (Приложение 1) и список имен и фамилий (Приложение 2), включенных в двуязычный латышско-русский переводной автоматический словарь, а также тестовый корпус, созданный для проведения экспериментов по предварительной оценке эффективности использования системы на материале текстов на латышском языке, функционирующих в социальной коммуникации. В состав тестового корпуса вошли двести латышских предложений, их ручные и машинные переводы (Приложение 3). Общий объём работы составляет 262 страницы печатного текста: основное содержание работы изложено на 202 страницах, 60 страниц занимают приложения.

 

Заключение научной работыдиссертация на тему "Латышско-русский машинный перевод в системе социальной коммуникации"

Результаты исследования были экспериментально апробированы в созданном модуле. Для объективной комплексной оценки качества машинного перевода с использованием созданного модуля были проведены три исследовательских эксперимента: автоматический анализ сопровождался лингвистическим анализом и ручной оценкой. Полученные результаты автоматического измерения были установлены в качестве базовых, которые в дальнейшем могут использоваться для сравнения следующих версий созданного модуля. Была также разработана иерархическая классификация ошибок, возникающих при машинном переводе с использованием созданного модуля, и намечены возможные направления исследования в дальнейшем для улучшения качества машинного перевода, а именно: определение набора модификаций алгоритмов и пополнения словарного обеспечения системы. В результате проведения экспериментов была установлена потенциальная эффективность использования созданной системы.

Таким образом, были решены основные задачи и достигнута цель исследования. Гипотеза о том, что система латышско-русского МП может создаваться на основе имеющихся модулей анализа государственного языка и использоваться как средство поддержания СК в латвийском обществе, позволяя пользователю преодолевать языковой барьер, была подтверждена.

СПИСОК ПРИНЯТЫХ СОКРАЩЕНИЙ

АПТ — автоматическая переработка текста

АРМ - автоматизированное рабочее место

АС — автоматический словарь

JIA - лингвистический автомат

МП - машинный перевод

МП-СК - система машинного перевода для поддержания социальной коммуникации

Текст СК — текст, функционирующий в социальной коммуникации

УС Я — универсальный сетевой язык

ЗАКЛЮЧЕНИЕ

Проведенное диссертационное исследование о возможностях выбора и модификации системы машинного перевода с государственным языком и встраивания системы МП-СК позволило прийти к следующим выводам.

Во-первых, социальная коммуникация в соответствии с особенностями и основными параметрами, исследованными в диссертации, может быть охарактеризована как:

• коммуникация между людьми;

• личностно-групповая коммуникация;

• социальное общение;

• линейная и однонаправленная коммуникация;

• электронная коммуникация.

Инструментом взаимодействия между субъектами социальной коммуникации являются информационные порталы социально-политических государственных институтов, включая средства массовой информации, а средством взаимодействия - персональный компьютер, подключенный к сети Интернет.

Основными необходимыми компонентами модели социальной коммуникации являются: субъекты, объект, электронный канал связи, код 1, код 2, шум, преобразователь.

Во-вторых, изучение общих принципов работы систем машинного перевода и специфики системы МП-СК позволило:

• выделить параметры, по которым система МП-СК отличается от других типов систем с точки зрения назначения и дальнейшего использования перевода;

• установить общие и частные требования, которым должна отвечать такая система для обеспечения эффективности социальной коммуникации.

К параметрам МП-СК, по которым такая система отличается от других типов систем, относятся:

• цель, с которой получатель текста СК вступает в процесс коммуникации;

• тип текстов, для перевода которых предназначена система.

Общие требования к системе МП-СК можно сформулировать в виде основных принципов организации такой системы:

• открытость, модульность и иерархичность организации;

• лингвистическая стратегия трансфера в качестве основного подхода к процессу перевода.

Система МП-СК должна отвечать следующим частным требованиям:

• по количеству языков — бинарная система, работающая с государственным языком в качестве входного языка и языком национального меньшинства в качестве выходного языка;

• по назначению перевода - получение грубого перевода текстов СК, достаточного для извлечения и понимания социальной информации пользователем, не знающим государственного языка;

• по степени автоматизации - система, работающая в полностью автоматизированном режиме.

Машинный перевод текстов СК должен быть достаточным для извлечения и понимания социальной информации пользователем, не знающим государственного языка.

В-третьих, с функциональной и прагматической точек зрения система МП-СК должна встраиваться в социальный лингвистический автомат, поддерживающий функцию машинного перевода для государственного языка. Анализ существующих практических типов лингвистических автоматов и практических систем МП с латышским языком позволил выбрать прототип такого лингвистического автомата, который должен представлять собой открытую систему с модульной и иерархической организацией, способную к развитию и адаптации к потребностям получателя текста СК. Прототипическая система должна отвечать требованиям, определенным для системы разрабатываемого типа.

В-четвертых, детальное рассмотрение архитектуры прототипической системы позволило определить особенности разработки и реализации в ней процедуры машинного перевода текстов СК с латышского языка на русский, которые состоят в следующем:

• архитектура встраиваемого модуля должна разрабатываться в соответствии с архитектурой прототипической системы;

• для создания встраиваемого модуля могут использоваться готовые модули автоматической переработки текста на государственном языке, входящие в структуру прототипической системы;

• для реализации нового направления перевода в прототипической системе необходимо модифицировать ее словарное обеспечение, а также разработать комплекс правил для уровней синтаксического трансфера и согласования.

Модификация словарного обеспечения прототипической системы проводилась в соответствии с требованиями, установленными в результате изучения лексических особенностей текстов СК на латышском языке, к которым относится использование нейтральной общей лексики, стандартизированных словосочетаний (клише), специализированной терминологической лексики, имен собственных (географических названий, названий организаций, имен и фамилий людей). Для текстов СК не характерно использование заимствований (за исключением отдельных выражений латинского происхождения), сокращений (за исключением общепринятых), синонимов в рамках одного текста (за исключением некоторых взаимозаменяемых слов).

В результате словник латышско-русского АС был модифицирован:

• добавлены лексические единицы латинского происхождения;

• откорректированы словарные статьи синонимов, а также включены паронимы с соответствующими русскими переводными эквивалентами;

• разработан дополнительный модуль для перевода низкочастотных лексических единиц;

• исправлены орфографические ошибки;

• включены списки географических названий, принятых на территории Латвии и других стран, а также имен и фамилий, выявленных по материалам текстов СК.

Разработка комплекса правил для уровней синтаксического трансфера и согласования проводилась:

• на основе исследования структурных и языковых особенностей оформления текстов СК на латышском языке, позволившего установить, что имеется ряд общих правил, которые соблюдаются при создании таких текстов и позволяют отнести тексты СК к моделированным текстам с нежесткой структурой и типизированным языковым оформлением, а также должны учитываться при проектировании системы МП-СК;

• на основе сопоставительного анализа грамматических характеристик латышского языка и особенностей их перевода на русский язык (на материале практических грамматик латышского и русского языков), в результате которого были выявлены типы грамматических преобразований, необходимых при латышско-русском машинном переводе;

• на основе изучения разработанных в прототипической системе функций, которые использовались для реализации установленных типов преобразований и разработки правил синтаксического трансфера и согласования в латышско-русском модуле.

 

Список научной литературыГорностай, Татьяна Александровна, диссертация по теме "Прикладная и математическая лингвистика"

1. Азарова И. В. Компьютерный тезаурус русского языка типа WordNet Электронный ресурс. / И. В. Азарова, О. А. Митрофанова,

2. A. А. Синопальникова // Труды международной конф. Диалог'2003 (Протвино, 11-16 июня, 2003 г.). 2003. - Режим доступа: http://www.dialog-21.ru/Archive/2003/Azarova.htm (дата обращения 23.11.2009).

3. Аладьев В. 3. Автоматизированное рабочее место математика /

4. B. 3. Аладьев, М. JT. Шишаков. М. : Лаборатория Базовых Знаний, 2000. -572 с. - (Техн. ун-т). - ISBN 5-93208-052-3.

5. Андреева Г. М. Социальная психология : учеб. для студентов вузов, обучающихся по направлению и специальности «Психология» / Г. М. Андреева. Изд. 5-е, испр. и доп. - М. : Аспект Пресс, 2003. - 363 с. -ISBN 5-7567-0274-1.

6. Бабушкина Н. В. Исследование результатов машинного перевода герундия: особенности анализа и критерии редактирования : дис. . канд.филол. наук. : 10.02.21 / Бабушкина Наталья Владимировна ; Рос. гос. пед. ун-т им. А. И. Герцена. СПб., 2006. - 242 с.

7. Базылев В. Н. «Философия» машинного перевода / В. Н. Базылев // Вестник Воронеж, гос. ун-та. Сер. Лингвистика и межкультурная коммуникация. 2005. - № 2. - С. 88-96. - ISSN 0234-5439.

8. Базылев В. Н. Семиотическая модель перевода / В. Н. Базылев // Политическая лингвистика. 2008. - Вып. 1(24). - С. 115-118. - ISSN 19992629.

9. Баранов А. Н. Введение в прикладную лингвистику : учеб. пособие. / А. Н. Баранов. М. : Эдиториал УРСС, 2001. - 358 с. - (Новый лингвист, учеб. / Моск. гос. ун-т им. М. В. Ломоносова, Филол. фак.). - ISBN 5-8360-0196-0.

10. Беляева Л. Н. Применение ЭВМ в лингвистических исследованиях и лингводидактике : учеб. пособие к спецкурсу / Л. Н. Беляева ; Ленингр. гос. пед. ин-т им. А. И. Герцена. Л. : Изд-во ЛГПИ им. А. И. Герцена, 1986. -82 с.

11. Беляева Л. Н. Основы теории перевода : программа и методические разработки для самостоятельной работы студентов / JI. Н. Беляева ; Рос. гос. пед. ун-т им. А. И. Герцена. СПб. : Изд-во РГПУ им. А. И. Герцена, 1998. — 50 с.

12. Беляева Л. Н. Лингвистические автоматы в современных информационных технологиях : моногр. / Л. Н. Беляева ; Рос. гос. пед. ун-т им. А. И. Герцена. СПб. : Изд-во РГПУ им. А. И. Герцена, 2001. - 130 с. -ISBN 5-8064-0514-1.

13. Бенвенист Э. Общая лингвистика / Э. Бенвенист ; общ. ред., вступ. ст. и коммент. Ю. С. Степанова ; пер. с франц. Ю. Н. Караулова и др.. 2-е изд., стер. - М. : УРСС, 2002. - 446 с. - (Лингвист, наследие XX века). - ISBN 5-354-00066-1.

14. A. В. Андронов. СПб. : Изд-во С.-Петерб. ун-та], 2001. - Вып. 1 : Секция балтистики. Вопросы синтаксиса балтийских языков. - С. 6-8.

15. Богданов В. В. Моделирование семантики предложения /

16. B. В. Богданов // Прикладное языкознание : учеб. / JI. В. Бондарко, JI. А. Вербицкая, Г. Я. Мартыненко и др. ; отв. ред. А. С. Герд ; С.-Петерб. гос. ун-т. СПб. : Изд-во С.-Петерб. ун-та, 1996. - С. 161-200. - ISBN 5-28801369.

17. Бреус Е. В. Теория и практика перевода с английского языка на русский : учеб. пособие / Е. В. Бреус ; Ун-т рос. акад. образования. 2-е изд. - М. : Изд-во УРАО, 2003. - 103 с. - ISBN 5-204-00402-5.

18. Бреус Е. В. Основы теории и практики перевода с русского языка на английский : учеб. пособие / Е. В. Бреус ; Ун-т рос. акад. образования. — 4-е изд. М.: УРАО, 2004. - 207 с. - ISBN 5-204-00418-1.

19. Ванников Ю. В. Типы научных и технических текстов и их лингвистические особенности : (метод, пособие) : ч. 1 / Ю. В. Ванников ; Всесоюзный центр переводов ; разраб. Ю. В. Ванников. М. : ВЦП, 1984. -50 с.

20. Векслер Б. X. Латышский язык : самоучитель / Б. X. Векслер,

21. B. А. Юрик. 6-е изд. - Рига : Звайгзне, 1988. - 446 с. - ISBN 5-4-5-00191-0.

22. Виноградов В. С. Введение в переводоведение / В. С. Виноградов. -М. : Изд-во Ин-та общ. среднего образования РАО, 2001. 224 с. - ISBN 57552-0041-6.

23. Володина Л. В. Деловое общение и основы теории коммуникации : учеб. пособие Электронный ресурс. / Л. В. Володина, О. К. Карпухина ;

24. C.-Петерб. гос. ун-т телекоммуникаций им. проф. М. А. Бонч-Бруевича, Гуманит. фак. — 2007. Режим доступа: http://dvo.sut.ru/libr/sotciolo/volod/index.htm (дата обращения 23.11.2009).

25. Гак В. Г. Порядок слов / В. Г. Гак // Языкознание : Большой энциклопедический словарь / гл. ред. В. Н. Ярцева. — 2-е изд., репр. М. : Большая рос. энцикл., 1998. - С. 388. - (Большие экцикл. слов.). - ISBN 585270-307-9.

26. Гальперин И. Р. Текст как объект лингвистического исследования / И. Р. Гальперин ; отв. ред. Г. В. Степанов. М. : Наука, 1981. - 140 с.

27. Глазунова Г. 77. Краткий справочник по грамматике русского языка: обобщающий курс 8-летней школы / Г. П. Глазунова. Рига : Звайгзне, 1979.- 150 с.

28. Грачев М. Н. Политическая коммуникация / М.Н.Грачев // Вестник Рос. ун-та дружбы народов. Сер. Политология. 1999. - № 1. -С. 24-39. - ISSN 0969-8732.

29. Гругиевщкая Т. Г. Основы межкультурной коммуникации : учеб. для вузов / Т. Г. Грушевицкая, В. Д. Попков, А. П. Садохин ; под ред.

30. A. П. Садохина. М.: ЮНИТИ-ДАНА, 2002. - 352 с. - ISBN 5-238-00359-5.

31. Грэхэм Л. Р. Естествознание, философия и науки о человеческом поведении в Советском Союзе / Лорен Р. Грэхэм ; пер. с англ. ; [послесл.

32. B. С. Степина. М.: Политиздат, 1991. - 479 с. - ISBN 5-250-00727-9.

33. ГуковА. Популярность Translate.ru продолжает бить рекорды Электронный ресурс. / А. Гуков // Пресс-релизы компании Промт. 2007. — Режим доступа: http://www.promt.ru/press/news/10775/ (дата обращения 23.11.2009).

34. СПб. : С.-Петерб. филос. общество, 2001. Вып. 12. - С. 199-202. -(Symposium).

35. ДридзеТ. М. Социальная коммуникация как текстовая деятельность в семиосоциопсихологии / Т. М. Дридзе // Общественные науки и современность. 1996. -№ 3. - С. 145-152. - ISSN 0869-0499.

36. Дрыбин В. В. Коммуникация как вид информационного общения /

37. Захаров В. П. Информационные системы : (документальный поиск) : учеб. пособие / В. П. Захаров ; С.-Петерб. гос. ун-т. СПб. : Изд-во

38. C.-Петерб. ун-та, 2002. 188 с. - ISBN 5-87403-034-4.

39. Захаров В. П. Информационно-поисковые системы : учеб.-методич. пособие / В. П. Захаров ; С.-Петерб. гос. ун-т, Филол. фак., Каф. мат. лингвистики. СПб.: Изд-во С.-Петерб. ун-та., 2005. - 48 с.

40. Зубова И. И. Информационные технологии в лингвистике : учеб. пособие для студентов вузов по специальности «Современные иностранные языки» / И. И. Зубова ; Мин-во образования Республики Беларусь ; Минск, гос. лингв, ун-т. Минск : б. и., 2001. - 211 с.

41. ИомдинЛ.Л. Уроки машинного перевода для детей и взрослых / JI. JI. Иомдин // Лингвистика для всех : зимняя лингвист, школа 2004 / ред.-сост. Е. С. Абелюк, Е. В. Муравенко. - М. : [Наука], 2004. - С. 56-68.

42. Казакевич О. С. Машинные фонды языков народов СССР / О. С. Казакевич // Научно-техническая информация. Сер. 2. Информ. процессы и системы / Всерос. ин-т науч. и техн. информ. РАН. — 1989. -№ 10.-ISSN0548-0027.

43. Каменская О. JI. Текст и коммуникация : учеб. пособие для ин-тов и фак. иностр. яз. / О. Л. Каменская. М. : Высш. шк., 1990. - 152 с. - (Б-ка филолога). - ISBN 5-06-000246-2.

44. Карамышева Т. В. Компьютерная лингводидактика : моногр. / Т. В. Карамышева. СПб. : СОЮЗ, 2000. - 112 с. - ISBN 5-94033-012-6.

45. Кашкин В. Б. Введение в теорию коммуникации : учеб. пособие / В. Б. Кашкин, JL В. Квасова, А. А. Болдырева ; М-во образования Рос. Федерации ; Воронеж, гос. техн. ун-т. Воронеж : Изд-во Воронеж, гос. техн. ун-та, 2000.- 173 с.

46. Коваль С. А. Лингвистические проблемы компьютерной морфологии / С. А. Коваль ; С.-Петерб. гос. ун-т. СПб. : Изд-во С.-Петерб. ун-та, 2005. - 150 с. - ISBN 5-288-03731-0.

47. Комиссаров В. Н. Коммуникативные концепции перевода / В. Н. Комиссаров // Перевод и коммуникация : сб. / отв. ред. А. Д. Швейцер, Н. К. Рябцева, А. П. Василевич. ; Рос. Акад. наук, Ин-т языкознания. М. : [б. и.], 1997.-С. 6-16.

48. Комиссаров В. Н. Переводческие аспекты межкультурной коммуникации / В. Н. Комиссаров // Актуальные проблемы межкультурной коммуникации ; Моск. гос. лингвист, ун-т. М. : Изд-во Моск. гос. лингвист, ун-та, 1999.-С. 75-87.

49. Конецкая В. П. Социология коммуникаций : учеб. /

50. B. П. Конецкая. М. : Междунар. ун-т бизнеса и упр, 1997. - 302 с. - ISBN 589313-010-3.

51. Крейдлин Л. Что такое UNL? Электронный ресурс. / JI. Крейдлин// Компьютерра. 2001. - Режим доступа: http://offline.computerra.ru/2001/390/8299/ (дата обращения 24.11.2009).

52. Крылов С. А. Актуальные задачи морфологического анализа и синтеза в интегрированной информационной среде STARLING /

53. C. А. Крылов, С. А. Старостин // Труды международной конф Диалог'2003 (Протвино, 11-16 июня, 2003 г.). 2003. - Режим доступа: http://www.dialog-21.ru/Archive/2003/Krylov.htm (дата обращения 22.11.2009).

54. Крылов С. А. Интегрированная информационная среда STARLING и её использование в сфере корпусной лингвистики / С. А. Крылов,

55. Кулагина О. С. Исследования по машинному переводу / О. С. Кулагина ; отв. ред. Б. Ю. Розенцвейг ; Ин-т прикладной математики им. М. В. Келдыша, Науч. совет по комплекс, проблеме «Кибернетика». -М. : Наука, 1979.-320 с.

56. Кутузов А. Б. Коммуникативные особенности дискурса компьютерных сетевых форумов Электронный ресурс. / А. Б. Кутузов. -2006. Режим доступа: http://tc.utmn.ru/files/kutuzovdiscourse.pdf (дата обращения 23.11.2009).

57. Кушнерук С. П. Документная лингвистика : (рус. деловой текст) : учеб. пособие / С. П. Кушнерук ; М-во образования Рос. Федерации ; Волгоград, гос. ун-т. Волгоград : Изд-во Волгоград, гос. ун-та, 1999. -93 с.-ISBN 5-85534-275-1.

58. Леонтьев А. А. Психолингвистические единицы и порождение речевого высказывания / А. А. Леонтьев. — 2-е изд., стер. — М. : Едиториал УРСС, 2003. 306 с. - ISBN 5354005167.

59. Лигута Т. В. Основы знаний о языке : учеб. пособие / Т. В. Лигута. Рига : Retorika А, 1998. - 223 с. - (Для средней школы). -ISBN 9984-93173-0.

60. Лингвистические ресурсы автоматизированного рабочего места филолога : коллективная монография. / [Л. Н. Беляева, А. А. Виландеберк, Л. А. Девель и др.]. СПб. : Изд-во ИнфоДа, 2004. - 181 с. - ISBN 5-94652083-0 : 300.

61. Лингвистический процессор для сложных информационных систем / Ю. Д. Апресян, И. М. Богуславский, Л. Л. Иомдин и др. ; отв. ред. д-р филол. наук Л. П. Крысин ; Рос. Акад. наук, Ин-т пробл. передачи информ. М.: Наука, 1992. - 256 с. - ISBN 5-02-006928-0.

62. Лингвистическое обеспечение системы ЭТАП-2 / Ю. Д. Апресян, И. М. Богуславский, Л. Л. Иомдин и др. ; отв. ред. д-р физ.-мат. наук Р. Л. Добрушин ; Акад. наук СССР, Ин-т пробл. передачи информ. М. : Наука, 1989. - 295 с. - ISBN 5-02-006572-2.

63. МарчукЮ. Н. Проблемы машинного перевода / Ю. Н. Марчук. -М.: Наука, 1983.-234 с.

64. МарчукЮ. Н. Автоматический перевод / Ю. Н. Марчук // Языкознание : Большой энциклопедический словарь / гл. ред. В. Н. Ярцева.2.е изд., репр. — М. : Большая рос. энцикл., 1998. — С. 388. — (Большие экцикл. слов.). ISBN 5-85270-307-9.

65. Мирам Г. Э. Профессия: переводчик / Г. Э. Мирам. — Киев : Ника-центр, 1999. 158 с. - ISBN 966-521-041-6.

66. Морозова Л. А. Функции российского государства на современном этапе / JI. А. Морозова // Государство и право. 1993. - № 6. - С. 98-108. -ISSN 0132-0769.

67. О машинном переводе с русского языка на латышский / А. Ё. Гобземис, В. Г. Горобец, В. А. Юрик, Т. А. Якубайтис // Автоматика и вычислительная техника. 1961. - С. 149-164. - ISSN 0132-4160.

68. Ореховский В. А. Алгоритм идентификации слов естественных языков и его применение при обработке текстовых документов /

69. В. А. Ореховский, Б. Ф. Мишнев // Автоматика и вычислительная техника. — 1995. № 3. - С. 36-47. - ISSN 0132-4160.

70. Орлов В. И. Знания, умения, навыки и обучение / В.И.Орлов ; Моск. ун-т потреб, кооп. М.: б. и., 1995.

71. Откупщикова М. И. Синтаксис связного текста : учеб. пособие / М.И.Откупщикова ; ЛГУ им. А. А. Жданова. Л. : Изд-во ЛГУ, 1982. -103 с.

72. Панков И. П. Информационно-поисковые системы / И. П. Панков,

73. B. П. Захаров // Прикладное языкознание : учеб. / Л. В. Бондарко, Л. А. Вербицкая, Г. Я. Мартыненко и др. ; отв. ред. А. С. Герд ; С.-Петерб. гос. ун-т. СПб. : Изд-во С.-Петерб. ун-та, 1996. - С. 334-359. - ISBN 5-28801369.

74. C. 399-407. ISBN 5-288-01369.

75. Педагогика и психология высшей школы / М. В. Буланова-Топоркова, И. П. Дусева, А. В. Духавнева и др.. — Ростов н/Д. : Феникс, 1998. 544 с. - (Учеб., учеб. пособия).

76. Переверзев В. Н. Металогические аспекты теории коммуникации / В. Н. Переверзев // Вестник Российской коммуникативной ассоциации : сб. науч. тр. Ростов н/Д. : ИУБиП, 2002. - Вып. 1 : Теория коммуникации & прикладная коммуникация. - С. 118-128.

77. Пешков И. В. Еще раз «Мышление и речь» или о предмете риторики / И. В. Пешков // Мышление и речь / JI. С. Выготский. 5-е изд., испр. - М. : Лабиринт, 1999. - С. 341-347. - (Философия риторики. Риторика философии). - ISBN 5-87604-097-5.

78. Пиотровская К. Р. Современная компьютерная лингводидактика / К. Р. Пиотровская // Научно-техническая информация. Сер. 2. Информ. процессы и системы / Всерос. ин-т науч. и техн. информ. РАН. — 1991. — № 4. С. 26-29. - ISSN 0548-0027.

79. Пиотровский Р. Г. Новые горизонты машинного перевода / Р. Г. Пиотровский // Научно-техническая информация. Сер. 2. Информ. процессы и системы / Всерос. ин-т науч. и техн. информ. РАН. — 2002. -№ 1. С. 17-29. - ISSN 0548-0027.

80. Пиотровский Р. Г. Синергетика текста : учеб. пособие для студентов языковых вузов / Р. Г. Пиотровский. Минск : Минск, гос. лингвист, ун-т, 2005. - 156 с. - ISBN 985-460-048-3.

81. Почепцов Г. Г. Теория коммуникации / Г. Г. Почепцов. М. : Рефл-бук, 2001. - 651 с. - ISBN ISBN 6-543-048-3.

82. Розенталъ Д. Э. Современный русский язык : учеб. пособие. / Д. Э. Розенталь, И. Б. Голуб, М. А.Теленкова. М. : Междунар. отношения, 1995. - 560 с. - ISBN 5-7133-0830-8.

83. Русская грамматика : в 2-х т. / гл. ред. Н. Ю. Шведова. М. : Наука, 1980. - Т. 1 : Фонетика. Фонология. Ударение. Интонация. Словообразование. Морфология. - 783 с.

84. Рязанцева Т. И. Теория и практика работы с гипертекстом : (на материале английского языка) : учебное пособие для студентов вузов, обучающихся по гуманитарным специальностям / Т. И. Рязанцева. — М. :

85. Академия, 2008. — 203 с. — (Высшее проф. образование. Языкознание). ISBN 978-5-7695-4223-7.

86. Саломатина А. В. Создание текстовых словарей для систем распознавания речи на основе электронного словаря паронимов / А. В. Саломатина // Квантитативная лингвистика и семантика : сб. науч. тр. — Новосибирск : б. и., 2000. Вып. 2. - С. 63-72.

87. Селезнев К. Обработка текстов на естественном языке Электронный ресурс. / К. Селезнев // Открытые системы. 2003. - № 12. — Режим доступа: http://www.osp.ru/text/print/302/183694.html (дата обращения 23.11.2009).

88. Семенова М. Ф. Имя прилагательное в русском и латышском языках / М. Ф. Семенова. Рига : Изд-во Латв. гос. ун-та им. П. Стучки, 1964.-21 с.

89. Семенова М. Ф. Сопоставление сложного предложения в русском и латышском языках : учеб. пособие / М. Ф. Семенова. — Рига : Изд-во Латв. гос. ун-та им. П. Стучки, 1976. 24 с.

90. Семенова М. Ф. Лингвистические вопросы перевода : учеб. пособие / М. Ф. Семенова. Рига : Изд-во Латв. гос. ун-та им. П. Стучки, 1978.-55 с.

91. Семенова М. Ф. Сопоставительная грамматика русского и латышского языков / М. Ф. Семенова. Рига : Vards, 1994. - 154 с.

92. Система машинного перевода «Кросслятор 2.0» и анализ ее функциональности для задачи трансляции знаний Электронный ресурс. /

93. B. А. Галактионов, А. М. Мусатов, О. Ю. Мансурова и др.. 2007. - Режим доступа: http://www.keldysh.ru/papers/2007/prep89/prep200789.html (дата обращения 23.11.2009).

94. Соколов А. В. Общая теория социальной коммуникации : учеб. пособие / А. В. Соколов. СПб. : Михайлов, 2002. - 459 с. - ISBN 5-80160091-4.

95. Соколова С. Системы перевода ПРОМТ Электронный ресурс. /

96. C. Соколова // ПРОМТ: разработка решений для автоматизированного перевода. 2005. - Режим доступа: http://www.promt.ru/company/technology/articles/2005.ppt (дата обращения 23.11.2009).

97. Соссюр Ф. де. Курс общей лингвистики : пер. с фр. / Фердинанд де Соссюр. Изд. 2-е, стер. - М. : Едиториал УРСС, 2004. - 256 с. -(Лингвист, наследие XX века). - ISBN 5-354-00556-6.

98. Сталтмане В. Э. Латышский язык / В. Э. Сталтмане // Языкознание : Большой энциклопедический словарь / гл. ред. В. Н. Ярцева. -2-е изд., репр. М. : Большая рос. энцикл., 1998. - С. 255. - (Большие экцикл. слов.). - ISBN 5-85270-307-9.

99. Стелле А. Изучаем латышский язык : пособие для начинающих : (второй этап обучения) / А. Стелле, А. Страуме, П. Лиепинын. Рига : Звайгзне, 1990. - 176 с. - ISBN 6-405-00731-5.

100. Стрелковский Г. М. Теория и практика военного перевода: немецкий язык / Г. М. Стрелковский. М. : Воениздат, 1979. - 272 с.

101. ТомахинГ.Д. Перевод как межкультурная коммуникация / Г. Д. Томахин // Перевод и коммуникация : сб. / отв. ред. А. Д. Швейцер,

102. Н. К. Рябцева, А. П. Василевич ; Рос. Акад. наук, Ин-т языкознания. М. : Ин-т языкознания РАН, 1997. - С. 129-137.

103. Топоров В. Н. Балтийские языки / В. Н. Топоров// Языкознание : Большой энциклопедический словарь / гл. ред. В. Н. Ярцева. 2-е изд., репр. - М. : Большая рос. энцикл., 1998 а. - С. 64-65.— (Большие экцикл. слов.). - ISBN 5-85270-307-9.

104. Топоров В. И. Индоевропейские языки / В.Н.Топоров // Языкознание : Большой энциклопедический словарь / гл. ред. В. Н. Ярцева. -2-е изд., репр. М. : Большая рос. энцикл., 1998 б. - С. 186-189. - (Большие экцикл. слов.). - ISBN 5-85270-307-9.

105. Тункин С. Информационные технологии на службу охраны труда / С. Тункин // Библиотека инженера по охране труда. - 2006. - № 10. -С. 66-69.

106. ТураеваЗ. Я. Лингвистика текста : учеб. пособие для пед. ин-тов по спец. № 2103 «Иностр. яз.» / 3. Я. Тураева. М. : Просвещение, 1986. -126 с. - (Текст: Структура и семантика).

107. УбинИ. И. ЭВМ и Словарь : метод, пособие / И. И. Убин ; М-во науки, высш. шк. и техн. политики Рос. Федерации, Рос. Акад. наук, Всерос. центр пер.. М. : ВЦП, 1992. - 179 с.

108. Вып. 1 : Коммуникативные системы животных и язык человека. Проблема происхождения языка. С. 367-394. - ISBN 978-5-5-9551-0299-8.

109. Фридман В. С. Используются ли знаки (и символы?) в системах коммуникации позвоночных Электронный ресурс. / В. С. Фридман // Библиотека по эволюции. — 2009. Режим доступа: http://rogov.zrwz.ru/Macroevolution/fridman2009.doc (дата обращения 23.11.2009).

110. Цаголова Р. С. Обоснование социологии коммуникации как научной дисциплины / Р. С. Цаголова // Вестник Моск. ун-та. Сер. 18. Социология и политология / гл. ред. В. И. Добреньков. 1999. - № 4. - С. 84-90.-ISSN 1029-3736.

111. Черниговская Т. В. Язык, мозг и компьютерная метафора / Т. В. Черниговская // Человек. 2007. - № 2. - С. 63-75. - ISSN 0236-2007.

112. Чижаковский В. А. Тезаурус в системах автоматической переработки текста / В. А. Чижаковский, Л. Н. Беляева ; отв. ред. Р. Г. Пиотровский. Кишинев : Штиинца, 1983. - 163 с.

113. Шайхитдинова С. К. К понятию «коммуникация» / С. К. Шайхитдинова // Вестник Воронежского гос. ун-та. Сер. Филология. Журналистика. 2004. - № 2. - С. 162-168. - ISSN 0234-5439.

114. Шаляпина 3. М. Автоматический перевод: эволюция и современные тенденции / 3. М. Шаляпина // Вопросы языкознания. 1996. -№ 2. - С. 105-117. - ISSN 0373-658Х.

115. Шарков Ф. И. Массовые коммуникации и медиапланирование : учеб. пособие / Ф. И. Шарков. М. : Изд-во Альфа-Пресс, 2008. - 256 с. -ISBN 978-5-94280-337-7.

116. Andronov A. V. A Survey of the Case Paradigm in Latvian Electronic resource. / A. V. Andronov. 2001. - Mode of access: http://www.genling.nw.ru/Staff/Andronov/publicat/CaseLV.pdf (23.11.2009).

117. BeliaevaL. Machine Translation Versus Dictionary and Text Structure / L. Beliaeva // Journal of Quantitative Linguistics. 2003. - Vol. 10, №2.-P. 193-211.-ISSN 0929-6174.

118. Boguslavsky I. Multilinguality in ETAP-3: Reuse of Lexical Resources Electronic resource. / I. Boguslavsky, L. Iomdin, V. Sizov. 2004. - Mode of access: http://proling.iitp.ru/bibitems/lexicalreusecoling2004.pdf (23.11.2009).

119. BreidtE. Accessing Foreign Languages with Compass / E. Breidt, H. Feldweg // Machine Translation. 1997. - Vol. 12, № 1-2. - P. 153-174. -ISSN 0922-6567.

120. Carbonell J. New Paradigms for Machine Translation Electronic resource. / Jaime Carbonell [et al.]. 2009. - Mode of access: http://www.mt-archive.info/Translingual-Europe-2009-Carbonell-2-ppt.pdf (23.11.2009).

121. CeplTte B. A. Latviesu valodas praktiska gramatika / Brigita Cepllte, Laimdots CeplTtis // Maclbu izdevums. Riga : Zvaigzne. - 1991. - 240 1pp. -ISBN 5-405-00575-4.

122. CeplTtis L. Latviesu valodas sintakse / L. CeplTtis, J. Rozenbergs, J. Valdmanis. RTga : Zvaigzne, 1989. - 271 1pp. - ISBN 5-405-00254-2.

123. Cocke J. Programming Languages and Their Compilers : Preliminary Notes / John Cocke ; Courant Institute of Mathematical Sciences. Second rev. ed. - New York : Courant Inst. Math. Sci., 1970. - 767 p.

124. Fifteenth ed. 2009. - Mode of access: http://www.hutchinsweb.me.uk/Compendium-15.pdf (23.11.2009).

125. Dillinger M. Interlinguas & Semantic Roles Electronic resource. / Mike Dillinger. 2005. - Mode of access: http://www.mt-archive.info/MTS-2005-Dillinger.pdf (23.11.2009).

126. DinhD. A Knowledge Based Approach for English-Vietnamese Machine Translation Electronic resource. / D. Dinh. 1998. - Mode of access: http://sealang.net/sala/archives/pdf4/dinh2000knowledge.pdf (23.11.2009).

127. Dini P. U. Baltu valodas / Pietro Umberto Dini ; tulkojums no italiesu Dace Meiere. Riga : Jana Rozes apgads, 2000. - 574 1pp. - ISBN 9984-623-96-3.

128. EiseleA. Hybrid Machine Translation: Combining Rule-Based and Statistical MT Systems Electronic resource. / Andreas Eisele. 2007. - Mode of access: http://www.mt-archive.info/MTMarathon-2007-Eisele.pdf (23.11.2009).

129. EiseleA. Hybrid Architectures for Machine Translation Electronic resource. / Andreas Eisele. 2008. - Mode of access: http://www.mt-archive.info/MTMarathon-2008-Eisele-ppt.pdf (23.11.2009).

130. ETAP-3 Linguistic Processor: A Full-Fledged NLP Implementation of the Meaning <-> Text Theory Electronic resource. / J. Apresian, I. Boguslavsky, L. Iomdin [etal.]. 2003. - Mode of access: http://proling.iitp.ru/bibitems/ETAPandMTT.pdf (23.11.2009).

131. Filling Knowledge Gaps in a Broad-Coverage Machine Translation System Electronic resource. / K. Knight, I. Chander, M. Haines [et al.]. 1995. -Mode of access: http://dli.iiit.ac.in/ijcai/IJCAI-95-VOL2/PDF/048.pdf (23.11.2009).

132. Estonian Language. Tallinn : Tallinna Raamatutriikikoda, 2005. - P. 113-118. — ISBN 9985-894-83-9.

133. Gawronska B. An MT Oriented Model of Aspect and Article Semantics / Barbara Gawronska. Lund : Lund Univ. Press, 1993. - 246 p. -(Travaux de l'lnstitut de Linguistique de Lund 28). - ISBN 91-7966-237-4.

134. GreitaneL Maslntulkosanas sistema LATRA / I. Greitane // Latvijas Zinatnu Akademijas Vestis. 1997. - Vol. 51, № 3. - Lpp. 1-6. - ISSN 14070081.

135. GreitaneL Datortehnologija ka valodas petTsanas virziens / I. Greitane // Baltu filologija VIII : rakstu krajums. Riga : Latvijas Universitate, 1998.-Lpp. 48-52.

136. Grice P. Logic and Conversation // Syntax and Semantics: Speech Acts / ed. P. Cole, J. Morgan. New York : Academic Press, 1975. - Vol. 3. -P. 41-58. - ISBN 978-0-12-785423-6.

137. GujevskaD. Pareizrakstibas un pareizrunas rokasgramata / D. Gujevska, A. Mikelsone, T. Porite. Riga : Avots, 2002. - 234 lpp. - ISBN 9984-700-64-X.

138. HajicJ. CESILKO an MT System for Closely Related Languages Electronic resource. / J. Hajic, J. Hric, V. Kubon. - 2000. - Mode of access: http://www.cse.ust.hk/acl2000/Demo/03kubon.pdf (23.11.2009).

139. Hutchins J. Machine Translation: Past, Present, Future / John Hutchins. Chichester, UK : Ellis Horwood, 1986. - 382 p. - (Ellis Horwood Series in Computers and their Applications). - ISBN 0-85312-788-3.

140. Hutchins J. An Introduction to Machine Translation / John Hutchins, Harold Somers. London : Academic Press, 1992. - 362 p. - ISBN 0-12362830 X.

141. Hutchins J. Machine Translation: History and General Principles / John Hutchins // The Encyclopedia of Languages and Linguistics / ed. R. E. Asher. Oxford : Pergamon Press, 1994. - Vol. 5. - P. 2322-2332. - ISBN 0-08-035943-4.

142. Hutchins J. The Origins of the Translator's Workstation / John Hutchins // Machine Translation. 1998 a. - Vol. 13, № 4. - P. 287-307. - ISSN 0922-6567.

143. Hutchins J. Twenty Years of Translating and the Computer Electronic resource. / John Hutchins. 1998 6. - Mode of access: http://www.hutchinsweb.me.uk/Aslib-1998-ppt.pdf (23.11.2009).

144. Hutchins J. Commercial Systems: State of the Art in 1999 Electronic resource. / John Hutchins. 1999. - Mode of access: http://www.hutchinsweb.me.uk/Somers-1999.pdf (23.11.2009).

145. Hutchins J. The IAMT Certification Initiative and Defining Translation System Categories Electronic resource. / John Hutchins. 2000 a. -Mode of access: http://nl.ijs.si/eamtOO/proc/Hutchins.pdf (23.11.2009).

146. Hutchins J. Machine Translation / John Hutchins // Encyclopedia of Computer Science / ed. Anthony Ralston, Edwin D. Reilly, David Hemmendinger. 4th ed. - New York : Grove's Dictionaries, 2000 6. - P. 10591066. - ISBN 1-561-59248-x.

147. Hutchins J. Machine Translation and Human Translation: In Competition or in Complementation? / John Hutchins // International Journal of Translation.-2001 a.-Vol. 13,№ 1-2.-P. 5-20.-ISSN 0924-1884.

148. Hutchins J. Towards a New Vision for MT Electronic resource. / John Hutchins. 2001 6.- Mode of access: http://www.hutchinsweb.me.uk/MTS-2001.pdf (23.11.2009).

149. Hutchins J. Machine Translation: Half a Century of Research and Use Electronic resource. / John Hutchins. 2003. - Mode of access: http://www.hutchinsweb.me.uk/Avila-2003.pdf (23.11.2009).

150. Hutchins J. Machine Translation: A Concise History Electronic resource. / John Hutchins. 2007 a. - Mode of access: http://www.hutchinsweb.me.uk/CUHK-2006.pdf (23.11.2009).

151. Hutchins J. Machine Translation in Europe and North America: Brief Account of Current Status and Future Prospects Electronic resource. / John Hutchins. 2007 6. - Mode of access: http://www.hutchinsweb.me.uk/JAPIO-2007.pdf (23.11.2009).

152. Hutchins J. Milestones in the History of Machine Translation Electronic resource. / John Hutchins. 2007 в. - Mode of access: http://www.hutchinsweb.me.uk/SUSU-2007-l-ppt.pdf (23.11.2009).

153. Hutchins J. Outline of the Evolution of Machine Translation Electronic resource. / John Hutchins. 2008. - Acess mode: http://www.hutchinsweb.me.uk/Aslib-2008-ppt.pdf (23.11.2009).

154. Hutchins J. Uses and Applications of Machine Translation Electronic resource. / John Hutchins. 2009. - Mode of access: http://www.hutchinsweb.me.uk/Westminster-2009.pdf (23.11.2009).

155. IomdinL. Learning from Parallel Corpora: Experiments in Machine Translation Electronic resource. / Leonid Iomdin, Oliver Streiter. 1999. - Mode of access: http://proling.iitp.ru/bibitems/iomstr.html (23.11.2009).

156. Josan G. S. A Punjabi to Hindi Machine Translation System Electronic resource. / Gurpreet Singh Josan, Gurpreet Singh Lehal. 2008. -Mode of access: http://www.mt-archive.info/Coling-2008-Josan.pdf (23.11.2009).

157. KasamiT. An Efficient Recognition and Syntax-Analysis Algorithm for Context-Free Languages : Scientific Report AFCRL-65-758 / T. Kasami. -Bedford, MA : Air Force Cambridge Research Lab., 1965.

158. KauchakD. Contributions to Research on Machine Translation Electronic resource. / David Kauchak. 2006. - Mode of access: http://www.mt-archive.info/Kauchak-2006.pdf (23.11.2009).

159. Kay M. The Proper Place of Men and Machines in Language Translation / Martin Kay // Machine Translation. 1997. - Vol. 12, № 1-2. - P. 223. - ISSN 0922-6567.

160. Knight К. Machine Translation in the Year 2004 / Kevin Knight, Daniel Marcu // Acoustics, Speech, and Signal Processing, 2005 : Proceedings (March 18-23, Philadelphia, PA, USA). 2005. - Vol. 5. - P. 965-968.

161. Robert E. Frederking, Kathryn B. Taylor. Berlin etc. : Springe-Verlag, 2004. -P. 115-124. - (Lecture Notes in Artificial Intelligence, Lecture Notes in Computer Science 3265). - ISBN 3-540-23300-8.

162. Koehn P. Europarl: A Parallel Corpus for Statistical Machine Translation Electronic resource. / Philipp Koehn. 2005. - Mode of access: http://www.iccs.inf.ed.ac.uk/~pkoehn/publications/europarl-mtsummit05.pdf (23.11.2009).

163. Koehn P. 20 Years of Statistical Machine Translation Electronic resource. / Philipp Koehn. 2009. - Mode of access: http://www.mt-archive.info/Translingual-Europe-2009-Koehn-ppt.pdf (23.11.2009).

164. KrUmina V. Normatlvo aktu izstrades rokasgramata / V. Krumina, V. Skujina. Riga : Valsts Kanceleja, 2002. - 116 1pp.

165. Kuskis J. Mtlsu valoda. Padomi valodas spodrinasanai / Janis Kuskis // RLB Latviesu valodas attlstibas кора. Riga : Antava, 2006. - 271 1pp. - ISBN 9984-39-038-1.

166. Lasswell H. The Structure and Function of Communication in Society / H. Lasswell // The Process and Effects of Mass Communication. Rev. ed. -Urbana. : University of Illinois Press, 1971. - P. 84-99. - ISBN 978-0252001970.

167. LauzeL. Ikdienas sazina: vienkarss teikums latviesu saranvaloda / Linda Lauze. Liepaja : Liepajas Pedagogijas akademija, 2004. - 195 1pp. -ISBN 9984-754-31-6.

168. Learning Machine Translation / ed. Cyril Goutte, Nicola Cancedda, Marc Dymetman et al. ; Massachusetts Institute of Technology. Cambridge, Mass. : MIT Press, 2009. - 328 p. - (Neural information processing). - ISBN 9780-262-07297-7.

169. Learning, Forgetting and Remembering: Statistical Support for Rule-Based MT Electronic resource. / Oliver Streiter, Leonid L. Iomdin, Munpyo Hong [etal.]. 1999. - Mode of access: http://proling.iitp.ru/bibitems/streitetal.html (23.11.2009).

170. Linguistic Automaton Today / M. Ignatieva, V. Chizhakovsky, A. Popescu et al. // The Computer Science Journal of Moldova. 1994. - Vol. 2, № 1(4). - P. 40-73. - ISSN 1561-4042.

171. Machine Translation: A Knowledge-Based Approach / Sergei Nirenburg, Jaime Carbonell, Masaru Tomita et al.. Boston : Ap Professional, 1992. 250 p. - ISBN 9781558601284.

172. MaheshK. Semantic Classification for Practical Natural Language Processing / Kavi Mahesh, Sergei Nirenburg // Advances in Classification Research. 1995. - Vol. 6. - P. 79-94. - ISBN 1-57387-046-3.

173. Mahesh K. Ontology Development for Machine Translation: Ideology and Methodology Electronic resource. / Kavi Mahesh. 1996. - Mode of access: http://citeseerx.ist.psu.edu/viewdoc/download?doi=:l 0.1.1.47.3449&rep=repl&typ e=pdf (23.11.2009).

174. Mahesh K. Divergence Patterns in Machine Translation between Hindi and English Electronic resource. / Kavi Mahesh, Sinha Anil Thakur. 2005. -Acess mode: http://www.mt-archive.info/MTS-2005-Sinha-3.pdf (23.11.2009).

175. MarcuD. Data-Driven Machine Translation: a Conversation with Linguistics and Translation Studies Electronic resource. / Daniel Marcu, Alan K. Melby. 2006. - Mode of access: http://www.mt-archive.info/AMTA-2006-Marcu-Melby.pdf (23.11.2009).fh

176. McOuail D. Mass Communication Theory / Denis McQuail. 4 ed. -London : Sage Publications Ltd, 2000. - 552 p. - ISBN 978-0761965473.

177. Munteanu D. Improving Machine Translation Performance by Exploiting Non-Parallel Corpora / Dragos Stefan Munteanu, Daniel Marcu // Computational Linguistics. 2005. - Vol. 31, №4. - P. 477-504. - ISSN 08912017.

178. Niefien S. Improving Statistical Machine Translation Using Morpho-Syntactic Information Electronic resource. / Sonja Niefien. 2002. — Access mode: http://www.mt-archive.info/Niessen-2002.pdf (23.11.2009).

179. Niefien S. Statistical Machine Translation with Scarce Resources Using Morpho-Syntactic Information / Sonja Niefien, Hermann Ney // Computational Linguistics. 2004. - Vol. 30, № 2. - P. 181-204. - ISSN 0891-2017.

180. Och F. J. A Systematic Comparison of Various Statistical Alignment Models / F. J. Och, H. Ney // Computational Linguistics. 2003. - Vol. 29, № 1. -P. 19-51.-ISSN:0891-2017.

181. Paegle D. Latviesu literaras valodas morfologija : 1. d. / Dzintra Paegle ; Latvijas Universitate. Riga : Zinatne, 2003. - 240 1pp. - ISBN 9984698-78-5.

182. Piotrowski R. Development of a Linguistic Automaton in Speech Statistics Group / R. Piotrowski // Automatic Documentation and Mathematical Linguistics. 1991. - Vol. 25, № 9. - P. 12-18. - ISSN 0005-1055.

183. Piotrowski R. Development of a Linguistic Automaton on the Basis of Statistics of Speech / R. Piotrowski, Y. Tambovtsev // Literary and Linguistic Computing. 1994. - Vol. 9, No 4. - P. 291-294. - ISSN 0268-1145.

184. Piotrowski R. G. Linguistic Automaton / Rajmund G. Piotrowski, Larissa N. Beliaeva // Quantitative Linguistics : An International Handbook / ed. Reinhard Kohler, Gabriel Altmann, Rajmund G. Piotrowski. Berlin, New York :

185. Walter de Gruyter, 2005. P. 921-931. - (Handbooks of Linguistics and Communication Science). - ISBN 978-3-11-015578-5.

186. Piperidis S. Machine Translation and Its Philosophical Accounts Electronic resource. / Stelios Piperidis. 2009. - Mode of access: http://www.mt-archive.info/EACL-2009-Piperidis.pdf (23.11.2009).

187. Proszeky G. Comprehension Assistance Meets Machine Translation Electronic resource. / G. Proszeky. 2002. - P. 1-5. - Mode of access: http://citeseerx.ist.psu.edu/viewdoc/download?doi=l 0.1.1.103.568&rep=rep 1 &typ e=pdf (23.11.2009).

188. Ruesch J. Communication: The Social Matrix of Psychiatry / Jurgen Ruesch,' Gregory Bateson. New York : W.W.Norton & Co., Inc, 1987. -328 p. - ISBN 978-0393023770.

189. Shannon С. E. The Mathematical Theory of Communication / Claude E. Shannon 11 The Mathematical Theory of Communication / Warren Weaver, Claude E. Shannon. Urbana, Chicago : University of Illinois Press, 1963. - P. 29115. - ISBN 0-252-72548-4.

190. Sigurd B. The Potential of Swetra A Multilanguage MT System / B. Sigurd, B. Gawronska-Werngren // Machine Translation. - 1988. - Vol. 3, № 3/4. - P. 237-250. - ISSN 0922-6567.

191. Sigurd В. Swetra "Referent Grammar" / B. Sigurd 11 Computerized Grammars for Analysis and Machine Translation. Lund : Lund University press, 1994. - P. 7-56. - ISBN 0862383838.

192. Skadina I. Machine Translation for Latvian / I. Skadina // The First Baltic Conference on Human Language Technologies : Proceedings (April 21-22, Riga, Latvia). Riga : s. п., 2004. - P. 102-106.

193. Skadina I. English-Latvian SMT: Knowledge or Data? Electronic resource. / I. Skadina, E. Bralltis. 2009. - Mode of access: http://dspace.utlib.ee/dspace/bitstream/! 0062/9792/l/paper57.pdf (23.11.2009).

194. The Mathematics of Statistical Machine Translation: Parameter Estimation / P. Brown, V. Delia Pietra, S. Delia Pietra et al. // Computational Linguistics. 1993. - Vol. 19, № 2. - P. 263-311. - ISSN 0891-2017.

195. Thurmair G. Will There Be Winners? Electronic resource. / Gregor Thurmair. 2009. - Mode of access: - http://www.mt-archive.info/Translingual-Europe-2009-Thurmair-ppt.pdf (23.11.2009).

196. Tildes Birojs 2008 : celvedis / Sabiedriba Tilde. Riga : s. п., 2008. -24 1pp.

197. TurianJ.P. Evaluation of Machine Translation and Its Evaluation / J. P. Turian // Proceedings of the Ninth Machine Translation Summit (23-27 September, New Orleans, USA). East Stroudsburg, PA : AMTA., 2003. -P. 386-393.

198. Uszkoreit H. Will There Be a Winner? Electronic resource. / Hans Uszkoreit. 2009. - Mode of access: http://www.mt-archive.info/Translingual-Europe-2009-Uszkoreit-2-ppt.pdf (23.11.2009).

199. Vauquois B. Automatic Translation A Survey of Different Approaches / B. Vauquois // Readings in Machine Translation / ed. Sergei Nirenburg, Harold L. Somers, Yorick A. Wilks. - Cambridge, MA : MIT Press, 2003. - P. 332-338. - ISBN 0-262-14074-8.

200. Wu D. The HKUST Leading Question Translation System Electronic resource. / Dekai Wu. 2003. - Mode of access: http://ww.cse.ust.hk/~dekai/libraryA^Dekai/WUDekaiMTSummit200307 26.pdf (23.11.2009).

201. Younger D. H. Recognition and Parsing of Context-Free Languages in Time n3 / Daniel H. Younger // Information and Control. 1967. - № 10(2). -P. 189-208.-ISSN0019-9958.

202. СПИСОК ИСПОЛЬЗОВАННЫХ СЛОВАРЕЙ

203. Новый большой англо-русский словарь : т. 3 : R-Z / Ю. Д. Апресян и др. ; под общ. рук. акад. Ю.Д.Апресяна. М. : Русский язык, 1994. -823 с. - ISBN: 5-200-01955-9.

204. Словарь по кибернетике / под ред. акад. В. М. Глушкова. — Киев : Гл. редакция УСЭ, 1979. 623 с.

205. Современный словарь иностранных слов : ок. 20 000 слов. СПб. : Дуэт, 1994. - 752 с. - ISBN 5-7116-0022-2.

206. Философский словарь / под ред. И. Т. Фролова. Изд. 4-е. - М. : Изд-во полит, лит., 1981. - 590 с.1. ГЛОССАРИЙ13

207. Автоматизированное рабочее место комплекс программных и аппаратных средств, который, как правило, интегрирован в одну систему для поддержания определенного рода деятельности.

208. Архитектура системы машинного перевода набор компонентов системы машинного перевода, составляющих лингвистическое обеспечение системы.

209. Домашнее автоматизированное рабочее место— автоматизированное рабочее место, предназначенное для поддержания неофициальной (бытовой) коммуникации неспециалиста, не связанной с узкой профессиональной деятельностью.

210. Домашний лингвистический автоматлингвистический автомат, входящий в структуру домашнего автоматизированного рабочего места.

211. Коммуникация взаимодействие между субъектами коммуникации, опосредованное объектом такого взаимодействия, т. е. передача объекта социальной коммуникации отправителем и прием объекта coifucuibHou коммуникации получателем.

212. Лингвистический автомат многофункциональный иерархический комплекс аппаратных, программных, лингвистических и иногда лингводидактических средств, объединенных функцией (функциями) автоматической переработки текста.13

213. Курсивом в толкованиях выделены термины, для которых в глоссарии имеются отдельные словарные статьи.

214. Общение конкретный тип коммуникации (ср. профессиональное общение, неофициальное (бытовое) общение, социальное общение).

215. Объект социальной коммуникации текст, функционирующий в социальной коммуникации, передаваемый отправителем и принимаемый получателем.

216. Профессиональное автоматизированное рабочее место автоматизированное рабочее место, предназначенное для под держания профессиональной и / или учебной деятельности.

217. Профессиональный лингвистический автомат -лингвистический автомат, входящий в структуру профессионального автоматизированного рабочего места.

218. Система машинного перевода комплекс программного и лингвистического обеспечения для осуществления процедуры машинного перевода.

219. Социальная коммуникация особый тип общения социально-политических институтов конкретного государства с жителем этого государства.

220. Социальное автоматизированное рабочее место-социально-ориентированное автоматизированное рабочее место для различных категорий пользователей.

221. Социальный лингвистический автоматлингвистический автомат, входящий в структуру социального автоматизированного рабочего места, в котором реализуется функция машинного перевода для государственного языка.

222. Субъект коммуникации участник коммуникации -коммуникант.