автореферат диссертации по филологии, специальность ВАК РФ 10.02.21
диссертация на тему:
Компьютерное моделирование графемно-фонемного преобразования в английском языке

  • Год: 2005
  • Автор научной работы: Корочков, Александр Викторович
  • Ученая cтепень: кандидата филологических наук
  • Место защиты диссертации: Санкт-Петербург
  • Код cпециальности ВАК: 10.02.21
450 руб.
Диссертация по филологии на тему 'Компьютерное моделирование графемно-фонемного преобразования в английском языке'

Полный текст автореферата диссертации по теме "Компьютерное моделирование графемно-фонемного преобразования в английском языке"

Санкт-Петербургский государственный университет

На правах рукописи

КОРОЧКОВ АЛЕКСАНДР ВИКТОРОВИЧ

КОМПЬЮТЕРНОЕ МОДЕЛИРОВАНИЕ ГРАФЕМНО-ФОНЕМНОГО ПРЕОБРАЗОВАНИЯ В АНГЛИЙСКОМ ЯЗЫКЕ

Специальность 10.02.21 - Прикладная и математическая лингвистика

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата филологических наук

Санкт- Петербург 2005

Работа выполнена на кафедре прикладной и математической лингвистики Санкт-Петербургского государственного университета

Откупщикова Майя Ивановна доктор филологических наук, профессор

Вольская Нина Борисовна кандидат филологических наук, доцент

Российский государственный педагогический университет имени А. И. Герцена

Защита состоится « J » июня 2005 г. в часов на заседании

диссертационного совета Д 212.232.23 по защите диссертаций на соискание ученой степени доктора филологических наук при Санкт-Петербургском государственном университете по адресу: 199034, г. Санкт-Петербург, Университетская набережная, д.11,ауд. 25.

С диссертацией можно ознакомиться в научной библиотеке имени A.M. Горького Санкт-Петербургского государственного университета (г. Санкт-Петербург, Университетская набережная, д. 7/9).

Автореферат разослан

Ученый секретарь диссертационного совета, доктор филологических наук,

профессор Светозарова Н. Д.

Официальные оппоненты:

Ведущая организация:

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность исследования. Рассмотрение языка как деятельности, т.е. системы или процедуры преобразований языковой информации одного типа в другой, хотя и имеет некоторую традицию, приобрело особую актуальность с момента появления такого универсального средства реализации различных деятельностных моделей как компьютер, что, в частности, проявилось в создании такой отрасли знаний о языке, которую принято называть "Обработка естественного языка (ОЕЯ)"1. Одним из типов преобразователей языковой информации является процедура, задающая переход от графемного представления слова к фонемному. Этот тип преобразования составляет основное содержание лингвистической части перехода от графического (письменного) представления информации к звуковому.

В области ОЕЯ подобного рода преобразование осуществляется в системах порождения речи "Текст —» Речь", которые либо реализуются как отдельные самостоятельные системы преобразования, либо включаются в качестве компонента объемлющей системы ОЕЯ. Большая часть существующих систем подобного рода в лингвистическом аспекте теоретически основывается на работах Р.Л. Венезки (R.L. Venezky) (теория буквенно-звуковых (фонемных) соответствий), Н. Хомского (N. Chomsky) и М. Халле (М. Halle) (генеративная фонология - абстрактные базовые формы и правила постановки словесных ударений).

В то же время параллельно с задачами построения автоматических систем порождения речи существует достаточно традиционная область обучения иностранному языку, в интересующем нас случае - английскому языку, и одним из неотъемлемых компонентов данного процесса является обучение умению читать, т.е. озвучивать письменный текст. Как правило, этот процесс предполагает использование некоторого набора правил чтения, которые теоретически не только не основываются на идеях генеративной фонологии, но и не являются даже в какой-либо степени формализованными.

Если для правил первого типа существуют некоторые количественные оценки их адекватности, то для правил второго типа, которые широко используются в обучении, существует лишь достаточно приблизительная качественная оценка их адекватности, что не позволяет научно-обоснованно решать вопросы их применимости при обучении английскому языку. Потребность в использовании научно-обоснованных критериев для решения указанной проблемы придает научную актуальность исследованиям, способным получить необходимые количественные данные.

1 В англоязычных источниках - Natural Language Processing (NLP).

Необходимая количественная оценка может быть получена только после компьютерного моделирования правил второго типа, что определяет научную актуальность исследования и последующего компьютерного моделирования графемно-фонемного преобразования (ГФП), базирующегося на существующих традиционных правилах чтения.

Отсутствие описания ГФП, основанного на существующих правилах чтения и пригодного для последующей компьютерной реализации, определяет основную цель данного исследования - создание такого описания.

Основная цель диссертации - описание, или моделирование, этапа перехода от графемного представления к фонемному в английском языке такими средствами, которые позволили бы произвести последующую апробацию этого описания средствами компьютерного моделирования, т.е. реализацию описания на каком-либо языке программирования. Другими словами, это означает создание формального описания данного перехода на уровне, достаточном для последующей реализации через соответствующие языки программирования.

Выдвижение данной цели обусловило постановку следующих задач:

- создание логической классификации возможных способов организации ГФП в языке для последующего отграничения/выделения объекта исследования и определения состояния дел в его описании;

- введение критериев для сравнения подходов с целью определения наиболее эффективного подхода для использования в последующем компьютерном моделировании перехода;

- выявление на основе введенной классификации структуры перехода, т.е. разбиение всего перехода на отдельные подэтапы;

- определение источников традиционных правил чтения;

- отбор правил для последующего моделирования;

- распределение отобранных правил по блокам, ответственным за решение однотипных задач (создание сводов исходных правил);

- определение последовательности применения правил внутри блоков (алгоритмизация правил);

- описание формальных средств, которые могут быть достаточными для получения промежуточного формального описания, предназначенного для последующей реализации на одном из языков программирования;

- описание при помощи этих формальных средств каждого из выявленных подэтапов (формализация правил) и его частичная (первичная) апробация путем анализа соответствующих примеров;

- компьютерное моделирование полученного описания, т.е. его реализация на одном из языков программирования;

- выбор или создание/модификация словарных источников для апробации полученной компьютерной модели (машиночитаемых словарей соответ-

ствующей структуры, содержащих в словарных статьях результат эталонного транскрибирования);

- построение оценочной процедуры,

- апробация компьютерной модели при помощи этой процедуры и используемых источников, в частности, получение количественной оценки степени адекватности применяемых правил чтения для английского языка и влиянии на адекватность преобразования информации о частеречной и/или морфемной разметке.

Разработка теоретических положений и создание на их основе компьютерной модели графемно-фонемного преобразования для английского языка стало возможным благодаря комплексному использованию теоретических и экспериментальных методов исследования.

Методология работы опирается на:

- системный подход, позволяющий определить место предмета иссле-

дования диссертации в области обработки естественного языка;

- монографический метод, предполагающий всестороннее, полное и

детализированное описание исследуемого объекта, в данном случае этапа графемного-фонемного перехода;

- проектный метод, определяющий целостность исследования, стадии

и порядок его разработки;

- абстрактно-логический метод, используемый при классификации

подходов и описании исходных наборов правил;

-моделирование как метод исследования структуры и основных свойств объекта моделирования;

-эмпирический метод, связанный с постановкой экспериментальных проверок теории (правил);

- эмпирической основой работы послужили уже существующие и до-

полнительно созданные правила чтения.

Научная новизна исследования определяется, во-первых, как постановкой самой проблемы полного формального описания этапа графемно-фонемного перехода для английского языка на основе традиционных правил чтения, так и сущностью избранного подхода к ее решению. Названные выше цели и задачи исследования применительно к данному материалу ранее другими авторами не ставились. Во-вторых, впервые получена полная работающая компьютерная модель графемно-фонемного перехода (части этапа чтения графемного текста) для английского языка, основанного на традиционных правилах чтения. В-третьих, впервые получена количественная оценка степени адекватности применяемых правил чтения для английского языка, степени влияния на адекватность преобразования информации о частеречной

и/или морфемной разметке и исчерпывающий список слов-исключений для этих правил, начинающихся с буквы А английского алфавита, и созданы предпосылки для получения полного исчерпывающего списка слов-исключений для этих же правил.

Теоретическая значимость работы. Теоретическая значимость полученных результатов состоит в том, что они могут быть использованы при построении как частных теорий графемно-фонемных переходов для других языков, так и общей теории графемно-фонемных переходов. Кроме того, полученные результаты могут послужить основой для построения типологии языков, базирующейся на степени сложности графемно-фонемного перехода в языках и используемых при этом типах преобразований (правил).

Практическая значимость работы. Практическая значимость исследования заключается в создании предпосылок для получения эффективного и компактного (для применения, например, в мобильных устройствах связи) программного и/или аппаратного лингвистического обеспечения синтеза речи, способного работать на неограниченном входном материале, что характерно для любых систем, построенных на правилах.

Результаты данного исследования могут быть также использованы в общих и специальных курсах языкознания и в практике обучения студентов английскому языку.

Апробация работы. Основные идеи и результаты настоящего исследования обсуждались на Огаревских чтениях Мордовского государственного университета (Саранск, 2002), на международной конференции "Когнитивное моделирование в лингвистике" (Варна, 2003) и на международной конференции 8РЕСОМ' 2003 ("Речь и компьютер") (Москва, 2003).

По теме диссертации было опубликовано 5 печатных работ на русском и английском языках.

Структура и объем работы. Структура диссертации отражает ход исследования и соответствует последовательности решения сформулированных автором задач. Первая глава посвящена рассмотрению возможных подходов, вторая - анализу состояния дел в описании моделируемого объекта исследования и введению формальных средств, используемых для его описания. Главы с третьей по седьмую посвящены построению формальных моделей слогоделения, акцентуации, определения типа слога и посимвольного преобразования. Восьмая глава посвящена описанию создания компьютерной модели формализованного в предшествующих главах преобразования и ее апробации на материале машиночитаемых словарей.

Диссертация изложена на 396 страницах, состоит из основной (309 страниц) и служебной части (87 страниц). Основная часть содержит введение, 8 глав, заключение и библиографический список. Служебная часть со-

держит 3 приложения. Библиографический список включает 147 наименований, в том числе 114 иноязычных.

ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ

Во введении обосновывается актуальность темы исследования, характеризуется состояние ее научной разработанности, определяется методологическая база, формулируются цель и задачи исследования, его научная новизна, дается теоретическая и практическая значимость работы.

Глава I посвящена описанию возможных способов организации преобразования, выделению объекта исследования. В ней содержится описание структуры перехода для выбранного подхода, путем сравнения с другими подходами определяется место используемого подхода в созданной классификации.

В разделе 1.1 вводится классификация подходов к построению ГФП. Первое основание классификации строится на выделении двух основных направлений моделирования, привязанных к способу получения лингвистических знаний, используемых в системах преобразования. По этому основанию разделяются подходы, построенные на автоматическом или ручном (экспертном) способе получения этих знаний. Исходя из целей данного исследования дальнейшее изложение концентрируется на подходах втором типа. Эти подходы классифицируются на основе типа объекта, который преобразуется. В зависимости от объекта преобразования они делятся на те, которые основаны на преобразовании либо целых слов (так называемые прямые, словарные или словесные подходы), либо частей слов (морфем) - морфемные подходы, либо отдельных символов (простых графем) - графемные подходы. Возможны также некоторые комбинации этих подходов.

Для проведения сравнения выявленных подходов вводятся следующие критерии:

1) функциональные, такие как степень покрытия входного материала (отношение количества материала, для которого преобразование возможно, к общему количеству возможного входного материала); степень словесной адекватности преобразования (отношение числа правильно преобразованных последовательностей символов (слов) к общему числу преобразованных последовательностей символов) и

2) критерии компьютерной эффективности (так как речь идет о компьютерном моделировании) - быстродействие и объем используемой памяти.

В разделах 1.2-1.5 достаточно подробно рассматриваются характеристики словесных, морфемных, графемных и комбинированных подходов.

После получения в предшествующих разделах некоторых значений критериев сравнения в разделе 1.6 показывается, что наилучшими для ком-

пьютерного моделирования характеристиками обладают подходы, включающие либо только посимвольное преобразование, либо преобразование символов в комбинации с преобразованиями объектов других типов. В этом случае возможно достижение максимальной словесной адекватности системы при максимальной степени покрытия входного материала и сравнительно небольшом объеме используемой памяти.

Исходя из этого для последующего моделирования за основу берется комбинированный графемно-словесный с элементами морфемного деления тип подхода, а объектом исследования становится графемная часть этого подхода.

Глава II посвящена описанию состояния дел в моделировании на основе или с привлечением графемного типа подхода, описанию последовательности моделирования существующих правил чтения. В ней вводятся формальные средства, которые могут быть применены для описания преобразования.

В разделе 2.1 описывается состояние дел в исследовании и применении графемных подходов, основанных на правилах, и место среди них подхода на основе существующих правил чтения. Прежде всего, работы по данной тематике разделяются по языку-объекту и дальнейшее описание концентрируется на английском языке, для которого исследуемое преобразование является одним из самых сложных. Далее для того, чтобы показать, на чем основывается различие между графемными подходами, применяемыми в практических системах синтеза речи, и графемным подходом, моделирующим существующие правила чтения, кратко характеризуются лингвистические основания этих подходов.

Показывается, что часть используемых в правилах свойств лингвистических объектов, подлежащих преобразованию, совпадает в обоих типах подходов и, прежде всего, это использование непосредственного окружения лингвистических объектов (их контекст). Но при этом имеется также и некоторая непересекающаяся часть используемых свойств объектов, наличие которой и позволяет четко отграничить один тип подхода от другого, и соответственно, не позволяет прямо переносить некоторые данные, полученные при применении правил одного типа, на применение правил другого типа. В данном случае речь идет, прежде всего, о получении отсутствующей количественной оценки степени адекватности правил чтения, применяемых при обучении английскому языку.

В разделе 2.2 описывается последовательность моделирования существующих правил чтения и источники соответствующих правил.

Правила чтения широко известны, но изначально предназначены для их применения человеком, а не компьютером. Поэтому получение компьютерной модели этих правил предполагает прохождение их через несколько

этапов предварительной обработки. Первоначально из различных источников создаются исходные наборы (своды) правил. В рамках графемного подхода все правила разделяются на несколько категорий, т.е. создается несколько сводов правил. Это связано с тем, что собственно вычисление посимвольных соответствий, и прежде всего, для гласных элементов, возможно лишь при привлечении дополнительной информации о типе слога, что, в свою очередь, требует предварительного разбиения слова на слоги. Все это приводит к тому, что для получения транскрипции входное слово в графемном подходе последовательно подвергается процессам слогоделения, постановки ударения (ударений) в изолированном слове (акцентуация), определения других характеристик (типов) слогов (открытость/закрытость и др.) и контекстно-зависимого посимвольного преобразования. Кроме того, для проведения преобразования может привлекаться и другая информация, например, о принадлежности слова к определенной части речи и морфемном составе анализируемого слова, получаемая от других лингвистических процессов обработки, не входящих в состав процессов, реализующих ГФП.

В источниках могут встречаться неравнообъемные правила, когда в соответствующей паре правил одно является более общим, а другое - частным случаем первого. Встречаются также правила, которые прямо противоречат друг другу. Исходя из этого правила в полученных сводах затем подвергаются дополнительной обработке, в результате которой из сводов устраняются противоречащие правила и оставляется лишь один из вариантов разнообъем-ных правил. После этого оставшиеся правила алгоритмизуются (т.е. задается последовательность их применения) и формализуются. На последнем этапе моделирования эти правила (алгоритмы) реализуются на каком-либо языке программирования, что приводит к созданию работающей на компьютере модели соответствующих языковых процессов.

В разделе 2.3 описывается используемая формальная система, которая может быть отнесена к формальному классу конечных преобразователей (трансдьюсеров).

Для промежуточного этапа формализации (конечный - запись на языке программирования) правил слогоделения, акцентуации, определения типа слога и посимвольного преобразования используется система подстановок или в другой терминологии - переписываний, называемая правилами, которая задается определенными входными и выходными алфавитами и конечными совокупностями правил (формул) вывода. Совокупности правил вывода задаются как упорядоченные множества. Используется два типа правил вывода: правила замены описания некоторого лингвистического объекта на другое и правила применимости либо правил замены, либо других правил применимости. Операция замены в соответствующих формулах обозначается символом а операция применимости - символом

Общая форма двухуровнева правила применимости следующая:

Л-"й>=> (a---ß<j>a---ß -*a---ß<pa---ß),

где операция, обозначенная многоточием, соединяет части разрывного контекста, а алфавитные символы обозначают объекты, являющиеся операндами операций. Правило замены является частным случаем правила применимости, в котором не задано (опущено) первое условие (контекст). В части правила с операцией замены также может быть опущена любая контекстная часть.

Каждое правило обозначается типом и номером в этом типе. Тип задает множество правил. Порядок выборки элемента из множества определяется номером правила. Правило с меньшим номером проверяется на применимость до правила с большим номером. Примеры правил приводятся ниже.

Выбор правила для преобразования происходит следующим образом. Для каждого текущего символа (в более общем случае - объекта) анализируемого слова просматривается соответствующее множество правил, начиная с первого правила и далее по порядку номеров правил. При выборе правила сравнивается на совпадение левая часть правила (до знака преобразования) и часть представления слова такой же длины, что и левая часть правила, начинающаяся с текущего объекта (которому соответствует некоторый символ исходного слова). После выбора правила и преобразования по этому правилу происходит смена текущего элемента. Порядок смены текущего элемента и прекращение выборки правил зависят от множества, которому принадлежат применяемые правила.

Глава III посвящена описанию процесса слогоделения и сопутствующих ему процессов, составляющих первый этап графемно-фонемного преобразования.

Процесс слогоделения проходит в следующем порядке. Входная строка, полученная в результате либо автоматического, либо смоделированного "вручную" через возможные выходные данные морфологического анализа, инициализируется, сегментируется, категоризируется и маркируется. Инициализация предполагает обрамление исходной строки объектами, задающими границы строки и начальное значение для подсистемы маркирования слогов. При категоризации, совмещенной с графемной сегментацией, каждый выделенный графемный объект (символ или их последовательность) проини-циализированной строки получает атрибут (признак) принадлежности к категории гласных или согласных элементов. Маркирование заключается в присвоении каждому объекту атрибута, обозначающего номер слога. В формальном своде правил имеется 1 правило инициализации, 48 правил сегментации-категоризации и 18 правил маркирования. Ниже приводится множество правил маркирования в сокращенной форме отображения, при которой

указываются только существенные для данного правила свойства задействованных объектов. Гласные обозначены символом а согласные - символом С. Символ подчеркивания обозначает границу словоформы. Переменная содержит номер слога, остальные символы являются литералами1. Символ двойного плюса обозначает увеличение значения соответствующей переменной на единицу.

Упорядоченное множество правил подэтапа слогоделения, названного выше маркированием (М):

(М1)

УчхУ -» УщхцУ^, (М2)

У,СУ -> ^С^к,,, (МЗ)

(М4)

У, НУ -4 У„х„1„^,. (М5)

(Мб)

УщпУ Кг^Л,,, (М7)

У,хгК (М8)

КСгУ ущс„ (М9)

К -» V, с, с,_, (М10)

(МИ)

с„с-*с„с„, (М12)

С, и ->с,у„ (М13)

(М14)

_,С-»_,С„„ где )7=0, (М15)

(М16)

(М17)

К, сссс_ -» V, с, с, с, с,_. (М18)

Глава IV посвящена описанию процесса постановки ударения (ударений) в отдельном изолированном слове - акцентуации.

Процесс акцентуации включает следующие последовательные процессы: частеречной инициализации, выделения частей слова, подлежащих отдельному анализу, специального морфологического анализа, предварительной инициализации, собственно акцентуации и терминации - присвоения остаточного признака безударности. Предлагается 2 правила частеречной ини-

1 Самоопределенными величинами, т.е. обозначающими самих себя.

цианизации, 46 правил выделения частей слова, подлежащих отдельному анализу, 34 правила специального морфологического анализа, 2 правила предварительной инициализации, 41 правило собственно акцентуации (включающие 32 правила постановки первичного ударения и 9 правил постановки вторичного ударения - последние описаны в 2 вариантах) и 5 правил терминации.

Ниже приводятся правила постановки первичного ударения в сокращенной записи. В них использованы следующие новые (индексные) обозначения: УЬ обозначает глагол, Adj -прилагательное, Pf-префикс, Rt -корень, Stl - первичную простую ударность, Stic - первичную сложную ударность, символ ~ обозначает морфемную границу, остальные символы являются литералами. Операция, обозначенная знаком "•••>-", является разновидностью операции разрывного контекста, в которой задано направление поиска объекта, удовлетворяющего описанию, заданному в качестве операнда операции.

е,Л 1 е—> 1 I е Ч Ч 1 7 Ч ' (РА1)

e„,ni„e„~ -> е®!т е„ 1-1 Ч П 1 1 ' (РА2)

е,-Л (РАЗ)

(РА4)

е,Л ♦ е —> еЛ| t t е ~ -1 ^ S-i Vi \с„ • (РА5)

i„in,A,~ i!'!n„a„~, If-l 1} t] if-l q 7 ' (РА6)

(РА7)

ее,- ее„ ~ (РА8)

С' П-1 Ч 4-2 1-1 (РА9)

V .yV V -,У*'<...у у у 1~1 Ч 1-2 4-1 Ч' (РАЮ)

V •>-CC.,~-a*b „I .е. —+V„7" 4-1 Ч-l Ч Ч Ч 4-2 » (РА11)

V Ч • Ч-1 Ч Ч Ч 4-2 «Л-. (РА 12)

V ■уСС ,-i* v„e„~->y7-xCC v е 4-1 Ч-1 Ч Ч 4-1 Ч'1 Ч Ч » (РА 13)

V (РА 14)

V (РА 15)

V (РА 16)

V (РА 17)

V V,, С„ — а'? 4-2 Ч-" Ч-« (РА 18)

Глава V посвящена описанию процесса определения типа слога. Процедура определения характеристик слогообразующего элемента (типа слога) включает следующие последовательные процессы: определения модифицированном^ (наличия буквы г справа от гласного элемента), первичной открытости/закрытости, вторичной закрытости (слогов, исходно являющихся открытыми) и степени полноты озвучивания гласного элемента. Она использует 3 правила определения модифицированном^ слога, 2 правила определения первичной открытости/закрытости слога, 12 правил определения вторичной закрытости слога и 31 правило определения степени полноты озвучивания гласного элемента слога.

Ниже в качестве примера приводятся правила определения вторичной закрытости слога в которых используются следующие новые (относи-

тельно предшествующих правил) обозначения: Ор обозначает открытость слога, - закрытость слога, - вторичное ударение, - безударность, - немодифицированность. Элементы набора правил определения вторичной закрытости слога в сокращенной записи:

(БСО) (80С2)

у*1г.0р р .. . ¡№ у У5"'°Т ■••■>- 1"' V

% Ч+2 ^ % ^

С0'с-К:, С -» Г'^-^СС

уА'Мг.О^ у уЯК-.Ору

Ч 4+1 ч ||+1'

у5||с.0/> ySrlc.Um.CI

Ч Ч *

уИ1.0р ySll.Vfii.CI

.*5М,0р р . ¡(/1.СТ 1 р ¡Ш.СТ

7 4+1 ч

у£... ц^ £... ^ ц

I) 1)+1 ч 4+1 '

V"» С-У ие"' у*,ша С-у ие'"„.

Ч 1+1 п п* I

Глава VI посвящена описанию процессов посимвольного преобразования согласных. В главе предлагается 3 формализованных правила для буквы В, 14 правил - для буквы С, 11 правил - для буквы D, 1 правило - для буквы F, 10 правил - для буквы G, 2 правила - для буквы Н, 1 правило - для буквы J, 3 правила - для буквы К, 9 правил - для буквы L, 2 правила - для буквы М, 19 правил - для буквы N, 6 правил - для буквы Р, 3 правила - для буквы Q, 8 правил - для буквы R, 35 правил - для буквы S, 17 правил - для буквы Т, 1 правило - для буквы V, 6 правил - для буквы W, 15 правил - для буквы X, 3 правила - для буквы Z и 24 правила для недопущения удвоения согласных звуков. Всего предлагается 193 правила этой категории (в это число не включены правила с полным контекстом, который описывает отдельную словоформу, предназначенные для обработки слов-исключений).

Глава VII посвящена описанию процессов посимвольного преобразования гласных. В главе предлагается 44 формализованных правила для буквы А, 69 правил - для буквы Е, 41 правило - для буквы /, 55 правил - для буквы О, 52 правила - для буквы U, 9 правил - для буквы К Таким образом, всего предлагается 270 правил этой категории (в это число также не включены правила с полным контекстом, предназначенные для обработки слов-исключений).

Элементы набора правил А (буква А и диграфы на ее основе) в сокращенной записи представлены ниже. Транскрипционные знаки обрамлены косыми чертами. При полном отсутствии звучания, т.е. //, обрамление опускается, в остальных случаях отсутствие звучания отдельного элемента может быть обозначено символом 0. Обрамление буквы алфавита или категориального символа квадратными скобками обозначает, что соответствующий элемент был ранее транскрибирован. Другие новые (относительно предшест-

(БОСЗ) (БОС4) (80С5) (БОСб) (80С7) (БОСв) (БОС9) (80С10) (БОСП) (80С12)

вующих правил) обозначения: Мй обозначает модифицированное™ гласной, /•7 - полное озвучивание гласной, Rd - редуцированное.

aa -> /aj, (Al) a"st—> /aj, (А24)

ae"m -4 IrJ, (A2) a" th—> laJ, (А25)

aeMd /еэ/, (A3) a" 1С—> hJ, (А26)

aiUm,n Ы, (A4) aMce—> /i/ce~, (А27)

aiMd,f1 -> /еэ/, (A5) aMde~ -> /i/de~, (А28)

ai" -» Л/, (A6) aMge—> /i/ge~, (А29)

au—> /эи/~, (A7) aMte~ Me~, (АЗО)

au -> Ы, (A8) aUm,0p,FI -» /ei/, (А31)

aw -> hj. (A9) aMi,0p,n /еэ/, (А32)

ay" /ei/, (A10) а"тЛ" /эе/, (АЗЗ)

ayRd ->N, (All) aMd,a,n -> /а:/, (А34)

/w/aa,n -4/w0/oa" , (A12) /f/aMl~_-> /¡/l-_. (А35)

a"lf~->/a:/, (A13) //0/ам1~_->//0Л~_, (А36)

anlm—> /a:/, (A 14) ///a"dn--_-> /J/n~_, (А37)

anlve~ -»/аУ, (A 15) //0/aRdn~_-» /J0/n~_, (А38)

a" ff~ -»/а-У, (A 16) [mn]aRdl~_ -4 [mn]/a/l-

aRft—»/aj, (A17) (А39)

a "nee—> /aj, (A 18) [г]ам1~_ [г]/э/1-_, (А40)

a" nch- -> /aj, (A 19) [У]ам1~_ [V]/a/l~_, (А41)

a"nt ~->/aj, (A20) aBdl~ 1-, (А42)

a"sk—> /a j, (A21) Лк/ам11у-_ Лк/11у~_, (А43)

[C]aF,sp—> /aj, (A22) а*" /э/. (А44)

[C]anss~ /aj, (A23)

Всего в главах VI и VII предлагается 463 правила посимвольных преобразований (в это число не включены правила с полным контекстом).

Ниже приводится демонстрация действия правил посимвольного преобразования на примере анализа слова atmospheric, которое после этапа определения типа слога может быть представлено следующим образом (описание отдельного объекта, построенное по позиционному принципу, обрамляется круглыми скобками; число в описании объекта обозначает номер слога):

atmospheric: (_. 0) ~ (а, V, 1, Adj, Rt, St2, Um, CI, Fl) (t, С, 1, Adj) (m, C, 2, Adj) (о, V, 2, Adj, Rt, Us, Um, CI, Rd) (s, C, 2, Adj) (p, C, 3, Adj) (h, C, 3, Adj)

(е, V, 3, Adj, Rt, Stic, Um, CI, Fl) (r, C, 4, Adj) ~~ (i, V, 4, Adj, Rt, Us, Um, CI, Rd) (с, C, 4, Adj) ~ (_, 0).

To же в краткой форме записи: .a^-a-"t,m2o^"i'Ms1'pJh,e^'x'-nrii^-c'Mci.

Применение правил посимвольного преобразования (над стрелкой приводится номер примененного правила из соответствующего множества правил) приведет к следующему результату:

Пример 1. Анализ слова atmospheric.

(_> 0) ~ (а, V, 1, Adj, Rt, St2, Um, CI, Fl) (t, С, 1, Adj) (m, C, 2, Adj) (о, V, 2, Adj, Rt, Us, Um, CI, Rd) (s, C, 2, Adj) (p, C, 3, Adj) (h, C, 3, Adj) (e, V, 3, Adj, Rt, Stic, Um, CI, Fl) (r, C, 4, Adj) — (i, V, 4, Adj, Rt, Us, Um, CI, Rd) (с, C, 4, Adj) ~ (_, 0) ) (_, 0) - (a, V, I, Adj, Rt, St2, Um, CI, Fl, /ae/) (t, C, I, Adj) (m, C, 2, Adj) (о, V, 2, Adj, Rt, Us, Um, CI, Rd) (s, C, 2, Adj) (p, C, 3, Adj) (h, C, 3, Adj) (e, V, 3, Adj, Rt, Stic, Um, CI, Fl) (r, C, 4, Adj) — (i, V, 4, Adj, Rt, Us, Um, CI, Rd) (с, C, 4, Adj) ~ (_, 0) —(_, 0) ~ (a, V, 1, Adj, Rt, St2, Um, CI, Fl, /&Г) (t, C,

1, Adj, /t/) (m, C, 2, Adj) (о, V, 2, Adj, Rt, Us, Um, CI, Rd) (s, C, 2, Ad/) (p, C, 3, Adj) (h, C, 3, Adj) (e, V, 3, Ad/, Л/, Stic, Um, CI, Fl) (r, C, 4, Adj) ~~ (i, V, 4, Adj, Rt, Us, Um, CI, Rd) (с, C, 4, Ad/) - (_> 0) —¡(_. 0) ~ (a, V, 1, Ad/, /?/, St2, Um, CI, Fl, /sJ) (t, C, 1, Adj, Л/) (m, C, 2, Ad/, /ш/) (о, V, 2, Arfy, fli, Us, Um, CI, Rd) (s, C, 2, Arf/l (p, C, 3, Adj) (h, C, 3, Adj) (e, К 3, Adj, Rt, Stic, Um, CI, Fl) (r, C, 4, Adj) ~~ (¡, V, 4, Adj, Rt, Us, Um, CI, Rd) (с, C, 4, Adj) - (_, 0) ) (_. 0) ~ (a, V, 1, Adj, Rt, St2, Um, CI, Fl, /ae/) (t, C, 1, Adj, ЛГ) (m, C, 2, Adj, /та/) (о, V,

2, Adj, Rt, Us, Um, CI, Rd, /э/) (s, C, 2, Adj) (p, C, 3, Adj) (h, C, 3, Adj) (e, V, 3, Adj, Rt, Stic, Um, CI, Fl) (r, C, 4, Ad/) ~~ (i, V, 4, Аф', ЙГ, ta, í/m, CI, Rd) (с, C, 4, Adj) ~ (_, 0) —^ (_, 0) ~ (a, V, 1, Adj, Rt, St2, Um, CI, Fl, /зе/) (t, С, 1, Adj, M) (m, C, 2, Adj, /m/) (о, V, 2, Adj, Rt, Us, Um, CI, Rd, /э/) (s, C, 2, Adj, /s/) (p, C,

3, Adj) (h, C, 3, Adj) (e, V, 3, Rt, Stic, Um, CI, Fl) (r, C, 4, Adj) ~~ (I, V, 4,

Д/, Us, Um, CI, Rd) (с, C, 4, Adj) - (_, 0) —^ (_. 0) - (a, V, 1, Ad/, Rt, St2, Um, CI, Fl, /Э&0 (t, С, 1, Adj, Л/) (m, C, 2, Adj, /m/) (о, V, 2, Ad/, Rt, Us, Um, CI, Rd, /a/) (s, C, 2, Adj, s) (p, C, 3, Adj, /0/) (h, C, 3, Ad/', til) (e, V, 3, Adj, Rt, Stic, Um, CI, Fl) (r, C, 4, Ad/) — (i, V, 4, Ad/, Л/, Us, Um, CI, Rd) (с, C, 4, Ad/) ~ (_. 0) —^ (_, 0) ~ (a, V, 1, Adj, Rt, St2, Um. CI, Fl, /зе/) (t, С, 1, Adj, Л/) (m, C, 2, Adj, /га/) (о, V, 2, Adj, Rt, Us, Um, CI, Rd, /a/) (s, C, 2, Ad/, /s/) (p, C, 3, Ad/, /0/) (h, C, 3, Ad/, ЛО (e, V, 3, Adj, Rt, Stic, Um, CI, Fl, leí) (r, C, 4, Adj) ~~ (i, V, 4, Adj, Rt, Us, Um, CI, Rd) (с, C, 4, Adj) - (_. 0) —^ (_, 0) ~ (a, V, 1, Adj, Rt, St2, Um, CI, Fl, /ге/) (t, C, 1, Adj, Л/) (m, C, 2, Adj, /m/) (о, V, 2, Adj, Rt, Us, Um, CI, Rd, /a/) (s, C, 2, Ad/, s) (p, C, 3, Ad/, /0/) (h, C, 3, Ad/, /£0 (e, V, 3, Adj, Rt, Stic, Um, CI, Fl, /е/) (r, C, 4, Ad/, /г/) ~~ (i, V, 4, Ad/, Rt, Us, Um, CI, Rd) (с, C, 4, Ad/)

~ (_. 0) —(_, 0) - (а, V, 1, Adj, Rt, St2, Um, CI, Fl, a?) (t, С, 1, Adj, t) (m, C, 2, Аф', m) (о, V, 2, Adj, Rt, Us, Um, CI, Rd, э) (s, C, 2, Adj, s) (p, C, 3, Adj, 0) (h, С, 3, Лф, f) (e, V, 3, /W;, Rt, Stic, Um, CI, Fl, e) (r, C, 4, Лф', /г/) ~~ (i, V, 4, Adj, Rt, Us, Um, CI, Rd, i) (с, C, 4, Adj) ~ (_. 0) —^ (_, 0) - (a, V, 1, Adj, Rt, St2, Um, CI, Fl, /ге/) (t, С, I, Adj, Af) (m, C, 2, Adj, /т/) (о, V, 2, Adj, Rt, Us, Um, CI, Rd, /a/) (s, C, 2, Adj, /af) (p, C, 3, Adj, /0/) (h, C, 3, Adj, /V) (e, V, 3, Adj, Rt, Stic, Um, CI, Fl, /е/) (r, C, 4, Adj, A/) — (i, V, 4, Adj, Rt, Us, Um, CI, Rd, AT) (с, C, 4, Adj, Ik/)~(_.0).

Результат преобразования в краткой форме: /(Setmas'fenk/.

Глава VIII посвящена описанию создания компьютерной модели формализованного в предшествующих главах преобразования и ее апробации на материале машиночитаемых словарей, в частности, получению количественной оценки степени адекватности применяемых правил чтения для английского языка и степени влияния на адекватность преобразования информации о частеречной и/или морфемной разметке.

В разделе 8.1 описывается в общем виде компьютерная модель - реализация системы формальных правил как программной системы.

Система автоматического транскрибирования (KorLang Transcriber) была реализована через систему программирования ассоциативных (семантических) сетей KorNet'. В этой системе возможно параллельное существование компьютерных моделей (реализаций) различных версий правил преобразования. В настоящее время реализованы две версии, названные 1999 и 2002 по времени их первой реализации. Исходные правила первой версии в основном построены на работе И.Г. Мкртчян2 с добавлением авторских правил. Часть этих правил реализована декларативно через систему семантических сетей (правила посимвольного преобразования и часть правил акцентуации), а другая часть (правила частичного морфологического анализа, слогоделения, определения типа слога и основная часть правил акцентуации) -процедурно. В отличие от описанных выше правил, которые относятся к версии 2002, правила версии 1999 не имеют промежуточного формального описания через упомянутую выше систему подстановок. Объем базы данных для этого свода - 27 Кбайт. С точки зрения отладки системы эта версия является не полностью завершенной.

1 Корочков А.В. KorNet - модель данных и система прюраммирования семантической сети для платформы Wn32/PC // Методы и средства управления технологическими процессами: Сб. тр. III Междунар. науч. конф. - Саранск: Изд-во Мордов. ун-та, 1999. - С. 148-152.

2 Learn to Read English Words. (Пособие по технике чтения на английском языке). - М.: Международные отношения, 1977.

В версии 2002 все основные правила преобразования реализованы декларативно через систему ассоциативных сетей. Объем базы данных для этого свода правил - 119 Кбайт (из них 105 Кбайт занимает база с правилами и 14 Кбайт - база, содержащая стандартные слова-исключения для раздела по букве А). Правила данной версии являются реализацией формальных правил, описанных в предшествующих главах реферируемой диссертации.

Так как обе версии в основном базируются на существующих правилах чтения, то моделирование на их основе позволило обратиться к некоторым задачам, решение которых может оказаться полезным и за пределами компьютерной лингвистики и ее приложений. Одной из таких задач является получение точной количественной оценки степени адекватности существующих правил чтения английского языка, для которых пока имеется лишь качественная оценка. Дополнительным результатом эксперимента со сводом существующих правил является получение исчерпывающего списка слов, которые для существующих правил чтения должны рассматриваться как исключения.

Решение этих задач помимо создания системы, построенной на базе свода в основном существующих правил, предполагает наличие некоторого эталонного машиночитаемого корпуса транскрипций слов. Вопросы, связанные с построением подобного корпуса, рассматриваются в разделе 8.2.

Основой для построения такого корпуса может являться практически любой словарь, в котором приводятся транскрипции слов. Для проведения предварительного эксперимента был выбран раздел буквы "А" словаря А.С. Хорнби1. Информация этого раздела (заглавие словарной статьи и варианты ее транскрибирования) была переведена в машиночитаемую форму. Создано 4 варианта представления этого раздела. В первом варианте подлежащее анализу слово полностью совпадает с заглавием исходной словарной статьи. Во втором - дополнительно содержит информацию о части речи этой словоформы и/или ее основы. В третьем варианте словоформа может быть разбита на морфемы. В четвертом варианте может одновременно предоставляться как частеречная информация, так и морфемная.

Вторым источником для решения задачи и, соответственно, апробации системы правил, послужил свободно распространяемый в Интернет машиночитаемый вариант англо-русского словаря В.К. Мюллера2 (изд. 1961 г.), который был адаптирован для решения поставленных выше задач. Адаптация в основном включала выделение заглавий словарных статей и соответствующих им транскрипций (для одного заглавия возможно несколько вариантов транскрибирования) из текста словарной статьи и приведение этой информации к формату, применяемому на входе подсистемы оценки результата преобразований.

1 Учебный словарь современного английского языка. Спец. изд. для СССР/ А. С. Хорнби при участии К. Руз. - М.: Просвещение, 1984.

2 В К. Мюллер. Англо-русский словарь. - М.: Гос. изд-во иностр. и нац. словарей, 1961.

Во втором разделе шестой главы также охарактеризован третий источник - свободно распространяемый в Интернет машиночитаемый словарь проекта произносительного словаря (The Carnegie Mellon Pronouncing Dictionary) университета Карнеги Мелон (США).

В разделе 8.3 рассматриваются оценочные процедуры для получения таких выявляемых характеристик как:

- среднее время на обработку одного слова (у), получаемое по формуле (общее время на обработку/количество обработанных слов);

- словесная адекватность системы вычисляемая по формуле (количество полученных правильных транскрипций слов*100/общее количество полученных транскрипций слов);

- фонемная адекватность (корректность) системы вычисляемая по формуле (количество полученных корректных фонем* 100/общее количество эталонных фонем).

В разделе 8.4 приводятся результаты эксперимента с эталонным корпусом транскрипций.

В разделе 8.4.1 рассматриваются быстродействие системы и степень адекватности используемых правил. Результаты соответствующего эксперимента приведены в табл. 1.

Таблица 1

Версия правил Вход У aw а,

1999 Хорнби 1 0.0173554 20 69

1999 Мюллер 0.00518992 28 76

2002 Хорнби 1 0.00578512 28 80

2002 Хорнби 2 0.00578512 33 82

2002 Хорнби 3 0.00578035 43 84

2002 Хорнби 4 0.00578512 54 88

2002 Хорнби 5 0.00578512 29 80

2002 Хорнби 6 0.00578512 55 88

2002 Мюллер 0.0069579 39 83

Обозначения, принятые в таблице: Хорнби 1 обозначает неразмеченный вариант машиночитаемого раздела словаря А.С. Хорнби, Хорнби 2 - вариант, содержащий морфемную разметку, Хорнби 3 - вариант, содержащий часте-речную разметку, Хорнби 4 - вариант, содержащий и морфемную, и часте-речную разметку, Хорнби 5 - это вариант Хорнби 1 с подключенным словарем приводимых в существующих правилах исключений, начинающихся на букву "А". Такое же соотношение между Хорнби 6 и Хорнби 4. Адаптация

словаря В.К. Мюллера, обозначенная как Мюллер, имеет только один вариант, который не содержит ни морфемной, ни частеречной разметки.

В разделе 8.4.2 рассматривается влияние частеречной и морфемной разметки на степень адекватности системы правил.

В разделе 8.4.3 приводятся выводы по результатам эксперимента.

В заключении сформулированы основные теоретические и экспериментальные результаты, которые состоят в следующем:

- разработава теоретическая классификация возможных способов организации этапа графемно-фонемного перехода;

- получены результаты сравнения возможных способов организации перехода и определены критерии, используемые для их получения;

- определена структура перехода для используемого подхода;

- определены возможные источники традиционных правил чтения;

- проведен отбор и модификация существующих традиционных правил чтения и созданы дополнительные правила;

- созданы своды исходных правил, отражающие распределение правил по блокам, ответственным за решение однотипных задач;

- определена последовательность применения существующих правил чтения для наиболее адекватной реализации структуры перехода (алгоритмизация исходных правил чтения);

- описаны формальные средства, необходимые и достаточные для получения соответствующих формальных описаний, предназначенных для последующей компьютерной реализации;

- построено формальное описание выявленных подэтапов ГФП для английского языка, а именно:

- слогоделения,

- акцентуации,

- определения типа слога,

- посимвольных преобразований;

- построена компьютерная модель ГФП для английского языка;

- подготовлены машиночитаемые словарные источники;

- построена оценочная процедура;

- впервые на верифицируемой основе получены количественные оценки степени адекватности традиционно применяемых правил чтения для английского языка и степени влияния на адекватность преобразования частеречной и/или морфемной разметки.

Полученные результаты показывают, что все заявленные цели достигнуты, а поставленные выше задачи решены.

Приложение I содержит расшифровку внутрисистемных символов транскрипции. Приложение II содержит источник для апробации автоматической системы транскрибирования, созданный на базе словаря А С. Хорнби. Приложение III содержит результаты работы автоматической системы транскрибирования по источнику, созданному на базе словаря А.С. Хорнби.

Основные положения диссертационного исследования отражены в следующих публикациях:

1. Компьютерное моделирование графемно-фонемного преобразования в английском языке (постановка задачи) // Социальные и гуманитарные исследования: традиции и реальности: Межвуз. сб. науч. тр. Саранск,

2002. Вып. 2. С. 388-392.

2. Компьютерное моделирование графемно-фонемного преобразования в английском языке (выбор подхода) // Вестник Мордовского университета. 2003. № 1-2. С. 79-91.

3. Компьютерное моделирование графемно-фонемного преобразования в английском языке (слогоделение) // Обработка текста и когнитивные технологии. Вып.8. Междун. конф. Когнитивное моделирование в лингвистике. Сб. докладов. - Варна, 2003. С. 216-228.

4. Computer Modeling of Grapheme to Phoneme Conversion for English // Proc. of Intern. Workshop SPECOM'2003 (Speech and Computer), Moscow, 2003. P. 155-157.

5. Компьютерное моделирование слогоделения в английском языке // Лингвистические и экстралингвистические проблемы коммуникации: теоретические и прикладные аспекты: Межвуз. сб. науч. тр. - Саранск,

2003. С. 174-186.

Подписано в печать 14.04.05. Объем 1,25 п. л. Тираж 100 экз. Заказ № 840.

Типография Издательства Мордовского университета 430000, г. Саранск, ул. Советская, 24

09 МАЙ 2005 J|J9

 

Оглавление научной работы автор диссертации — кандидата филологических наук Корочков, Александр Викторович

Введение.

Глава 1. Классификация и сравнение подходов к построению графемно-фонемного преобразования.

1.1. Классификация

1.2. Словесные подходы

1.3. Морфемные подходы.

1.4. Графемные подходы

1.5. Комбинированные подходы.

1.6. Сравнение подходов

Выводы по первой главе.:.

Глава 2. Графемные подходы.

2.1. Изученность вопроса (состояние дел).

2.2. Последовательность моделирования.

2.2.1. Источники правил.

2.2.2. Исходные наборы (своды) правил.

2.2.3. Дополнительная обработка.

2.2.4. Алгоритмизация и реализация.

2.2.5. Результаты моделирования.

2.3. Формальная система.

2.3.1. Операции и типы правил.

2.3.2. Упорядоченность правил.

2.3.3. Выбор правила для преобразования.

2.3.4. Представление объектов.

2.3.5. Конечный преобразователь.

Выводы по второй главе.

Глава 3. Моделирование процесса слогоделения.

3.1. Исходная задача.

3.2. Исходные правила.

3.3. Предварительная часть формализации.

3.4. Графемная сегментация и категоризация.

3.5. Слоговое маркирование.

3.6. Обработка буквы X.

3.7. Обработка начального слога.

3.8. Обработка конечного слога.

3.9. Набор правил маркирования.

3.10. Примеры анализа.

3.11. Проблема зияний и диграфов.

3.12. Вспомогательные правила.

3.13. Компонент слогоделения.

Выводы по третьей главе.

Глава 4. Моделирование процесса акцентуации.

4.1. Исходная задача.

4.2. Исходные правила.

4.2.1. Исходный набор правил

4.2.2. Мотивировка и примеры

4.3. Предварительная часть формализации.

4.3.1. Дополнительные свойства объектов

4.3.2. Дополнительные операции

4.4. Выделение частей слова.

4.5. Специальный морфологический анализ.

4.6. Правила акцентуации.

4.7. Предварительная инициализация.

4.8. Первичное ударение.

4.9. Вторичное ударение и терминация.

4.10. Компонент акцентуации.

4.11. Примеры анализа.

Выводы по четвертой главе.

Глава 5. Моделирование процесса определения типа слога.

5.1. Характеристики слога.

5.2. Определение модифицированности слога.

5.3. Первичная открытость/закрытость слога.

5.4. Вторичная закрытость слога.

5.4.1. Исходный набор правил

5.4.2. Мотивировка и примеры

5.4.3. Формализация.

5.5. Определение степени редукции.

5.5.1. Исходный набор правил

5.5.2. Мотивировка и примеры

5.5.3. Формализация.

5.6. Компонент определения типа слога.

5.7. Примеры анализа.

Выводы по пятой главе.

Глава 6. Моделирование процесса посимвольных преобразований согласных.

6.1. Введение.

6.2. Формулировка задачи.

6.3. Преобразование буквы В.

6.4. Преобразование буквы С.

6.5. Преобразование буквы D.

6.6. Преобразование буквы F.

6.7. Преобразование буквы G.

6.8. Преобразование буквы Н.

6.9. Преобразование буквы J.

6.10. Преобразование буквы К.

6.11. Преобразование буквы L.

6.12. Преобразование буквы М.

6.13. Преобразование буквы N.

6.14. Преобразование буквы Р.

6.15. Преобразование буквы Q.

6.16. Преобразование буквы R. vn 6.17. Преобразование буквы S.

6.18. Преобразование буквы Т.

6.19. Преобразование буквы V.

6.20. Преобразование буквы W.

6.21. Преобразование буквы X.

6.22. Преобразование буквы Z.

6.23. Удвоенные согласные звуки.

6.24. Последовательность обработки.

Выводы по шестой главе.

Глава 7. Моделирование процесса посимвольных преобразований гласных.

7.1. Исходная задача. ф 7.2. Преобразование буквы А.

7.3. Преобразование буквы Е.

7.4. Преобразование буквы 1.

7.5. Преобразование буквы 0.

7.6. Преобразование буквы U.

7.7. Преобразование буквы Y.

7.8. Выбор текущего элемента.

7.9. Примеры анализа.

Выводы по седьмой главе.

Глава 8. Компьютерное моделирование.

8.1. Реализация системы.

8.1.1. Язык программирования

8.1.2. Характеристики системы

8.2. Эталонные машиночитаемые словари.

8.2.1. Словарь Хорнби

8.2.2. Словарь Мюллера.

8.2.3. Словарь проекта CMU.

8.3. Оценочные процедуры.

8.4. Апробация системы на словарях.

8.4.1. Быстродействие и степень адекватности.

8.4.2. Влияние дополнительной разметки

8.4.3. Выводы по результатам эксперимента

Выводы по восьмой главе.

 

Введение диссертации2005 год, автореферат по филологии, Корочков, Александр Викторович

наиболее эффективного подхода для использования в последующем компьютерном моделировании перехода; - выявление на основе введенной классификации структуры перехода, т.е. разбиение всего перехода на отдельные подэтапы; - определение последовательности моделирования; - описание формальных средств, которые могут быть достаточными для получения промежуточного формального описания, предназначенного для последующей реализации на одном из языков программирования; - описание при помощи этого формального средства каждого из выявленных подэтапов и его частичная (первичная) апробация путем анализа соответствующих примеров; - компьютерное моделирование полученного описания, т.е. его реализация на одном из языков программирования; - выбор или создание/модификация источников для апробации полученной компьютерной модели (машиночитаемых словарей соответстС4'^ вующей структуры, содержащих в словарных статьях результат эталонного транскрибирования); - построение оценочной процедуры; - апробация компьютерной модели при помощи этой процедуры и используемых источников, в частности, получение количественной оценки степени адекватности применяемых правил чтения для английского языка.Структура диссертации отражает ход исследования и соответствует последовательности решения сформулированных выше задач. Пер("^z вая глава посвящена рассмотрению возможных подходов, вторая - аналич /Л зу состояния дел в описании моделируемого объекта исследования и введению формальных средств, используемых для его описания. Главы с третьей по седьмую посвящены построению формальных моделей слогоделения, акцентуации, определения типа слога и посимвольного преобразования. Восьмая глава посвящена описанию создания компьютерной модели формализованного в предшествующих главах преобразования и ее апробации на материале машиночитаемых словарей (в частности, получению количественной оценки степени адекватности применяемых правил чтения для английского языка и влиянии на адекватность преобразования информации о частеречной и/или морфемной разметке). (*>• (^> Разработка теоретических положений и создание на их основе компьютерной модели графемно-фонемного преобразования для английского языка стало возможным благодаря комплексному использованию теоретических и экспериментальных методов исследования.Методология работы опирается на: - системный подход, позволяющий определить место предмета исследования диссертации в области обработки естественного языка; - монографический метод, предполагающий всестороннее, полное и детализированное описание исследуемого объекта, в данном случае этапа графемного-фонемного перехода; - проектный метод, определяющий целостность исследования, стадии и порядок его разработки; - абстрактно-логический метод, используемый при классификации подходов и описании исходных наборов правил; -моделирование как метод исследования структуры и основных свойств объекта моделирования; I'L - эмпирический метод, связанный с постановкой экспериментальных проверок теории (правил); - эмпирической основой работы послужили уже существующие и дополнительно созданные правила чтения.Научная новизна исследования определяется, во-первых, как постановкой самой проблемы полного формального описания этапа графемно-фонемного перехода для английского языка на основе существующих правил чтения, так и сущностью избранного подхода к ее решению. Названные выше цели и задачи исследования применительно к данному материалу ранее другими авторами не ставились. Во-вторых, впервые получена полная работающая компьютерная модель графемно-фонемного перехода (части этапа чтения графемного текста) для английского языка, основанного на традиционных правилах чтения. В-третьих, впервые получена количественная оценка степени адекватности применяемых правил чтения для английского языка, степени влияния на адекватность преобразования информации о частеречной и/или морфемной разметке и исчерпывающий список слов-исключений для этих правил, начинающихся с буквы А английского алфавита, и созданы предпосылки для получения полного исчерпывающего списка слов-исключений для этих же правил. * С'^ К результатам, выносимым на защиту, можно отнести следующие: 1. Логическая классификация возможных способов организации этапа графемно-фонемного перехода.2. Результаты сравнения возможных способов организации перехода и критерии, используемые для их получения.3. Описание структуры перехода для используемого подхода. (^ ( ^ i^L 4. Определение последовательности применения существующих правил чтения для реализации структуры перехода (алгоритмизация исходных правил чтения).5. Модифицированный вариант существующих исходных правил чтения и авторские правила.6. Формальное описание выявленных подэтапов перехода для английского языка.6.1. Формальное описание слогоделения.6.2. Формальное описание акцентуации.6.3. Формальное описание определения типа слога.6.4. Формальное описание посимвольных преобразований.7. Количественные оценки степени адекватности применяемых правил чтения для английского языка и степени влияния на адекватность преобразования информации о частеречной и/или морфемной разметке Теоретическая значимость работы. Теоретическая значимость полученных результатов состоит в том, что они могут быть использованы при построении как частных теорий графемно-фонемных переходов для других языков, так и общей теории графемно-фонемных переходов. Кроме того, полученные результаты могут послужить основой для построения типологии языков, базирующейся на степени сложности графемнофонемного перехода в языках и используемых при этом типах преобразований (правил).Практическая значимость исследования заключается в создании предпосылок для получения эффективного и компактного (для применения, например, в мобильных устройствах связи) программного и/или аппаратного лингвистического обеспечения синтеза речи, способного работать на неограниченном входном материале, что характерно для любых систем, построенных на правилах. * ' (+; ;ML. Результаты данного исследования могут быть также использованы в общих и специальных курсах языкознания и в практике обучения студентов английскому языку.Апробация работы. Основные идеи и результаты настоящего исследования обсуждались на Огаревских чтениях Мордовского государственного университета (Саранск, 2002), на международной конференции "Когнитивное моделирование в лингвистике" (Варна, 2003) и на международной конференции SPECOM' 2003 ("Речь и компьютер") (Москва, 2003). (J^ » ' (^ > С!^^

 

Заключение научной работыдиссертация на тему "Компьютерное моделирование графемно-фонемного преобразования в английском языке"

Выводы по восьмой главе

1. Завершающим этапом моделирования является построение компьютерной модели.

2. Компьютерно реализованные правила могут быть представлены достаточно компактно. Объем созданных баз данных правил-27 и 105+14 килобайт.

3. Для проведения лингвистических экспериментов (компьютерной апробации модели) необходимо наличие машиночитаемых версий обычных словарей.

4. Исходные словари могут отличаться фонемным описанием одних и тех же единиц, что может потребовать проведения их синхронизации.

5. Также необходимо наличие некоторой оценочной процедуры, выявляющей среднее время на обработку одного слова и словесную и фонемную адекватность построенной системы. Вычисление первых двух характеристик является достаточно тривиальной задачей, вычисление же последней требует решения проблемы соотнесенности сравниваемых значений фонем. Для решения этой проблемы может быть использована 82 шаговая процедура, позволяющая получить необходимый результат в достаточном приближении.

6. В результате эксперимента на основе первого неразмеченного варианта представления информации из словаря А.С. Хорнби для версии правил 1999 (без учета слов-исключений, которые не вводились в базу данных правил) была получена оценка степени их фонемной адекватности в 69 %, а словесной - в 20 %, для версии 2002 и полностью размеченной версии этого же словаря - 88% и 55% соответственно (наилучшая для словаря оценка).

7. Для неразмеченного машиночитаемого варианта словаря В.К. Мюллера наилучшая оценка фонемной адекватности составила 83%, а словесной - 39%.

8. Учет частеречной принадлежности при преобразовании позволяет повысить его словесную адекватность примерно в 1,5 раза.

9. Учет морфемного деления позволяет повысить словесную адекватность преобразования менее чем в 1,2 раза.

10.Одновременный учет и частеречной принадлежности, и морфемного деления позволяет повысить словесную адекватность преобразования почти в 2 раза.

11 .Фонемная адекватность мало зависит от использования дополнительной информации о частеречной принадлежности и/или морфемном делении.

12.Полностью размеченный вариант словаря В.К. Мюллера мог бы дать при использовании правил версии 2002 словесную адекватность в 75,2%, а фонемную - в 91,3%.

13.Стандартные списки слов-исключений не являются исчерпывающими.

14.Адекватность построенной системы преобразования может быть увеличена.

15.Является целесообразным применение при обучении чтению упорядоченных (алгоритмизированных) правил чтения.

ЗАКЛЮЧЕНИЕ

Решение общей задачи компьютерного моделирования графемно-фонемного преобразования (ГФП) является многоэтапным процессом, который необходимо начинать с выявления и последующего сравнения возможных подходов к ее решению. Исходя из типа преобразуемого объекта были выделены следующие основные способы организации исследуемого преобразования:

- словесный, или пословный, описываемый непосредственным переходом между графическим представлением слова (графическое слово) и фонемным (фонемное слово);

- морфемный, предполагающий непосредственный переход от графического морфа к фонемному;

- графемный, предполагающий посимвольное преобразование.

Для проведения сравнения подходов были предложены следующие критерии:

1. Быстродействие (у ).

2. Объем используемой памяти (£).

3. Степень охвата, или покрытия, входного графического материала (Л): з И ,

Л--, где /- множество таких элементов на входе системы преобразования, для которых она может выдать результат, a U— множество всех возможных элементов на входе системы (/с U);

4. Степень правильности, или адекватности, этого преобразования (а):

I и\ а

1*1 где R — множество таких элементов на входе системы, для которых получаемый результат преобразования является правильным и единственным (RcT).

По этим критериям основные базовые подходы: варианты пословного (П1, П2 и ПЗ), морфемный (П4), варианты графемного (П5, П6) и наиболее важные (интересные) их комбинации: пословно-графемный (П7), графемно-пословный (П8) и графемно-морфемный (П9) были расположены на следующих относительных шкалах:

Я: 0 < П4 < (П1 = ПЗ) < П2* < П9 < (П5* =П6 = П7 = П8)= 1. а : 0 < П2* < П4< П1 < (ПЗ = П5*) = 1. а: 0<? П6<П9 < (П7 = П8) ?= 1. с (у): O(Min) < П2* < П7 < ПЗ < П1 < П4 < П6 < П5 * < +оо(Мах). O(Min) < ? П9 < П8 ?< +со(Мах).

Исходя из проведенного в работе сравнения можно заключить, что компьютерное моделирование ГФП для английского языка разумно начинать с реализации графемного подхода и далее в зависимости от полученного результата решать вопрос о необходимости реализации графемно-словесного или графемно-морфемного подхода (на основе данных реализованного графемного подхода).

Графемные подходы могут быть разделены по источникам (происхождению) правил на те, которые получены вследствие применения некоторой автоматической процедуры, и те, которые построены ручным способом. Последние могут быть разделены на основании используемых в правилах лингвистических характеристик объектов на традиционные и концептуальные (теоретические, системные) - первые применяются при обучении чтению, а вторые - при построении автоматических систем синтеза речи.

Моделирование (как первых, так и вторых) правил любого происхождения имеет практическую значимость и актуальность в применении компьютерной лингвистики при построении автоматических систем синтеза речи, способных функционировать на неограниченном входном мате риале, что характерно для любых систем, построенных на правилах. Но только моделирование вторых позволяет получить новые данные, применимые и за пределами компьютерной лингвистики, например, при построении наиболее эффективной методики обучения чтению на английском языке. Кроме того, моделирование последних ранее не проводилось (что определяет новизну исследования). Поэтому представляемое исследование посвящено моделированию процесса графемно-фонемного преоб разования на основе традиционных (применяемых в нашей обучающей системе и построенных на использовании вполне определенных лингвистических характеристик) правил чтения.

Выявлено, что до использования в компьютерной модели традиционные правила должны быть подвергнуты предварительной обработке вследствие следующих причин:

- множественности источников их представления;

- наличия однотипных правил с разнообъемностью охвата (формулировок);

- наличия противоречащих друг другу правил;

- отсутствия явного деления правил на блоки (модули), решающие свои специфические задачи и, как следствие, отсутствие информации о порядке взаимодействия (последовательности работы) соответствующих блоков;

- отсутствия явно заданной последовательности применения правил;

- предназначенности для использования человеком, а не компьютерной (моделирующей) системой.

Соответственно, эта обработка должна включать следующее:

- определение источников правил для использования;

- выбор одного из неравнообъемных или представляющих альтернативу правил;

- распределение правил по блокам, ответственным за решение специфических (однотипных) задач (создание сводов исходных правил);

- задание последовательности применения (упорядочение) правил внутри блоков (<алгоритмизация правил);

- формализация правил.

Определено приоритетное использование источников специальной направленности по отношению к работам общего характера.

Выявлено, что правила преобразования для графемного подхода должны включать: объект преобразования (графема), получаемый объект (фонема или фонемы), объекты, окружающие преобразуемый объект (графем-ный контекст), супраграфемную информацию: тип слога (ударный/безударный, открытый/закрытый), тип морфемы (аффикс/корень), категорию (часть речи) слова, включающего преобразуемый объект (графему).

Все это предполагает осуществление следующих процессов: морфологический анализ, синтаксический анализ, слогоделение, акцентуация, определение типа слога, пографемное контекстно и слогово-зависимое преобразование в фонемы.

Первые два из названных являются независимыми от ГФП процессами и не являются предметом рассмотрения в данной работе.

Исходя из вышеизложенного были созданы своды (блоки) исходных правил, описывающих слогоделение, специальный морфологический анализ, акцентуацию, определение типов слогов по критериям открытости/закрытости, наличия буквы г (модификатора) в качестве правого контекста гласного элемента и собственно графемно-фонемное преобразование.

Правила в исходных множествах (сводах) были упорядочены (алгоритмизированы) с применением критериев "общее - частное правило" и "более и менее частотное (часто употребляемое) правило".

Формализация исходных правил строилась" на-основе системы правил подстановок, или переписываний, относящихся к формальному классу конечных преобразователей (трансдьюсеров), которая задается определенными входными и выходными алфавитами и конечными совокупностями правил (формул) вывода. Совокупности правил вывода задаются как упорядоченные множества. Используется два типа правил вывода: правила замены описания некоторого лингвистического объекта на другое и правила применимости либо правил замены, либо других правил применимости. Операция замены в соответствующих формулах обозначается символом "-»", а операция применимости — символом "=>".

Общая форма двухуровнего правила применимости следующая: Л~-со=>(а-'-/Зфа'-'/3 а---/3(ра-~0), где операция, обозначенная многоточием, соединяет части разрывного контекста, а алфавитные символы обозначают объекты, являющиеся операндами операций.

Каждое правило обозначается типом и номером в этом типе. Тип задает множество правил. Порядок выборки элемента из множества определяется номером правила.

Далее введенная формальная система используется для описания выделенных этапов графемно-фонемного преобразования.

Компонент слогоделения отвечает за выделение графического слога, состоящего в обязательном порядке из одного элемента категории гласных, который факультативно может быть окружен элементами, относящимися к категории согласных. Все согласные элементы, расположенные до первого слогообразующего элемента (гласного), относятся к первому слогу. Все согласные элементы, расположенные после последнего слогообразующего элемента, относятся к последнему слогу. Если между слогообразующими элементами находится одна согласная буква, то она относится к правому слогу, если больше одной, то первая из них относится к левому слогу, а остальные - к правому (кроме одного частного случая).

Процесс слогоделения проходит в следующем порядке. Входная строка, полученная в результате либо автоматического, либо смоделированного "вручную" через возможные выходные данные морфологического анализа, инициализируется, сегментируется, категоризируется и маркируется. Инициализация предполагает обрамление исходной строки объектами, задающими границы строки и начальное значение для подсистемы маркирования слогов. При категоризации, совмещенной с графемной сегментацией, каждый выделенный графемный объект (символ или их последовательность) проинициализированной строки получает атрибут (признак) принадлежности к категории гласных или согласных элементов. Маркирование заключается в присвоении каждому объекту атрибута, обозначающего номер слога.

В формальном своде правил выделено 1 правило инициализации, 48 правил сегментации-категоризации и 18 правил маркирования.

В процесс акцентуации включены следующие последовательные процессы: частеречной инициализации, выделения частей слова, подлежащих отдельному анализу, специального морфологического анализа, предварительной инициализации, собственно акцентуации и терминации. Предлагается 2 правила частеречной инициализации, 46 правил выделения частей слова, подлежащих отдельному анализу, 34 правила специального морфологического анализа, 2 правила предварительной инициализации, 41 правило собственно акцентуации (включающие 32 правила постановки первичного ударения и 9 правил постановки вторичного ударения) и 5 правил терминации.

Предложена процедура определения характеристик слогообразующего элемента (типа слога), которая включает следующие последовательные процессы: определения модифицированности (наличия буквы г справа от гласного элемента), первичной открытости/закрытости, вторичной закрытости (слогов, исходно являющихся открытыми) и степени полноты озвучивания гласного элемента. Она использует 3 правила определения модифицированности слога, 2 правила определения первичной открытости/закрытости слога, 12 правил определения вторичной закрытости слога и 31 правило определения степени полноты озвучивания гласного элемента слога.

Для описания графемно-фонемных соответствий для согласных английского алфавита в работе предложено 3 формализованных правила для буквы В, 14 правил - для буквы С, 11 правил - для буквы D, 1 правило -для буквы F, 10 правил — для буквы G, 2 правила — для буквы Н, 1 правило

- для буквы J, 3 правила - для буквы К, 9 правил - для буквы L, 2 правила

- для буквы М, 19 правил - для буквы N, 6 правил - для буквы Р, 3 правила - для буквы Q, 8 правил - для буквы R, 35 правил - для буквы S, 17 правил - для буквы Т, 1 правило — для буквы V, 6 правил - для буквы W,

15 правил — для буквы X, 3 правила - для буквы Z и 24 правила для недопущения удвоения согласных звуков. Всего предлагается 193 правил этой категории (в это число не включены правила с полным контекстом, который описывает отдельную словоформу, предназначенные для обработки слов-исключений).

Для описания процессов посимвольного преобразования гласных предложено 44 формализованных правила для буквы А, 69 правил - для буквы Е, 41 правило - для буквы I, 55 правил - для буквы О, 52 правила -для буквы U, 9 правил - для буквы Y. Таким образом, всего предлагается 270 правил этой категории (в это число также не включены правила с полным контекстом, предназначенные для обработки слов-исключений).

Всего предлагается 463 правила посимвольных преобразований (в это число не включены правила с полным контекстом, т.е. правила, описывающие исключения).

Завершающим этапом моделирования является построение компьютерной модели, т.е. перевод промежуточного формализованного представления в конечную стадию формализации, отраженную через компьютерный язык программирования.

Компьютерной реализацией описанной ранее формальной системы является система автоматического транскрибирования KorLang Transcriber. Для реализации системы транскрибирования была выбрана собственная система программирования ассоциативных сетей KorNet, позволяющая работать с динамическими объектами произвольной структуры, что и представляют собой лингвистические объекты — компоненты вышеприведенных правил.

Особенностью созданной системы транскрибирования является возможность параллельного существования компьютерных моделей (реализаций) различных версий правил преобразования. На данный момент создано 2 версии, отличающиеся источниками правил и используемыми способами реализации правил (декларативным и/или процедурным). Объем созданных баз данных правил - 27 и 105+14 килобайт.

Оценка моделей проходила на основе машиночитаемых версий двух словарей: раздел буквы "А" словаря А.С. Хорнби (1210 единиц) и адаптированный вариант седьмого издания (1961 год) англо-русского словаря В.К. Мюллера (35068 единиц). Машиночитаемая версия раздела словаря А.С. Хорнби была создана специально для проведения оценочного эксперимента.

В работе предложены оценочные процедуры, которые выявляют среднее время на обработку одного слова, словесную и фонемную адекватность системы. Вычисление первых двух характеристик является достаточно тривиальной задачей, вычисление же последней требует решения проблемы соотнесенности сравниваемых значений фонем. Для решения этой проблемы предложена 83 шаговая процедура, позволяющая получить необходимый результат в достаточном приближении.

В результате эксперимента на основе первого варианта представления информации из словаря А.С. Хорнби для версии правил 1999 (без учета слов-исключений, которые не вводились в эту базу данных правил) была получена оценка степени их фонемной адекватности в 69 %, а словесной — в 20 %, для версии 2002 наилучшие оценки - 88% и 55% соответственно.

Для словаря В.К. Мюллера наилучшая оценка фонемной адекватности составила 83%, а словесной - 39%. При работе с данными из этого словаря система не использовала информацию о частеречной принадлежности и морфемном делении преобразуемого слова.

Из апробации на основе словаря А.С. Хорнби, для которого было создано несколько машиночитаемых вариантов представления, различающихся наличием или отсутствием дополнительной частеречной и/или морфемной разметки, были получены следующие данные.

Разница между анализом с учетом частеречной принадлежности (используется в правилах специального морфологического анализа, постановки ударений, определения полноты озвучивания гласной слога и некоторых правилах посимвольных соответствий) и без него составляет в абсолютном выражении для словесной адекватности 15%, а для фонемной — 4%. Увеличение адекватности относительно неразмеченного варианта, адекватность которого может быть взята в этом случае за базовую и приравнена к 100%, составляет для словесной адекватности 53,57%, а для фонемной — 5%.

Разница между анализом с учетом морфемного деления (используется в большинстве правил) и без него составляет в абсолютном выражении для словесной адекватности 5%, а для фонемной - 2%. Увеличение адекватности относительно неразмеченного варианта, адекватность которого может быть взята за базовую и приравнена к 100%, составляет для словесной адекватности 17,85%, а для фонемной - 2,5%.

Разница между анализом на основе неразмеченного варианта словаря А.С. Хорнби и анализом на основе частеречно и морфемно размеченного варианта составляет в абсолютном выражении для словесной адекватности 26%, а для фонемной - 8%. Увеличение адекватности относительно неразмеченного варианта, адекватность которого может быть взята за базовую и приравнена к 100%, составляет для словесной адекватности 92,85%, а для фонемной - 10%.

Подключение стандартного словаря слов-исключений к анализу на основе неразмеченного варианта словаря А.С. Хорнби привело к увеличению в абсолютном выражении словесной адекватности на 1%, т.е. составила 29%, фонемная же адекватность осталась практически неизменной. Увеличение адекватности относительно неразмеченного варианта, адекватность которого может быть взята за базовую и приравнена к 100%, составило для словесной адекватности 3,57%.

Подключение стандартного словаря слов-исключений к анализу на основе полностью размеченного варианта словаря А.С. Хорнби привело к увеличению в абсолютном выражении словесной адекватности на 1%, т.е. составила 55%, фонемная же адекватность осталась также неизменной. Увеличение адекватности относительно размеченного варианта, адекватность которого может быть взята за базовую и приравнена к 100%, составило для словесной адекватности 1,85%.

Данные, полученные в результате эксперимента, позволяют сделать следующие выводы.

1. Упорядоченные (алгоритмизованные) правила чтения позволяют правильно озвучивать (читать) значительную часть входного материала, особенно с точки зрения фонемного состава результата (более 88%) адекватности). Сообразно этому можно считать вполне целесообразным их применение при обучении чтению.

2. Учет частеречной принадлежности при преобразовании позволяет повысить его словесную адекватность в 1,5 раза, что является достаточно большой величиной и косвенно говорит о соответствующей степени использования частеречной характеристики в рассматриваемых правилах и объеме подпадающих под эти правила входных данных.

3. Учет морфемного деления позволяет повысить словесную адекватность преобразования менее чем в 1,2 раза.

4. Одновременный учет и частеречной принадлежности, и морфемного деления позволяет повысить словесную адекватность преобразования почти в 2 раза, что в конечном итоге говорит о важности учета этих характеристик при преобразовании (чтении).

5. Фонемная адекватность мало зависит от использования дополнительной информации о частеречной принадлежности и/или морфемном делении, что может говорить о том, что доля в результате несоответствующих эталону фонем относительно невелика, что косвенно также подтверждается общей степенью фонемной адекватности (88%).

6. Стандартные списки слов-исключений не являются исчерпывающими.

При последующем использовании этих выводов необходимо учитывать их некоторую гипотетичность, связанную с использованием для апробации в нескольких вариантах представления только относительно небольшой части словаря А.С. Хорнби.

Также некоторой гипотетичностью будет обладать перенос полученных данных на словарь В.К. Мюллера. Эта экстраполяция могла бы дать следующие абсолютные результаты, просчитанные от базовых вариантов в 39 и 83%. Полностью размеченный вариант словаря В.К. Мюллера мог бы дать при использовании правил версии 2002 словесную адекватность в 75,2%, а фонемную - в 91,3%. Расхождение с результатами, полученными на основе машиночитаемой версии части словаря А.С. Хорнби, может объясняться различиями в фонемном описании словарного материала, что действительно было обнаружено в процессе работы с рассматриваемыми словарями.

Еще одним результатом эксперимента явился исчерпывающий для полученного свода правил список слов-исключений, который приводится в соответствующем приложении. Предварительный анализ этого списка позволяет заключить, что адекватность построенной системы преобразования может быть увеличена.

С общелингвистической точки зрения полученное формальное описание (модель) графемно-фонемного преобразования в английском языке может быть рассмотрена как теория соответствующего процесса и может послужить основой для создания подобных теорий для других языков.

Впервые полученные верифицируемые количественные данные о степени адекватности традиционных правил чтения и степени влияния на эту адекватность таких лингвистических характеристик, как информация о морфемной структуре слова и его частеречной принадлежности, могут быть использованы при оптимизации процесса обучения английскому языку.

Данные о количестве применяемых при преобразовании (чтении) правил могут быть использованы для описания сложности графемно-фонемного преобразования в различных языках при построении соответствующих типологических теорий.

 

Список научной литературыКорочков, Александр Викторович, диссертация по теме "Прикладная и математическая лингвистика"

1. Абрамкина Т.А. Обучение произношению и технике чтения на английском языке. — М.: Изд-во МГУ, 1972. — 118 с.

2. Андрианова JI.H., Багрова Н.Ю., Ершова Э.В. Английский язык для заочных технических вузов: Учебник. — М.: Высшая школа, 1988. — 415 с.

3. Балинская В.И. Графика современного английского языка. — М.: Высшая школа, 1964. 354 с.

4. Балинская В.И. Орфография современного английского языка. — М.: Высшая школа, 1967. 327 с.

5. Большой англо-русский словарь. В 2-х т. Ок. 160000 слов. / Под общ. рук. И.Р.Гальперина, Э.М. Медниковой 4-е изд., испр., с доп. - М.: Рус.яз., т. 1 - 1987 - 1037 е., т.2 - 1988 - 1071 с.

6. Гумбольт В. фон. Избранные труды по языкознанию. Пер. с нем. — М., 1984.

7. Драгунова Е. И., Краснощекова Г. И. Английская орфоэпическая система. Методическое пособие для преподавателей средней школы. — М.: Учпедгиз, 1944.

8. Зиндер J1.P. Общая фонетика. 2 изд. М., 1979.

9. Зиндер JI.P. Проблемы и методы экспериментально-фонетического анализа речи. JL, 1980.

10. Ю.Кнут Д. Искусство программирования для ЭВМ, т. 3, Сортировка и поиск. М.: Мир, 1978. - 844 с.

11. П.Корочков А.В. Система программирования KorNet // XXIV Огарев-ские чтения: Тезисы докладов научной конференции.: В 3 ч. Часть 3 Саранск: Изд-во Мордов. университета, 1995. С. 15.

12. Корочков А.В. KorNet модель данных и система программирования семантической сети для платформы Win32/PC // Методы и средства управления технологическими процессами: Сб. тр. III

13. Междунар. науч. конф. — Саранск: Изд-во Мордов. ун-та, 1999. С. 148-152.

14. Корочков А.В. Компьютерное моделирование графемно-фонемного преобразования в английском языке (постановка задачи) // Социальные и гуманитарные исследования: традиции и реальности: Межвуз. сб. науч. тр. Саранск, 2002. Вып. 2. С. 388-392.

15. Корочков А.В. Компьютерное моделирование графемно-фонемного преобразования в английском языке (выбор подхода) // Вестник Мордовского университета. 2003. № 1-2. С. 79-91.

16. Корочков А.В. Компьютерное моделирование слогоделения в английском языке // Лингвистические и экстралингвистические проблемы коммуникации: теоретические и прикладные аспекты: Межвуз. сб. науч. тр. — Саранск, 2003. С. 174-186.

17. Лингвистический энциклопедический словарь / Гл. ред. В.Н. Ярцева. — М.: Сов. энциклопедия, 1990. 685 с.

18. Матюшкина-Герке Т.И. и др. Учебник английского языка для 1 курса институтов и факультетов иностранных языков. Учебник. — М.: Высшая школа, 1974. 384 с.

19. Мкртчян И.Г. Learn to Read English Words. (Пособие по технике чтения на английском языке). М.: Международные отношения, 1977.- 192 с.

20. Мюллер В.К. Англо-русский словарь. М.: Гос. изд-во иностр. и нац. словарей, 1961.

21. Панов М.В. Современный русский язык. Фонетика. М., 1979.

22. Потапова Р.К. Речь: коммуникация, информация, кибернетика. М., 2001.

23. Реформатский А.А. Из истории отечественной фонологии. М., 1970.

24. Реформатский А.А. Фонологические этюды. М., 1975.

25. Реформатский А.А. Очерки по фонологии, морфонологии и морфологии. М, 1979.

26. Сидоров В.Н. О Московской фонологической школе // Развитие фонетики современного русского языка. М., 1971.

27. Щерба JI.B. Языковая система и речевая деятельность. JL, 1974.

28. Страуструп Б. Язык программирования Си++: Пер. с англ. — М.: Радио и связь, 1991.-352 с.

29. Узкий А.Ф. Правила чтения английских слов. (Учебное пособие). — СПб.: Химера, 2002.-112 с.

30. Цейтин Г.С. Программирование на ассоциативных сетях // ЭВМ в проектировании и производстве, вып.2, под ред. Г.В. Орловского. — JI: "Машиностроение", Ленингр. отд., 1985. С. 16-48.

31. Шаншиева С.А. Английский язык для математиков (интенсивный курс для начинающих): Учебник. М.: Изд-во МГУ, 1991. — 400 с.

32. Adamson, M.J., Damper, R.I. A recurrent network that learns to pronounce English text // Proceedings of ICSLP'96 (International Conference on Spoken Language Processing), 1996. P. 1704-1707.

33. Albano, Cavalcante, E., Moreira, A.A. Archisegment-based letter-to-phone conversion for concatenative speech synthesis in Portuguese.1.SLP, 1996.

34. Albrow, K.H. The English Writing System: notes towards a description, Longman, 1972.

35. Allen, J., Hunnicutt, M.S., Klatt, D. From text to speech the MITalk system. MIT Press, Cambridge, Massachusetts, 1987.

36. Andersen, O., Dalsgaard, P. A self-learning approach to transcription of Danish Proper Names // ICSLP'94 (International Conference on Spoken Language Processing), Sep. 1994. P. 1627-1630.

37. Andersen, O., Kuhn, R., Lazarides, A., Dalsgaard, P., Haas, J., Noth, E. Comparison of Two Tree-Structured Approaches for Grapheme-to-Phoneme Conversion // Proc. of ICSLP-96, Philadelphia, Vol. 3, 1996. P. 1700-1703.

38. Bagshaw, P.C. Phonemic transcription by analogy in text-to-speech synthesis: Novel word pronunciation and lexicon compression // Computational Linguistics, 12(2), 1998. P. 119-142.

39. Berendsen, E., Don, J. Morphology and stress in a rule-based grapheme-to-phoneme conversion system for Dutch // J. Laver, M.A. Jack (eds.), Proceedings of European Conference on Speech Technology, Edinburgh, September 1987, vol. 1. P. 239-242.

40. Bernstein, J., Pisoni, D.B. Unlimited Text-to-Speech System: Description and Evaluation of a Microprocessor-Based Device // Proceedings of The International Conference on Acoustics, Speech and Signal Processing (ICASSP-80), 1980. P. 576 579.

41. Bisani, M., Ney, H. Investigations on joint-multigram models for grapheme-to-phoneme conversion // Proceedings of the 7th International Conference on Spoken Language Processing, Denver, CO, Sep. 2002, vol. 1. P. 105-108.

42. Bisani, M., Ney, H. Multigram-based Grapheme-to-Phoneme Conversion for LVCSR.

43. Black, A. W., Lenzo, K., Pagel, V. Issues in building general letter to sound rules // Proceedings of the Third ESCA Workshop on Speech Synthesis, Jenolan Caves, Australia, 1998.

44. Bosch, A. van den, Daelemans, W. Data-oriented methods for grapheme-to-phoneme conversion // Proceedings of European Chapter of ACL, Utrecht, 1993. P. 45-53.

45. Bouma, G. A finite state and data oriented method for grapheme to phoneme conversion // 1st Conf. of the North American Chapter of the Association for Сотр. Linguistics, Seattle, WA, 2000.

46. Chomsky, N., Halle, M., The Sound Pattern of English, Harper and Row, 1968.

47. Coile, Bert Van. Inductive Learning of Grapheme-to-Phoneme rules // ICSLP (International Conference on Spoken Language Processing). 19.1.1-19.1.4, 1990.

48. Coile, Bert Van. Inductive learning of pronunciation rules with the DE-PES system // IEEE, 1991.

49. Coker, C., Church, K., and Liberman, M. Morphology and rhyming: Two powerful alternatives to letter-to-sound rules for speech synthesis //

50. Bailly, G., Benoit, C., editors, Proceedings of the First ESCA Workshop on Speech Synthesis, European Speech Communication Association, Autrans, France, 1990. P. 83—86.

51. Coleman, J. English word-stress in unification-based grammar // Computational Phonology, Edinburgh Working Papers in Cognitive Science 8, ed. T. Mark Ellison and James Scobbie, 1993. P. 97-106.

52. Cremelie, N., Martens, J-P. Generation of word pronunciation networks from automatically learned inter-word coarticulation rules // Proceedings of ProRISC/IEEE Workshop on Circuits, Systems and Signal Processing, 1996. P. 89-94.

53. Daelemans, W. GRAFON: An Object-oriented System for Automatic Grapheme to Phoneme Transliteration and Phonological Rule Testing. Memo, University ofNijmegen, 1985.

54. Daelemans, W. GRAFON: A Grapheme-to-phoneme Conversion System for Dutch // Proceedings of the Twelfth International Conference on Computational Linguistics (COLING-88), Budapest, 1988. P. 133-138.

55. Daelemans, W., Bosch, A. van den, Gillis, S., Durieux, G. A data-driven approach to stress acquisition // Proceedings of the ECML workshop on machine learning techniques for Text Analysis / Adriaans Pieter (Ed.), Vienna, 1993. P. 15-24.

56. Daelemans, W., Gillis, S., Durieux, G. The acquisition of stress: a data-oriented approach // Computational Linguistics, 20, 1994. P. 421-451.

57. Daelemans, W., Bosch, A. van den. Language-independent data-oriented grapheme-to-phoneme conversion // Progress in Speech Synthesis, J. P. van Santen, R. W. Sproat, J. P. Olive, and J. Hirschberg, Eds. New York: Springer-Verlag, 1997. P. 77-90.

58. Damper, R. I. Self-learning and connectionist approaches to text-phoneme conversion // Connectionist models of memory and language, ed. by J. Levy, D. Bairaktaris and P. Cairns, London: UCL Press, 1995.1. P. 117-144.

59. Dedina, M., Nusbaum, H. PRONOUNCE: a program for pronunciation by analogy// Computer Speech and Language, 5, 1991. P. 55—64.

60. Deshmukh, Neeraj, Weber, M., Picone, J. Automated generation of N-best pronunciations of proper nouns. ICSLP, 1996.

61. Divay, M., and Vitale, A.J. Algorithms for grapheme-phoneme translation for English and French: Applications // Computational Linguistics, 23(4), 1997. P. 495-523.

62. Dresher, B.E., Kaye, J.D. A computational learning model for metrical phonology// Cognition, 34, 1990. P. 137-195.

63. Dutoit, T. An introduction to text-to-speech synthesis. Kluwer Academic Publishers, Dordrecht Hardbound, 1997, 312 pp.

64. Elovitz, H.S., Johnson, R., McHugh, A., Shore, J.E. Letter-to-sound rules for automatic translation of English text to phonetics // IEEE ASSP-24, 1976. P.446-459.

65. Fitt, S. The pronunciation of unfamiliar native and non-native town names // Eurospeech 95, 1995. P. 2227-2230.

66. Fitt, S. The generation of regional pronunciations of English for speech synthesis // Eurospeech 97, 1997. P. 2447-2450.

67. Fosler, E., Weintraub, M., Wegmann, S., Yu-Hung Kao, Sanjeev Khu-danpur, Charles Galles, and Murat Saraclar. Automatic learning of word pronunciation from data // ICSLP '96, Philadelphia, addendum, 1996. P. 28-29.

68. Fudge, E. English Word-Stress. Allen and Unwin, London, 1984.

69. Gildea, D., Jurafsky, D. Learning bias and phonological-rule induction // Computational Linguistics, 22, 1996. P. 497-530.

70. Handbook of the International Phonetic Association, Cambridge University Press, 1999.

71. Hammond, M. Syllable parsing in English and French. ROA-58-0000,1995.

72. Hammond, M. Vowel quantity and syllabification in English // Language, 73, 1997. P. 1-17.

73. Hayes, B. Extrametricality and English stress // Linguistic Inquiry, 13, 1982. P. 227-276.ш,

74. Hayes, B. Metrical stress theory: principles and case studies. Chicago: University of Chicago Press, 1995.

75. Hochberg, J., Mniszewski, S., Calleja, Т., Papcun, A. A default hierarchy for pronouncing English // IEEE Transactions on Pattern Analysis and Machine Intelligence, 13,1991. P. 957-964.

76. Hunnicutt, S. Phonological Rules for a Text-to-Speech System // AJCL Microfiche 57, 1976.

77. Hunnicutt, S. Grapheme-to-Phoneme Rules: A Review // STL/QPSR, 2-3/1980, 1980.

78. Hunnicutt, S., Meng, H., Seneff, S. & Zue, V. Reversible Letter-to-Sound Sound-to-Letter Generation Based on Parsing Word Morphology // Eurospeech '93, Berlin, Sept. 21-23, 1993, Vol. 2. P. 763-766.

79. Jannedy, S., Mobius, B. Name pronunciation in German text-to-speech synthesis // ANLP '97, 1997. P. 49-56.

80. Jiang, Li, Hsiao-Wuen Hon and Xuedong Huang. Improvements on a trainable letter-to-sound converter// Eurospeech '97, 1997. P. 605-608.

81. Kaplan, R. & Kay, M. Regular models of phonological rule systems // f1 Computational Linguistics, 20/3, 1994. P. 331-378.

82. Karaali, О., Corrigan, G., Gerson, I. Speech Synthesis with Neural Networks // World Conference on Neural Networks, 1996.

83. Karaali, O., Corrigan, G., Gerson, I., Massey, N. Text-to-Speech Conversion with Neural Networks: A Recurrent TDNN Approach // Euro-speech '97, 1997.

84. Kessler, В., Treiman, R. Syllable structure and the distribution of phonemes in English syllables // Journal of Memory and Language, 37, 1997. P. 295-311.

85. Kienappel, A.K., Kneser, R. Designing Very Compact Decision Trees for Grapheme-to-Phoneme Transcription // Proc. Eurospeech, Aalborg, Denmark, September 2001. P. 1911-1914.

86. Byeongchang Kim, Wonil Lee, Geunbae Lee, Jong-Hyeok Lee. Unlimited vocabulary grapheme-to-phoneme conversion for Korean TTS // Proceedings of ACL-COLING 98, Montreal, 1998. P. 675-679.

87. Byeongchang Kim, Geunbae Lee, Jong-Hyeok Lee. Morpheme-based grapheme to phoneme conversion using phonetic patterns and morpho-phonemic connectivity information // ACM Transactions on Asian Language Information Processing, vol.1, iss.l, 2002. P. 65-82.

88. Klatt D.H. Review of text-to-speech conversion for English // Journal of the Acoustical Society of America, 82 (3), September 1987. P. 737-793.

89. Knight, K., Graehl, J. Machine transliteration // Proceedings of the 35th Annual Meeting of the Association for Computionational Linguistics, 1997. P. 128-135.

90. Korochkov, A.V. Computer Modeling of Grapheme to Phoneme Conversion for English // Proc. of Intern. Workshop SPECOM'2003 (Speech and Computer), Moscow, 2003. P. 155-157.

91. Ladd, D.R. English compound stress // Gibbon, D. and Richter, H., editors, Intonation, Accent and Rhythm, W. de Gruyter, Berlin, 1984. P. 253—266.

92. Lammens, J.M.G. A Lexicon-based Grapheme-to-phoneme Conversion System // European Conference on Speech Technology / Laver, J., Jack, M.A. (Eds.), Edinburgh, September, 1987. P. 281-285.

93. Lawrence, S.G.C., Kaye, G. Alignment of phonemes with their corresponding orthography // Computer Speech and Language, 1, 1986. P. 153-165.

94. Liberman, M., Church, K. Text Analysis and Word Pronunciation in Text-to-speech Synthesis // Advances in speech signal processing, ed. S. Furui and M. Sondhi. New York: Marcel Dekker, 1992.

95. Liberman, M., Prince, A. On stress and linguistic rhythm // Linguistic Inquiry, 8, 1977. P. 249—336.

96. Liberman, M., Sproat, R. The stress and structure of modified noun phrases in English // Szabolcsi, A., Sag, I., editors, Lexical Matters. CSLI, University of Chicago Press, 1992.

97. Libossek, M., Schiel, F. Syllable-based Text-to-phoneme Conversion for German.

98. Linguistic Data Consortium. 1995. COMLEX English pronouncing lexicon. Trustees of the University of Pennsylvania, version 0.2.

99. Lucas, S.M., Damper, R.I. Syntactic neural networks for bidirectional text-phonetics translation // Talking machines: theories, models and applications, ed. by G. Bailly and C. Benoit. Amsterdam: Elsevier/North-Holland, 1992. P. 127-141.

100. Luk, R.W.P., Damper, R.I. Stochastic transduction for text-to-phoneme conversion// Eurospeech 91, 1991. P. 779-782.

101. Luk, R.W.P., Damper, R.I. Inference of letter-phoneme correspondences using generalized stochastic transducers // ICSLP 93, 1993.

102. Luk, R.W.P., Damper, R.I. A novel approach to inferring letter-phoneme correspondences // ICASSP (The International Conference on Acoustics, Speech and Signal Processing), 1991.

103. Luk, R.W.P., Damper, R.I. Inference of Letter-Phoneme Correspondences by Delimiting and Dynamic Time Warping Techniques // IEEE, 1992.

104. Luk, R.W.P., Damper, R.I. Inference of letter-phoneme correspondences with predefined consonant and vowel patterns // IEEE, 1992.

105. Lukin, P., Parshin, A. Text-to-Text Transcription Tool for MS Word // Intern. Workshop "Speech and Computer" (SPECOM' 2003). Moscow, 2003. P. 151-154.

106. Meng, H.M., Seneff, S., Zue, V. Reversible letter-to-sound/sound-to-letter generation based on parsing word morphology // Speech Communication, 18, 1996. P. 47-63.

107. Mobius, В., Sproat, R., Santen, J., Olive, J. The Bell Labs German Text-to-Speech System: An Overview // Proceedings of the European Conference on Speech Communication and Technology, vol. 5, 1997. P. 2443-2446.

108. Monaghan, A. Rhythm and stress in speech synthesis // Computer Speech and Language, 4, 1990. P. 71—78.

109. Ottesen, G., Horvei, В., Stensby, S. Predicting the Pronunciationof Norwegian names by self-learning software // Proceedings of Ono-mastica Research Colloquium, Dec. 1994. P. 17-24.

110. Parfitt, S.H., Sharman, R.A. A bidirectional model of English pronunciation// Eurospeech '91, 2, 1991. P. 800-804.

111. Plaut, D. A connectionist approach to word reading and acquired dyslexia: Extension to sequential processing // Cognitive Science, 23, 1999. P. 543-568.

112. Potapova, R.K. Linguistic rules for Text-To-Speech Synthesis // Text Processing and Cognitive Technologies, 8, Intern. Conference "Cognitive Modeling in Linguistics", Proceedings, Varna, September, 2003. P. 418-432.

113. Potapova, R.K., Sannikov, V.G. Development of text-to-speech algorithms suitable for realisation by microprocessors // Intern. Workshop "Speech and Computer" (SPECOM' 2001). Moscow, 2001. P. 2583.

114. Pounder, A., Kommenda, M. Morphological Analysis for a German Text-to-speech system // COLING '86, 1986.

115. Rentzepopoulous, P.A., Kokkinakis, G.K. Efficient multilingual phoneme-to-grapheme conversion based on HMM // Computational Linguistics, 22, 1996. P. 351-376.

116. Riley M., Ljolje, A. Automatic generation of detailed pronunciation lexicons // Automatic speech and speaker recognition: advanced topics, ed. Chin-Hui Lee, Frank K. Soong, and K.K. Paliwal. Boston: Kluwer, 1996. P. 285-301.

117. Rodd, J. Recurrent neural network learning of phonological regularities in Turkish // CoNLL97: Computational Natural Language Learning, ed. Т. M. Ellison, ACL, 1997. P. 97-106.

118. Ross, J. A Reanalysis of English Word Stress (Part I) // Brame, M., (ed), Contributions to Generative Phonology, University of Texas

119. Press, Austin, Texas, 1972.

120. Sejnowski, Т., Rosenberg, C. Parallel networks that learn to pronounce English text // Complex Systems, 1, 1987. P. 145-168.

121. Sproat, R. English noun-phrase accent prediction for text-to-speech // Computer Speech and Language, 8, 1994. P. 79-94.

122. Stanfill, C.W. Memory-based reasoning applied to English pronunciation // Proceedings AAAI-87, Seattle, WA, 1987. P. 577-581.

123. Stoianov, I.P. Connectionist lexical processing

124. Stoianov, I.P., Nerbonne, J. Connectionist grapheme to phoneme-conversion: Exploring distributed representations // 'Computational Linguistics in the Netherlands, 1999', 2000.

125. Stoianov, I.P., Nerbonne, J. Exploring phonotactics with simple recurrent networks // F. van Eynde, I. Schuurman, N. Schelkens, eds,'Computational Linguistics in the Netherlands, 1998', Rodopi, Amsterdam, NL, 2000. P. 51-68.

126. Survey of the State of the Art in Human Language Technology / Ronald A. Cole, Joseph Mariani, Hans Uszkoreit Annie Zaenen Victor Zue, Eds., Cambridge: Cambridge University Press, 1995. 533 pp.

127. Torkkola, K. An efficient way to learn English grapheme-to-phoneme rules automatically // IEEE, 1993.

128. Torstensson, N. Grapheme-to-phoneme conversion, a knowledge-based approach // TMH-QPSR Vol. 44 Fonetik, 2002.

129. Trager, G.L., Bloch, B. The syllabic phonemes of English // Language, 17, 1941. P. 223-246.

130. Urbanczyk, S.C., Eady, SJ. Assignment of syllable stress in a de-misyllable-based text-to-speech synthesis system// IEEE, 1989.

131. Venezky R.L. The Structure of English Orthography, Mouton, 1970.

132. Venezky R.L. The American Way of Spelling, Guilford, New York, 1999.

133. Vitale, T. An algorithm for high accuracy name pronunciation by parametric speech synthesizer// Computational Linguistics, 17, 1991. P. 257-276.

134. Weide, R.L. The Carnegie Mellon Pronouncing Dictionary. cmudict.0.4, 1995.

135. Wightman, C.W., Talkin, D.T. The Aligner: text-to-speech alignment using Markov models // Progress in speech synthesis, ed. Jan P.H. van Santen, Richard W. Sproat, Joseph P. Olive, and Julia Hirschberg. New York: Springer, 1997. P. 314-323.

136. Wothke, K. Automatic phonetic transcription taking into account the morphological structure of words // Technical Report, IBM Germany, Scientific Center, Heidelberg, 1991.

137. Yarowsky, D. Homograph disambiguation in text-to-speech synthesis // Progress in speech synthesis, ed. Jan P.H. van Santen, Richard W. Sproat, Joseph P. Olive, and Julia Hirschberg. New York: Springer, 1997. P. 157-172.

138. Yvon, F. Grapheme-to-phoneme conversion using multiple unbounded overlapping chunks // Proceedings of NeMLaP '96 (International Conference on New Methods in Language Processing), 1996.

139. Zemerli, Z., Obrecht, R.A., Henni, A., Sellami, M. Aravoice: An Arabic Text-To-Speech System // Intern. Workshop "Speech and Computer" (SPECOM' 2003). Moscow, 2003. P. 170-177.