Фонетическая база данных как основа лингвистических исследований

Шерстинова, Татьяна Юрьевна

автореферат диссертации по филологии, специальность ВАК РФ 10.02.21
диссертация на тему: Фонетическая база данных как основа лингвистических исследований

Год: 1995
Автор научной работы: Шерстинова, Татьяна Юрьевна
Ученая cтепень: кандидата филологических наук
Место защиты диссертации: Санкт-Петербург
Код cпециальности ВАК: 10.02.21

Автореферат по филологии на тему 'Фонетическая база данных как основа лингвистических исследований'

Полный текст автореферата диссертации по теме "Фонетическая база данных как основа лингвистических исследований"

САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

Р Г Б ОД

На правах рукописи

1.П сип С Д

ШЕРСТИНОВА Татьяна Юрьевна

ФОНЕТИЧЕСКАЯ БАЗА ДАННЫХ КАК ОСНОВА ЛИНГВИСТИЧЕСКИХ ИССЛЕДОВАНИЙ (Опыт построения и использования)

СПЕЦИАЛЬНОСТЬ 10.02.21 - СТРУКТУРНАЯ, ПРИКЛАДНАЯ И МАТЕМАТИЧЕСКАЯ ЛИНГВИСТИКА

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата филологических наук

САНКТ-ПЕТЕРБУРГ 1995

Диссертация выполнена на кафедре фонетики и методики преподавания иностранных языков Санкт-Петербургского университета.

Научный руководитель:

Официальные оппоненты:

доктор филологических наук, профессор Л.В.Бондарко

доктор филологических наук, профессор Г.Я.Мартыкенко кандидат филологических наук, А.С.Асиновский

Ведущее учреждение - Российский государственный педадогический университет им.А.И.Герцена.

Защита состоится « %/Ъ » (р&Ьрй-А Я 1996 года в часов на

заседании диссертационного совета К 063.57.52 по защите диссертации на соискание ученой степени кандидата филологических наук в Санкт-Петербургском государственном университете по адресу: 199034, Санкт-Петербург, В-034, Университетская наб., д.11, филологический факультет.

С диссертацией можно ознакомиться в Научной библиотеке имени А.М.Горького Санкт-Петербургского государственного университета (199034, Санкт-Петербург, В-034, Университетская наб., д.7/9).

Автореферат разослан «_ ¡.С 1996г.

Ученый секретарь ^____

диссертационного совета ¿^Т^Г. /

доктор филологических наук О.И.Бродович

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Использование электронно-вычислительной техники становится в последние годы необходимым условием для реализации большинства широкомасштабных исследовательских проектов. Поскольку в основе практически всех научных программ лежит сбор и обработка данных об изучаемом объекте реального мира, успешность и эффективность проведения исследовательского анализа в большой степени зависят от того, каким образом эти данные представлены и организованы. В настоящее время оптимальным способом компьютеризированного представления информации является ее организация в виде баз данных.

Разрабатываемая на кафедре фонетики СПбГУ исследовательская программа "Фонетический фонд русского языка" ставит своей задачей максимально полное описание фонетического аспекта современного русского языка. В комплексе работ по Фонетическому фонду особо важное место занимают подбор материала, составляющего содержание фонда, и исследования, направленные на выяснение основных фонетических характеристик представленной речевой информации, а также разработка методических средств, обеспечивающих проведение таких исследований. Накопленный Фонетическим фондом блок звуковой информации на настоящий момент уже достаточно представителен и содержит тысячи файлов оцифрованных слогов, слов, фраз, текстов и их отдельных сегментов в произнесении разных дикторов. На каждую сегментную единицу (как правило, открытый слог) составляется описание, которое включает в себя, в частности: "идеальную" фонематическую и фонетическую транскрипцию, параметры ввода и атрибуты сигнала, сведения о длительности сегментов, значения и характер движения формант, спектрограммы, осциллограммы, комментарий исследователя и т.д. Роль аккумулятора описаний всех параметров звуковых сегментов и основы для лингвистических исследований в программе Фонетического фонда отводится фонетической базе данных, разработка которой является одним из ключевых моментов реализации программы Фонда.

Актуальность работы. В последние годы выявляется общая тенденция в проведении фонетических исследований во всем мире, выражающаяся в создании во многих странах фонетических баз данных для национальных и других языков. Поэтому актуальность диссертации определяется в первую очередь отсутствием в настоящее время других фонетических баз данных, имеющих своей целью поддержку теоретических и экспериментальных исследований в области русской фонетики, и необходимостью создания базы данных для Фонетического фонда русского языка.

Цель работы состоит в создании экспериментального образца фонетической базы данных для лингвистических исследований и ее апробации.

Задачами работы являются:

1. Разработка структуры организации имеющегося фонетического материала в виде компьютерной базы данных для лингвистических исследований.

2. Создание базы и ввод в ЭВМ данных о реализации двух тысяч гласных, характеризующих произнесение фонетически представительного текста (ФПТ) двумя дикторами-носителями санкт-петербургской произносительной нормы.

3. Описание представительности базы по фонемной принадлежности гласных, их реальной транскрипции, минимальному контексту реализации.

4. Апробация базы: создание прикладных программ обработки материала, осуществление автоматической обработки данных и проведение анализа некоторых фонетических характеристик гласных базы (фонематической принадлежности, реальной транскрипции и длительности).

Научная новизна диссертации состоит в том, что впервые для русского языка создана фонетическая база данных, содержащая не только собственно звуковые сигналы, но и их фонетическое и пользовательское описание. Принципиально новым является введение в базу такого параметра описания гласных, как реальная транскрипция. Специально разработанные средства автоматической обработки данных

позволили проводить исследование реализации гласных одновременно по нескольким параметрам. Предложена методика сравнения речи дикторов с точки зрения вариативности ее фонетических характеристик, получен объемный статистический материал, описывающий разные аспекты реализации гласных.

Практическая ценность работы заключается в создании базы данных для Фонетического фонда русского языка, предназначенной для проведения теоретических исследований по русской фонетике и решения целого ряда прикладных задач: как например, поддержки систем автоматического распознавания и синтеза речи, разработки средств для усовершенствования существующих транскрипторов, компьютерных обучающих программ для студентов-филологов, в том числе и для изучающих русский язык иностранных студентов и т.д. В результате автоматической обработки базы был получен обширный материал, позволяющий комплексно исследовать реализацию гласных в речи в зависимости от ряда факторов, произведен его начальный анализ, а также продемонстрированы некоторые новые возможности лингвистических исследований, появляющиеся в результате компьютерного представления изучаемого материала в виде базы данных.

Апробация работы. Основные положения диссертации обсуждались па заведаниях кафедры фонетики и методики преподавания иностранных языков СПбГУ и на собраниях, посвященных созданию Фонетического фонда русского языка.

Структура и объем работы. Диссертация состоит из введения, пяти глав, заключения, списка использованной литературы и трех приложений. Основная часть работы содержит 184 страницы. В качестве иллюстраций приводятся 41 таблица и 18 рисунков. Список литературы включает 174 наименования. Приложения насчитывают 99 страниц, в состав которых входит, в частности, 31 таблица.

СОДЕРЖАНИЕ РАБОТЫ

Во введении определяется цель и задачи работы, обосновывается актуальность избранной темы диссертации, а именно - необходимость создания и использования баз данных в лингвистических и фонетических исследованиях, и в частности - для реализации программы Фонетического фонда русского языка. Кратко излагается общая концепция Фонетического фонда, перечисляются его основные компоненты.

Первая глава "Базы данных как основа научных исследований" состоит из трех разделов. В первом разделе "Базы данных как накопитель информации. Виды баз данных" дается определение компьютерной базы данных как совокупности взаимосвязанных, определенным образом структурированных и хранящихся вместе данных, которые можно обрабатывать различными алгоритмическими программами, дополнять, модифицировать и обновлять с помощью специальных средств управления базой данных (СУБД). Кратко излагается предыстория баз данных, обосновывается их преимущество по сравнению с используемыми ранее информационными системами, имеющими файловую организацию данных. Приводится общая характеристика трех основных типов баз данных, различающихся по способу установления связей между элементами представленной информации: реляционных, иерархических и сетевых.

Во втором разделе "Базы данных как основа для лингвистических исследований" констатируется, что компьютерное представление информации в виде баз данных в настоящее время широко используется в самых разных областях языкознания и прикладной лингвистики. Приводятся примеры разнообразных лингвистических баз данных, разрабатываемых в России, Европе и США.

В третьем разделе "Фонетические базы данных" отмечается, что фонетика первой из всех лингвистических наук стала использовать преимущества представления исследуемого материала в виде базы данных. Объясняется это в первую очень тем, что анализ речевых

сигналов обычно связан с обработкой очень больших объемов исходного материала, автоматизация которой существенно повышает эффективность работы фонетиста. Дается краткий обзор имеющихся фонетических баз данных (для европейских языков), которые очень разнообразны по назначению и отличаются друг от друга не только в плане самого речевого материала, подлежащего занесению в базу данных, но и способов его структурной организации и описания. Отмечается, что характерной особенностью всех реализованных ранее фонетических баз данных для русского языка является ориентация на поддержку разработок в области речевой технологии (систем автоматического распознавания и синтеза речи). В то же время назначением создаваемой базы данных для Фонетического фонда русского языка должно стать не только решение частных прикладных задач, но и обеспечение широкомасштабных исследований по русской фонетике. Приводится список возможных параметров описания звуковых сегментов, которые планируется ввести в базу данных в будущем.

Вторая глава "Фонетическая база данных FON2", посвященная описанию разработанной базы данных, состоит из шести разделов. В первом разделе главы "Описание материала, составляющего содержание базы данных FON2" отмечается, что основное содержание базы составляет фонетически существенная информация о реализации 2000 гласных в звуковых версиях фонетически представительного текста (ФПТ, являющегося составной частью звукового блока Фонетического фонда русского языка) в произнесении двух дикторов-носителей санкт-петербургской произносительной нормы (мужской и женский голос).

Дикторы читали текст (с которым они были предварительно ознакомлены) в звукоизолированной камере. Затем звуковые версии текста были оцифрованы и отсегментированы на открытые слоги и конечные согласные элементы. На каждую сегментную единицу (слог) было составлено описание, включающее его фонематическую и фонетическую транскрипцию, параметры ввода и атрибуты сигнала, сведения о длительности сегментов, комментарии исследователя; были получены рассчитанные методом БФП сонаграммы и осциллограммы.

Кроме того, в результате слухового и акустического анализа гласных как изолированно от контекста, так и в составе слога, аудитором-экспертом была определена их "реальная" транскрипция. Полученная информация о реализации гласных стала основным материалом, заложенным в базу данных FON2.

В следующих двух разделах излагаются основные принципы разработки базы данных, аргументируется выбор среды программирования FoxPro в качестве основы для построения базы.

Четвертый раздел содержит общие характеристики базы данных и информацию о ее структуре. Собственно база данных содержится в файле fon2.dbf, объемом памяти в 117 Кбайт. Необходимым условием любых манипуляций с базой (просмотра, обработки, изменения информации и т.д.) является ее запуск в системной среде СУБД FoxPro.

FON2 - это реляционная база данных, все содержание которой представлено в виде таблицы, строки которой - это записи базы, а столбцы - поля записей. При этом отдельная запись характеризует звуковые реализации (двумя дикторами) определенной гласной фонемы ФПТ, а поля записей - параметры описания реализаций гласных аллофонов и пользовательская информация.

База данных FON2, как и любая автоматизированная система информации, модифицируется во времени. На момент написания данной работы общее число записей в базе насчитывает 968 единиц, а число параметров описания -17.

Параметры описания можно условно разделить на 2 типа: собственно-фонетические и пользовательские. Первые характеризуют гласные с точки зрения существенных фонетическо-фонологических признаков (фонематической принадлежности, минимального контекста, реальной транскрипции, положения по отношению к ударению, длительности и др.), а вторые представляют собой информацию, обеспечивающую быстрый и удобный доступ к соответствующим файлам в Фонетическом фонде (имя файла, номер страницы каталога) и параллельные ссылки между записями в тех случаях, когда наблюдается различие в фонематическом прочтении текста дикторами.

Па настоящий момент информация в БД представлена по следующим параметрам (полям):

Recn порядковый номер записи в БД;

Phon фонематическая принадлежность гласног о;

W минимальный контекст (слово, часть синтагмы) в

фонематической транскрипции;

Conl минимальный контекст (фонема) слева;

Сопг минимальный контекст (фонема) справа;

RT реальная транскрипция гласного в произнесении

диктора I (ЩЛП);

RT2 реальная транскрипция гласного в произнесении диктора 2 (ТВИ);

Str положение гласного по отношению к ударению;

D2 абсолютная длительность гласного в произнесении

диктора 2;

CVC палатализация непосредственно соседствующих согласных;

Sigl имя файла с оцифрованной записью сигнала (для диктора 1);

Sig2 имя файла с оцифрованной записью сигнала (для диктора 2);

Ncat2 номер страницы каталога для диктора 2;

Notes фразовая/синтагматическая позиция гласного в тексте, а также особенности реализации гласного диктором 1 ;

Notes2 особенности реализации гласного диктором 2;

Listl порядковый номер гласного по тексту;

Memo поле для записи комментариев исследователя.

В следующих разделах "Фонетически существенные параметры описания" и "Пользовательский аспект" излагаются принципы представления всех параметров описания гласных в машинно-читаемом виде. Рассматриваются специально разработанные правила перевода стандартной транскрипционной записи в линейную цепочку символов

алфавита ASCII, переобозначения ударности/безударности гласного к его синтагматической позиции в двузначный численный код.

В третьей главе "Некоторые результаты компьютерной обработки базы данных" приводятся результаты автоматической обработки базы, выполненной средствами внутреннего командного языка СУБД FoxPro. Здесь уточняются некоторые характеристики исследуемого речевого материала (представительного текста): рассматривается частотность гласных фонем в озвученном тексте (раздел 3.1.1), их распределение на ударные и безударные аллофоны (раздел 3.1.2); проводится сравнение этих данных с полученными ранее "идеальными" характеристиками ФПТ, подсчитанными по его орфографической записи. Такая информация о представительности базы данных необходима для планирования исследовательских экспериментов и кроме того позволяет оценивать объективность полученных на этом материале результатов лингвистического анализа.

Хорошо известно, что непосредственный контекст является одним из основных факторов, определяющих реализацию гласных. Поэтому при разработке концепции фонетической базы FON2, а затем и задании алгоритмов ее автоматической обработки, этому параметру придавалось особое значение. В разделе "Непосредственный контекст гласных" приводятся сравнительные данные о частоте встречаемости в ФПТ позиций гласных с точки зрения их двустороннего непосредственного контекста. Далее в подразделе "Согласные в позиции непосредственного контекста гласных" рассматривается корреляция фонематической принадлежности согласных и частоты их встречаемости в роли непосредственного контекста. Для каждой согласной фонемы была подсчитана и проранжирована алгебраическая разность абсолютных частот встречаемости их аллофонов непосредственно слева и справа от гласных. Приводятся данные об абсолютной и относительной частоте встречаемости в позиции непосредственного контекста разных групп согласных. В следующем разделе "Представительность структур непосредственного контекста" приводится частота встречаемости в базе всех возможных 13 типов структур контекста. Наиболее частотными, как и следовало ожидать,

оказались такие позиции гласных, для которых и правый и левый контекст - согласные: в контексте CVC находятся 36% гласных, С VC' -16%, C'VC - 19% и CVC' - 11% (где V - анализируемый гласный, С -твердый согласный, С' - мягкий согласный). Для всех гласных фонем базы (ударных и безударных) составлены таблицы представительности контекстных структур этих четырех типов с ссылкой на соответствующие записи базы данных (см. Приложение III). И наконец, в последнем разделе данной главы "Гласные в соседстве с гласными" рассматриваются те случаи, когда из сочетаний двух или трех гласных (обычно сложных для сегментирования) по крайней мере один удалось отсегментировать и проанализировать.

Четвертая глава "Реальная транскрипция гласных базы данных" включает в себя восемь разделов; весь представленный здесь материал был получен в результате автоматической обработки базы как внутренними средствами командного языка СУБД FoxPro, так и с помощью специально разработанных пользовательских прикладных программ. В вводной части дается ссылка на первый раздел второй главы диссертации, в котором рассматривалась методика транскрибирования гласных базы данных. Отмечается, что несмотря на относительно субъективный характер полученной транскрипции, мы будем условно называть ее "реальной", как отражающую особенности реальной речи, и в противопоставлении с "идеальной". Всего в базе данных представлена реальная транскрипция 1884 гласных звуков и нечленимых сочетаний с гласными (946 единиц для диктора 1 и 938 - для диктора 2).

В первом разделе "Базовые аллофоны гласных" вводится понятие базового аллофона как определенного фонетического типа (звукотипа) гласных, реальная транскрипция которых совпадает по крайней мере в основном символе. Поскольку при транскрибировании гласных в качестве основных символов были использованы знаки, представленные на рисунке 1, то число возможных базовых аллофонов определяется их количеством и равняется 21.

У 1 ы ш и

У 1 X- ъ и

0 е о

ое £ 3 Л 0

ае

а а

Рисунок 1. Транскрипционные символы базы данных в координатах

артикуляторного треугольника.

Все аллофоны гласных, транскрипционная запись которых в главном символе совпадает, мы будем называть реализациями одного базового аллофона. Эти реализации могут быть двух типов: неназализованные и назализованные (например, [ ы ] и [ ы ]). Если реальная транскрипция гласного содержит дополнительные диакритические пометки ( например, [ *эе ]), будем считать, что базовый аллофон реализован в модифицированном варианте, а сами диакритики будем условно называть "огласовками".

Во втором разделе "Аллофонная представительность базы данных" приводится информация об абсолютной и относительной частоте встречаемости реализаций всех базовых аллофонов. Значительная часть реализаций гласных в базе данных (73%) приходится на недифтонгоидные однозначно определенные неназализованные с огласовками и без них. Констатируется, что несмотря на то, что наиболее частотной фонемой ФПТ является / а /, и около 39% всех гласных текста теоретически представляют собой аллофоны именно этой фонемы, в звуковых реализациях ФПГ очевидно количественное преобладание гласных переднего ряда, верхнего и среднего подъема и [ ы ] (суммарный процент реализаций только четырех наиболее частотных базовых аллофонов [ 1 ], [ е ], [ ы ] и [ X ] составляет 50.4% от общего количества гласных, что уже на 10% превышает количество аллофонов, теоретически относимых к фонемам / 1 /,/ е / и / ы /; гласные же [ а ] и [ а ] показывают намного более скромный процент реализаций - лишь 14.3%.

В третьем разделе "Частотность структур реальной транскрипции" рассматривается четыре возможных структуры транскрипции однозначно определенных недифтонгоидных гласных:

1. базовый аллофон без огласовок (неназализованный или назализованный) (например, [ л ] или [ Л ]);

2. начальная огласовка + базовый аллофон ([ °л ] или [ 'Л ]);

3. базовый аллофон + конечная огласовка ([ л» ] или [ л° ]);

4. базовый аллофон с начальной и конечной огласовками([°Л'] или[ 'л0]).

Приводится информация о распределении представленной в базе данных реальной транскрипции гласных по указанным типам структур для каждого базового аллофона с учетом наличия или отсутствия назализованности.

В четвертом разделе "Огласовки базовых аллофонов" анализируются диакритические пометки в транскрипции гласных, которые передают модификации, наблюдаемые при реализации базовых аллофонов.

В пятом разделе "Дифтонги как реальная транскрипция" перечисляются дифтонги, использованные при транскрибировании гласных ФПТ, с указанием частоты их встречаемости.

В следующем разделе "Прочие особенности реальной транскрипции" приводятся наблюдаемые у некоторых гласных особенности реализации, не предусмотренные стандартной записью транскрипции (например, "хриплый", "слабый", "глухой").

Седьмой раздел посвящен сравнительному рассмотрению речи дикторов в плане частоты употребления аллофонов гласных. Для того, чтобы выявить наиболее яркие отличия в речи дикторов по данному параметру была произведена следующая операция: для всех базовых аллофонов гласных было отдельно подсчитано суммарное количество их реализаций в произнесении текста диктором 1 и тоже самое -диктором 2, после чего была определена алгебраическая разность А этих значений. Сравнение модулей полученных значений разности А с установленными пороговыми позволяет выявить наиболее

"характерные" аллофоны, определяющие речь первого и второго дикторов на материале прочтения текста. Так, диктором 1 (женский голос) в отличие от диктора 2 (мужской голос) значительно чаше употреблялись аллофоны [ 1 ], [ ± ] и [ и ] (заметим, что все они верхнего подъема). Аллофон [ и ] встретился в речи первого диктора в 2 раза чаще, чем в речи второго, а [ ± ] - более чем в 5 раз. Для второго диктора самыми "характерными" по сравнению с диктором 1 являются следующие 5 гласных: [ 1], [ о ], [ а ], [ ы ] и [ э ].

Далее сопоставляются ранги частотности базовых аллофонов в речи обоих дикторов. Делается вывод, что для большинства аллофонов они близки по значению или совпадают. Самое существенное отличие в ранге наблюдается для гласного [ ± ], ранг которого в речи диктора 2 на 9 единиц выше ранга в речи диктора 1.

Была получена информация о частоте употребления каждым диктором в речи рассматриваемых базовых аллофонов с учетом того, насколько часто гласный реализовывался в неназализованном/ назализованном вариантах, с огласовками или без них, как элемент более сложных дифтонгоидных звуков, а его транскрипционное обозначение использовалось при определении фонетически неясных гласных.

В восьмом разделе "Соотношение фонем и реальной транскрипции" еще раз подчеркивается высокая вариативность реализаций гласных фонем в анализируемом озвученном тексте, отмеченная ранее в работах Л.В.Бондарко и В.И.Кузнецова. Автоматическая обработка данных о реальной транскрипции позволила получить конкретный числовой материал, характеризующий реализацию каждой из 6-ти гласных фонем. На его основе осуществлен анализ "от базового аллофона - к фонеме" и обратно - "от фонемы - к аллофонам". Приводятся гистограммы аллофонных реализаций для каждой фонемы в отдельности (на рисунке 2 см. гистограмму реализации фонемы / а /).

а_£.0—Ы-_3-_;е е ^ 0 ое о у лиф н/о

Рисунок 2. Реализация фонемы / а / на материале базы данных в процентах.

Обозначения: а ... У - основной символ реальной транскрипции;

"диф" - дифтонгоидная реализация фонемы; "н/о" - фонетически неясная реализация (реальная транскрипция не определена).

В пятой главе "Исследование длительности гласных" рассматривается опыт проведения лингвистического исследования с использованием возможностей автоматической обработки данных: предлагается анализ на нашем материале конкретной фонетической характеристики - длительности гласных. Длительность является одним из важнейших факторов, определяющих фонетическое качество звуков речи, а также организующих просодическую структуру последней. Изучение временной структуры речи имеет большое значение для решения многих практических задач, и в первую очередь - для создания систем автоматического синтеза речи. Материалом для исследования длительности в нашем случае послужили данные о реализации гласных в прочтении текста диктором II (мужской голос). Абсолютная длительность (в миллисекундах) была с высокой точностью определена по отсегментированным компьютерным спектрограммам для 937 гласных.

В первом разделе главы анализируется зависимость длительности гласного от: 1) его фонемной принадлежности; 2) положения по отношению к ударению; 3) одновременно от этих двух параметров. Средняя длительность гласных по тексту, автоматически подсчитанная средствами СУБД, равняется 77мс. Средняя длительность ударных аллофонов, общее количество которых составляет 359 (38,3%), равна 102мс, а 578-ти безударных (61.7%) - 61мс. Среди ударных гласных наибольшей длительностью характеризуются аллофоны / а /, а из

безударных -lui. Самые краткие ударные - / ы / и / и /, а безударные -/ ы / и / i /. Среднее значение длительности гласных, находящихся в позиции синтагматического ударения оказалось примерно на 20мс больше среднего значения всех ударных гласных и более чем на ЗОмс -среднего значения немаркированных ударных гласных. Из безударных самой высокой длительностью характеризуются гласные последнего слога заударных окончаний синтагм. Среднее значение длительности неконечного заударного... оказалось практически равным средней длительности гласных первого предударного слога. Это позволяет утверждать, что в потоке речи нет существенной разницы между предударными и заударными слогами слов (разумеется, кроме конечных заударных в синтагме или фразе). Поэтому с начала фразы (синтагмы) до ее последнего ударного слога поток речи можно считать состоящим из ударных и предударных (первых, вторых, третьих) слогов.

Во втором разделе "Длительность конкретных аллофонов гласных" проводится сопоставительный анализ двух параметров реализации гласных: "реальной " транскрипции и продолжительности звучания, с целью выявления их возможной корреляции. Безотносительно к ударности/безударности гласных наиболее долгими оказались аллофоны [ ге ] и [ о ], а также [ а ], [ и ] и [ а ], т.е. наиболее открытые гласные (нижнего подъема) и основные аллофоны огубленных фонем заднего ряда / о / и I и /. Гласные переднего ряда [ е ], [ i ], [ е ], [ œ ], [ 0 ] и [ ы ] имеют средние ранги длительности, а наиболее краткими являются огубленные аллофоны переднего ряда [ у ] и [ y ] и традиционно именуемые "неопределенными" гласные [ э ] и [ ъ ].

Основная группа недифтонгоидных гласных аллофонов с однозначно определенной транскрипцией состоит из 657 неназализованных и 154 назализованных. Автоматическое усреднение длительности по всем неназализованным аллофонам дало среднее значение, равное 75мс; для 249-ти ударных оно равняется 101мс, а для 408-ми безударных - 59мс.

В следующих разделах "Длительность назализованных аллофонов гласных" и "Длительность неназализованных аллофонов в зависимости от их положения по отношению ' к ударению"

рассматриваются данные о средней продолжительности звучания назализованных и неназализованных реализаций всех базовых аллофонов независимо от ударности, а для неназализованкых - и в сопоставлении с 12-ю наиболее частотными синтагматическими позициями с учетом ударности/безударности гласных.

Последние два раздела главы "Длительность гласных в зависимости от длины фразы" и "Динамика длительности гласных внутри фраз" имеют не столько содержательный, сколько иллюстративный характер, показывая, какие существуют еще возможности исследования длительности гласных на представленном материале.

В заключении излагаются основные положения работы, а также возможные перспективы дальнейшего развития и использования базы данных FON2 и прикладных программ обработки. В качестве приложений к работе представлены:

• Документальная форма фонетической базы данных FON2 (сокращенный пользовательский вариант) (Приложение 1).

• Фонетический представительный текст (ФПТ) с нумерацией записей в базе данных FON 2 (Приложение 2).

• Таблицы представительности ФПТ по контексту гласных (Приложение 3).

Основные положения диссертации отражены в следующих публикациях:

1. Шерстинова Т.Ю. Фонетическая база данных FON2: назначение и структура И БФФ РЯ - Bochum-СПб. - 1994, ноябрь, N% 5 - с.146-166.

2. Жежель Т.Ю. Фонетическая характеристика заударных гласных, обозначаемых буквой "я" ("а"), после мягких согласных в абсолютном конце слова в тексте // БФФ РЯ - Bochum-СПб. - 1989, февраль, N% 2 -с.105-110.

автореферат диссертации по филологии, специальность ВАК РФ 10.02.21 диссертация на тему: Фонетическая база данных как основа лингвистических исследований

Полный текст автореферата диссертации по теме "Фонетическая база данных как основа лингвистических исследований"

Похожие темы диссертаций

автореферат диссертации по филологии, специальность ВАК РФ 10.02.21
диссертация на тему: Фонетическая база данных как основа лингвистических исследований