автореферат диссертации по филологии, специальность ВАК РФ 10.02.02
диссертация на тему: Ритмо-темпоральные характеристики татарского языка в плане автоматического синтеза речи
Полный текст автореферата диссертации по теме "Ритмо-темпоральные характеристики татарского языка в плане автоматического синтеза речи"
На правах рукописи
004601901
Сайхунов Мансур Равхатович
РИТМО-ТЕМПОРАЛЬНЫЕ ХАРАКТЕРИСТИКИ ТАТАРСКОГО ЯЗЫКА В ПЛАНЕ АВТОМАТИЧЕСКОГО СИНТЕЗА РЕЧИ
10 02.02 —Языки народов Российской Федерации (татарский язык)
АВТОРЕФЕРАТ
диссертации на соискание ученой степени кандидата филологических наук
1 3 МАЙ 2010
Казань-2010
004601901
Работа выполнена на кафедре современного татарского языка и в лаборатории экспериментальной фонетики филологического факультета ГОУ ВПО «Казанский государственный университет им В И Ульянова-Ленина»
Научный руководитель:
доктор филологических наук, профессор Хисамова Фагима Миргалиевна
Научный консультант:
кандидат филологических наук, доцент Ибрагимов Тавзих Ибрагимович
Официальные оппоненты:
доктор филологических наук, профессор Хакимзянов Фярид Сабирзянович
кандидат филологических наук, доцент Сунгатов Гафур Масгутович
Ведущая организация:
ФГОУ ВПО «Чувашский государственный университет им И Н Ульянова»
Защита диссертации состоится «20» мая 2010 г в 14 00 часов на заседании диссертационного совета Д 212 081 12 по защите диссертаций на соискание ученой степени доктора филологических наук при ГОУ ВПО «Казанский государственный университет им В И. Ульянова-Ленина» по адресу 420008, г. Казань, ул Кремлевская, 35 (корпус № 2), ауд. 1113
С диссертацией можно ознакомиться в Научной библиотеке им Н И. Лобачевского Казанского государственного университета им В И Ульянова-Ленина
Электронная версия автореферата размещена на официальном сайте
Казанского государственного университета им В И. Ульянова-Ленина http //www ksu ru
Автореферат разослан « апреля 2010 г
Ученый секретарь
диссертационного совета,
доктор филологических наук, доцент
Юсупова А.Ш
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Развитие вычислительной техники, появление быстродействующих, обладающих практически неограниченной памятью компьютеров сделало возможной постановку и решение проблемы общения человека с машиной на естественном языке За последние 50-60 лет созданы системы распознавания и синтеза речи, а также множество различных устройств с речевым управлением Исследования по созданию интерфейсных систем «человек-машина» не ограничиваются разработкой технологий и технических устройств Лингвистическое обеспечение подобных систем имеет непосредственное отношение к речевой деятельности человека вообще и процессам восприятия и порождения речи в частности
Разрабатываемый синтезатор татарской речи относится к типу «текст -речь» и предназначен для преобразования произвольного орфографического текста в устную форму языка Основным блоком данного типа синтезаторов является автоматический транскрибиратор, назначение которого -представление буквенной записи в виде речевых единиц
Опыты по синтезу татарской речи показали, что возможность построения автоматического транскриптора для татарского языка сопряжена со значительными трудностями Современная орфография татарского языка представляет механическое объединение трех языковых систем - татарского, русского и арабского Транскрипция орфографического текста усложняется следующими двумя обстоятельствами: 1) наличием в татарском языке огромного количества разночитаемых словоформ и 2) отсутствием в языке акустико-артикуляционной базы, способной обеспечить требования орфоэпий татарского и русского языков
Первая задача осложняется существующим в орфографии правилом, согласно которому грамматические формы заимствованных основ формируются путем присоединения к концу слова аффиксов татарского языка Нередко для того, чтобы выяснить, какая часть словоформы является русским заимствованием, а какая - представляет сочетание аффиксов татарского языка, требуется произвести морфологический анализ словоформы Но для выполнения морфологического анализа необходимо установить наличие в словоформе русской основы (аркада, таксагыз, тарасын) Получается порочный круг.
Что касается второй задачи - наличия необходимой акустико-артикуляционной базы, то такового нет и быть не может. Включение в фонетическую систему татарского языка трех гласных и пяти согласных русского языка явно недостаточно для произнесения более 40% заимствованной лексики по-русски. Для татарского языка не характерны ни йотированные согласные, ни мягкие [ль], [иь], ни широкое произношение гласных, ни словесное ударение, необходимое для озвучивания консонантных групп типа бокс, штраф, допинг и тд. Другими словами, принятые орфоэпические нормы - произношение заимствований так, как они
произносятся в языке-доноре — не обеспечены фонетическими ресурсами татарского языка
В диссертационной работе исследована супрасегментная система, а именно выявлена и описана ритмо-темпоральная структура татарского языка, которая понимается нами как сочетание ритмической единицы и паузы, следующей непосредственно за ритмической группой
Ритм - естественное свойство речи — зависит от структуры языка, темпа речи, а также от эмоционального состояния говорящего. В акцентных языках, таких как русский, английский, важную роль в организации ритмики играет ударение В языках, в которых ударение отсутствует, в построении ритмики речи основную роль играет ритмическая группа - фрагмент речи, состоящий из одного слова или сочетания слов, обладающих интонационной и смысловой целостностью Слоги в составе ритмической группы организованы по тональности, интенсивности и длительности
Построение системы просодического оформления синтезированных предложений, содержащих в своем составе как исконно татарские, так и заимствованные слова, не представляется возможным В диссертационной работе в силу указанных обстоятельств, а именно - невозможности при существующей орфографии и орфоэпии автоматической фонетической транскрипции произвольного текста и просодического оформления синтезированных предложений - решается проб тема создания целостной проблемно ориентированной фонетико-фонологической системы татарского языка
Актуальность темы диссертации определяется следующими обстоятельствами
Ритм - одна из основных просодических характеристик речи Как и словесное ударение он выполняет смыслоразличительную, словоразделительную и словообъединительную функции В татарском языкознании ритмо-темпоральные характеристики текста вообще не исследованы, работы, посвященные анализу ритмики, паузации текста, отсутствуют
Исследование ритмо-темпоральных характеристик татарской речи направлено на решение практической задачи, а именно - создание автоматического синтезатора татарской речи Основное назначение синтезатора - помочь людям, потерявшим зрение, вхождению в мир, в общество
Языковая политика в стране неоднократно менялась, что не могло не отразиться на фонологической системе языка В этом плане синтезаторы как преобразователи произвольного орфографического текста в речь представляют собой необходимый инструмент для проверки целостности графической и фонетической систем, возможности использования языка в новых информационных технологиях
Цель настоящей работы состояла в выявлении ритмо-темпоральных особенностей татарской речи, разработке системы правил, которые при
наложении на синтезированную речь придали бы ей просодическую стройность
Достижение поставленной дели предполагает решение следующих конкретных задач*
- установление лежащей в основе ритмической структуры татарского языка речевой единицы, ее характера, природы и функции,
- нахождение тонального и динамического контуров ритмической единицы,
- выявление свойств редукции кратких гласных в составе ритмической единнцы (ритмической группы),
- определение средней длительности пауз, соответствующей различным знакам препинания;
- создание системы правил просодической параметризации ритмических групп в синтезированной речи,
- построение проблемно-ориентированной фонетико-фонологической системы татарского языка
Научная новизна. Впервые осуществлено исследование ритмо-темпоральной организации текста в указанном аспекте Особенность проведенного изучения состоит в том, что оно проводится комплексно — с учетом современного состояния фонологической системы татарского языка, особенностей просодии слова и фонетической структуры татарского языка. Установление ритмической единицы языка, создание правил паузирования и просодического оформления речи проводится в целях улучшения качества синтезированной речи, внедрения татарского языка в новые информационные технологии
Объектом исследования являются тексты, прочитанные вслух дикторами — носителями литературного татарского языка Экспериментальный материал составили эмоционально-нейтральные отрывки (авторская речь) из художественных произведений татарских писателей-прозаиков
Предмет исследования - ритмо-темпоральная организация предложения, а также фонетическая структура ритмической группы - характер распределения слогов по длительности, интенсивности и частоте основного тона, зависимость акустических параметров ритмических групп, играющих важную роль в акцентуации речи, от позиции ритмической группы в предложении
Теоретическая значимость. В лингвистической литературе ритм трактуется как чередование соизмеримых речевых единиц В акцентных языках такими единицами являются ударные и безударные слоги Неакцентным языкам подобного рода чередования не характерны Ритм в таких языках представляет повторяемость ритмических групп Но, как известно, нет единого определения понятия «ритмическая группа» К ритмической группе нередко приравнивается как фонетическое слово, так и синтагма, и фраза Теоретическая значимость настоящего исследования
заключается в определении базовой ритмической единицы татарского языка, ее фонетической (просодической) структуры и вариативности, установлении связи между величиной ритмической группы и темпом речи, а также между распределением различных длин пауз и длительностью предшествующих им и следующих за ними ритмических групп
Практическая значимость полученных результатов. Результаты работы важны в собственно лингвистическом аспекте, поскольку алгоритмическое описание языка позволяет выявить существующие вариативности в его использовании и выбрать ту форму, которая способствует сохранению языка.
Разрабатываемый синтезатор предназначен для озвучивания произвольного орфографического текста Если учесть, что в настоящее время принята компьютерная верстка как художественных произведений, так и периодики, то с помощью синтезатора люди, лишенные зрения, получают возможность знакомиться с содержанием печатных изданий.
Достоверность результатов исследования обеспечивается применением современных компьютерных программ акустического анализа речи Метод «анализ через синтез» сделал возможным осуществление проверки ряда теоретических положений, в частности, о необходимости и достаточности выделенного нами состава фонем для озвучивания орфографических текстов на татарском языке
Теоретико-методологическую основу исследования составили классические труды по общему языкознанию Фердинанда де Соссюра, И А. Бодуэна де Куртенэ, JI В. Щербы, работы в области фонетики JIP Зивдера, Л В Бондарко, JIB Златоустовой, а также исследования татарского языка экспериментально-фонетическими методами таких лингвистов, как В А. Богородицкий, Г. Шараф, У .ILL Байчура, X X Салимов, Т.И Ибрагимов, Г.М. Сунгатов и др
Методы исследования. В диссертационной работе применен комплекс методов, включающий. 1) экспериментально-фонетические методы -экспериментально-акустический анализ речи с применением компьютерных программ Speech Analyzer, Sound Foige, Win Pitch Pro, Cool Edit, 2) метод моделирования - создание алгоритмов мелодической, динамической и темпоральной параметризации ритмических групп, 3) методы .математической статистики - усреднение измерений длительностей, частоты основного тона, интенсивностей слогов ритмических групп по данным, полученным на основе анализа текстов в произношении различных дикторов, 4) метод «анализ через синтез» - наличие элементной базы и программных ресурсов, необходимых для осуществления опытных преобразований текста в речь, позволяют широко использовать данный метод, который дает исследователю возможность проверить каждое правило просодической параметризации на примере звучания множества фраз; 5) метод лингвистического анализа в работе отражается в описании языка с позиции первичности устной формы по отношению к письменной, а также в оценках
изменения языка, в том числе предписываемых нормой, с позиции непротиворечивости системе языка
Положения, выносимые на защиту:
- Соизмеримые и регулярно повторяющиеся речевые единицы, лежащие в основе ритмической структуры татарского языка
- Природа и функции ритмической единицы, определение контура распределения длительностей слогов, а также контуров изменения частот основного тона и интенсивностей ритмической единицы
- Паузирование текста, характер распределения длительностей пауз в соответствии с расстановкой знаков препинания и величины выделяемых ими синтаксических структур
- Фонетические изменения звуков в речевом потоке, природа и характер редукции кратких гласных
- Алгоритм просодической параметризации ритмических групп в синтезированной речи.
- Современные системы общения человека с машиной и действующие орфография и орфоэпия татарского языка.
Апробация работы. Основные положения диссертации изложены во время выступлений с докладами на региональных, всероссийских и международных конференциях: «Теории и практики языкового плюрализма и билингвизма междисциплинарный подход» - Поволжская научно-практическая конференция студентов, аспирантов, молодых ученых и специалистов Казань, КГУ, 7 декабря 2006 г; «TEL-2006» - Казанская школа по компьютерной и когнитивной лингвистике Казань, КГУ, АН РТ, 9-11 декабря 2006 г, «Проблемы сохранения языка и культуры в условиях глобализации» - VII Международный симпозиум «Языковые контакты Поволжья» Казань, КГУ, 2-5 июля 2008 г, Итоговые научные конференции КГУ (2006,2007,2009)
Публикации. По материалам диссертации опубликовано семь статей (одна из них в журнале, входящем в Перечень ВАК РФ)
Структура работы. Работа изложена на 152 страницах, содержит 7 таблиц, 11 рисунков и 195 библиографических ссылок Диссертация состоит из введения, четырех глав, заключения, списка литературы и приложения.
ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ
Во Введении обоснована актуальность темы, сформулированы цели и задачи исследования, показана научная новизна и практическая значимость работы
В первой главе «Фонетический строй татарского языка. Исторический аспект и современное состояние» рассматривается история изучения фонетико-фонологической системы и интонационного строя татарского языка, особое внимание уделяется проблеме акцентологии р тюркских языках, указываются основные сложности при создании систем
автоматического синтеза речи на базе текущей фонетико-фонологической структуры татарского языка
Первые работы по татарскому языку появились в конце XVIII века Они были продиктованы задачами подготовки кадров мелких чиновников для административно-управленческого аппарата, т е носили чисто прагматический характер
Научный интерес к предмету - описание татарского языка как своеобразной системы коммуникации - начинается с работ В В Радлова1, И А Бодуэна де Куртенэ2 и Каюма Насыйри3. Дальнейшее изучение звукового строя татарского языка связано с именами таких ученых, как В А Богородицкий, Дж Вапиди, Г Нугайбек, Г Шараф, Г.Х Алпаров, М И Махмутов, У Ш Байчура, Р Ф Шакирова, Ф Г Исхаков, А Афлетунов, Г Ф Саттаров, Ш Н Асылгараев, Д Г Тумашева, Ф Ю Юсупов, Г X. Ахатов, Л Т Махмутова, ТИ Ибрагимов, XX Салимов, ФМ Хисамова, Ф С Хакимзянов, Г М Сунгатов и др
Фонетика татарского языка как научное направление сформировалась в 20-е годы XX века Этому в значительной степени способствовала жизнь и научная деятельность в Казани одного из основателей Казанской лингвистической школы В А Богородицкого4 Работы В А. Богородицкого стимулировали интенсивное изучение татарского языка Под его непосредственным руководством были выполнены первые работы по экспериментальной фонетике, диалектологии. Изучение татарского языка в этот период проводилось методами полевой лингвистики На основе данных слухового анализа татарской речи и многолетних наблюдений над произношением татарами русских слов В А Богородицкий выделяет в татарском языке 9 гласных и 24 согласных фонем
В 40-е годы в стране начинается новый этап «языкового строительства» -перевод письменностей на кириллицу Наряду с разработкой алфавитов и грамматик для бесписьменных языков, «языковое строительство» включало в себя создание общего терминологического фонда для языков с кириллическим алфавитом В результате, в национальных языках, в том числе и в татарском языке, образуется пласт неадаптированных русских заимствований Современная орфография и орфоэпия татарского языка состоят из двух частей - правил правописания (произнесения) словоформ татарского языка и правил правописания (произнесения) словоформ русского языка Попытки построения целостной фонетической системы (путем
'РадловВВ Опыт словаря тюркских наречий в4-хт СПб, 1893-1911 Т 1-4
2 Бодуэн де Куртенэ И А Избранные труды по общему языкознанию в 2-х т М Изд-во АН СССР, 1963 Т 1-2
3 Насыйри К Энмузэж Казан, 1895 86 6
4 Богородицкий В А Введение в татарское языкознание в связи с другими тюркскими языками / Под ред чл -кор АН СССР проф Н К Дмитриева 2-е изд, испр и доп Казань Татгосиздат, 1953 220 с
включения в фонологическую систему языка трех гласных и пяти согласных фонем русского языка) успеха не имели Механическое объединение двух языковых систем не может образовать систему Оно приводит только к смешению языков, что в высшей степени затрудняет создание систем автоматического поиска и обработки информации Внедрению татарского языка в новые информационные технологии, расширению его функциональных возможностей может способствовать построение новых орфографии и орфоэпии, допускающих освоение заимствований без нарушения действующей алфавитной системы
Для решения таких практических задач, как автоматическое распознавание и синтез речи, необходимо определить характер и функциональные особенности просодии слова Между тем, в языкознании отсутствует общепризнанная точка зрения как по вопросу самого существования словесного ударения в тюркских языках, так и относительно его природы, характера и функций При этом число исследователей, признающих существование словесного ударения в тюркских языках, и число их оппонентов примерно одинаково
Что касается татарского языкознания, то, согласно академическим грамматикам и учебникам5, в татарском языке словесное ударение фиксированное и падает на последний слог, оно носит квантитативный характер, выполняет смыслоразличительную функцию На наш взгляд, данные утверждения не бесспорны в силу следующих причин Во-первых, фиксированное ударение не может выполнять смыслоразличительную функцию Во-зторых, для татарского языка характерно явление регрессивной ассимиляции, когда конечный звук предшествующего слова уподобляется начальному звуку следующего слова. Более того, нередко на стыках слов происходит перераспределение слогов Примеры китап алдым (взял книгу) - ки+та+бал+дьш, китэ алмадык (не смогли уехать) - ки+тал+ма+дык) Таким образом, фонемы конечного слога отнюдь не находятся в сильной позиции Некоторое увеличение длительности гласного последнего слога, скорее, обусловлено расслаблением артикуляторных органов к концу слова, а не падением ударения на этот слог
Данные анализа литературы по вопросу словесного ударения, аудирования синтезированной речи позволяют полагать, что в тюркских языках не существует такого словесного ударения, как, например, в русском или английском языках. Наблюдаемое в татарском языке некоторое увеличение длительности гласного в конечном слоге слова не имеет отношения к словесному удареншо и требует дополнительного изучения
Вторлп глава диссертации «Проблема реконструкции звучания орфографического текста на татарской языке» посвящена разработке
5 Татарская грамматика в 3-х т / Под ред М 3 Закиева, Ф А Ганиева, КЗ Зиннатуллиной Казань Татарское книжное издательство, 1995 Т 1 С 96-102
проблемно ориентированной фонетико-фонологичеекой системы татарского языка
Основной единицей фонологии является фонема В татарском языкознании фонема определяется как «неделимая далее звуковая единица языка, которая служит для построения словоформ и для различения их звуковых видов»6. Выделение фонем в татарском языке осуществлялось и продолжает осуществляться на основе правила «Если два звука, находящиеся в одинаковом фонетическом контексте и одинаковой фонетической позиции, различают два разных слова, то они являются различными фонемами» С помощью данного правила в звуковой системе татарского языка выделено 12 гласных и 28 согласных фонем В литературе по татарской фонетике подчеркивается, что три {loi, 1ы1, leí) из двенадцати гласных фонем, а также три (je!, 1щ/, li¡/) из двадцати восьми согласных фонем встречаются только в русских заимствованиях. Другими словами, они не вступают в синтагматические и парадигматические отношения с остальной частью фонем. Такое положение сделало практически невозможным создание алгоритма автоматической транскрипции
В плане решения задачи автоматического преобразования произвольного орфографического текста в речь (синтез речи) нами разработаны целостные проблемно ориентированные фонологическая и фонетическая системы татарского языка
Определение фонемного состава языка проводилось на основе учения о фонеме Л В Щербы. Опираясь на ассоциативные связи между акустическим представлением фонемы и значением морфем, в татарском языке нами выделены следующие 9 гласных lal, 1э1, loi, leí, /у/, /у/, 1ы1, lel, lui) и 23 согласных фонем - 161, /в/, /г/, lâl, 1ж/, lotçl, /з/, /«/, /к/, lui, 1м1, lui, 1ц1, Inl, Ipl, Ici, Ы, /ф/, 1x1, Ihl, Ы, 1ч1, M
Анализ выделенных фонем на множестве грамматических морфем показал, что данный состав фонем удовлетворяет условиям необходимости и достаточности Аудирование синтезированной речи также не выявило явных системных нарушений и затруднений в понимании содержания текстов по причине отсутствия какой-либо фонемы
Отметим, что приведенная выше проблемно ориентированная система фонем незначительно отличается от состава фонем, которыми В А. Богородицкий описывает речь носителей татарского языка В представлении «народного говора» В А Богородицкий использует 10 гласных {lal, ht, loi, lel, /у/, /у/, /ы/ (краткий), lel, lui, /ы/ (долгий)) и 24 согласных {161, Inl, lel, 1ф/, /г/, /к/, 1з/, Ici, /ж/, huí, /эк;/, /ч/, Ipl, /л/, Ы, /н/, 1ц1, lui, Ihl, Ixl, Iml, Iql, /д/, IbI) фонем Из десяти гласных девять являются полными, а /ы/ (долгий) - позиционно закрепленной, те архифонемой Учитывая дифтонгоидность данной фонемы и то, что при соединении с притяжательным аффиксом (напр. с «-ым») она как ложный дифтонг легко
6 Татарская грамматика С 88
распадается на две самостоятельные фонемы (абый-ым - [абы-йым] - «мой брат»), фонема /ы/ (долгий) нами в работе не рассматривается в качестве фонологической единицы языка В составе выделенных В А Богородицким согласных фонем не содержится фонема /в/ Однако с учетом ассоциативной связанности звука [в] со значением суффикса -ова/-ева (Мшнебаева, Ганисва) и активного употребления этих суффиксов консонантизм татарского языка был дополнен данной согласной фонемой В составе выделенных нами согласных не хватает также увулярных /<?/ и /#/. На самом деле они присутствуют, но не как фонемы, а как аллофоны заднеязычных /к/ и /г/ Существование последних в мягком и твердом вариантах подтверждается ассоциативной связью их с формой лица в составе глаголов прошедшего времени (бар+ды+к - ходили, кил+де+к - пришли), а также с формой притяжательного аффикса существительных (алда+гы — в переднем, встэ+ге - в верхнем) Таким образом, выделенный состав фонем в количественном и качественном отношениях представляет необходимый и достаточный инструментарий для выражения значений грамматических морфем татарского языка
Синтез речи по тексту, помимо преобразования орфографического текста в фонемную запись, предполагает перевод фонемной записи в сегменты звучащей речи Фонетическое представление текста включает определение состава речевых звуков, при помощи которых происходит общение между носителями языка, а также артикуляторную, акустическую и перцептивную вариативности речевых единиц Но как это сделать"?
Как известно, речь психологична и, как таковая, она индивидуальна Как пишет И А Бодуэн де Куртенэ- «Язык существует только в индивидуальных мозгах, только в душах, только в психике индивидов или особей, составляющих данное языковое общество Язык племенной и национальный является чистою отвлеченностью, обобщающей конструкцией, созданной из целого ряда реально существующих индивидуальных языков»7 Эту «обобщающую конструкцию» В А Богородицкий, длительное время занимавшийся изучением говора носителей татарского языка, назвал «народным говором» Собранный ученым богатый фактический материал, сделанные на его основе многочисленные теоретические обобщения и сегодня представляют огромную ценность На основе своих многолетних наблюдений за произношением татарами русских заимствований В А Богородицкий делает следующие заключения8
1 Замена ударных гласных средней открытости [о] и [э] узкими \у] и [и] (гармоника - гармун, завод - завут, вагон — вагун, билет ~ билит, мех - мих)
2 Ударная [а] в соседстве с мягким согласным, предшествующим или следующим, передается мягкой [а] (печать - пичат, скатерть - скатир, шляпа - гилапа и т.д)
7 Бодуэн де Куртенэ И А Избранные труды по общему языкознанию Т 2 С 71
8 Богородицкий В А Введение в татарское языкознание С 209-213
3 а) Замена предударного [о] на [а] {хомут — камыт, пароход - прахут, конфета — канфит и т д )
б) Замена предударного [о] на [у] (соха - сука, воронка — буранка и т д ) 4. Предударный [е] субештуируется гласным [и] (безмен - бизман, стена — стина, телеграф - тилиграф, межа - мияса и т д)
5 В словах с двумя предударными слогами гласная второго предударного слога опускается {арестант - ристан, капитан - кпитан, керосин - Красин, колокол - клакул, тарантас - трантас и т д).
6 Опущение гласного в словах женского рода на -а, -я при условии безударности этих гласных {минута - минут, гиря — гер, солома - сапам, конфета — канфит, фабрика — фабрик и тд)
Таким образом, звуковая система татарского языка не располагает открытыми гласными, характерными для русского языка Татарские гласные произносятся при меньшем раскрытии рта, а, следовательно, при меньшей затрате энергии Этому способствует и отсутствие в татарском языке словесного ударения (такого, как в русском языке), поскольку говорящему не требуется затрачивать дополнительную энергию для выделения отдельных слогов
На основе анализа русских заимствований В А Богородицкий отмечает следующие особенности системы согласных татарского языка9
1 Для татарского языка не характерно наличие губно-зубного [б] и в заимствованных словах он заменяется слабоартикулируемым губно-губным [б] {вор - бур, воронка - буранка, завод - забут) или же сонорным [>г], когда этот звук следует в начале либо в конце слова {вагон — щзгун, виноград — штограт, церковь - чиркам, плов - там и т д )
2. Аффриката [(/] заменяется на спиранты [с] или [ч] {купец - купис, офицер — афисар, церковь — чиркам, цыган - чиган и г д )
Из результатов исследования В А Богородицкого следует, что произношение согласных, как и в случае гласных, характеризуется слабой артикуляцией Это проявляется, во-первых, в произношении звонких взрывных, в частности, в произношении звука [б] По замечанию В А Богородицкого, он звучит похожим на [с?], во-вторых, в произношении аффрикат [гД и [ч] в артикуляции этих звуков, по В А Богородицкому, смычка почти отсутствует. В-третьих, слабая артикуляция гласных и согласных затрудняет произношение (озвучивание) кластера согласных
Всеми перечисленными обстоятельствами и объясняет в своих трудах В А Богородицкий затруднительность произношения заимствований, содержащих группу согласных Эти сочетания произносятся со вставочным гласным либо перед согласными, либо между согласными Данное явление обусловлено ничем иным, как слабой артикуляцией гласных и согласных в татарской речи При такой артикуляции для обеспечения слышимости слова
9 Богородицкий В А. Введение ь татарское языкознание С 213-217
говорящий вынужден использовать гласные звуки {штраф - ыштраф, шарф - шарыф, студент — ыстудент и т д )
Анализ адаптированных — освоенных языком — русских заимствований показывает, что русская фонема /к/ близка по артикуляции и звучанию палатализованному варианту татарской фонемы 1к1, те звуку [/с] Слова «капуста», «корзина», «комедия», «книга», «решетка» и т д освоены татарским языком в форме «кзбестз», «кзрзин», «кзмит», «кенэгэ», «рзшэткэ»
В случае преобразования арабских заимствований слоги, содержащие твердые Iql и Igl, целиком транскрибировались непалатализованными фонемами Так, слова мэгълумат, тзкъдим, тзгъмшат, нэкъ, мзгърифэт транскрибированы в форме маглумзт, такдим, таглимзт, нак, магрифэт
Отмеченные выше особенности звуковой системы легли в основу алгоритма автоматической фонематической транскрипции неадаптированных заимствований русского и арабского языков. Были учтены также изменения, происходящие в современном татарском языке В частности, и то, что закон сингармонизма в чистом виде, те таком, в каком этот закон существует в базовой лексике, в современном языке не действует
Характерной особенностью вокализма тюркских языков, в частности татарского языка, является наличие в нем кратких гласных loi, /о/, /ы/, leí В литературе по фонетике татарского языка редукция гласных loi, loi, /ы/, le (э)1 объясняется с позиции акцентологии10 Согласно учебникам и академическим грамматикам, сокращение длительности краткого гласного вплоть до нуля происходит в неударном слоге В ударной позиции (ударным в указанных трудах считается последний слог слова) длительность краткого гласного вполне сопоставима с длительностью долгого гласного На первый взгляд, такая трактовка кажется убедительной Действительно, в финальной позиции слова длительности кратких и долгих гласных существенно не отличаются Но в конечной позиции в многосложных словах происходит нейтрализация оппозиции гласных по признаку огубленность-неогубленность, оппозиции согласных по признаку звонкий-глухой (флаг [флак], код [кот], газ [гас]), что не характерно для сильной (ударной) позиции слога Кроме того, объяснение редукции кратких гласных неударной позицией слога вступает в противоречие с мнением о подверженности редукции в зависимости от свойства быть изначально краткими
Это свойство гласных loi, lel, lui, le (э)! быть (по причине своих артикуляторных особенностей) краткими подтверждают полученные нами данные (таблица 1) Экспериментальный материал, предназначенный для оценки разности в длительностях долгих и кратких гласных, включает девять одинаковых в синтаксическом отношении предложений Длительности гласных измерялись в словах, состоящих из одного слога (в таблице
10 Богородицмш В А Введение в татарское языкознание С 85 , Татарская грамматика С 84
выделены курсивом). Текст в произношении диктора-мужчины в стиле разговорной речи был переведен в цифровой формат и проанализирован соответствующими компьютерными программами Запись
экспериментального материала повторялась неоднократно.
В столбцах 1-5 таблицы 1 приведены длительности в миллисекундах (мс) гласного, прозвучавшего при первом, втором .. и пятом чтениях, соответственно В последнем столбце мс) указаны средние длительности каждого гласного по всем чтениям На основе данных строк 4-7 последнего столбца была определена средняя длительность некоего абстрактного краткого гласного (Ц) и на базе данных строк 1-3, 8, 9 - средняя длительность некоего абстрактного долгого гласного 0ДЛ)
Таблица 1 Длительности гласных в односложных словах
№ Предложения 1 2 3 4 5 t, MC
1 Кибетгэ туш беткэн (В магазине закончилась тушь) 84 64 73 75 60 71
2 Базардан сус алдык (На базаре купили паклю.) 80 74 66 76 57 71
3 Буразнада кэс ята. (На борозде лежит дерн.) 105 88 84 92 92 92
4 Алгы теш сынды (Сломался передний зуб) 54 40 34 58 45 46
5 Тирэккэ кош кунган (На тополь села птица) 56 62 49 73 51 58
6 ЯОыйган кеч бетге (Накопленная сила закончилась ) 56 55 50 40 50 50
7 Салкын кыш килде. (Пришла холодная зима ) 36 54 54 48 43 47
8 Козге кич ядатте (Наступил осенний вечер ) 80 66 64 44 67 64
9 Кызлар каш буйый (Девушки красят брови ) 101 90 96 79 96 91
Вычисленные средние длительности оказались равными 78 мс и 50 мс соответственно Таким образом, длительность долгого гласного примерно на 30 мс больше краткого Это отличие, однако, не может быть вызвано ударностью слога, поскольку длительности как кратких, так и долгих гласных измерялись в односложных словах и при иных равных фонетических условиях Следовательно, краткость звуков loi, /в/, /ы/, le (а)! обусловлена не ударением, а их артикуляционными особенностями Гласные loi, loi, 1ы1, le (э)1 объединяет подъем Они произносятся при минимальном растворе рта, в их артикуляции не участвует нижняя челюсть - наиболее массивный
артикуляторный орган Положение языка обеспечивается незначительным раствором рта (расслабленное состояние мышц массивных челюстей) и оказывается удобным для перехода к артикуляции следующею согласного звука
Степень редукции кратких гласных изучена нами в зависимости от следующих четырех факторов- типа слога, контекста, позиции их употребления в многосложном слове, а также от повторного употребления в том же слове Экспериментальный материал, необходимый и достаточный для решения той или иной конкретной задачи, пред став ля ч совокупность простых предложений Слова, содержащие анализируемые гласные, относились к одной части речи, имели одинаковое количество слогов и занимали одну и ту же позицию в предложении
В таблице 2 приведены усредненные значения измеренных длительностей кратких и долгах гласных в слогах, находящихся в начале слова
Таблица 2 Длительности кратких и долгих гласных в слогах различного
типа
№ Тип слога Краткий МС ^кр2 " Долгий и. мс ^дл2 " 1дл " ^кр
1 СГС 22 41 53 25 31
2 ГС 63 0 78 0 15
3 СГ 19 44 48 30 29
4 Г 39 24 70 8 31
5 СГС (слово) 50 13 78 78 0
Как видно из последнего столбца таблицы 2, разность в продолжительностях звучания долгих и кратких гласных в слогах СГС, СГ, Г и в слове, состоящем из слога СГС, сохраняется приблизительно на одном уровне Минимальна эта разность в слогах типа ГС Что касается зависимости длительности кратких гласных от типа слога, то она довольно существенная Согласно данным столбца ^ - Ц,,, максимальная редукция кратких гласных наблюдается в слогах СГ, в несколько меньшей степени в слогах СГС и еще меньшая в гласных, выступающих в качестве слога типа Г.
Изучение зависимости редукции краткого гласного от консонантного окружения выявило, что редукции благоприятствует употребление краткого гласного в составе слова, в котором С] является смычным, а С2 -переднеязычным спирантом Несколько в меньшей степени гласные редуцируются в контексте между смычным и сонорным звуками Еще в меньшей степени редукция наблюдается в контексте между спирантом и сонорным, а также в положении между сонорным и фрикативным согласными
Исследование зависимости редукции от позиции краткого гласного в слове показало, что сокращение длительности кратких гласных и, тем более,
полная редукция, как правило, не характерны для аффиксальной части словоформы Исключение составляют следующие случаи
- при распределении аффиксальной части слова на слоги краткая гласная может оказаться в составе слога СГ, а следующий слог - начинаться на согласный Ipl (кал-дырыр «оставит» - кал+ды+рыр, он;ик~тереп «запрягая» -sfquK+me+pen) В указанных условиях краткие гласные /ы/ и leí сокращаются до полного исчезновения, и происходит объединение слогов (кал+дрыр, ядик+треп),
- в аффиксальной части слова первый слог с кратким гласным относится к типу СГ, а второй слог начинается на сонорный /л/ (кш-делэр «приехали», аша-дылар «покушали») В этих условиях краткая гласная примерно наполовину сокращается в длительности
На рис 1 приведены осциллограммы фрагментов словосочетаний телэр кебек «кажется, (он) захочет», киттелэр кебек «кажется, (они) уехали» и киттегез кебек «кажется, (вы) уехали».
в приведенных словосочетаниях, имеют разную величину. В слове киттелэр
[е] звучит несколько дольше, чем в слове телзр, а в слове киттегез редукция [е] практически отсутствует
Из описания фонетико-фонологического строя языка следует, что основную роль в формировании звуковой системы татарского языка сыграл фактор удобопроизнесения - стремление минимизировать затраты энергии при произнесении. Об этом, в частности, свидетельствуют такие факты, как отсутствие в базовой лексике слов с нарушением закона сингармонизма, использование вставочных гласных для озвучивания сочетания согласных в заимствованных словах {стол - встэл, шляпа — эшлзпэ, шарф - шарыф), отсутствие грамматических морфем с гласными loi и loi (в конце слова они переходят соответственно в /ы/ и leí, которые более удобны для произнесения), согласование фонем по признаку звонкость/глухость на стыках морфем, оглушение согласных в конце слова {nyà — пот, утюг — утук, очередь — чират, кладовая — келэт) и т д
Третья глава «Ритмо-темпоральные характеристики татарской речи» посвящена изучению ритмо-темпоральной организации текста и построению алгоритма просодической параметризации синтезированной речи Под ритмо-темпоральной организацией понимается сочетание ритмической единицы и паузы Ритмо-темпоральное структурирование синтезированной речи имеет важное фонологическое и фонетическое значение. Нетрудно показать, что предложение Хэмидэ эби куршесе Кэшифэнец кергэнен яратмады в зависимости от разбиения на ритмические единицы будет выражать различные смыслы Если границу ритмической группы провести между словами эби. и куршесе, то предложение переводится как Бабушке Хамиде не понравился приход соседки Кашифы Если границу ритмической группы провести между словами куршесе и Кэшифэнец, то предложение будет переводиться как Соседке бабушки Хамиды не понравился приход Кашифы. На рис. 2 и 3 приведены графики распределения длительностей слогообразующих гласных, соответствующих первому и второму способам структурирований данного предложения
Рис. 2 Кривая распределения длительностей гласных в предложении «Хэмидэ эби куршесе / Кэшифэнец кергэнен яратмады»
Х& ми до е Ои кум ше се К» ши фе кшч кер га н&н iTi,'i par ма аы
Рис 3. Кривая распределения длительностей гласных в предложении «Хэмидэ эби / куршесе Кэшифэнец кергэнен яратмады»
В настоящей работе за элементарную ритмическую единицу принята ритмическая группа - слово или сочетание слов, представляющее интонационное и смысловое целое Свойством повторяемости обладает не фонемная структура ритмической группы, а ее просодическая структура, которая включает упорядоченность слогов по длительности, тону и интенсивности Изучение ритмики предполагает описание просодии ритмической группы, характера ее изменения в зависимости от позиции употребления во фразе (предложении), а также в связи с переменой иных фонетических условий
Исследование особенностей ритмо-темпоральной организации татарской речи, в том числе фонетической структуры ритмической единицы, в работе проводится по прочитанным диктором письменным текстам Тексты представляют собой авторскую речь из произведений татарских писателей и озвучены диктором-мужчиной - носителем татарского литературного языка Акустический анализ (измерение частоты основного тона, изменения интенсивности и длительности слогообразующего гласного) проводился с помощью программы Speech Analyzer В качестве примера в таблице 3 приведены данные изменения длительностей слогообразующих гласных ритмических групп Цифры в скобках показывают число измерений, на основе которых получены значения длительностей гласных
Таблица 3 Правила параметризации длительностей кратких (Кр) и долгих (Дл) гласных, входящих в состав начальной, серединной и конечной РГ В правилах учтены также тип слога (Г, СГ, ГС, СГС), позиция слога в слове и позиция слова в РГ__
Длительность (в мс)
Начальное слово Серединное слово Конечное слово
а: 1 1 и о 5 « а я з X '1 •д и о 3 « а сз 3 я 1 Е Ь 3 С! 3
Начал! СЛОГ Серед* СЛОГ £ <и а о ЬЙ Начал! СЛОГ Ч и ° о 5 У <и Я О И Начал! СЛОГ 9 и и 0 т <и X о И
Г Кр 46(1) 49(1)
а иг Дл 72(5) 63(1) 85(1) 62(10) 67(9)
к 5 СГ Кр 38(2) 47(5) 46(12) 39(6) 47(5) 61(11) 51(5) 48(12) 131(15)
1 Дл 56(22) 70(16) 71(14) 55(16) 64(15) 74(8) 64(19) 66(30) 114(28)
»а ГС Кр 69(2) 34(1) 50(1)
Дл 75(7) 176(1) 66(2) 72(8)
'X з ГО СГС Кр 42(7) 45(5) 45(19) 45(3) 51(9) 50(21) 40(7) 45(4) 64(10)
Дл 66(14) 72(8) 65(18) 60(10) 62(7) 64(23) 61(20) 61(15) 96(19)
Кр 61(1) 41(1) 82(1)
и о. Г Дл 80(6) 79(11) 62(11)
3 д 4 5 СГ Кр 52(8) 41(8) 45(16) 51(6) 47(7) 53(17) 39(5) 41(12) 132(13)
Дл 62(18) 59(14) 79(14) 56(14) 59(17) 82(16) 59(30) 61(45) 121(33)
ГС Кр 54(4) 29(2) 28(1) 17(1)
О. в- Дл 73(2) 77(8) 61(10) 54(1)
и ез СО СГС Кр 54(1) 52(8) 57(12) 35(10) 45(5) 53(19) 55(4) 44(12) 61(19)
Дл 59(13) 59(5) 73(21) 60(10) 54(11) 64(21) 60(19) 54(25) 95(25)
Г Кр 59(1) 46(1)
а. Дл 63(5) 70(1) 61(13) 53(1) 79(10)
Он ё СГ Кр 30(5) 42(4) 59(11) 37(10) 47(12) 58(17) 40(5) 34(7) 124(33)
£ аз Дл 60(23) 73(12) 75(20) 58(36) 63(33) 79(35) 57(19) 66(15) 146(22)
<и ГС Кр 57(2) 42(1) 48(2)
о Дл 74(6) 64(9) 68(1) 67(5)
со СГС Кр 41(7) 37(7) 50(21) 59(6) 40(16) 54(27) 38(10) 33(5) 82(10)
Дл 57(8) 60(9) 71(24) 56(22) 63(11) 69(31) 67(25) 62(6) 98(13)
Как следует из приведенных данных, в предложенной системе просодической параметризации интонационное оформление синтезированного высказывания осуществляется с учетом следующих моментов а) позиции ритмической группы, б) позиции фонослова в ритмической группе, в) позиции слога в фонослове, г) открытости (закрытости) слога, д) полной или частичной открытости (закрытости) слога, е) краткости (долготности) слогообразующего гласного При анализе фонетически транскрибированного предложения каждому слогу
присваивается шестизначный код «1J к 1 ш п», где 1 — позиция ритмической группы, которая может принимать следующие три значения 1 - начальная, 2 - серединная и 3 - конечная в предложении ритмическая группа, J - позиция фонослова в ритмической группе. Она может принимать те же самые три значения 1 — начальная, 2 - серединная, 3 - конечная, к - позиция слога в фонослове, которая принимает значения 1, 2, 3, те может находиться в позициях начала, середины и конца слова, 1 - принимает два значения 1 -открытый и 2 - закрытый, ш — полностью или частично открытый (закрытый) слог, принимает значения - 1 - полностью открытый (полностью закрытый), 2 - частично открытый (частично закрытый), п — принимает два значения: 1 -краткий и 2 - долгий.
Данные таблицы 3 и аналогичные им легли в основу алгоритма просодической параметризации ритмических групп.
Вслед за формированием просодии ритмической группы проводилась расстановка пауз между ритмическими группами текста Алгоритм распределения пауз был разработан на основе данных анализа художественного текста Данные, полученные от разных дикторов, были усреднены и использованы при ритмо-темпоральном структурировании синтезированной речи Исходя из специфики проводимою исследования (улучшение качества синтезированной речи), первостепенное внимание в настоящей работе уделено следующим моментам
— степень соответствия между паузированием текста и системой пунктуации языка,
— вариативность пауз по длительности и причины вариативности,
- различия в чтениях текста одним и тем же и разными дикторами,
- система распределения несанкционированных (необеспеченных знаком препинания) пауз
Решение поставленных вопросов сопряжено с проведением большого количества экспериментальных исследований. Результаты настоящего этапа исследований являются предварительными и требуют дополнительного привлечения больших по объему текстов Приведенные в работе числовые данные и выводы получены на основе анализа текста (отрывок из художественного произведения), включающего 173 словоупотребления В ходе работы были подсчитаны средние длительности пауз, соответствующих местам употребления каждого из указанных знаков препинания, а также границам, не обусловленным пунктуацией ритмических групп, для каждого диктора Общие данные по распределению длительностей различных типов пауз представлены в таблице 4 Различия в чтениях одного и того же диктора, как и отличия в чтениях разными дикторами, оказались значительными С учетом выявленного обстоятельства средние длительности паузы, соответствующей определенному знаку препинания, а также паузы на границах, не обозначенных пунктуацией ритмических групп, были вычислены путем деления суммы всех пауз, обусловленных данным знаком препинания, на количество произведенных измерений
Расчеты показали, что средняя длительность паузы на границах предложений у первого диктора составила 520 мс, у второго диктора - 470 мс, у третьего диктора - 530 мс Размах вариаций в значениях длительностей данного вида пауз для первого диктора оказался равным 1390 мс, для второго - 280 мс и для третьего - 330 мс
Таблица 4 Распределение длительностей пауз в зависимости от вида знаков препинания.____
Число точек Число запятых Число двоеточий Число тире Число несанкционированных разрывов
выд паузой невыд паузой выд паузой невыд паузой выд паузой невыд паузой вид паузой невыд паузой
84 0 82 20 5 1 7 5 55
510мс 268мс 391мс 349мс ЗЗОмс
Представ ченные в таблице 4 данные позволяют сделать некоторые обобщения Во-первых, 100%-ное паузирование характерно для границ предложений, во-вторых, запятые не всегда выделяются паузой Оказалось, что двоеточия и тире выделяются одинаковой паузой, а слова, написанные через дефис, не выделяются паузой. И, наконец, слова, написанные через тире, могут выделяться паузой, а могут и не выделяться
Числа, приведенные в последней строке таблицы 4, являются средними значениями длительностей пауз, соответствующих указанным знакам препинания Обращает на себя внимание то обстоятельство, что разброс между значениями пауз, отвечающих тому или иному знаку препинания, значителен Так, размах вариаций в распределениях длительностей пауз, соответствующих местам расположения точек, составляет 1369 мс, а аналогичный размах в случае запятых — 531 мс
Как показали исследования, основным фактором, влияющим на длительность паузы, является длина как предшествующей знаку препинания, так и следующей за знаком препинания фразы. Например, средняя длительность паузы после предложений длиной от 14 < t" < 24 оказалась 550 мс, за предложениями длиной 8 < t < 10 составила 520 мс, а в случае предложений, имеющих длину 3 < t < 5, оказалась равной 370 мс Такая же зависимость наблюдается в длительностях пауз после запятой. В местах, где запятые следовали за фразами, включающими от шести до десяти слов, средняя длительность паузы оказалась 303 мс В местах, в которых запятые следовали за фразами длиной от одного до четырех слов включительно, средняя длительность паузы составила 180 мс
11 Здесь t - длина предложения в словах.
Из представленных в таблице 4 данных следует, что паузальные разрывы характерны не только для мест пунктуации 26% пауз были обнаружены в местах, где не было никаких знаков препинания Мы назвали их несанкционированными паузами Средняя продолжительность несанкционированных пауз близка средней длительности пауз, соответствующих запятым Необходимо отметить, что основная масса несанкционированных пауз встречается во фразах, содержащих более пяти слов Следовательно, эти паузы могли быть инициированы смысловой обособленностью содержащихся во фразах словосочетаний, характером синтаксических отношений словосочетаний, а также особенностями физиологии речевого дыхания
В ходе работы было выявлено, что количество речевых тактов зависит не только и не столько от сложности предложения, сколько от наличия в предложении обособленных обстоятельств, групп субъекта и предиката Из анализа грамматической структуры речевых тактов выяснилось, что границы их совпадают с границами составляющих предложения - субъекта, предиката и обстоятельств
Сделанные выводы носят предварительный характер Отмел им также, что изучение манеры чтения текста поставило перед разработчиками еще одну задачу, а именно, выяснение степени адекватности действующей системы пунктуации татарского языка Анализ татарских текстов из Интернета показал, что средняя длина предложений в татарском языке равна 13 словам, средняя длина интонационных фраз - 5,4 Наряду с приведенными данными в этих текстах нередко встречаются предложения длиной 20 и более слов, написанные без всяких знаков препинания Эти факты вызывают некоторое сомнение в соответствии между паузированием текста и системой пунктуации, принятой в языке
Глава четвертая - «Прикладной аспект ритмо-темпоральных характеристик применительно к автоматическому синтезу татарской речи» - включает сведения, относящиеся непосредственно к функционированию системы автоматического синтеза речи
Разрабатываемый синтезатор является дифонным и предназначен для преобразования произвольного орфографического текста в речь
На рис 4 приведена общая блок-схема разрабатываемого синтезатора татарской речи
ТЕКСТ
Рис 4. Блок-схема синтезатора
Работа блока нормализации состоит из следующих операций
а) расшифровка аббревиатур и сокращений,
б) преобразование чисел в числительные,
в) обозначение символов словами,
г) выявление и исправление ошибок
Задачей блока обработки входного текста на фонематическом уровне является приведение орфографического текста к единой системе Как было отмечено, современная орфография татарского языка представляет эклектику трех языковых систем - татарского, русского и арабского В таком виде орфография не допускает алгоритмического описания как фонетической транскрипции, так и расчленения слов на слоги и просодическую параметризацию текста
Фонематическое транскрибирование орфографического текста осуществляется в два этапа На первом этапе определяется принадлежность
входного слова тому или иному языку, на втором - осуществляется собственно фонематическая транскрипция Наличие первого этапа -выделение иноязычных слов (неадаптированных заимствований) — обусловлено отсутствием научно разработанной орфографии языка Рассмотрим работу фонематического транскрибиратора на примерах Допустим, на вход синтезатора поступили предложения «Хэмитов документларын сейфка биклэп, конторадан чыгып китте» (Заперев свои документы в сейф, Хамитов вышел из конторы), «Аныц оклады зур тугел» (У него оклад небольшой), «Мансур абый - академикмы7» (Дядя Мансур -академик?). На выходе блока фонематической транскрипции эти предложения будут записаны в форме «.Хэмитыф дакуминтларын сийыфкэ биклэп, кэнтурдан чыгып китте», «Аныц эклады зур тугелг>, «Мансур абый экэдимикмы?»
Задачей блока фонетической транскрипции является представление написанного в фонемных единицах с указанием границ ритмических групп текста в форме звучащих предложений. Проблема синтеза речи, близкой естественной, не может быть решена без учета и моделирования позиционных и комбинаторных изменений гласных и согласных в пределах слова и ритмической группы Фонетическая транскрипция в основном производится на уровне словоформ Часть транскрипции, касающаяся оформления стыков слов, проводится на уровне словосочетаний, те в ритмических группах
При фонетической транскрипции основное внимание уделяется явлениям редукции и полным выпадениям звуков Наиболее показательными в этом плане являются изменения в длительностях кратких гласных, таких как [ы],
М, [о], [в]
Просодическая структура ритмических групп различается по их позиции в предложении.
Общая схема интонационного оформления синтезированного высказывания включает несколько этапов действий а) определение границ фраз во входном предложении, б) определение границ ритмических групп во фразе, в) представление каждого гласного фонетически транскрибированного входного предложения в форме шестибуквенных кодовых слов, г) обеспечение паузами различной длительности границ РГ, фраз и предложений, д) переоформление просодии конечной РГ в соответствии с типом предложения
Указанные компоненты предложения представляют отдельные ритмические группы и, как таковые, обладают просодической структурой -своеобразным распределением частот основного тона (мелодическим контуром), интенсивносггей (динамическим контуром) и длительностей (контуром распределения длительностей слогов) Чередование ритмических групп с паузой, на которую они заканчиваются, в данной работе принято за ритмо-темпоральную характеристику татарской речи При этом необходимо отметить, что длительность пауз, следующих за ритмической группой,
связана как с длиной предшествующей ритмической группы, так и с длиной следующей за паузой ритмической группы.
В Заключении обобщаются и излагаются выводы диссертационного исследования
Просодическое оформление синтезированной речи, в частности, ритмо-темпоральное структурирование звучания произвольного орфографического текста на татарском языке выходит за рамки интонологии В процессе решения поставленных задач выяснилось, что не все результаты, полученные лингвистами для оптимизации общения человек-человек, могут использоваться в разработке интерфейсов человек-машина Первые же опыты по транскрипции орфографического текста показали, что отсутствие целостных фонологической и фонетической систем крайне затрудняет создание синтезатора речи, существенно осложняет разработку систем автоматического поиска и обработку информации
Постановка отдельных задач настоящего исследования, а именно -построение проблемно ориентированной фонетико-фонологической системы татарского языка, проведение дополнительных исследований по вопросам акцентологии - была продиктована данными обстоятельствами
Наличие опытного образца синтезатора татарской речи позволило широко применить в работе метод «анализ через синтез», вносить поправки в звучание сегментных и супрасегментных единиц языка, выявить и объяснить системные связи между единицами сегментной и супрасегментной фонетики.
Выводы
1 Определена ритмическая единица речи, построены контуры изменения длительностей, частот основного тона и интенсивностей слогов в пределах ритмических единиц
2 Выявлены особенности фонетических изменений звуков на границе слогов и слов, входящих в одну ритмическую группу, характер и природа редукции кратких гласных
3 Определены особенности паузирования текста, вариативность паузирования, соответствие расстановок пауз знакам препинания
4 Построены алгоритмы автоматической параметризации ритмо-темпоральной структуры предложения, а также редукции кратких гласных
5 Разработана целостная фонетико-фонологическая система татарского языка на базе описания В А Богородицким «народного говора» и с использованием метода «анализ через синтез» Система позволяет озвучить орфографические тексты в рамках звукового строя татарского языка
В Приложении приводится список используемых в работе сокращений, список дикторов, а также экспериментальные материалы проведенных фонетико-акустических исследований
Основные положения диссертации отражены в следующих публикациях:
Публикации в изданиях, рекомендованных ВАК Министерства образования и
печати РФ
1) Ибрагимов ТИ. К проблеме реконструкции звучания письменного текста Редукция кратких гласных в татарском языке / Т.И. Ибрагимов, M Р. Сайхунов // Ученые записки Казанского государственного университета. Серия гуманитарные науки Книга 3 / Науч ред MX Салахов - Казань • Изд-во Казан гос ун-та, 2009. - С 288-298
Другие публикации
2) Сайхунов М.Р. Ритмо-темпорапьные характеристики татарской разговорной речи / M Р. Сайхунов // Теории и практики языкового плюрализма и билингвизма междисциплинарный подход Материалы Поволжской научно-практической конференции студентов, аспирантов, молодых ученых и специалистов. 7 декабря 2006 года / Под ред В 3 Гарифуллина - Казань Изд-во Казан гос ун-та, 2007 - С 60-62.
3) Сайхунов M Р Татар теле фонетикасын эксперименталь юнэлештэ ейрэнунец тарихы Ьэм максат-бурычлары / M Р. Сайхунов // Ученые записки - 2006. Сборник / Науч ред И.А Гилязов — Казань Изд-во Казан гос ун-та, 2007. - С 349-350
4) Ибрагимов Т.И Вариативность чтения текстов на татарском языке паузирование / Т И Ибрагимов, Ф И Салимов, М.Р. Сайхунов // Труды Казанской школы по компьютерной и когнитивной лингвистике ТЕЛ-2006 -Казань, 2007.-С. 117-121
5) Сайхунов M Р. Ритмическая структура татарской разговорной речи / M Р. Сайхунов // Ученые записки - 2007 Сборник / Науч ред И А Гилязов -Казань Изд-во Казан гос ун-та, 2008 -С. 237-239
6) Синтез татарской речи по тексту Состояние и перспективы / Т.И Ибрагимов, Ф.И Салимов, Р.Р Хусаинов, M Р Сайхунов // Проблемы сохранения языка и культуры в условиях глобализации Материалы VII Международного симпозиума «Языковые контакты Поволжья», 2-5 июля 2008 г / Науч ред И А Гилязов - Казань Изд-во Казан, гос ун-та, 2009 -С. 88-92
7) Ибрагимов ТИ Вопросы интонационного синтеза татарской речи Реконструкция ритмики письменного текста / ТИ Ибрагимов, М.Р. Сайхунов // Труды Казанской школы по компьютерной и когнитивной лингвистике TEL-2008. - Казань : Изд-во Казан гос ун-та, 2009 - С. 123-128
Подписано в печать 08.04 2010 Формат 60 х 84 Бумага офсетная Гарнитура Тайме Печать офсетная. Уел печ л 1,75. Тираж 100 экз Заказ №К-13
Отпечатано
в Институте языка, литературы и искусства им. Г. Ибрагимова АН РТ 420111, г. Казань, ул Лобачевского, д 2/31, т 292-76-59
Оглавление научной работы автор диссертации — кандидата филологических наук Сайхунов, Мансур Равхатович
ВВЕДЕНИЕ
ГЛАВА 1. Фонетический строй татарского языка. Исторический аспект и современное состояние
1.1. Фонетико-фонологическая система татарского языка
1.2. Интонационный строй татарского языка
1.3. Акцентология в тюркских языках
ГЛАВА 2. Проблема реконструкции звучания орфографического текста на татарском языке
2.1. Прагматически ориентированная фонологическая система татарского языка
2.2. Фонетическая система татарского языка в рамках прикладной фонетики
2.3. Явление редукции кратких гласных в татарском языке
ГЛАВА 3. Ритмо-темпоральные характеристики татарской речи
3.1. Ритмический строй татарского языка
3.2. Паузирование письменной речи в татарском языке
ГЛАВА 4. Прикладной аспект ритмо-темпоральных характеристик применительно к автоматическому синтезу татарской речи
Введение диссертации2010 год, автореферат по филологии, Сайхунов, Мансур Равхатович
Долгое время лингвистика занималась изучением языков в целях усовершенствования преподавания грамматики, обучения родному языку и иностранным языкам. В теоретическом плане основное внимание уделялось типологии языков, что успешно осуществлялось с помощью сравнительно-типологического метода.
Научно-технический прогресс, появление быстродействующих, обладающих практически неограниченной памятью ЭВМ существенно изменили положение дел в лингвистике. Стали возможными постановка и изучение проблемы речевого общения человека с машиной - создание систем распознавания и синтеза речи, различного рода устройств с речевым управлением. Внедрение компьютерных технологий в исследование языка обогатило лингвистику новыми приложениями, способствовало появлению в языкознании новых подходов и методов.
В последние годы прилагаются значительные усилия по компьютерному обеспечению функционирования татарского языка. Так была издана и лицензирована раскладка клавиатуры персонального компьютера с буквами татарского алфавита, созданы электронные учебники и словари, разработана лабораторная версия синтезатора татарской речи по орфографическому тексту. Начаты и продолжаются работы по машинному переводу деловых бумаг с русского, турецкого и немецкого языков на татарский язык, по созданию компьютерного фонда татарского языка.
Исследования в области внедрения компьютерных технологий в функционирование татарского языка привлекли внимание представителей различных дисциплин: математиков, физиков, медиков, психологов и т.д. Это существенно расширило татарское языкознание тематически, обогатило его методами алгоритмического описания задачи и компьютерного анализа речи, способствовало объективной оценке современного состояния и перспектив развития татарского языка.
Диссертационная работа посвящена изучению ритмо-темпоральных характеристик татарского языка. Проведенные по теме исследования ориентированы на улучшение качества синтезированной речи, а именно, синтез просодически организованной речи. Если учесть, что просодические параметры речи накладываются на аллофоны фонем, то решение поставленной задачи предполагает алгоритмическое описание сегментной и супрасегментной структур татарского языка. Такое описание окажется более адекватным звуковой системе татарского языка, а, следовательно, будет и способствовать усовершенствованию его орфографии и орфоэпии.
Актуальность темы диссертации определяется следующими обстоятельствами:
Ритм - одна из основных просодических характеристик речи. Как и словесное ударение, ритм выполняет смыслоразличительную, разделительную и словообъединительную функции. В татарском языкознании ритмо-темпоральные характеристики текста вообще не исследованы; работы, посвященные анализу ритмики, паузации текста отсутствуют.
Исследование ритмо-темпоральных характеристик татарской речи направлено на решение практической задачи, а именно - создание автоматического синтезатора татарской речи. Основное назначение синтезатора - помочь людям, потерявшим зрение, вхождению в мир, в общество.
За последние 50-60 лет состав фонем татарского языка пополнился гласными /<5/, /ы/, /ё (э)/, согласными lei, 1ц1, 1щ1, 1ц1, Isl, что не могло не отразиться на фонологической системе языка. Синтезаторы как преобразователи произвольного орфографического текста в речь представляют необходимый инструмент для проверки целостности графической и фонетической систем, возможности использования языка в новых информационных технологиях.
Целью настоящей диссертационной работы является выявление ритмо-темпоральных особенностей татарской речи, разработка системы правил, которые при наложении на синтезированную на уровне сегментных звуков речь придали бы ей просодическую стройность. Достижение поставленной цели предполагает решение следующих конкретных задач:
1. Установление лежащей в основе ритмической структуры татарского языка речевой единицы, ее характера, природы и функции.
2. Нахождение тонального и динамического контуров ритмической единицы.
3. Выявление свойств редукции кратких гласных в составе ритмической единицы (ритмической группы).
4. Определение средней длительности пауз, соответствующей различным знакам препинания.
5. Создание системы правил просодической параметризации ритмических групп в синтезированной речи.
6. Построение проблемно-ориентированной фонетико-фонологической системы татарского языка.
Научная новизна
Впервые осуществлено исследование ритмо-темпоральной организации текста в указанном аспекте. Особенность проведенного изучения состоит в том, что оно проводится комплексно - выявлена периодически повторяющаяся в речи единица языка, установлены акустические параметры этой единицы и ее роль в улучшении качества синтезированной речи.
Объектом исследования являются прочитанные вслух дикторами -носителями литературного татарского языка - тексты. Экспериментальный материал составили эмоционально-нейтральные отрывки (авторская речь) из художественных произведений татарских писателей-прозаиков.
Предмет исследования - ритмо-темпоральная организация предложения, а также фонетическая структура ритмической группы -характер распределения слогов по длительности, интенсивности и частоте основного тона, выявление зависимости акустических параметров ритмических групп, играющих важную роль в акцентуации речи, от позиции ритмической группы в предложении.
Теоретическая значимость
В лингвистической литературе ритм трактуется как чередование соизмеримых речевых единиц. В акцентных языках такими единицами являются ударные и безударные слоги. Неакцентным языкам, к которым относится татарский язык, подобного рода чередования не характерны. Ритм в таких языках представляет повторяемость ритмических групп. Но, как известно, нет единого определения ритмической группы. К ритмической группе нередко приравнивается как фонетическое слово, так и синтагма, и фраза.
В настоящей работе выявлена базовая ритмическая единица татарского языка, ее фонетическая (просодическая) структура и вариативность. Установлена взаимосвязь между величиной ритмической группы и темпом речи, а также между распределением различных длин пауз и длительностью предшествующих им и следующих за ними ритмических групп.
Практическая значимость
Разрабатываемый синтезатор предназначен для озвучивания произвольного орфографического текста. Если учесть, что в настоящее время принята компьютерная верстка как художественных произведений, так и периодики, то с помощью синтезатора люди, лишенные зрения, получают возможность знакомиться с содержанием печатных изданий.
Результаты работы важны в собственно лингвистическом аспекте, поскольку алгоритмическое описание языка позволяет выявить существующие вариативности в использовании языка и выбрать ту форму, которая способствует сохранению языка.
Достоверность результатов исследования обеспечивается применением современных компьютерных программ акустического анализа речи. Метод «анализ через синтез» сделал возможным осуществление проверки ряда теоретических положений, в частности, о необходимости и достаточности выделенного нами состава фонем для озвучивания орфографических текстов на татарском языке.
Теоретико-методологическую основу исследования составили классические труды по общему языкознанию Фердинанда де Соссюра, И.А. Бодуэна де Куртенэ, JI.B. Щербы, работы в области фонетики JI.P. Зиндера, JI.B. Бондарко, Л.В. Златоустовой, а также исследования татарского языка экспериментально-фонетическими методами таких лингвистов, как В.А. Богородицкий, Г. Шараф, У.Ш. Байчура, Х.Х. Салимов, Т.И. Ибрагимов, Г.М. Сунгатов и др.
Методы исследования
В диссертационной работе применен комплекс методов, включающий: 1) экспериментально-фонетические методы - экспериментально-акустический анализ речи с применением компьютерных программ Speech Analyzer, Sound Forge, Win Pitch Pro, Cool Edit; 2) метод моделирования -создание алгоритмов мелодической, динамической и темпоральной параметризации ритмических групп; 3) методы математической статистики - усреднение измерений длительностей, частоты основного тона, интенсивностей слогов ритмических групп по данным, полученным на основе анализа текстов в произношении различных дикторов; 4) метод «анализ через синтез» - наличие элементной базы и программных ресурсов, необходимых для осуществления опытных преобразований текста в речь, позволяют широко использовать данный метод, который дает исследователю возможность проверить каждое правило просодической параметризации на примере звучания множества фраз; 5) метод лингвистического анализа в работе отражается в описании языка с позиции первичности устной формы по отношению к письменной, а также в оценках изменения языка, в том числе предписываемых нормой, с позиции непротиворечивости системе языка.
Положения, выносимые на защиту:
- Соизмеримые и регулярно повторяющиеся речевые единицы, лежащие в основе ритмической структуры татарского языка.
- Природа и функции ритмической единицы, определение контура распределения длительностей слогов, а также контуров изменения частот основного тона и интенсивностей ритмической единицы.
- Паузирование текста, характер распределения длительностей пауз в соответствии с расстановкой знаков препинания и величины выделяемых ими синтаксических структур.
- Фонетические изменения звуков в речевом потоке, природа и характер редукции кратких гласных.
- Алгоритм просодической параметризации ритмических групп в синтезированной речи.
- Современные системы общения человека с машиной и действующие орфография и орфоэпия татарского языка.
Апробация работы
Основные положения диссертации были изложены во время выступлений с докладами на региональных, всероссийских и международных конференциях: 1) «Теории и практики языкового плюрализма и билингвизма: междисциплинарный подход» - Поволжская научно-практическая конференция студентов, аспирантов, молодых ученых и специалистов. Казань, КГУ, 7 декабря 2006 г.; 2) «ТЕЬ-2006» - Казанская школа по компьютерной и когнитивной лингвистике. Казань, КГУ, АН РТ,
9-11 декабря 2006 г.; 3) «Проблемы сохранения языка и культуры в условиях глобализации» - VII Международный симпозиум «Языковые контакты Поволжья». Казань, КГУ, 2-5 июля 2008 г.; 4) «TEL-2008» - Казанская школа по компьютерной и когнитивной лингвистике. Казань, КГУ, АН РТ,
10-13 декабря 2008 г.
Публикации
По материалам диссертации опубликованы три статьи (одна из них в журнале, входящем в перечень ВАК РФ), четыре тезиса докладов на конференциях различного уровня.
Публикации в изданиях, рекомендованных ВАК Министерства образования и печати РФ:
1) Ибрагимов Т.И. К проблеме реконструкции звучания письменного текста. Редукция кратких гласных в татарском языке / Т.И. Ибрагимов, М.Р. Сайхунов // Ученые записки Казанского государственного университета. Серия гуманитарные науки. Книга 3 / Науч. ред. М.Х. Салахов. - Казань : Изд-во Казан, гос. ун-та, 2009. -С. 288-298.
Другие публикации:
2) Сайхунов М.Р. Ритмо-темпоральные характеристики татарской разговорной речи / М.Р. Сайхунов // Теории и практики языкового плюрализма и билингвизма: междисциплинарный подход. Материалы Поволжской научно-практической конференции студентов, аспирантов, молодых ученых и специалистов. 7 декабря 2006 года / Под. ред. В.З. Гарифуллина. - Казань : Изд-во Казан, гос. ун-та, 2007.-С. 60-62.
3) Сайхунов М.Р. Татар теле фонетикасын эксперименталь юнэлештэ ейрэнунец тарихы Ьэм максат-бурычлары / М.Р. Сайхунов // Ученые записки - 2006: Сборник / Науч. ред. И.А. Гилязов. - Казань : Изд-во Казан, гос. ун-та, 2007. - С. 349-350.
4) Ибрагимов Т.Н. Вариативность чтения текстов на татарском языке: паузирование / Т.И. Ибрагимов, Ф.И. Салимов, М.Р. Сайхунов // Труды Казанской школы по компьютерной и когнитивной лингвистике ТЕЛ-2006. - Казань, 2007. - С. 117-121.
5) Сайхунов М.Р. Ритмическая структура татарской разговорной речи / М.Р. Сайхунов // Ученые записки - 2007: Сборник / Науч. ред. И.А. Гилязов. - Казань : Изд-во Казан, гос. ун-та, 2008. - С. 237-239.
6) Синтез татарской речи по тексту. Состояние и перспективы / Т.И. Ибрагимов, Ф.И. Салимов, P.P. Хусаинов, М.Р. Сайхунов // Проблемы сохранения языка и культуры в условиях глобализации: Материалы VII Международного симпозиума «Языковые контакты Поволжья», 2-5 июля 2008 г. / Науч. ред. И.А. Гилязов. - Казань : Изд-во Казан, гос. ун-та, 2009. - С. 88-92.
7) Ибрагимов Т.И. Вопросы интонационного синтеза татарской речи. Реконструкция ритмики письменного текста / Т.И. Ибрагимов, М.Р. Сайхунов // Труды Казанской школы по компьютерной и когнитивной лингвистике TEL-2008. - Казань : Изд-во Казан, гос. унта, 2009.-С. 123-128.
Работа выполнена на кафедре современного татарского языка факультета татарской филологии и истории и в лаборатории экспериментальной фонетики филологического факультета КГУ.
Структура работы
Диссертационная работа состоит из введения, четырех глав с анализом результатов, заключения, библиографического списка (195 наименований), приложения.
Заключение научной работыдиссертация на тему "Ритмо-темпоральные характеристики татарского языка в плане автоматического синтеза речи"
Выводы
В рамках проблемы автоматического синтеза татарской речи проведено прагматически ориентированное исследование звукового строя татарского языка.
1. Определена ритмическая единица речи, построены контуры изменения длительностей, частот основного тона и интенсивностей слогов в пределах ритмических единиц.
2. Выявлены особенности фонетических изменений звуков на границе слогов и слов, входящих в одну ритмическую группу, характер и природа редукции кратких гласных.
3. Определены особенности паузирования текста, вариативность паузирования, соответствие расстановок пауз знакам препинания.
4. Построены алгоритмы автоматической параметризации ритмо-темпоральной структуры предложения, а также редукции кратких гласных.
5. Разработана целостная фонетико-фонологическая система татарского языка на базе описания В.А. Богородицким «народного говора» и с г использованием метода «анализ через синтез». Система позволяет озвучить орфографические тексты в рамках звукового строя татарского языка.
ЗАКЛЮЧЕНИЕ
Развитие вычислительной техники, появление быстродействующ компьютеров с практически неограниченной нам™ сделало возможной
Го т— и Р— 0б— ЧеЛ0ВеКа ° На ом языке, за последние 50-60 лет создан, систем, распознав^ и синтеза речи, а также множество различных устройств с рече*ьш —ением. Значение работ по решению указанных прикладных зада. не ограничивается разработкой технологий и технических устройств. Исследования по лингвистическому обеспечению систем распознавав и синтеза речи одновременно направлены на создание искусственно интеллекта, т.е. системы, способной обИаться с человеком с понимаем его языка. таким образом, работы по созданию систем распознавания и синтеза речй помимо прикладного значения имеют непосредственное отио„е к исследованию речевой деятельности человека вообше и пр цессоз восприятия и порождения речи носителем языка в частности. Изу™ рече ой коммуникации в указанных аспектах целесообразно проводив на разноси— языках, функциональная мощность языков также не ймеет существенного значения.
Разрабатываемый синтезатор татарской речи относится к типу «текст речь» и предназначен для преобразования произвольного орфографического текста в устную форму язык, Основным блоком данного типа синтезаторов является ав—ческий транскриптор, который должен перевести буквы в речевые единицы. В процессе построения синтезаторов выяснилось, что сложность алгоритма транскрипции для разных языков различи, Так, если в финском языке для перевода орфоэпического текста в фонетическую запись достаточно двух-трех десятков правил, то для фонетической транскрипции текстов английского языка потребуется несколько сотен правил и словарь исключений в несколько тысяч слов.
Примеры автоматического синтеза татарской речи по тексту показали, что возможность построения автоматического транскриптора для татарского языка сопряжена со значительными трудностями. Современная орфография татарского языка представляет механическое объединение трех языковых систем - татарского, русского и арабского. Транскрипция орфографического текста усложняется следующими двумя обстоятельствами: 1) наличием в татарском языке огромного количества разночитаемых словоформ и 2) отсутствием в языке фонетико-артикуляторной базы, способной обеспечить требования орфоэпий татарского и русского языков.
Первая задача осложняется существующим в орфографии правилом, согласно которому грамматические формы заимствованных основ формируются путем присоединения к концу слова аффиксов татарского языка. Нередко для того чтобы выяснить, какая часть словоформы является русским заимствованием, а какая - представляет сочетание аффиксов татарского языка, требуется произвести морфологический анализ словоформы. Но для выполнения морфологического анализа необходимо установить наличие в словоформе русской основы (аркада, таксагыз, тарасын). Получается порочный круг.
Что касается второй задачи - наличия необходимого количества фонетических ресурсов, то такового нет и быть не может. Фонетическая система каждого языка представляет единое целое, в котором как фонемы, так и речевые звуки вступают в парадигматические и синтагматические отношения. Включение в фонетическую систему татарского языка трех гласных и четырех согласных русского языка не в состоянии обеспечить прознесение по-русски 40% заимствованной лексики. Для татарского языка не характерны ни йотированные согласные, ни мягкие [ль], [нь], ни широкое произношение гласных, ни употребление консонантных групп в одном слоге и т.д. Другими словами, принятые орфоэпические нормы - произносить заимствования так, как они произносятся в языке доноре - не обеспечены фонетическими ресурсами татарского языка.
Известно, что звуковая оболочка речи, речевое сообщение состоит из двух типов звуковых единиц: сегментных и супрасегментных. Как сегментные, так и супрасегментные единицы языка представляют систему, т.е. являются тем речевым звуком, а также тем репрезентантом просодии лишь в парадигматическом и синтагматическом противопоставлении с другими единицами данного типа звукового множества.
В настоящей диссертационной работе исследована супрасегментная система, а именно выявлена и описана ритмо-темпоральная структура татарского языка. Под ритмо-темпоральной структурой понимается сочетание ритмической единицы и паузы, следующей непосредственно за ритмической группой.
Ритм - естественное свойство речи - зависит от структуры языка, темпа речи, а также от эмоционального состояния говорящего. В акцентных языках, таких как русский, английский, важную роль в организации ритмики играет ударение. В языках, в которых ударение отсутствует, в построении ритмики речи основную роль играет ритмическая группа - фрагмент речи, состоящий из одного слова или сочетания слов, обладающих интонационной и смысловой целостностью. Слоги в составе ритмической группы организованы по тональности, интенсивности и длительности.
Татарский язык не принадлежит к акцентным языкам. Вместе с тем более 40% лексики современного татарского языка составляют русские заимствования, которые согласно орфографии и орфоэпии пишутся и произносятся так, как в оригинале. В орфографических словарях татарского языка нередко указывается, как данное заимствование пишется и на какой слог падает ударение.
Построение системы просодического оформления синтезированных предложений, содержащих в своем составе как исконно татарские, так и заимствованные слова, не представляется возможным. В диссертационной работе в силу указанных обстоятельств, а именно, невозможности при существующей орфографии и орфоэпии автоматической фонетической транскрипции произвольного текста и просодического оформления синтезированных предложений, решается проблема создания целостной прагматически ориентированной фонетико-фонологической системы татарского языка.
Создание ее проводилось на основе учения о фонеме и речевых звуках И.А. Бодуэна де Куртенэ, В.А. Богородицкого, Л.В. Щербы, Л.Р. Зиндера. Основным в их учении является то, что фонема - элемент речевой деятельности носителя языка, а не просто текста. В речи фонемы вычленяются и закрепляются в языковом сознании носителей, поскольку ассоциируются со значениями морфем. Речевой звук, выражающий значение морфемы либо разграничивающий морфемы, оказывается в фонологически сильной позиции и обособляется как артикуляторно-акустическая единица речи.
Исходя из функциональной значимости речевых звуков в различении значений морфем, в татарском языке были выделены следующие 9 гласных (1а/, Ы, /о/, /в/, 1у/, /у/, /ы/, lei, lul) и 23 согласных (161, lei, /г/, Idl, htcl, /з/, litl, IkI, 1л1, ImI, Inl, /ц/, Inl, I pi, Id, I ml, /ф/, Ixl, Ihl, I ml, Ы1, Iwf) фонемы. Ha множестве грамматических морфем установлено, что указанные фонемы удовлетворяют условиям необходимости и достаточности. На основе синтагматических отношений выделенных фонем была составлена дифоннная база синтезатора татарской речи. Отметим, что проведенные на базе дифонов многочисленные эксперименты по синтезу речи (по преобразованию текста в речь) не обнаружили нехватки фонологических ресурсов языка.
На базе выделенных фонем нами разработана фонетическая система устной формы татарского языка. При этом за основу устной формы татарского языка был принят «народный говор», описанный в трудах В.А. Богородицкого. Необходимо отметить, что В.А. Богородицкий на рубеже XIX - XX веков методами полевой лингвистики собрал богатый материал по артикуляторной и акустической фонетике татарского языка. Данные его наблюдений над произношением, татарами русских заимствований, теоретические обобщения собранного материала, свободные от орфографических и орфоэпических норм, являются бесценным источником в деле восстановления звукового строя татарского языка.
Предложенная в результате выполненного исследования фонетическая система так же, как и у В.А. Богородицкого, является целостной, т.е. не содержит различных правил для произношения заимствований и исконно татарских слов. В части произнесения заимствований эта система имеет некоторые особенности, а именно, в заимствованиях закон сингармонизма распространяется не на слова, а только на слоги. Иначе говоря, в словах заимствованных могут встречаться как палатализованные, так и непалатализованные слоги. Однако в пределах слогов все звуки должны быть либо палатальными, либо непалатальными (корабль - кэ+ра+бел, маркетинг - мар+ки+ти+нег, мануфактура - ма+ну+фэк+ту+ра).
Вынесенная на защиту проблема - исследование ритмо-темпоральных особенностей татарской речи. Как было отмечено, разрабатываемый синтезатор речи представляет собой пеобразователь произвольного орфографического текста в речь. С учетом данного обстоятельства ритмо-темпоральные характеристики татарской речи изучались на прочитанных диктором письменных текстах. Как показали исследования, дикторы при чтении текстов делают паузы не только в местах пунктуаций. Кроме того, в текстах нередко встречаются не обеспеченные паузой запятые. Было выявлено, что количество речевых тактов зависит не только и не столько от сложности предложения, сколько от наличия в предложении обособленных обстоятельств, групп субъекта и предиката. Из анализа грамматической структуры речевых тактов выяснилось, что границы их совпадают с границами составляющих предложения - субъекта, предиката и обстоятельств. Указанные компоненты предложения представляют отдельные ритмические группы и, как таковые, обладают просодической структурой - своеобразным распределением частот основного тона (мелодическим контуром), интенсивностей (динамическим контуром) и длительностей (контуром распределения длительностей слогов). Чередование ритмических групп с паузой, на которую они заканчиваются, в данной работе принято за ритмо-темпоральную характеристику татарской речи.
При этом необходимо отметить, что длительность пауз, следующих за ритмической группой, связана как с длиной предшествущей ритмической группы, так и с длиной следующей за паузой ритмической группы.
В работе алгоритм ритмического структурирования повествовательного предложения представлен в виде совокупности трех таблиц. В предложенном нами алгоритме просодическая параметризация синтезированного предложения осуществляется с учетом: а) позиции ритмической группы; б) позиции фонослова во фразе; в) позиции слога во фразе; г) открытости (закрытости) слога; д) полной или частичной открытости (закрытости) слога; е) краткости (долготности) слогообразующего гласного.
Приведены данные о длительностях пауз, соответствующих местам расположения отдельных знаков препинания.
Просодическая структура ритмических групп различается в зависимости от их позиции в предложении.
Одной из особенностей звукового строя татарского языка является наличие в нем кратких гласных. К ним относятся гласные /ы/, lei, /о/, lei.
Важным свойством кратких гласных является подверженность их редукции. Редукция может быть полной и частичной. При частичной редукции степень сокращения длительности гласного зависит от многих факторов, которые непременно должны быть учтены. В противном случае при синтезе речи возможно значительное ухудшение качества ее звучания.
Так, проведено сопоставительное изучение долгих и кратких гласных. Выявлено, что степень редукции кратких гласных зависит от следующих факторов: структуры слога, в котором они находятся, контекста, позиции в слове, длины слова. Краткие гласные наиболее подвержены редукции в составе слогов типа СГ. Полная редукция наблюдается в словах с конструкцией С1Г1 + (С21Г2С22; С21Г2) + (С31Г3; С31Г3С32) , когда Ci - глухой смычный, С21 - (телэгем - тлэ+гем, кврисец - кри+сец). Менее всего подвержены редукции краткие гласные в абсолютном конце слова, а также в составе слогов типа ГС.
Подверженность редукции кратких гласных вызвана, согласно полученным данным, не следованием их в безударной или ударной позиции слова (как это делается некоторыми фонетистами), а их артикуляторными особенностями.
Рассмотрению работы синтезатора татарской речи посвящен специальный раздел. Согласно приведенной блочной схеме входной текст проверяется на наличие в предложении аббревиатур, а таюке различного рода символов. Работа над этим блоком ввиду нечастого появления аббревиатур в тексте пока отложена. Алгоритм фонематической транскрипции реализован в программе и апробирован в разрабатываемом синтезаторе. В основу алгоритма положен состав фонем, выделенных на основе учения о фонеме и фонетических единицах речи основоположников Казанской лингвистической школы. Главная функция третьего блока -сегментация предложения на ритмические группы. На данном этапе неполный синтаксический анализ входного предложения не производится.
Разделение предложения на ритмические группы осуществляется на основе знаков препинания. Блок фонетической транскрипции выполняет редукцию гласных, формирует стыки слогов и слов, входящих в одну ритмическую группу. Блок просодической параметризации формирует, согласно разработанному нами алгоритму, ритмо-мелодическую структуру ритмических групп.
К настоящему моменту синтезатор позволяет успешно применять методику «анализ через синтез» в исследовании языка во всех его проявлениях. Следует отметить, что многократное аудирование синтезированнных текстов по разработанной фонологической и фонетической системе языка не обнаружило сколь-нибудь существенных изъянов в их звучании.
Список научной литературыСайхунов, Мансур Равхатович, диссертация по теме "Языки народов Российской Федерации (с указанием конкретного языка или языковой семьи)"
1. Абдуллаев Ш.М. Место и природа словесного ударения в современном азербайджанском языке (в свете экспериментальных данных) : автореф. дис. . канд. филол. наук / Ш.М. Абдуллаев. Баку, 1964. - 23 с.
2. Аванесов Р.И. Фонетика русского литературного языка / Р.И. Аванесов. — М. : Изд-во МГУ, 1956. 240 с.
3. Акбаев Ш.Х. О причинах редукции в тюркских языках / Ш.Х. Акбаев // Советская тюркология. 1986. - №3. - С. 3-13.
4. Антипова A.M. Направления исследований по интонации в современной лингвистике / A.M. Антипова // Вопросы языкознания. 1986. - №1. — С. 122-132.
5. Аралбаев Ж.А. Вокализм казахского языка: очерки по экспериментальной фонетике и фонологии) / Ж.А. Аралбаев. Алма-Ата : Наука, 1970. - 180 с.
6. Артемов В.А. Экспериментальная фонетика / В.А. Артемов. М. : Изд. лит. на иностр. яз., 1956. - 228 с.
7. Асылгараев Ш.Н. Синтагматическое членение татарской речи : Экспериментально-фонетическое исследование : автореф. дис. . канд. филол. наук / Ш.Н. Асылгараев. Казань, 1968. - 22 с.
8. Ахатов Г.Х. Диалект западносибирских татар / Г.Х. Ахатов. Уфа : Типография городского профессионально-технического училища №1, 1963.- 195 с.
9. Ахатов Г.Х. Диалект западносибирских татар: автореф. дис. . д-ра филол. наук / Г.Х. Ахатов. Ташкент, 1965. - 35 с.f
10. Назарбаева З.М. Казахская интонация / З.М. Базарбаева. Алматы : Дайк-Пресс, 2008.-284 с.
11. Н.Байчура У.Ш. Звуковой строй татарского языка : в 2 ч. / У.Ш. Байчура. -Казань : Изд-во КГУ, 1959. -Ч. 1. 185 с.
12. Байчура У.Ш. Звуковой строй татарского языка : в 2 ч. / У.Ш. Байчура. -Казань : Изд-во КГУ, 1961. Ч. 2. - 392 с.
13. Байчура У.Ш. Некоторые экспериментальные данные о мелодике речи и словесном ударении в уйгурском языке / У.Ш. Байчура // Структура и история тюркских языков. М., 1971.
14. Бакеева Д.Х. Сопоставительная фонетика английского и татарского языков / Д.Х. Бакеева. Казань : Изд-во Казан, ун-та, 1985. - 141 с.
15. Бакиров М.Х. Закономерности тюркского и татарского стихосложения в свете экспериментальных исследований : автореф. дис. . канд. филол. наук / М.Х. Бакиров. Казань : Изд-во КГУ, 1972. - 76 с.
16. Балтаева P.M. Интонационная структура общего вопроса в современном татарском языке : автореф. дис. . канд. филол. наук / P.M. Балтаева. -Казань, 1973.-24 с.
17. Баскаков Н.А. Каракалпакский язык / Н.А. Баскаков. М. : Изд-во АН СССР, 1951.-Т. 2.-544 с.
18. Блохина Л.П. Просодические характеристики речи и методы их анализа / Л.П. Блохина. М., 1980.
19. Богородицкий В.А. Движение тона в словах двусложных и трехсложных в татарском языке по экспериментальным данным / В.А. Богородицкий // Вестник научного общества татароведения. Казань, 1926. - № 4. - С. 39.
20. Богородицкий В.А. Введение в татарское языкознание в связи с другими тюркскими языками / В.А. Богородицкий ; под. ред. чл.-кор. АН СССР проф. Н.К. Дмитриева. 2-е изд., испр. и доп. - Казань : Татгосиздат, 1953.-220 с.
21. Бодуэн де Куртенэ И.А. Избранные труды по общему языкознанию : в 2 т. / И.А. Бодуэн де Куртенэ М. : Изд-во АН СССР, 1963. - Т. 1. -384 с.
22. Бодуэн де Куртенэ И.А. Избранные труды по общему языкознанию : в 2 т. / И.А. Бодуэн де Куртенэ М. : Изд-во АН СССР, 1963. - Т. 2. -392 с.
23. Бондарко Л.В. Звуковой строй современного русского языка / JI.B. Бондарко. -М. : Просвещение, 1977. 175 с.
24. Бондарко JI.B. Полезные признаки и организация фонемной классификации / JI.B. Бондарко // Звуковой строй языка. М., 1979. - С. 20-26.
25. Бондарко JI.B. Фонетическое описание языка и фонологическое описание речи / Л.В. Бондарко. Л. : Изд-во ЛГУ, 1981. - 199 с.
26. Брызгунова Е.А. Практическая фонетика и интонация русского языка / Е.А. Брызгунова. М. : Изд-во МГУ, 1963. - 307 с.
27. Виллер М.А. О зависимости французской ритмической группы от стиля речи / М.А. Виллер // Звуковой строй языка. М. : Наука, 1979. - С. 4451.
28. Винцюк Т.К. Анализ, распознавание и интерпретация речевых сигналов / Т.К. Винщок. Киев : Наукова Думка, 1987. - 261 с.
29. Владимирский В.А. К вопросу о социолингвистических принципах заимствования общественно-политических терминов в младописьменных языках народов СССР / В.А. Владимирский //
30. Социолингвистические проблемы развивающихся стран / Под ред. Ю.Д. Дешериева, А.Н. Баскакова. М. : Наука, 1975. - С. 303-315.
31. Газизов Р.С. Сопоставительная грамматика татарского и русского языков / Р.С. Газизов. Казань : Таткнигоиздат, 1966. - 368 с.
32. Гиганов И. Грамматика татарского языка / И. Гиганов. СПб., 1801. -188 с.
33. Гизатуллин Н.С. Сравнительно-типологический анализ интонации коммуникативных типов предложений английского и татарского языков в учебных целях / Н.С. Гизатуллин // Обучение иностранному языку в условиях билингвизма. Казань : КГПИ, 1981. - С. 117-145.
34. Джунисбеков А.Д. Есть ли словесное ударение в казахском языке / А.Д. Джунисбеков // Звуковой строй языка. М. : Наука, 1979. - С. 104108.
35. Джунисбеков А.Д. Сингармонизм в казахском языке / А.Д. Джунисбеков. Алма-Ата : Наука, 1980. - 77 с.
36. Джунисбеков А.Д. Просодика слова в казахском языке / А.Д. Джунисбеков. Алма-Ата : Наука, 1987. - 92 с.
37. Дмитриев Н.К. Грамматика башкирского языка / Н.К. Дмитриев. М. : Изд-во АН СССР, 1948а. - 276 с.
38. Дмитриев Н.К. Каюм Насыри филолог / Н.К. Дмитриев // Каюм Насыри. Материалы научных сессий, посвященных 120 летию со дня рождения. 1825-1945. - Казань : Татгосиздат, 19486. - С. 41-61.
39. Дмитриев Н.К. К фонетике татарского и русского языков / Н.К. Дмитриев // Очерки по методике преподавания русского и родного языков в татарской школе. М. : Учпедгиз, 1952. - С. 6-11.
40. Златоустова Л.В. Фонетические единицы русской речи / Л.В. Златоустова. -М. : Изд-во Моск. ун-та, 1981. 108 с.
41. Ибрагимов Т.И. Изучение образования слогов и структуры их сочетаний в татарском литературном языке : автореф. дис. . канд. филол. наук / Т.И. Ибрагимов. Казань : Изд-во КГПИ, 1970. - 20 с.
42. Ибрагимов Т.И. К изучению образования речевых звуков / Т.И. Ибрагимов. Деп. в ВИНИТИ №7511-84.
43. Ибрагимов Т.И. К определению состава фонем татарского языка / Т.И. Ибрагимов // Сборник «Языковые уровни и их взаимодействие». -Казань, 1990а.-С. 143-151.
44. Ибрагимов Т.И. О характере словесного ударения в татарском языке / Т.И. Ибрагимов // Тезисы докладов Всесоюзной конференции «Тюркская фонетика 90». - Алма-Ата, 19906. - С. 52-53.
45. Ибрагимов Т.И. К определению формантных частот гласных татарского языка в рамках теории речеобразования / Т.И. Ибрагимов // Литература и язык в контексте культуры и общественной жизни. Казань : Изд-во КГУ, 1992а.-С. 116-117.
46. Ибрагимов Т.И. К описанию звуковой системы татарского языка / Т.И. Ибрагимов // Труды Международной тюркологической конференции «Языки, духовная культура и история тюрков: традиции и современность». — Казань, 19926. С. 232-234.
47. Ибрагимов Т.И. Ускоренное обучение татарскому языку / Т.И. Ибрагимов. Казань : Изд-во КГУ, 1993.- 122 с.
48. Ибрагимов Т.И. К проблеме фонематического представления орфографического текста в синтезаторе татарской речи / Т.И. Ибрагимов // Труды математического центра им. Н.И. Лобачевского. Казань,1999. Т. 4. Компьютерная лингвистика. - С. 84-92.
49. Ибрагимов Т.И. К проблеме транскрипции и транслитерации татарского текста / Т.И. Ибрагимов, Ф.И. Салимов // II школа-семинар «Компьютерная и когнитивная лингвистика» Тезисы докладов. Казань,2000.-С. 8.
50. Ибрагимов Т.И. Синтезатор татарской речи. Формирование ритмических групп в речевом потоке / Т.И. Ибрагимов, Ф.И. Салимов, P.P. Хусаинов // Труды казанской школы по компьютерной и когнитивной лингвистике TEL-2000. Казань, 2001. - С. 80-86.
51. Ибрагимов Т.И. Синтезатор татарской речи как инструмент исследования языка / Т.И. Ибрагимов // Русская и сопоставительная филология. Материалы итоговой научной конференции. Казань : Унипресс, 2002а. - С. 27-29.
52. Ибрагимов Т.И. Синтезатор татарской речи: вопросы транскрипции заимствований и планирование языка / Т.И. Ибрагимов // Компьютернаялингвистика и интеллектуальные технологии. Труды Международного семинара Диалог-2002. М., 20026. - Т. 2. - С. 228-234.
53. Ибрагимов Т.И. К моделированию просодии ритмической группы при синтезе татарской речи / Т.И. Ибрагимов // Сборник докладов Международной конференции «Когнитивное моделирование в лингвистике». Варна, 2003. - С. 137-142.
54. Ибрагимов Т.И. К формированию акустической базы синтезатора татарской речи / Т.И. Ибрагимов // Доклады международной конференции Диалог-2004. М. : Наука, 2004а. - С. 237-239.
55. Ибрагимов Т.И. Вариативность чтения текстов на татарском языке: паузирование / Т.И. Ибрагимов, Ф.И. Салимов, М.Р. Сайхунов // Труды Казанской школы по компьютерной и когнитивной лингвистике TEL-2006. Казань, 2007. - С. 117-121.
56. Иванов М. Татарская грамматика / М. Иванов. Казань, 1842. - 311 с.
57. Исследования по сравнительной грамматике тюркских языков. Ч. 1. Фонетика. М. : Изд-во АН СССР, 1965. - 336 с.
58. Исхаков Ф.Г. Об отдельных фонемах татарского языка / Ф.Г. Исхаков // Исследования по сравнительной грамматике тюркских языков. Ч. 1. Фонетика. М. : Изд-во АН СССР, 1955.
59. Исхаков Ф.Г. Законы словесного ударения в татарском языке / Ф.Г. Исхаков // Исследования по сравнительной грамматике тюркских языков. Ч. 1. Фонетика. М. : Изд-во АН СССР, 1965. - С. 329-332.
60. Ишбердин Э.Ф. Ударение и система гласных башкирского языка / Э.Ф. Ишбердин // Советская тюркология. 1980. - №5. - С. 55-58.
61. Казем-Бек A.M. Общая грамматика турецко-татарского языка /
62. A.M. Казем-Бек. Казань, 1846. - 467 с.
63. Кантер JT.A. Системный анализ речевой интонации / JI.A. Кантер. М. : Высшая школа, 1988. - 127 с.
64. Капенов Г.С. Система изучения фонетики русского языка в казахской школе / Г.С. Капенов. Алма-Ата, 1975.
65. Касевич В.Б. Фонологические проблемы общего и восточного языкознания / В.Б. Касевич. М., 1983. - 295 с.
66. Касевич В.Б. Ударение и тон в языке и речевой деятельности /
67. B.Б. Касевич, Е.М. Шабельникова, В.В. Рыбин. JI. : Изд-во ЛГУ, 1990. - 244 с.
68. Кейтер Дж. Компьютеры синтезаторы речи / Дж. Кейтер ; пер. с англ. Э.Я. Пастрона ; под ред. В.А. Усика. - М. : Мир, 1985. - 237 с.
69. Кенесбаев С.К. К вопросу о закономерностях акцентуации в казахском языке / С.К. Кенесбаев // Вопросы казахской филологии. Алма-Ата, 1964.-С. 11-12.
70. Компилятивный синтез татарской речи / Т.И. Ибрагимов, Ф.И. Салимов, P.P. Хусаинов, Г.А. Давлетшина // Труды международного семинара по компьютерной лингвистике и ее приложениям Диалог'98. Таруса, 1998.-С. 472-477.
71. Кононов А.Н. Грамматика современного турецкого литературного языка / А.Н. Кононов. М. : Изд-во АН СССР, 1956. - 569 с.
72. Кононов А.Н. Грамматика современного узбекского литературного языка / А.Н. Кононов. М., 1960. - 446 с.
73. Кривнова О.Ф. Автоматический синтез русской речи по произвольному тексту / О.Ф. Кривнова // Труды международного семинара по компьютерной лингвистике и ее приложениям Диалог'98. Таруса, 1998. -С. 498-511.
74. Кривнова О.Ф. Паузирование при автоматическом синтезе речи / О.Ф. Кривнова, И.С. Чардин // Материалы конференции «Теория и практика речевых исследований (АРСО-99)». М., 1999. - С. 104-128.
75. Кривнова О.Ф. Генерация тонального контура фразы в системах автоматического синтеза фразы / О.Ф. Кривнова // Труды Международного семинара по компьютерной лингвистике и ее приложениям Диалог '2000. Протвино, 2000. - Т. 2. - С. 211-220.
76. Кузнецов В.Б. Лингвистическое обеспечение систем синтеза речи по правилам: достижения, проблемы и перспективы / В.Б. Кузнецова. -М. : ИНИОН РАН, 1992. 53 с.
77. Махмудов Г. Практическое руководство к изучению татарского языка / Г. Махмудов. Казань, 1857. - 255 с.
78. Махмутов М.И. Фонетическое и грамматическое освоение арабских заимствований в татарском литературном языке : дис. . канд. филол. наук / М.И. Махмутов. Казань, 1966. - 361 л.
79. Махмутова Л.Т. Опыт исследования тюркских диалектов. Мишарский диалект татарского языка / Л.Т. Махмутов. М. : Наука, 1978. - 271 с.
80. Михайлов В.Г. Измерение параметров речи / В.Г. Михайлов, Л.В. Златоустова ; под ред. М.А. Сапожкова. М. : Радио и связь, 1987. -168 с.
81. Насыри К. Краткая татарская грамматика / К. Насыри. Казань : Тип. Имп. ун-та, 1860.-80 с.
82. Потапова Т.Д. Об ударении в турецких топонимах / Т.Д.Потапова // Советская тюркология. 1978. - №5. - С. 79-91.
83. Потапова Р.К. Новые информационные технологии и лингвистика / Р.К. Потапова. М., 2002. - 574 с.
84. Проблемы и методы экспериментально-фонетического анализа речи / под. ред. Л.Р. Зиндера и Л.В. Бондарко. Л. : Изд-во ЛГУ, 1980. - 151 с.
85. Радлов В.В. Опыт словаря тюркских наречий : в 4 т. / В.В. Радлов. -СПб., 1893.-Т. 1.-66 с.
86. Радлов В.В. Опыт словаря тюркских наречий : в 4 т. / В.В. Радлов. -СПб., 1899.-Т. 2. -64 с.
87. Радлов В.В. Опыт словаря тюркских наречий : в 4 т. / В.В. Радлов. -СПб., 1905.-Т. 3.-98 с.
88. Радлов В.В. Опыт словаря тюркских наречий : в 4 т. / В.В. Радлов. -СПб., 1911.-Т. 4.-107 с.
89. Салимов Х.Х. Спектральный анализ татарских гласных : автореф. дис. . канд. филол. наук/Х.Х. Салимов. Казань, 1975. - 24 с.
90. Салимов Х.Х. Просо дическая система татарского языка: дис. . д-ра филол. наук / Х.Х. Салимов. Елабуга, 1999. - 366 л.
91. Сатгаров Г.Ф. Сопоставительный анализ звукового состава татарского литературного языка и диалектов / Г.Ф. Саттаров // Вопросы татарского языкознания. 19656. - С. 120-146.
92. Светозарова Н.Д. Интонационная система русского языка / Н.Д. Светозарова. Л. : Изд-во ЛГУ, 1982. - 175 с.
93. Современный татарский литературный язык: Лексикология. Фонетика. Морфология / Н.Б. Бурганова, М.З. Закиев, Х.Р. Курбатов и др. М. : Наука, 1969.-380 с.
94. Солнцев В.М. Язык как системно-структурное образование / В.М. Солнцев. М. : Наука, 1971.-292 с.
95. Сорокин В.Н. Синтез речи / В.Н. Сорокин. М. : Наука, 1992. - 391 с.
96. Соссюр Ф. де. Курс общей лингвистики / Ф. де Соссюр. М. : Либроком, 2009. - 256 с.
97. Старостов Л.Н. Об ударении в турецком языке / Л.Н. Старостов // Тр. Военного инст. иностран. языков. 1953. - №2. - С. 98-119.
98. Сунгатов Г.М. Экспериментально-фонетическое исследование татарской диалектной речи / Г.М. Сунгатов. Казань : Сиддхи-секьюрити, 2002. - 108 с.
99. Татарская грамматика / под ред. М.З. Закиева, Ф.А. Ганиева, К.З. Зиниатуллиной. Казань : Татарское книжное издательство, 1995. -Т. 1.-584 с.
100. Татарская энциклопедия / под. ред. М.Х. Хасанова. Казань : Идель-Пресс, 2002.-Т. 1.-671 с.
101. Трофимов М.И. О смыслоразличительной функции ударения в узбекском языке / М.И. Трофимов // Советская тюркология. 1980. -№4. - С. 63-71.
102. Троянский А. Краткая татарская грамматика / А.Троянский. СПб., 1814.-199 с.
103. Тумашева Д.Г. Диалекты сибирских татар / Д.Г. Тумашева. Казань : Изд-во Казан, ун-та, 1977. - 294 с.
104. Фант Г. Акустическая теория речеобразования / Г. Фант; пер. с англ. J1.A. Варшавского и В.И. Медведева ; под ред. B.C. Григорьева. М. : Наука, 1964.-284 с.
105. Фант Г. Анализ и синтез речи / Г. Фант ; пер. с англ. B.C. Лозовского и И.В. Бахмутовой ; под ред. Н.Г. Загоруйко. Новосибирск : Наука, 1970.- 167 с.
106. Фланаган Дж. Анализ, синтез и восприятие речи / Дж. Фланаган ; под ред. А.А. Пирогова ; пер. с англ. М. : Связь, 1968. - 396 с.
107. Фонетика спонтанной речи / под ред. Н.Д. Светозаровой. Л. : Изд-во ЛГУ, 1988.-245 с.
108. Хальфин И. Азбука и грамматика татарского языка / И. Хальфин. -Казань, 1809.- 106 с.
109. Хальфин С. Азбука татарского языка с обстоятельным описанием букв и складов / С. Хальфин. М., 1778. - 55 с.
110. Харисов Ф.Ф. Учимся говорить по-татарски / Ф.Ф. Харисов, Ч.М. Харисова. Наб. Челны : Изд-во КамАЗ, 1992. - 128 с.
111. Херари Ф. К построению общего исчисления распределения фонем / Ф. Херари, Г. Пейпер // Математическая лингвистика. М., 1964. - С. 1146.
112. Шараф Г. К вопросу о принятии для тюркских народностей латинского шрифта / Г. Шараф // Вестник науч. об-ва татароведения. 1926. - №5. -С. 15-80.
113. Шараф Г. Палятограммы звуков татарского языка сравнительно с русскими / Г. Шараф. Казань, 1927. - 40 с.
114. Шараф Г. Сонорная длительность татарских гласных / Г. Шараф. -Казань, 1928.-88 с.
115. Шеворошкин В.В. Звуковые цепи в языках мира /В.В. Шеворошкин. — М. : Наука, 1969.- 187 с.
116. Щерба J1.B. Фонетика французского языка / Л.В. Щерба. М. : Изд-во лит-ры на иностр. яз., 1957. - 311 с.
117. Щерба Л.В. Избранные труды по языкознанию и фонетике / Л.В. Щерба.-Л. : Изд-во ЛГУ, 1958.-Т. 1.- 182 с.
118. Щерба Л.В. Языковая система и речевая деятельность / Л.В. Щерба. -Л. : Наука, 1974.-428 с.
119. Щерба Л.В. Языковая система и речевая деятельность / Л.В. Щерба. -Изд. 2-е, стереотипное. М. : Едиториал УРСС, 2004. - 432 с.
120. Щербак A.M. Сравнительная фонетика тюркских языков / A.M. Щербак. -Л. : Наука, 1970.-204 с.1. На татарском языке
121. Абдуллина Р.С. Риторика Ъэм интонация : Монография / Р.С. Абдуллина. Яр Чаллы, 1999. - 400 б.
122. Абдуллина Р.С. Хэзерге татар теленец орфографиясе Ьэм орфоэпиясе / Р.С. Абдуллина. Казан : Мэгариф, 2009. - 240 б.
123. Алпаров Г.Х. Шэкли нигездэ татар грамматикасы / Г.Х. Алпаров. -Казан, 1926.-164 б.
124. Алпаров Г.Х. Сайланма хезмэтлэр : татар грамматикасы Ьэм гомуми тел белеме мэсьэлэлэре / Г.Х. Алпаров. Казан : Мэгариф, 2008. - 287 б.
125. Асылгараев Ш.Н. Тормыш баскычлары / Щ.Н. Асылгараев. Казан, 2008.-284 б.
126. Эфлэтунов Э.Ш. Хэзерге татар теле фонетикасы / Э.Ш. Эфлэтунов. -Казан : Татар, кит. нэшр., 1962. 53 б.
127. Эхэтов Г.Х. Татар диалектологиясе: югары уку йорты студентлары очен дэреслек / Г.Х. Эхэтов ; З.Р. Тенишев ред. Казан, 1984.
128. Байчура У.Ш. Татар теленен, кайбер фонетик узенчэлеклэре: эксперименталь-фонетик мэгълуматлар буенча / У.Ш. Байчура // Татар теле Ьэм эдэбияты мэсьэлэлэре. Казан, 1963. - Б. 127-140.
129. Вэлиди Д. Татар теленен, грамматикасы / Д. Вэлиди. Казан, 1919. -175 б.
130. Госман X. Шигырь тезелеше / X. Госман. Казан : Татар, кит. нэшр., 1982.- 192 б.
131. Ждлэй JI. Татар диалектологиясе: югары уку йортлары Ьэм пед. училищелары студ. очен д-лек / JI. Дэлэй. Казан : Татгосиздат, 1947. -134 б.
132. Ждпэй JI. Татар теленец орфоэпик нигезлэре / JI. Дэлэй. Казан: Татгосиздат, 1953. - 72 б.
133. Ж^элэй JI. Татар теленец тарихи фонетикасы буенча материаллар / Л. Дэлэй. Казан : Таткнигоиздат, 1954. - 108 б.
134. Зэкиев М.З. Татар морфонологиясенэ кереш / М.З. Зэкиев, Д.Э. Салихова. Казан : КДПИ, 1983. - 32 б.
135. Зэкиев М.З. Хэзерге татар эдэби теле синтаксисы Ьэм пунктуациясе / М.З. Зэкиев. Казан : Татар, кит. нэшр., 1984.
136. Курбатов Х.Р. Специфик фонемалар Иэм орфография / Х.Р. Курбатов II Совет эдэбияты. 1954. №3. - Б. 112-117.
137. Курбатов Х.Р. Татар эдэби теленец алфавит Ьэм орфография тарихы / Х.Р. Курбатов. Казан : Татар, кит. нэшр., 1999. - 139 б.
138. Мифтахов Б.М. Татар теле орфографиясе Ьэм пунктуациясенец кыен очракпары / Б.М. Мифтахов. Казан : Татар, кит. нэшр., 1970. - 160 б.
139. Насыйри К. Нэху китабы / К. Насыйри. Казан : Казан, ун-т тип., 1860. -79 б.
140. Насыйри К. Энмузэж; / К. Насыйри. Казан, 1895. - 86 б.
141. Насыйри К. Сайланма эсэрлэр / К. Насыйри. Казан : Татар, кит. нэшр., 1974.-Т. 1.-340 б.
142. Насыйри К. Сайланма эсэрлэр / К. Насыйри. Казан: Татар, кит. нэшр., 1975.-Т. 2.-317 б.
143. Низамов И.М. Ничек эйтергэ? Ничек язарга? : Татар интонациясе Ъэм аны язуда белдерунец кайбер мэсьэлэлэре / И.М. Низамов. Казан : КПССныц Татарстан рескомы нэшр., 1990.
144. Низамов И.М. Уем тел очында: Сейлэм Ьэм массакулэм аралашу / И.М. Низамов. - Казан : Татар, кит. нэшр., 1996.
145. Нугайбэк Г. Терлек / Г. Нугайбэк. Казан, 1911. - 80 б.
146. Нуриев Р. Татар сэхнэ сейлэме : Монография / Р. Нуриев. Казан : Мирас, 1998.- 187 б.
147. Нуриев Г.С. Сойлэм культурасы: орфоэпия, дикция, интонация: уку ярдэмлеге / Г.С. Нуриев. Казан : Печатный двор, 2001. - 152 б.
148. Саттаров Г.Ф. Фонетика укытуга карата / Г.Ф. Саттаров // Совет мэктэбе. 1964. -№ 9. - Б. 37-39.
149. Саттаров Г.Ф. Мэктэптэ тел культурасы / Г.Ф. Саттаров. Казан : Казан ун-ты нэшр., 1965а. - 151 б.
150. Саттаров Г.Ф. Алынма сузыкларны ейрэну / Г.Ф. Саттаров // Совет мэктэбе. 1966. -№ 10.-Б. 32-35.
151. Сафиуллина Ф.С. Хэзерге татар эдэби теле : югары Ьэм урта уку йортлары ечен дэреслек / Ф.С. Сафиуллина, М.З. Зэкиев. Тулыл. 2 нче басма. - Казан : Мэгариф, 2002. - 407 б.
152. Сэлимов Х.Х. Татар теленец аваз составы турында кайбер фикерлэр / Х.Х. Сэлимов // Совет мэктэбе. 1982. - № 11. - Б. 30-32.
153. Сэлимов Х.Х. Хэзерге татар теле фонетикасы : филология факультеты студентлары ечен методик курсэтмэлэр 11эм кунегулэр / Х.Х. Сэлимов. — Казан : Казан ун-ты нэшр., 1983. 61 б.
154. Сэлимов Х.Х. Татар теленец орфографик-орфоэпик сузлеге / Х.Х. Сэлимов. Казан : Яцалиф, 2004. - 192 б.
155. Сэлимов Х.Х. Татар теле фонетикасы / Х.Х. Сэлимов. Яр Чаллы : КамАЗ, 1993.-31 б.
156. Сонгатов Г.М. Татар диалектларыныц фонетикасы : татар филологиясе Ьэм тарихы факультеты студентлары ечен уку ярдэмлеге / Г.М. Сенгатов ; ф. ред. Г.Ф. Саттаров. Казан, 2000. - 44 б.
157. Сенгатов Г.М. Татар теленец фонетик закончалыклары : теоретик мэгълумат, кунегулэр Ьэм биремнэр / Г.М. Сенгатов; ф. ред. Ф.М. Хисамова. Казан, 2001. - 54 б.
158. Хаков В.Х. Стилистика 11эм суз сэнгате: укучыларга ярдэмлек / В.Х. Хаков. Казан : Татар, китап нэшр., 1979. - 158 б.
159. Хаков В.Х. Татар эдэби теле тарихы / В.Х. Хаков; ф. ред. З.Р. Тенишев. Казан : Казан ун-ты нэшр., 1993. - 325 б.
160. Хаков В.Х. Татар эдэби теле: Стилистика / В.Х. Хаков; Ф. ред. Х.Р. Курбатов. Казан : Татар, китап нэшр., 1999. - 302 б.
161. Хангилдин В.Н. Татар теле грамматикасы : Морфология Ьэм синтаксис / В.Н. Хангилдин. Казан : Тат. кит. нэшр., 1959. - 644 б.
162. Хэзерге татар эдэби теле : лексика, фонетика, орфоэпия, графика Ьэм орфография, морфология : югары уку йорты студ. Ьэм урта мэктэп укытучылары очен. Казан : Татар, кит. нэшр., 1965. - 299 б.
163. Хэкимжан Ф. Татар эдэби теле: фонетика: югары уку йортлары студентлары очен / Ф. Хэкимждн. Тулыл. 2 нче басма. - Казан : ТДГИ нэшр., 2001.-108 б.
164. Хисамова Ф.М. Хэзерге татар теле фонетикасы : татар филологиясе булеге студентлары очен методик курсэтмэлэр / Ф.М. Хисамова. -Казан : Казан ун-ты нэшр., 1987. 44 б.
165. Хесни Ф. Ни эйтергэ? Ничек эйтергэ? / Ф. Хосни. Казан : Татар, кит. нэшр., 1974.
166. Шакирова Р.Ф. Хэзерге татар теле фонетикасына кереш / Р.Ф. Шакирова. Казан : Таткнигоиздат, 1954. - 102 б.
167. Юсупов Р.А. Укучыларда сойлэм культурасы тэрбиялэу / Р.А. Юсупов. -Казан : Татар, кит. нэшр., 1983.
168. Юсупов Ф.Ю. Ж^ирле сойлэш шартларында фонетика укыту / Ф.Ю. Юсупов. Казан : Тат. кит. нэшр., 1977. - 160 б.
169. Юсупов Ф.Ю. Коньяк Урал Ьэм Урал арты сейлэшлэре : Чилэбе Ьэм Курган елкэлэрендэге татар сойлэшлэренец фонетик Ьэм грамматик узенчэлеклэре / Ф.Ю. Юсупов. Казан : Тат. китап нэшр., 1979. - 184 б.
170. Юсупов Ф.Ю. Татар теленец диалектлары : Урал сейлэшлэре / Ф.Ю. Юсупов ; ф. ред. Ф.Э. Ганиев. Казан : Мэгариф, 2003. - 349 б.
171. Юсупов Ф.Ю. Сафакул татарлары: тарих, тел, халык иждты / Ф.Ю. Юсупов. Казан, 2006. - 607 б.
172. Яфаров Л.И. Татар теле фонетикасыныц кайбер закончалыклы тенденциялэре : филол. фэн. канд. . дис / Л.И. Яфаров. Казан, 1955. -264 б.1. На иностранных языках
173. Laver J. Principles of Phonetics / J. Laver. Cambridge: Cambridge University Press, 1994. - 736 p.
174. Radloff W. Phonetik der nordlichen Turksprachen / W. Radloff. Leipzig, 1883.1. Словари
175. Ахманова О.С. Словарь лингвистических терминов / О.С. Ахманова. — М. : Сов. энциклопедия, 1966. 608 с.
176. Большой энциклопедический словарь. Языкознание / гл. ред. В.Н. Ярцева. М., 1998. - 685 с.
177. Лингвистический энциклопедический словарь / гл. ред. В.Н. Ярцева. — М. : Сов. энциклопедия, 1990. 685 с.
178. Розенталь Л.Э. Словарь-справочник лингвистических терминов: Пособие для учителя / Л.Э. Розенталь, М.А. Теленкова. 3-е изд., испр. и доп. - М. : Просвещение, 1985. - 399 с.1. Источники
179. Эмирхан И. Татар фэлсэфэсе Иэм милли мэгариф / И. Эмирхан. -Казан : Татар, кит. нэшр, 2003. 335 б.
180. Еники Э. Салават купере : хикэялэр / Э. Еники. Казан : Татар, кит. нэшр., 1966. - 234 б.
181. Еники Э. Эсэрлэр / Э. Еники. Казан : Татар, кит. нэшр., 2000. - Т. 1. -447 б.
182. Кутуй Г. Сайланма эсэрлэр / Г. Кутуй. Казан: Татар, кит. нэшр., 1965.-275 б.
183. Мицнегулов Х.Й. Гасырлар енен тьщлап. / Х.Й. Мицнегулов Казан : Мэгариф, 2003.-335 б.