автореферат диссертации по филологии, специальность ВАК РФ 10.02.19
диссертация на тему:
Теоретические основания соотношения акустических и перцептивных параметров звучащей речи и способы их описания

  • Год: 1993
  • Автор научной работы: Михайлов, Вадим Георгиевич
  • Ученая cтепень: доктора филологических наук
  • Место защиты диссертации: Москва
  • Код cпециальности ВАК: 10.02.19
Автореферат по филологии на тему 'Теоретические основания соотношения акустических и перцептивных параметров звучащей речи и способы их описания'

Полный текст автореферата диссертации по теме "Теоретические основания соотношения акустических и перцептивных параметров звучащей речи и способы их описания"

ОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ИМЕНИ М.В.ЛОМОНОСОВА ФИЛОЛОГИЧЕСКИЙ ФАКУЛЬТЕТ

На правах рукописи

МИХАЙЛОВ Вадим Георгиевич

ТЕОРЕТИЧЕСКИЕ ОСНОВАНИЯ СООТНОШЕНИЯ АКУСТИЧЕСКИХ И ПЕРЦЕПТИВНЫХ ПАРАМЕТРОВ ЗВУЧАЩЕЙ РЕЧИ И СПОСОБЫ ИХ ОПИСАНИЯ

Специальность 10.02.19 - Теория языкознания

Автореферат

диссертации на соискание ученой степени доктора филологических нэук

Москва, 1ЭЭЗ

Работа выполнена на кафедре общего и сравнительно-истори ческого языкознания филологического факультете Московског гоударственного университета имени М.В.Ломоносова

Официальные оппоненты:

1. Доктор филологических наук профессор Л.А.Кантер

2. Доктор филологических наук профессор Ю. Н. Марчук

3. Доктор филологических наук профессор М.К.Румянцев

Ведущая организация - Санкт-Петербургский Государствен» университет

Защита состоится " ^^ 199^г. в 15.00 часс

на заседании специализированного совета Д.053.05.16 щ; Московском государственном университете им. М.В.Ломоносова.

Адрес: 119899, Москва. ГСП, В-234. Ленинские горы, МГ им. М.В.Ломоносова, 1-й корпус гуманитарных факультетов, филе логический факультет.

С диссертацией можно ознакомиться в Научной библиотек им. А. М. Горького МГУ.

Автореферат.-разослан "

Ученый секретарь специализированного совета

доцент А. А:Поликарпс

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

В диссертации рассматривается актуальные проблемы описания фонетических характеристик и слухового восприятия звучащей речи. -з

Фонетика, развивая свой понятийный аппарат, исследует речевую деятельность с двух взаимосвязанных сторон: речи и языка. Такой подход описан во взглядах классиков-фонологов Н.С.Трубецкого и Р.О.Якобсона, относивших фонетику к науке о звуках речи и фонологию - к науке о звуках языка. Однако сегодня наряду со специализацией отдельных направлений лингвистических исследований наблюдаются также обратные тенденции -интеграционные процессы. Изучение закономерностей речевой деятельности во всей ее сложности и взаимообусловленности другими явлениями реальности - конситуацией. т.е. контекстами, социальными установками и другими условиями речевого акта, требует привлечения к фонетическим исследованиям результатов и методов смежных научных дисциплин: физиологии, акустики, психологии, кибернетики, теории речевой коммуникации и др '. С другой стороны. происходит взаимное обогащение смежных научных дисциплин. что может дать и дает существенно новые результаты. Так. компьютеризация методов исследования, в частности на базе персональных вычислительных машин, существенно усиливает возможности филолога в изучении процессов речеобразования. Вместе с тем вычислительная машина представляет собой чрезвычайно эффективное средство обучения с большими дидактическими возможностями. позволяющими успешно решить триединую задачу обучения: зачем учить, чему учить и как учить г .

Прикладная фонетика, оставаясь лингвистической наукой, вырабатывает и затем передает свои результаты в смежные научные направления, часто объединяемые названием "речевые гехно-

1 Звегинцев В. А. Теоретическая и прикладная лингвистика. -М.: Просвещение, 1968. - С. 160; см. также: Комлев И.Г. Слово р речи: денотативные аспекты. - М.: МГУ. 1992. - С. 200: С&асл-*ков М. А. Речевой сигнал в кибернетике и связи. - М.: Связьиз-дат. 1963,- С. 57.

2 Талызина Н.Ф. Управление процессом усвоения знания. - М.: МГУ. 1984. - С. 12.

- г -

логии". Проблемы прикладной фонетики отражены в большом числе научно-технических публикаций. Классическими работами остаются монографии Г.Фанта (1964). М.А.Сапожкова (1963). Дж. Л. Фланага-на (1963), Л.А.Чистович (1976). Серьезный вклад в'У освещении проблемы внесли работы отечественных ученых Л. В.Бондарко, В. И. Галунова. Н. Г. Загоруйко. Л.Р.Зиндера, Л. В. Златоустовой. Б.М.Лобанова, Н.Б.Покровского. Р.К.Потаповой. В.Н.Сорокина. А.А.Пирогова. Ю.Н.Прохорова и др. Были предложены решения проблемы речеобразования и восприятия; разработаны эффективные методы описания параметров акустического сигнала, обеспечивающие сжатое представление больших массивов звучащей речи для баз данных, информационно-справочных систем, устного речевого вывода печатного текста, систем речевого общения человек-ЭВМ. систем низко^коростной телефонии по каналам дальней и космической связи со скоростью передачи 1.2...4.8 кбит/с.

Однако по разным причинам некоторые интересные методы эффективного описания акустических параметров речи,. реализованные. например, в вокодерах, не нашли пока применения в филологии. хотя и открывают совершенно новые возможности для выполнения фундаментальных исследований закономерностей звучащей речи и слуха. Модель анализа-синтеза речи позволяет выделить в эксперименте какой-либо акустический параметр, например, амплитуду и частоту форманты, частоту основного тона и проводить изучение взаимосвязи этих параметров с лингвистическими параметрами. показателями качества, разборчивости и узнаваемости. Результаты измерений при этом могут быть описаны точными количественными величинами.

Актуальные проблемы прикладной фонетики представил в своей работе шведский ученый .Г. Фант 1 • Эта публикация оказала значительное влияние на дальнейшее развитие фонетических исследований. Г. Фант..представил речевой аппарат человека в виде электрической модели, состоящей из системы последовательно включенных резонансных контуров, соответствующих акустическим

1 •Фант Г. Акустическая теория речепреобразования: Пер. с англ. - М.: Наука. 1964. - 284 с.

полостям речевого тракта (ротовой,носовой и глоточной). В результате серии экспериментов и теоретических расчетов было получено полное совпадение акустических параметров звуков речи и искусственного сигнала на выходе модели, что послужило основанием для формулирования принципиальных положений акустической теории речеобразования: акустические характеристики звуков речи однозначно определяются конфигурацией и размерами полостей речевого аппарата; в спектре каждого звука могут быть выявлены инвариантные акустические признаки-корреляты, определяющие его фонетическое качество.

Такой, казалось бы. ясный вывод получил в научной литературе расширенную интерпретацию, вообще говоря, не вытекающую из акустической теории Г.Фанта: соотношение акустических параметров звуков речи и параметров порождающего их речевого тракта стало рассматриваться как изоморфное, т.е. обладающее однозначным соответствием в прямом (что верно>, и в обратном (что в общем случае неверно) направлениях.

Теория Г.Фанта, хотя и подтверждала тезис, сформулированный еще Ф. де Соссюром об акустико-артикуляционном процессе как сложном единстве, однако оставляла в тени существенную сторону речевой деятельности - язык, поскольку сама деятельность протекает одновременно в артикуляторной, акустической и психической формах 1.

* В качестве звуковых средств языка выступают сегментное и просодические единицы, представленные системой звуков, ритмическими структурами, синтагмами и фразами с соответствующей интонацией: контуром основного тона, словесными и смыслораэли-чительными.ударениями, паузами, тембром и темпом лроизкосгеккя.

Фонема - минимальная слово- и фзрморазличптельнзя лингвистическая единица плана выражения и ее позиционные и комбинаторные оттенки-аллофоны реализуется в речевом потоке 5 вило звуков. В качестве метода описания Фонем в системе оппозиция

1 Ссссюр Ф. де. Труды по языкознанию.-й.: Прогресс. ¡37". -С. ч--. См. также:Щерба Л.В. Русские гласные в качественном и количественном отношении. - Л.: Наука, 1383. - С. 2; Зкндер Л. Р. Общая фонетика. - М.: ВШ, 1979. - С. 38.

Е.Черри. к.Халле и Р.Якобсон 1 используют дифференциальные признаки, представляющие собой некоторое обобщение различительных артикуляторных и акустических признаков звуков речи. Признаки рассматриваются в статике 'без выявления их значимости для распознавания фонем в изолированных словах И в речевом потоке. По статусу дифференциальные признаки фонем отнесены К лингвистический единицам, хотя другие авторы относят их к физическим или вообще к особым промежуточным единицам между речью и языком Дело конечно не столько в терминологической неясности, сколько в концепциях качественного к количественного описания фонетических признаков звуков й непротиворечивом наложении научных основ фонетики.

Должен быть дан ответ на вопросы: Каким образом действует механизм идентификации фонем? В чем отличие Механизма распознавания изолированных звуков й звуков в речевом потоке? Какова взаимосвязь перцептивных и акустических параметров? Какую роль играет компейсаторный механизм речеобразования и категориаль-ность слухового восприятия, обеспечивающих распознавание даже при значительной вариативности артикуляторных и акустических параметров речи?. Кроме того, использование исследователями звучащей речи разных методик пйихолингвйстического эксперимента, непредставительность »сходного речевого материала и слабое применение методов Математической статистики при обработке данных часто приводит к противоречива* результатам и выводам. Анализ расхождений йог бы послужить стимулом к разработке научно обоснованных методик психолингвистического описания фонетического качества звучащей речи.

Наконец, хотелось бы отметить личностный мотив написания диссертации, связанный с полученными ранее автором результатами исследований 11.2,3], которые нуждались з углублении лингвистической интерпретации-» теоретическом обобщении.

1 Черри Е... Халле М.. Якобсон Р. К вопросу о логическом описании языков в их фонологическом аспекте // Новое в лингвистике / Под ред. В.А.Звегинцева. - М.: ИЛ. 1962. - С. 279-298.

* См., например. Методы автоматического распознования речи: Пер. с англ. / Под ред. У.Ли. - М.: Мир. 1983 - 716 с,; Ворон-кова Г.В. Проблемы фонологии. - Л.: ЛГУ,. 1984. - С.52.

Таким образом, актуальность дальнейшего развития методов описания акустических и перцептивных параметров звучащей речи и исследования характера их связи с языковыми единицами не вызывает сомнений.

Цель диссертации состоит в разработке теоретических оснований описания акустических и перцептивных параметров речи в моделях речевой коммуникации и методов оценки их соотношения с языковыми единицами.

Практическая цель работы - создание целостной системы оценок значимости акустических и перцептивных параметров в моделях речевой коммуникации, а также разработка пакета машинных программ измерения основных параметров и обработки данных психофизических сценок в человеко-машинных системах, системах автоматического распознавания и синтеза речи, а также в средствах вокодерной связи.

Исходя из сказанного, данное исследование включает следующие основные задачи:

1.' Разработка теоретических вопросов описания акустических и перцептивных параметров в системе речевой коммуникации, адекватно отображающих информационные и лингвистические свойства звучащей речи.

2. Исследование методов оценки значимости акустических и перцептивных параметров звучащей речи и их взаимосвязи с единицами языка в моделях речевой коммуникации.

3. Уточнение описания фонетических характеристик системы звукотипов по данным экспериментальных исследований.

Структура работы. Диссертация состоит из введения, пяти глав, заключения, списка литературы и приложения, изложенных *а 350 листах, 40 иллюстрациях.

Научная новизна диссертации состоит в следующем.

1. Система речевой коммуникации представлена как большая сиффузная система в .виде модели, включающей уровни мотивации, «мерения, реализации и восприятия, что дало возможность системной интерпретации основных свойств звучащей речи:

а) эмерджентность (целостность) реализуется в форме сложно единства производства (синтеза) и восприятия (анализа)

звучащей речи (принцип "говорим, слушая"), распознавания звучащей речи и внутренней импрессивной речи (принцип "слушаем, говоря"); определяет восприятие звукового облика фонем по совокупности различительных признаков, восприятие смысла фразы - по целостному тексту;

б) диффузность представлена в виде размытости (нечеткости) характеристик акустических коррелятов различительных признаков групп звукотипов, соотнесенных с коррелятивными рядами фонем; в тексте наблюдается взаимокомпенсация синтаксиса и интонации ("принцип замены" А.М.Пешковского);

в) иерархичность определяет соподчиненность признаков восприятия изолированных звуковых единиц и единиц в речевом потоке, а также значения изолированных единиц языка и их смысла в заданном семантическом и ситуационном контекстах;

г) самоорганизация присуща системе речевой коммуникации как биологической системе и реализуется в виде ранжирования звукотипов соответственно с вероятностью их встречаемости и в виде ранжирования различительных признаков звукотипов по значимости (расширенное применение закона Ципфа); проявляется в форме семантического ожидания слова, словосочетания в данной конситуации, сопровождаемой мимикой и хестамг ь речевом диалога (составляющие понятия "речевая компетенция");

д) адаптивность также является свойством биологических •нютем. которое обеспечивает необходимую определенность и стабильность акустических коррелятов сегмент:^; единиц при рече-образованни благодаря акустической и сосательной обратной связи (свойство категориалыюсти-фонеиатич;ости слуха), компенсирующей многовариантность реализации артику.чяторных программ образования звуковых единиц в речевом аппарате;

е) устойчивость речевой коммуникации обеспечивается благодаря избыточности сообщения (низкой энтропии).

Для выполнения фонетических исследований, изучения фундаментальных свойств речи и слуха рекомендованы модели анализа-синтеза речи . которые при сохранении свойств целостности системы речевой коммуникации и адекватности естественной и синтезированной речи, легко реализуются на современных ЭВМ.

Z. Показано, что звукотипы (основные оттенки фонем звучащей речи с относительно устойчивыми акустическими и перцептив-

ными характеристиками) характеризуются следующими существенными свойствами:

а) различительные признаки груш звукотипов. соотнесенных по свойству перцептивной близости с коррелятивными рядами фонем. имеют разную значимость для восприятия. Методом статистического анализа матриц звуковых ошибок ("ослышек") получены следующие ранги признаков (в порядке снижения веса): твердый/мягкий - 5 отн. ед.: звонкий/глухой - 3; сонорный/шумний -2 и. наконец, смычный/щелевой - 1 оти. ёд.:

б) к общим групповым признакам звукотипов отнесены признаки: сонорный/шумный, смычный/щелевой, звонкий/глухой, характеризующие способ образования, а также твердый/мягкий. Признаки места образования и оттенков (окраски) звукотипов в речевом континууме рассматриваются как негрупповые (частные);

в) каядому различительному признаку звукотипа соответствует комплекс акустических параметров например, признак "звонкий" представлен в звучащей речи не только гармониками основного тона, но и увеличенной интенсивность!) звонких сегментов. более четкой формантноЯ структурой по сравнению с глухими сегментами: признак "мягкий" отображен в 1-образном переходе второй форманты F2 на смерчом гласном, частотой F2 около 1.8...2.6 кГц. а такае снигеннсй интенсивностью составляющих в полосе частот 1,2... 1,8 кГц;

Г) групповые признаки звукотипов имеет Д0стат045!0 устойчивые акустические корреляты, мало зависящие от комбинаторн&х и позиционных изменений фонем и стиля произношения (1-образны;! трек второй форманта нз смежных гласных, пауза смычки; сравнительно четкая формантная структура и признак звонкости в течение всего сегмента). В потоке отдельные акустические параметры признаков, например, основной тон признака звонкости при сглу: шении. компенсируются другими параметрами (интенсивностью, длительности):

д) признаки места образования, которые фиксируются в фазе выдержки, з звучащей речи могут быть ослаблены из-за редукции и коартикуляции, хотя фазы экскурсии и рекурсии должны конечно как-то отражать движение к акустическим целя;.! в Фазе выдержки. В речевом диалоге компенсирующую функцию выполняет зрительный контакт ("чтение с губ");

е) методы статистического анализа матриц звуковых оиибок позволяют уточнить описание фонологической системы путем выявления перцептивно близких групп звукотипов и их общих различительных признаков. Например, в таблицах слогов, использованных при измерениях, к отдельным звукотипам отнесены (кроме известного ряда фонем) гласные /а, о. у. е/ и заднеязычные мягкие согласные /г', к', х'/, обладающие устойчивыми фонетическими характеристиками (по комплексу акустико-перцептивных признаков среднеязычный /)/ отнесен к группе мягких согласных);

а) функционирование модели восприятия речи определяется основными системными свойствами речевой коммуникации. Модель распознавания звучащей реч;: действует на синтаксическом, просодическом и сегментном уровнях, которые взаимодействуют на основе принципа компенсации (замены) функций синтаксиса, лексики. интонации и различительных признаков звукотипов в данном семантическом и ситуационном контексте, поддерживаемом мимикой н жестами (принцип "что надо, а не что дано").

Звуковые облики лексических единиц, устойчивых словосочетаний в речевом потоке определяются ритмической структурой, интонацией и групповыми различительными признаками звукотипов. а изолированных слов (слогов) - такие частными различительными признаками. Соотношение между представленностью признаков в звучащей речи, как и их принадлежность к заданному уровню. Ебсьма условны.

3. Предложены уточненные способы описания инвентаря акустических и перцептивных параметров звучащей речи в их взаимосвязи для филологических и лингвистических целей:

а) перечень акустических и перцептивных параметров звучащей речи зависит от цели анализа, от значимости параметров для восприятия звуковых единиц разного уросая, от конкретного речевого материала и конечно-ет структура языка. Например, различие акустических параметров русских фонем /л, р/; /п. ф/ для корейского языка перцептивно несущественно, признак твердый/мягкий фонем русского языка для ряда европейских языков нерелевантен, ритмическая структура во французском языке всегда име.т ударным последний слог в фонетическом слове, а в казахском - произвольный. Поэтому рассмотрение вопросов, связанных с типологией параметров, ограничено в основном статистическими.

- * -

характеристиками некоторых параметров звучащей речи, например, распределением частоты основного тона, спектрального распределения и др.;

б) акустические параметры находятся в сложной взаимосвязи с перцептивными. В общем случае акустические параметры в отличие от акустических коррелятов не обладают собственны!«? критериями сегментации речевого потока, как и способностью интерпретации значения звуковых единиц, однако изучение их свойств позволяет выявить существенные закономерности звучащей речи;

в) перцептивные параметры, определяющие фонетическое качество звучания - тембр, громкость, высота голоса, - соотносятся не с отдельными акустическими параметрами речи, а с их совокупностью - спектром, интенсивностью, частотой основного тона, длительностью ударных и безударных слогов;

г) некоторому акустическому параметру могут приписнЕпться разные перцептивные характеристики, например, частоте основного тона - высота голоса, четкость, тембральная окраска, плаксивость, хриплость, резкость;

д) - поскольку характеристики отра;кэют те или иные свойства сигнала, то фонетическое качество звучания следует принять за обобщенную акустико-перцептивнув характеристику звучащей речи. К обобщенной характеристике отнесены также четкость артикуляции (произношения), показателем которой является различимость звуков, слогов, а на семантическом уровне - внятность (разборчивость слов, фраз) и в данном ситуационном и семантическом контексте - смысл речевого высказывания;

е) соотношение между различимостью звуковых единиц и статистическими амплитудно-частотными характеристиками звучащей речи определяется условиями передачи к восприятия.

4. Показано, что качественные (вербальные) и количественные (артикуляционные) методы описания звучания речи обеспечивают при определенных условиях получение сходных или близких оценок:

а) оценки качества речи по методу мнений имеют тенденция к нивелированию результатов из-за Фактора "снисходительности -минимального риска" в оценках, ■ что делает метод малочувствительным. Из-за нестабильности оценок и значительной трудоемкости- применение метода ограничено;

б) метод парных сравнений может обеспечить при соблюдении некоторых условий устойчивость оценок. Разность в субъективных оценках качества речи для сравниваемых трактов (моделей синтеза речи) возрастает при заметном различии и снижается при мало заметном различии. Оценка по альтернативной шкале не зависит от длины Фраз. По балльной шкале при малой длине тестовых Фраз

(1___1,5 с) наблюдается значительный разброс балльных оценок.

а при длине Фраз 2...4 с оценки стабилизируются. Поэтому рекомендуется для речевых сигналов, различающихся незначительно, проводить альтернативные оценки заметности по критерию "Что больше нравится?", а при значительном различии - балльные оценки по критерию "На сколько лучше?". Между альтернативными и балльными оценками качества, а также между оценками качества и разборчивости речи имеется тесная корреляционная связь:

в) поскольку при сравнении ставится задача выявления способности моделей синтеза речи к адекватной передачи речевых сообщений, то весьма существенно отображение в речевых тестах всего многообразия звуковых средств языка. Для проведения измерений рекомендованы специально подобранные фразы;

г) метод описания качества звучащей речи по селективным признакам основан на вербализации экспертом-экспериментатором своего восприятия речевого сигнала. Все признаки разделены на две группы по пять признаков в каждой. С помощью этих признаков можно описать типичные виды искажений речевого сигнала. К признакам, воспринимаемым как механические, искажения, отнесены дребезжание, треск, хрип, призвуки, глухость. Фон, а к признакам искажения речевых характеристик - картавость, гнусавость, плаксивость, нечеткость артикуляции и шепелявость. Метод оценки качества по селективным признакам позволяет более точно описать небольшое различие в звучании речи по сравнению с методом парных сравнений, например, более адекватно квалифицировать речь учащегося'на иностранном языке и дать ее количественную оценку в выражениях, понятных и доступных учащемуся;

д) алгоритмизированная модель обобщенной оценки фонетического качества звучащей речи по совокупности разборчивости, натуральности, узнаваемости и других показателей позволяет сравнить разные синтезаторы по качеству звучащей речи и получить на этой основе непротиворечивые оценки.

5. Выполнен значительный объем экспериментальных исследований и введен в научный оборот значительный объем фактического материала:

а) дана экспериментальная интерпретация Фонологической системы на основе перцептивных характеристик звучащей речи. Получены' оценки эффективности параметрических моделей. Проведены измерения факторов искажения синтезированной речи, включая частотные искажения, акустические шумы, амплитудное ограничение и компрессирование;

. -б) исследован метод измерения дифференциальной (пороговой) чувствительности слуха к основным параметрам звучащей речи на.основе параметрической модели. Впервые получены данные пороговой чувствительности, слуха к джиттеру основного тона в речевом:потоке; .

в) исследованы статистические характеристики звучащей речи, включая распределение фонем и слогов, речевых пауз, частоты основного тона и ряда других параметров. Впервые измерено формантное распределение для мужских голосов русской речи, что позволило уточнить расчетные постоянные, используемые в теории разборчивости речи.

6. Разработан пакет машинных программ, предназначенных для комплексной оценки фонетических характеристик звучащей речи по данным психолингвистических и инструментальных 'измерений в человеко-машинных системах, системах автоматического распознавания. синтеза, вокодерной связи и в системах речевой коммуникации.

Таким образом, в результате комплексных системных исследований акустических и перцептивных параметров звучащей речи на базе разработанных новых методов и средств получено объяснение механизма восприятия звуковых единиц, основанное на концепции ранжированности различительных признаков звукоткиов по значимости и многогерности соответствущих акустических коррелятов этих признаков.Предложенная интерпретация свойств различительных признаков исходит из системного единства акустических и перцептивных параметров, что позволило преодолеть противоречия дихотомического принципа описания различительных признаков фонологической теории Е.Черри. Р.Якобсона и Г.Фа:;та,

обосновать структурное описание элементов фонологической системы и тем самым внести определенный вклад в фонетические знания.

Методы исследований основаны на системном обобщении и развитии описательных и количественных методов лингвистики с ее специфическими средствами изучения звучащей речи. Использованы также методу моделирования речевой деятельности с привлечением методов психофизического эксперимента, устанавливающих меру сходства и различия звуковых возбудителей, и яетодов теоретико-вероятностного анализа случайных процессов.

Системность методов исследования направлена на вычленение из звучащей речи как объекта лингвистики закономерностей функционирования звуковых средств как предмета исследований, представленных акустическими и перцептивными параметрами речевого континуума в их взаимосвязи с языковыми единицами. Такой подход требует применения инструментальных методов измерения акустических параметров в сочетании с психолингвистическими измерениями перцептивных параметров единиц речевого континуума.

Описание акустических и перцептивных свойств звуковых единиц выливается в их фонетическую характеристику. Вместе с тем необходимо отметить, что акустические методы описания не имеют собственных критериев оценки качества звучания или маркировки границ единиц языка в речевом потоке. Перцептивные же методы описания трудно поддаются четкой регламентации и на их результаты существенное влияние оказывают принятые измерительные процедуры, состав и структура речевого материала, эмоционально-стилистические различия 1. Поэтому необходимо разработать с привлечением теории психофизического шкалирования методы описания перцептис.ных параметров, которые бы обеспечивали необходимую стабильность,-объективность, практическую примени-

1 Златоустова Л.В. Развитие прикладной лингвистики в МГУ // Вестник Московского Университета. Филология, 1976. - N3. -С. 36-46. См. также: Брызгунова Е. А. Эмоционально-стилистические различия русской звучащей речи.-М.: МГУ,1984; Сорокин Ю.А. Психолингвистические аспекты изучения текста. - М., 1985.

мость бценой.

Системность исследования речевой деятельносто как сложной системы- обуславливает необходимость моделирования ее основных функциональных своййтв. Поскольку внутренние информационные процессы высшей нервной деятельности' остаются скрытыми для наблюдения, то цель» моделирования монет быть изучение некоторых как бы' внутренних процессов через внешние свойства, например, значимости акустических параметров для восприятия речи и распознавания.

В фонетических исследованиях с успехом применяются модели синтеза речи по правилам, с помощью которых были измерены области значения формантных параметров, обеспечивающие категсри-эльность восприятия гласных, а также дифференциальная чувствительность слуха к изменениям частоты основного тона и положения формант. Недостатком подобных моделей является низкое (механическое) качество синтезированной речи и большая трудоемкость эксперимента 1.

Значительными преимуществами перед моделями синтеза по правилам обладают параметрические модели анализа - синтеза речи. которые обеспечивают получение высококачественной синтезированной речи в реальном масштабе времени с точно измеренными известными значениями акустических параметров, представлягдамя амплитуду и частоту формант, частоту основного тона и т.д. Некоторое изменение одного из параметров каким-то образом сказываются на восприятии речи, что монет быть тага?.« оценено с помощью -психоликгзистических методов измерения. Конечно, для применения параметрических моделей в исследованиях речи и сгу-ха потребовалось разработать специфические методы оценки адекватности самих моделей системе речевой коммуникации, а такхе обосновать структуру моделей, наиболее полно отвечаш^их задачам фонетических исследований.

Апробация работы. Основные результаты работы доложены и обсуждены на конференциях и совещаниях: на Всесоюзной конфе-

Фланаган Дж. Анализ, синтез и восприятие речи: Пер. с англ. - М.: Связь, 1968. - 396 е.; см. также: Чистович Л.А. Руководство по физиологии. Физиология речи, восприятие речи человеком. - Л.: Наука. 1976. - 386 с.

ренции по использованию TCO и ЭВМ в учебном процессе, Москва. 1985: на Всесоюзном совещании по проблеме автоматического распознавания и синтеза речи. Киев. 1988: на XIV и XV конференциях Всесоюзного научно-технического общества им. А.С.Попова, в 1988-1991 гг.: на Всесоюзном семинаре по искусственному интеллекту. Переславль-Залесский. 1988: на IV Всесоюзном семинаре по разработке и применению программных средств ПЭВМ в учебном процессе. Симферополь. 1988:.на семинарах МО НТО им. А. С. Попова по проблеме общения "человек - ЭВМ". 1988-1993; на сессии РАО. Москва. 1992 г.; на XI Всесоюзной акустической конференции. Москва, 1991 г. : на научных конференциях МИС в 1991-1993 гг.-; на XVI и XVII семинарах АРСО в 1991-1992 гг. ; на научных конференциях МГУ "Ломоносовские чтения". 1990-1993 и др.

Публикации. По материалам диссертации опубликовано около 40 статей в научно-технических журналах, общим объемом 25 п.л., три монографии: "Информационные и статистические характеристики устной речи" - М.: МГУ. 1992 - 10 п.л.: "Вокодерная связь" (в соавторстве с М.А.Сапожковым. ) - М. : Радио и связь. 1983. -18 п.л. (в т.ч. автора - 5 п.л.); "Измерение параметров речи" (в соавторстве с Л.В.Златоустовой) - М. : Радио и связь, 1987. - 14 п.л. (в т.ч. автора - 10 п.л.). Подготовлена монография "Основы речевой акустики" (в соавторстве с Р.К.Потаповой и Г. С. Рамишвшш) - М. : Радио и связь, (в печати) - 31 п. л. (в том числе автора - 20 п.л.); написано бблее 30 отчетов по научно-исследовательским работам, выполненным под научным руководством и при участии автора в 1957-1993 гг.

Внедрение результатов работы. Материалы диссертации использованы на занятиях и в пособии по курсу "Формализованные модели и применение ЭВМ в филологии" на факультете повышения квалификации филологического факультета МГУ. 1985-1991 гг.

На основе выполнение«- исследований разработаны эффективные методы и алгоритмы измерения акустических параметров звучащей речи, защищенные 12 авторскими свидетельствами; на основе разработанного автором пакета машинных программ и методов оценки перцепт.вных параметров звучащей речи подготовлен проект ГОСТ-Р "Передача речи по трактам связи. Методы оценки качества, разборчивости и узнаваемости", включенный в план государственной стандартизации на 1995 г. •

Основные положения, выносимые иа защиту:

1. Системное описание акустических и перцептивных параметров звучащей речи, на основе комплексного представления речевой коммуникации в виде большой диффузной системы, характеризуемой эмерджентностью, иерархической структурой на сегментном и просодическом уровнях, диффузностью основных параметров; биологический аспект системы отражен в свойстве самоорганизации и адаптивности.

2. Целостная система оценок значимости акустических и перцептивных параметров, содержащая экспериментальные методы психолингвистических измерений, методы инструментальных измерений и расчетные методы в совокупности взаимосвязанных характеристик акустических и перцептивных параметров звукотипов, показателей разборчивости и качества звучащей речи.

3. Методы фонетических исследований фундаментальных свойсте речи и слуха на базе параметрических моделей анализа-синтеза речи, включая измерения категориальности восприятия звуковых единиц и чувствительности слуха к джиттеру основного тона, а-также, методы исследования специфических искажений звучащей речи.

4. Модель восприятия звучащей речи применительно к изучению значимости акустических и перцептивных параметров речи.

5. Уточненные способы описания инвентаря акустических и перцептивных параметров звуковых единиц в их взаимосвязи для филологических и лингвистических целей, включат интерпретацию бинарной оппозиции как сложного комплекса акустических и перцептивных параметров различительных признаков звукотипов.

СОДЕРЖАНИЕ' РАБОТЫ

Системный анализ звучащей речи, представленный в первой главе работы, включает в себя вопросы уточнения и упорядочения описания ее основных свойств и тем самым углубления понимания проблем речезой деятельности в целом. Методология системного анализа предполагает изучение внутренних свойств системы речевой коммуникации, недоступных непосредственному наблюдении, путем•моделирования, в интересах поставленной цели исследо-

вания

.Понятие системного анализа речевое деятельности охватывает все уровни языка: от поиска в языке неких аналогий с философскими категориями {противоречие, ртрриание отррщания. сопельная полезность), др рссждиирр чщяы? харадт^исуик щ-чаа^Й речи, «эдрирер шфдорр'*.' щрв&рсц сцр-

•Tewonj анализа остается Рвисамю ^ртапуе^ j^agr i сделанное f-Щ fl ]В«ещ»ё 'щщ 'craffif

тельности f ' Wfflfö"ifflijfi^ PPfp-

альиое; р^^ре/статачное; фиэд^рр-

кое «атер{|а^ре/лсшшнеское ^ент§льное* {¡¡«ес^е р щ Ристец-.jjttffl прдэдд'к'изунр|шв ^¡ву^а^ ре$§ щ

^^^Уш'е^ст^''' 'V

Но^це^уа^а^ ^одель речевой цщрттш. ртоОра^афв^я Чаши предст^ле^я о »«еха^з^ ^риодарвания сис^эд в це-закономе^остях ^за^орЕшзи рорт^ш аяацентов. содержит блоки форциррведи. ре^лизафш коммуникативного намерения И понимания ' знешшх ко^шуникативнызс явлений. Структурные звенья блоков Мотивация - уртацовка - база знаний; восприятие

- распознавание - интерпретация и щ>,) охвачены слсирыми связями. соответствующими уровням иерархии и взздцодействия указанных блоков. "

Рассмотрение системы речевой ^омцуншсашщ с позиции щ-яостности (единства) составные »истрй. включая язык, звучащую речь и импрессивную речь позволяет дать более адекватное обь-

\ Шрейдер Ю.А.. Шаров A.A. Системы и модели. - М.: Радар и связь. 1982.- 152 с. См.та^е: Кибрик А.Е. Подлежащее и проблема универсальной модели языка// Известия АН.- Сер.ЛиЯ. 1979. -'т.38.- Я Котов Р.Г,,^Вовико£1 А.Й.. Скокан Ю.Ц. Прикладная лингвистика и информационная технология.-И.: Наука, 1987. -164 с; ¥арчук ¿.'¿^Проблей* машнного перевода.-. Ц.: Наука. 1983.

2 Сидоров Е.В. Проблемы речевой системности. - И.: Наука, 1987. -s с.28; Нантер JL А. Системный анализ речевой интонации.

- Г : Высшая школа. 1988. - О; 17; Мельников Г. П. Системология и языковые аспекты кибернетики. - И.: Наука. 1978;

яснение многим языковым явлениям 1. Например, наблюдение над больным с тяжелой формой афазии, но сохранившим интеллект, показало, что больной мог повторять мелодию популярной песни, сопровождая ее ритмическими движениями рук, ног. головы: при затррмокении движений"воспроизведение мелодий нарушалось.

Чрезвычайно показательны наблюдения за детьми, пишущими под диктовку. При затруднении нормальной импрессивной внутренней речи зажатием языка между зубами, число орфографических ошибок у учеников резко возрастало. Вместе с тем нарушение Фонематического слуха в виде смешения некоторых звуков, например. заднеязычных или звонких/глухих, в ряде случаев приводит к потере способности у больного к активной спонтанной устной речи, при этом в произнесенных словах могут наблюдаться звуковые подмены (так называемые "литеральные парафазии"). При тугоухости и глухоте нормальная речь затруднена, ее громкость и интонация искажены. Приведенные примеры с исключением одного из элементов системы иллюстрируют нарушение Функционирования системы в целом, ее целостности.

Свойством эмерджентности объясняется восприятие звукового облика фонемы по совокупности различительных признаков (здесь уместно привести замечание Л.Р.Зиндера о артикуляции Фонемы как целостной единицы г).

Диффузность в модели речевой коммуникации определяется нечетким размытым характером распределения функциональных нагрузок между составляющими подсистемами . Именно поэтому воз-моино особое взаимоотношение ьежду интонацией и синтаксисом в звучащей речи ("принцип замены" А. М. Пешковского): чем полнее представлены грамматические средства, тем слабее интонационные признаки во Фразе и обратно - чем сильнее интонационные средства, тем слабее могут быть грамматические. Однако интонационные признаки не имеют однозначного соответствия с синтаксическими

1 См., например: Златоустова Л. В. Интонация и просодия в организации текста// Звучащий текст. - М.: ПНИОН. 1983. -с. 12; Хомская Е.Д. Нейропсихология. - М.: МГУ, 1987. - с. 152.

2 Зиндер Л. Р. К вопросу об' артикуляционной базе// Экспериментальна фонетический анализ речи, - Л.: ЛГУ. 198-1,- С. 12.

и могут с ними даже расходиться '.

Наблюдения "принципа .замены" в звучащей речи носят в основном качественный характер или ограничены оценкой отдельных параметров. Так. в эксперименте Т. И. Николаевой со сложноподчиненными союзными предложениями контрастной характеристикой при отсутствии союза оказалась длительность' паузы. Вместе с тем комплексная оценка явления взаимной компенсации звуковых средств языка представляет несомненный интерес. С этой целью нами были проведены эксперименты по оценке перцептивного распознавания омысла фраз по ключевым словам, произнесенным четырьмя дикторами в объясняющей контексте с разной силой речевого воздействия:

1. Иди! Отрой дверь/ ("приказ"); Иди! Возвращайся, пожалуйста. побыстрее! ("просьба"): Иди! Я не возражаю! ("разрешение"); Иди! Тал тебе будет хорошо! ("совет") и т.д.

2. Тише! А то испортишь! ("предостережение"); Тише! А то хуже будет! ("угроза"); Тише! Не плачь, ("утешение"): Тише! Мы их напугаем, ("заговор") и т.д.

Группа из 10 аудиторов прослушивала слова Иди! или Тише/, сегментированные в случайном порядке из приведенных фраз и отмечала в отпечатанном списке ту Фразу, которая соответствовала перцептивно воспринятому виду речевого воздействия. Были получены следующие результаты. Распознавание вида речевого воздействия для ключевого слова иди оказалось равным: "отгон" -9155, "уступка" - 82. "призыв" - 79. "указание" - 73. "приказ" - 70, "подзыв" - 76, "разрешение" - 61, "приглашение" - 45. "просьба" - 45. "мольба" - 52%. а для ключевого слова тише равным: "угроза" - 93%. "утешение" - 70. "предостережение" -56, "заговор" - 45%. Если принять за условную величину уверенного распознавания 75%, то окажется, что из всех видов воздей-

4 Пешковский A.M. Интонация и грг -матика// История советского языкознания/Под ред. Ф.М.Березина. - М.: ВШ. 1981.-С.304. См. также: Виноградов В.В. Основные вопросы синтаксиса предложения.- Там же.- С.316; Николаева Т.М. "Принцип замены" A.M. Пешковского и отдельные компоненты интонации// Вопросы Фонетики и обучение произношению/ Под ред. А.А.Леонтьева и Н.И.Самойловой.- М.: МГУ. 1975.- С. 153..

ствия были уверенно опознаны по ключевому слову менее половины (5 из 14): "отгон", "угроза", "уступка", "призыв", "подзыв" -первая группа воздействий. Остальные виды речевых воздействий опознавались неуверенно (вторая группа). Наблюдались систематические ошибки отнесения одного вида речевого воздействия к близкому по эмоциональной окраске другому виду, например, воздействие "просьба" в 45Х случаев отнесено к воздействию "мольба" и наоборот "мольба" к воздействию "просьба" в 37% случаев. Для воздействий "убеждение" и "совет" соответствующие цифры равны 52 и 303.

Анализ осциллограмм и спектрограмм фраз с ключевым словом тише на голосах двух мужчин и двух женщин показал, что уровень и длительность безударной гласной по сравнению с ударной увеличились примерно в 1.5 раза при речевых воздействиях первой группы по сравнению со второй. При этом частота основного тона на ударном гласном оказалась несколько увеличенной, как и частота второй и третьей формант, а характеристики согласных изменились незначительно. Этим, видимо, и объясняется неуверенное различение вида речевого воздействия по изолированному ключевому слову. Виды речевого воздействия заметно отличаются по признаку пауэации фраз: ключевое слово в первой группе с сильными видами воздействия выделяется во фразе паузой длительностью до 300...400 мс. а в группе со средней и слабой силой воздействия - паузой короче 100...150 мс, причем во фпазах некоторых дикторов ключевое слово вообще не выделено четкой паузой.

Сравним эти результаты с данными, полученными для слова посадка, произнесенного диктором с разной эмоциональной установкой [2]. Для положительных видов эмоций ("удовольствие", "восторг") зарегистрировано повышение частоты второй-четвертой формант на 100...300 Гц и отрицательного вида эмоций f"ирония") - на 350 Гц. Отмечено также в последнем случае увеличение скорости изменения частоты основного тона на ударном гласном до 800 Гц/с, а также усиление микрофлуктуация (джиггера) периодов основного тона и удлинение заударного слога по сравнению с ударным. Таким образом: вид эмоциональной установки в отличие от в;,да речевого воздействия представлен в звучащей речи контрастными акустическими признакам;:, что и обеспечивает

уверенное распознавание видов эмоций по семантически нейтральному слову 1.

Таким образом, приведенные данные позволяют дать расширенную интерпретацию "принципа замены" A.M. Пешковского: чем больше сила речевого воздействия и ярче эмоциональная окраска, тем слабее влияние контекста на распознавание смысла ключевого слова и обратно: чем слабее контраст акустических и перцептивных характеристик, тем сильнее воздействие контекста на восприятие.

Свойсъво адаптивности определяется биологическим характером системы речевой коммуникации. Предполагается, что слуховое распознавание единиц языка осуществляется на основе звуковых образов этьх единиц, хранящихся в мозгу. В таком случае процесс речеобразования должен сопровождаться процедурой нормализации параметров речи на сегментном и просодическом уровнях. В качестве механизма ' адаптации может выступать нервномышечная активность речевого аппарата, корректируемая по цепи акустической обратной связи.

Временные изменения формант звуков в фазе экскурсии направлены к некоторым значениям в фазе выдержки. Можно высказать предположение, что возможная точность нормализации частоты формант определяется чувствительностью слуха к минимально заметным перемещениям максимума в спектре сигнала, которые равны ширине критических полос слуха (частотных групп).

Самоорганизация является особым свойством биологических систем, характеризующимся возрастанием информационной избыточности и снижением энтропии единиц речи на различных уровнях реализации.

Упорядоченность распределения этих единиц приводит к увеличению избыточности R, характерной для самоорганизующихся систем: R=l-Ht/Н0, где Ht —Iptlgp, -энтропия единиц речи с ве-

1 См. также: Речь, эмоции и личность: материалы симпозиума/ Под ред. В.И. Галунова. - Л.: Наука. - 1978. - 197 с.Румянцев М.К. и др. Машинное моделирование (синтез) эмоциональных интонаций// Доклады XI Вс. акуст. конф.. Москва,:1991. -Секция Ф. - С. 17-20.

роятностью Pi. Н0 - то же)при pt ■ const.

Это свойство модели речевой коммуникации проявляется, например, в изменении (росте) вероятности угадывания в тексте очередной буквы по п-1 предшествующим и слов в составе устойчивых словосочетаний в речевом потоке.

Статистическое распределение фонем довольно точно подчиняется закономерности Мандельброта-Ципфа, установленной для слов r*p=const, где г - ранг фонемы, р - вероятность встречаемости.

Место, которое занимает то или иной слово в системе лексических единиц, определяет его потенциальные связи. BObii'^-носта образоввать словосочетания 1.

Поэтому не вызывают удивления результаты эксперимента, в котором из-за недостаточной языковой компетенции у детей 7-8 лет и у иностранных студентов I-II курсов," изучающих русский язык, распознавание слов в шумах оказалось в 1.5 раза хуже, чем у носителей языка г. Еще более контрастные результаты должны дать устойчивые словосочетания.

Сюда следует добавить особенности функционального стиля: в разговоре друзей на бытовую тему ожидается использование определенной лексики, в политическом докладе ожидается упоминание определенных фактов, следовательно - и лексики. Сама сфера общения, предметная область и соответствующий ей набор языковых средств существенно снижают многообразие отбираемых говорящим языковых средств,, что конечно снижает область поиска, выбора при распознавании. В оптимизации речевого акта, придании ему особой выразительности используются эмоциональные жесты. опережающий характер которых может также способствовать

1 Апресян Ю.Д. Идеи и методы структурной лингвистики. -М.: Просвещение. 1966. - С. 86. См. также: Речевые тесты и их применение/Под ред. Л.В. Златоустовой.- М.: МГУ. 1986,- С.37.

8 Штерн A.C. Статистическая модель восприятия слова по лингвистическим признакам// Экспериментальная фонетика/ Под ред. Л. В. Златоустовой - М.: МГУ. 1989. - С. 64.; ее же: Газные способы "включения" механизма вероятностного прогнозирования// Экспериментально-фонетический анализ речи/ Под Л. в. Вон-

дарко - Л.: ЛГУ. 1984,- С. 141.

восприятию речи 1. Вероятно, все это могло бы объяснить устойчивость понимания звучащей речи носителями языка в условиях нечеткой артикуляции и определенной элипсисности разговорной речи.

В свете описанных системных свойств звучащей речи в работе развивается представление о гипотетической модели восприятия. основным вопросом для функционирования модели остается противоречие между устойчивостью восприятия единиц языка в речевом потоке и значительной вариативностью акустических характеристик звуковых единиц. Например, распределения формантных портретов гласных в речевом потоке имеют значительные области перекрытия, которые могут выходить за зоны категориального восприятия. В модели, осуществляющей распознавание "снизу-вверх". должны при этом возникать многочисленные ошибки на сегментном уровне, что и демонстрируют соответствующие устройства автоматического распознавания звучащей речи (см.. например. сн. г на стр. 4), Объяснение же восприятия действием лингвистической корректировки на синтаксическом уровне представляется недостаточным, поскольку хорошо известны факты редукции и даже потери заударных во флексиях лексических единиц (например, глухого заударного во фразе Наш(х) бьют, которая получает однозначный смысл только в контексте). С другой стороны, объяснение восприятия принципом "сверху-вниз" на основе звуковых обликов единиц речи 2 вполне вероятно, хотя и нувда-ется в уточнении того, что представляют собой эти облики.

В предлагаемой модели восприятия действуют оба принципа ("снизу-вверх" и "сверху-вниз") при•приоритете первого принципа. когда воспринимается изолированное слово, слог и второго

1 Татубаев С.С. Жесты как компонент искусства.- Алма-Ата: Казахстан. 1979. - 109 с.

г Жинкин Н.И. Речь как проводник информации. - М.: Наука. 1982.- С.160. См. также: Потапова Р.К. Тайны современного кентавра. Речевое взаимодействие "человек-машина" - И.; Радио и связь, 1392.- 248 е.; ^cndarKo L.V. Phonetic aspects of stu-dlng phonetic systems and speech activity// Proc. Xl-th ICPhS, 1987. - Pl.1.1.1.; Речевая связь с машинами: Пер. с англ.//ТИ-ЙЭР. 1976,- Т. 64. - N 4,- 199 с.

принципа, сопровождающего восприятие речевого континуума. Однако для объяснения, механизма восприятия звучащей речи в условиях значительной вариативности акустических параметров зву-котипов требуются дальнейшие исследования. Одно из возможных направлений таких исследований состоит в выявлении устойчивых различительных признаков групп звукотнпов, соотнесенных с коррелятивными рядами фонем по перцептивным характеристикам. Исходные данные могут быть получены путем артикуляционных измерений разборчивости. Обоснование такого подхода содержится во второй главе диссертации. Приведем некоторые результаты.

1. Наши исследования проведены на материале слоговых артикуляционных таблиц, включавших все возможные СГС слоги русской речи. В измерениях разборчивости участвовала бригада из четырех дикторов (двух мужчин и двух женщин) и четырех аудиторов. Были получены полные матрицы ошибок из 36 согласных для 4-х видов трактов, включая естественную речь (при соотношении сигнал/шум 10 дБ), две модели анализа-синтеза речи (LPC-воко-дер со скоростью передачи 2.4 кб/с. полувокодер со скоростью передачи 9,6 кб/с). Обьем измерений составил около 100 тыс. звуков, что обеспечило статистически устойчивые результаты (видимо впервые для русского языка) 1. Обработка, матриц ошибок выполнялась на ПЭВМ IBM PC/AT с использованием методов многомерного статистического анализа данных.

Методом статистического регрессионного анализа матриц звуковых ошибок ("ослышек"), были установлены следующие ранги и веса (в отн. ед.) групповых признаков звукотипов (в порядке

1 одно из первых исследований матриц звуковых ошибок выполнили G. Miller. P. Nicely (1955) и S. Singh (1968) CMUler G.. Nicely P. An Analysis of Perceptual Confusion among Consonants// JASA, 1955.- Vol.27. - N 2.- P.338-352; Singh S. A Distinctive Feature Analysis of Responses to a Multiple Choice Intelligibility Test // IRAL. 1968.- N 6. - P. 37-53]. В первой работе использовались 200 открытых слогов СГ. включавших 16 согласных и гласный /а/ английского языка, а во второй -минимальные пары из односложных слов. Однако ограниченный объем данных не обеспечил проведение представительного статистического анализа.

снижения): твердый/мягкий - 5, звонкий/глухой - 3. сонорный/шумный - 2, смычный/щелевой - 1.

Перечисленные признаки можно было бы отнести к способу образования, хотя некоторые авторы [М.В. Панов (1979); М.И. Ма-тусевич (1976)] относят признаки мягкости и „звонкости к отдельным категориям. Ранжировка признаков только по акустическим параметрам., согласно методике визуального "чтения" спектрограмм 1 отличается от экспериментально измеренной по перцептивным характеристикам: признак "смычный" опережает по весу признак "шумный", а признак-"звонкий" имеет весовой коэффициент равный весу признака "твердый" или оперекает его. Причина расхождений возможно лежит в недостаточной полноте сведений о скрытых знаниях экспертов-лингвистов и известной погрешности экспериментальных данных.

2. Групповые признаки имеют достаточно устойчивые групповые акустические характеристики независимо от стиля произношения, позиционных и комбинаторных изменений фонем. С другой стороны признаки места образования в фазах экскурсии и рекурсии оказываются непостоянными и их акустические корреляты в фазе выдержки не всегда фиксируются из-за явлений редукции и коартикуляции.

3 В речевом потоке действует закон смысловой семантической связности текста, определяемый условной вероятностью появления звука после предшествующих п-звуков. В звукосочетаниях СГС этот закон не действует и можно предположить, что распределение звуковых ошибок ("ослышек") дол;::но как-то зависеть-от вероятности встречаемости звухотипов в русской речи. Анализ матриц звуковых ошибок подтвердил сказанное: чем частотнее звукотип, тем лучше его различимость. Различие между естественной и синтезированной речью проявляется прежде всего, в увеличении коэффициента регрессии и коэффициента множественной

1 Цзуэ В. Лингвистический подход к автоматическому распознаванию речевых сигналов// ТИИЭР: Пер. с англ.- 1985.Т. 73. - С. 75-91; Зиновье: а Н. В. Особенности фонетической интерпретации "слепых" сонограмм при работе с временным окном// Труды АРСО-ХШ - Новосибирск. 1984.- Ч. 2. - С. 30-32.

корреляции. Можно предположить, что в условиях более затрудненного восприятия синтезированной речи по сравнению с естественной по различительным признакам звукотипов аудиторы в большей степени рриентируют^Я на их вероятность встречаемости. Таким образом, проведенный анализ дает воздоя^ость уточнить описание ({юнологичесрй системы на основа объединения звукотипов 8 грУДПЦ по признакам близости (схожести) слуховых характеристик. распознавании звучащей речи используются ранги групповых различительных признаков звукотипов. соотнесенных с коррелятивнщ«! рядами фонем, и вероятность ик встречаемости-

4. Перцецтивнце звуковце ошибки ("ослышки") обладают свойствоц р<нфадения прщдлежности к групповым различительным признакам произцеседеад звуков. $ нашем эксперименте и? общего чис^ц ерибоц в распознавании твердых сегласшм естественной речи равного сохранили принадлеадость К группе твердых 7% ■осдашек" и лишь ^ "ослышек" отошел к группе мягких, а ИЗ общего числа '•ослышек" ницт«* ергдаенвд равное 8* сохранили групповую принадлежность и перешли в группу твердых - 2%. Такиц образом, па признаку твердШ/кягкий групповую принадлежность сохранили 75...8855 "оелдаек". Такой же характер имеют данные по различимости других признаков: по групповому признаку звонкий/глухой из общего числа ошибок равного 5... 1256 групповую. принадлежность сохрани® 75...80% "ослышек". по признаку "сонорный" иа общего числа ошибок равного 4% - 80%. по признаку "смычный" из 4% ошибок - 70% и по признаку "щелевой" из общего числа ошибок 13% - 75%. Интересно отметить, что из всех "ослышек" потерявших признак сонорный 2/3 перешли в смычные и 1/3 в щелевые, а, "ослышки", потерявшие признаки "щелевой" и "смычный", получили поровну признаки "сонорный" и "смычный" вместо первого, "сонорный" и "щелевой" вместо второго.

5. В синтезированной речи групповые различительные признаки звукотипов менее устойчивы по сравнению с естественной речью. При увеличении ошибок в распознавании согласных по -.сем группам примерно в 2-2,5 раза относительное число "ослышек", потерявших групповую принадлежность различительных признакоь произнесенных звуков, возросло по признакам: "сонорный" - до 50% (вместо 20% для естественной речи), в том числе получивших признак "смычный" - 15% и "щелевой" - 35%; "смычный" - "»0%

(вместо 3055 для естественной речи), в том числе получивши) признак "сонорный" - 18% и "щелевой" - 52% и. наконец, "щелевой" - 48?5 (вместо 252 для естественной речи), в том числе получивших признак "сонорный" - 16% и "смычный" - 32%. По различительным признакам твердый/мягкий и звонкий/глухой соотношение числа "ослышек", сохранивших групповую принадлежность исходных звукам или сменивших её. для естественной и синтезированной речи изменилось мало. Исходя из сказанного, можно предложить такое объяснение определенной неадекватности показателей разборчивости синтезированной речи и абонентской оценки внятности"(понятности) фраз: внятность определяется не только средней распознаваемостью согласных (в нашем примере по признаку твердый/мягкий - 82... 8495, звонкий/глухой 78... 88, сонорный -89, смычный -85 и щелевой - 11%). но также устойчивостью сохранения частных различительных признаков звукотипов искаженной речи. '

Рассмотренное свойство синтезированной речи сравнимо со случаями ненормативного произнесения звуков речи лицами, изучающими русский язык, например согласных /л.р/: /п.ф/ во фразе Лора- играла роли феи и Психеи, проинесенной корейцем; согласных /р, т'.,л'/ ео фразе Татьяна и Илья реконструировали территорию парка, произнесенной немцем, французом.

6. Обращает на себя внимание близость по перцептивным характеристикам сонанта /у к мягким / л', н'/, например, вместо переданного слога ян /Зан/ был зафиксирован слог лян /л'ан/, вместо тай - таль. Наблюдались также .случаи перехода начального /$/ в мягкие /м',в'/ и конечного.- в /с',т'/. Типичен также переход губного смычного /б/ в щелевой /в/, аффрикаты /ц/ - в смычный /т/ или щелевой /с/, аффрикаты /ч'/ - б /г'/-,

В звукосочетаниях С'ГС с гласными /и,е/ частота второй форманты ?г гласных и сонанта /¡/ близки 1. В позиции СГЗ. С'ГЗ сонант /3/ часто представлен третьей формантой при слабых ,

1 См. также: Зубкова Л.Г. Фонетическая реализация консонантных противопоставлений в русском языке - м.: УДН. 1974. -С. 59; Бондарко Л. В. Звуковой строй современного русского языка, - М.: Просвещение, 1977,- С. 67; Широков О.С. Введение в языкознание, - М.: МГУ, 1985,- С. 42.

Гг, что сближает /¡/ по характеристикам с мягкими согласными /х'.Ф'Л Вид 1-образного трека Гг подобен описанному для звукосочетания ЗГС. Как и для мягких согласных в спектре наблюдается усиление полосы частот 2... 3 кГц и ослабление полосы частот 1...2 кГц. Отметим, что конечный Л)/ представлен в изолированных слогах СГ$ часто глухим напряженным вариантом Л)/ в отличии от конечного бесшумного неслогового /и/ в безударных слогах слов.

Анализ матриц звуковых ошибок позволил выявить перцептивно близкие группы звуков, которые наиболее часто смешивались. Исследование отмеченного явления приведено во второй и третьей главах диссертации. Типичные замены для начальных согласных следующие:

б~>м.п.в: в—>м, б; к. г— >х; л~>р.н.м: и—>н,в.б; н—>л,м; п—>б,ф; б'— >м',п\в'; в'-->ф',м\б'; г'-->х',л'; к'—>х'; л'~>н',м',р\л'; м'—Ж'.б'.в'.л'; н'—>л'.м'; п'—>б'.ф'; р'—>л': ф—>п; ф'— >в'.п'; х—Ж.г; х'—Ж'.г'

Замены для конечных согласных:

п—>т: т—>п; с—>ш,ц; ш-->ч. с; ч-->щ, ш; ф—>х; м-->н, л; л—>р.м,н; н—>м.л; р—>л; п'—>т; т'—ж'.п': с'—>щ; щ—>с',ч; ц—>с; х—>ф; м'—>н': л'—>р'; н'—>м'; р'-->л'; к'-->т';

Как уже отмечалось, переходы одних звуков в другие совершаются в основном внутри групп, соотнесенных с коррелятивными рядами фонем. С другой стороны, в отличие от традиционной классификации звуков щелевой согласный /в/ оказался перцептивно близким к сонанту /м/ и смычному /б/, смычные /г'.к'/ - к щелевому /х'/. Видимо в первом случае преобладающим признаком является признак "губный", а во втором - "заднеязычный".

6. Каждый из групповых признаков звукотипзз соотнесен с рядом акустических параметров, а отдельные акустические параметры определяют ряд перцептивных признаков звучащей речи. Для иллюстраций сказанного приведем результаты измерения разборчивости речи, синтезированной с нормальным спектром (тональным -на звонких согласных и гласных, шумовым - на глухих согласных)

или только с шумовым. Различимость звонких согласных в синтезированной- шумной речи почти не изменилась по сравнению с нормальной речью (89 и 9256 соответственно), а различимость глухих согласных снизилась примерно в 1,6 раза (до 85%). Эти результаты объясняются тем, что кроме вида спектра звонкие и глухие коррелятизных пар звукотипов, например /в-ф; з-с/, различаются также формой спектра (звонкие являются более низкими), длительностью (звонкие короче глухих, в том числе фаза смычки также меньше), интенсивностью (звонкие громче), частотой основного тона на переходе от согласного к гласному (см. сноску на стр. 26)

7. Акустические параметры звукотипов в речевом потоке непостоянны. Причины вариативности характеристик звукотипов отнесены к четырем группам: лингвистической (позиционные и комбинаторные изменения фонем, стиль произношения), физиологической (различия по половому и возрастному признаку говорящего, зависимость от состояния и индивидуальных особенностей строения речевого аппарата), экстралингвистической (эмоционального состояния говорящего, воздействие акустических шумов) и технологической (характеристики помещения и технических средств звукозаписи и звуковоспроизведения). На основе предложенной классификации ео второй главе работы дается анализ статистических характеристик звучащей нормативной речи.

8. Акустические параметры звучащей речи в общем случае не имеют собственных критериев интерпретации значения звуковых единиц. Однако статистические характеристики акустических параметров звучащей речи могут быть прямо соотнесены с показателями разборчивости, полученными путем психолингвистического эксперимента или путем расчета пс методикам на основе положений теории разборчивости [Ю.С. Быков, 1959; М.А. Сапожков, 1959; Н.Б. Покровский, 1962; N. French, J. Steinberg, 1947].

К основным понятиям теории разборчивости относится фор-кантное распргделение A(f), представляющее собой зависимость относительного количества информативных единиц речи (формант), приходящихся в среднем ка каждую частотную полосу речевого сигнала. Анализ методоз измерения разборчивости изложен в третьей главе, а методов расчета синтезированной речи - в пятой главе.

Формантное распределение для мужских голосов Ам (П и для кенских А,(Г) должно конечно различаться, однако для русской эечи это различие не определено. Приведенные в работе данные восполняют отмеченный пробел '.

Для измерения формантного распределения А, (Г) был использован следующий метод. Путем артикуляционных испытаний измерялась разборчивость слогов Б! в полосах частот Р1. Далее по зависимости разборчивости формант от разборчивости слогов А(з) вычислялась величина А ). Разборчивость формант в полосе частот Г,

А! - А (Г, + ^ - АСсИ?,) и (с учетом аддитивности формант) интегральное формантное распределение

МП - % А,.

Артикуляционные измерения проводились по таблицам ВКАС на высококачественном электроакустическом тракте. Для получения статистически обоснованных данных к измерениям была привлечена артикуляционная бригада из девяти дикторов-мужчин и четы-рех-пяти слушателей. Средний возраст дикторов 23 года и слушателей 20 лет. Члены бригады не имели дефектов речи и слуха. Бригада работала ежедневно полный рабочий день с перерывами на отдых при норме приема 40 таблиц. За два месяца непрерывных испытаний по пяти дней в неделю было принято около 400 ООО звуков. Большой объем единичных измерений обеспечил высокую достоверность результатов. Величина абсолютной погрешности измерений с вероятностью 0,95 не превышала 2-3%. Коэффициент экспериментальной практики бригады г = 0,98...0,99. Полученные частотные полосы равной разборчивости для мужских голосов заметно отличаются от средних, например, для полосы частот 100... 1000 Гц формантная разборчивость (и соответствующая разборчивость слогов) для мужских голосов равна 0,3 (58%), а по

1 В работах Н.Б. Покровского (1962) и ».С. Быкова (1959) приведем усредненные данные для мужских и женских голосов; известное распределение Л„ (f) [см., например,: Kryter К Methods for the Calculations and Use of the articulation Index/' JASA. 1962,- Vol.34.- N 11.- P. 1689-16973 относится к англиГ кой речи и может рассматриваться только как ориентировочное

усредненным данным 0,25 (45%); для полосы частот 100...1700 Гц -0.5 (82%), а по усредненным данным 0,44 (74%)... Отмеченное отличие распределения A„(f) от усредненного должно учитываться в процедурах оценки качества передачи, при создании средств анализа-синтеза и распознаваний' речи.

Фонетическое качество звучащей речи определяется совокупностью признаков, характеризующих естественность, узнаваемость, понятность, громкость, наличие посторонних призвуков и помех. Цель тестирования заключается в установлении степени соответствия качества звучания некоторым нормам; выявлении источников искажения и их устранения.

Тестирование звучащей речи осуществляется в интересах телефонии (оценка качества передачи или тракта связи), педагогики (обучение произношению на иностранном языке), медицины (выявление дефектов речи и слуха). ' криминалистики (идентификация личности по голосу) и др.

В развитие методов оценки качества звучания значительный вклад внесли Л.В. Щерба (1940). Л. Р. Зиндер (1954). М.А. Сапожков (195Э). Н.Б. Покровский (1962). И.Е. Горон (1959). Н. Fletcher (1929). G. Fairbanks (1958), К. Kryter (1965). В последние годы опубликованы результаты ряда новых исследований по данной проблеме [Л.Р. Зиндер, A.C. Штерн (1986). Р.К. Потапова (1986), Л. ß. Златоустова .(1986), Г. В. Вемян (1985), W. Volers (1983)].

Однако некоторые вопросы требуют своего решения, например, по обоснованию соотношения оценок качества речи, полученных разными методами на основе соответствующих теоретических предпосылок.

Психолингвистические методы тестирования можно условно разделить на методы измерений с использованием артикуляционных таблиц (слогов, слов, фраз) и методы вербального описания качества звучания х. Описание этих методов в третьей и четвер-

1 Методы инструментальных измерений качества звучания (корреляционные и тональные методы, метод линейных спектральных пар и др.) в данное исследование не включены. Описание этих методов см., например: Quakenbush S. R. Objective Measures of Speech Quality - Prentice Hall, 1988.

той главах работы иллюстрировано примерами оценки качества передачи; полученные, результаты и выводы вполне сохраняют свою значимость и для других видов тестирования.

Правильность оценки информационной пропускной способности тракта телефонной связи может быть достигнута лишь с тем приближением. с которым свойства звучащей речи отражены з испытательном материале и измерительных процедурах.

Были исследованы два типа таблиц: таблицы выбора и таблицы парных звукосочетаний. Артикуляционные измерения разборчивости речи проводились с использованием ЬРС-вокодера со скоростью передачи 2.4 кб/с. Показано, что по сравнению со слоговыми таблицами по ГОСТ 7153-68 эти таблицы имеют значительную избыточность (соответствующие значения разборчивости 84.4; 98,9 и 96,7%). Поэтому их применение, видимо, ограничено условиями измерений при низких значениях разборчивости для сильных шумов и помех.

Таблицы парных звукосочетаний аналогичны диагностическим таблицам Ш?Т. применяемым для оценки разборчивости речи в США 1. Таблицы БИТ имеют ряд недостатков. Инстинктивная Функция фонемы, которая противопоставляет лексическую единицу по контрасту звуковых элементов, ограничена заданной моделью парных дифференциальных признаков. Поэтому в эксперименте выявляется только часть реальных перцептивных характеристик. Кроме того, лексическое значение вносит значительную избыточность в измерения (например, в одном эксперименте аудиторы прослушивали односложные слова и слоги СГС в случайном порядке следования. Получена различимость слов около 100%, а слогов - 70%).

Таблицы СГС позволяют получить полную матрицу звуковых ошибок и далее выполнять анализ на основе разных моделей восприятия, включая модель дифференциальных признаков Н. Хомского.

Исследована одна из разновидностей методов слоговых артикуляционных измерений - метод дописывания, состоящий в том. что аудитор получает отпечатанную таблицу с неполными слогами, в которых отсутствует начальный (конечный) согласный, например, ...е/о/м, ка.......и/ы/с и т.д. При испытаниях елу-

1 Volers W. Diagnostic Acceptability Measure for Speech Communication Slstems / ICASSP 77. - P. 204-207.

шатель дописывает слог услышанным звуком, например, сем. каш, б ы с. Экспериментальные данные получены на моделях анализа-синтеза речи со скоростью передачи информации 2,4. ..4,8 кб/с. Звуковая разборчивость по методу дописывания Л = 1 -п Pi4i; где pt - вероятность встречаемости 1-звука в таблице слогов. qt - вероятность искажения i-звука и приближенное значение Д - 1 - q, где q - относительное число искаженных начальных (конечных) согласных в таблице. '

Предложенный метод сокращает требуемое время тренировки артикуляционной бригады и отвечает требованиям автоматизации измерительных процедур на базе ПЭВМ. Применение ПЭВМ исключает известное явление запоминаемости таблиц путем процедуры перемешивания слогов, обеспечивает лингвистический анализ данных, оформление документации, а также сопоставимость оценок разборчивости путем сравнительных последовательных испытаний исследуемых систем речевой связи. Описанный метод измерения разборчивости речи и пакет машинных алгоритмов обработки данных на ПЭВМ IBM PC включен в проект государственного стандарта по методам оценки разборчивости и качества речевой коммуникации.

Для оценки качества речи применяют методы мнений, экспертных оценок, парных сравнений и селективных признаков. Наши исследования показали, что применение первых двух методов ограничено в основном испытгниями трактов связи с участием целевого эксперта. Выявлены условия, при которых метод парных сравнений обеспечивает повторяемость и стабильность оценок. Разность в субъективных оценках качества речи для сравниваемых режимов возрастает при заметном различии и снижается лри мало заметном различии. Оценка по' альтернативной шкале не зависит от длины фраз. При балльной шкале при малой длине фраз 1-1,5 с наблюдается значительный разброс балльных оценок, а при длине фраз 2-4 с оценки остаются примерно постоянными. Поэтому, рекомендуется для режимов, различающихся незначительно, давать альтернативные оценки заметности по.критерии "Что больше нравится?', а при значительном различии давать оценки в. баллах по критерию "На сколько лучше?''.

Поскольку при сравнении моделей ставится задача выявления способности этих моделей к адекватной передаче речевых сообщений, то весьма существенно отображение в речевых тестах всего

многообразия эмоционалыгогстилистических различий устной речи. Для проведения измерений рекомендованы специально подобранные фразы.

Проведено обоснование системы селективных признаков, адекватно представляющих качество речи, для чего исследована проблема вербализации слуховых образов 1.

В проведенных экспериментах по оценки качества речи использовались 24 признака, которые были выделены в результате экспертной оценки специалистами-филологами различных моделей анализа-синтеза речи. Записи синтезированной речи многократно прослушивались и сравнивались друг с другом и с естественной речью. Из всего набора признаков были затем выделены 10 признаков, которые встречаются наиболее часто и в терминах которых можно описать различные модели.

К признакам, воспринимаемым как механические искажения, относятся: дребезжание, треск, хрип, призвуки, глухость, фон, а к признакам искажения речевых характеристик: картавость, гнусавость, плаксивость, нечеткость артикуляции и шепелявость.

Исследования показали, что между оценками разборчивости и качества речи по методу парных сравнений, а также между оценками по методу мнений и качеством речи по селективным признакам имеется тесная связь, причем последний показатель оказался особенно чувствительным- при хорошем качестве речи. В моделях анализа-синтеза речи со скоростью передачи 4,8 кб/с отмечается по сравнению с режимом 9,6 кб/с усиление искажений вида "хрип", "бульканье", "гнусавость", а со скоростью передачи 1,2 кб/с - дополнительное усиление признаков "плач", "звонкость", "реверберация", "картавость".

На основе проведенных исследований предложена модель обобщенной оценки качества речевой связи, учитывающая показатели качества передачи Х4 (разборчивость, натуральность, узнаваемость, селективные признаки), полученные с учетом требований к передачи информации по каналу связи (ш^...озап!ищенноогь и помехоустойчивость передачи, тандемное соединение вокодеров с переприемом по низкой частоте и др.).

1 Ломов Б.Ф., Беляева Ф. В.. Носуленко В.Н. Вербальное коли рование в познавательных процессах. - М.: Наука. 1986. - с. ' !У.

На вход модели поступает специальный речевой тест и осуществляется оценивание показателей качества X,. Далее выполняются процедуры нормирования и взвешивания показателей Xj," где 1 - 1.2.. .h.

Нормированное значение показателя -Хщ " (Xj - Xlnln)/(X1B„ - Х1я1л), где Х1вах - максимальное значение. Х1и1я - минимальное значение.

После умножения Х1И на коэффициент веса К, получим Yt - Хщ*^. где Ку • 0..Л.

Обобщенный показатель качества I • I Yt/h. который мокет быть получен путем опроса мнений экспертов.

Путем изменения параметров сигнала х,. определяющих показатели разборчивости Ха и качества Хр речи осуществляют поиск минимума функции d - I0 - I. где 10 - исходная оценка качества звучания при q - В„ » О; I » X I3 ta - интегральная оценка для заданных условий речевой коммуникации (при q > О,- В^ > 0. tj - 1. J - 1.2.;.Ы).

Найденное значение оценки при d - d„tB представляет максимальную интегральную оценку качества речевой коммуникации

I - W-

Распределение tj определяется экспериментально, например, по относительному времени передачи информации по КВ-радиокана-лу с помехами q. или задается системными требованиям!. Минимум d получают путем изменения соотношения скоростей передачи параметров Xj. введения избыточности в передачу, а также обнаружения и исправления ошибок на приеме по известным лингвистическим зависимостям. •

Описанная модель позволяет максимизировать интегральную оценку качества речевой коммуникации. Описанный алгоритм реализован на персональном компьютере IBM PC со средствами ввода-вывода речевой информации и программами инструментальной оценки.

На базе высококачественного синтезатора речи были проведены экспериментальные исследования ряда параметров звучащей речи, в т.ч. восприятия смещения формантных треков и микроф-луктуаций основного тона. Основные результаты описаны в пятой главе работы. Приведены также оценки эффективности параметрических моделей. Проведены измерения и расчет разборчивости

синтезированной речи при воздействии частотных искажений, акустических шумов, амплитудного ограничения, компрессирования и тандемного включения вокодеров.

Таким образом, в результате теоретических и экспериментальных исследований системы речевой коммуникации выявлены и систематизированы основные свойства системы и проведено их описание. Системное изучение значимости акустических и перцептивных параметров выполнено с помощью разработанного нового специфического комплекса 'методов и средств исследования основных закономерностей речеобразования и восприятия на различном уровне реализации в системе речевой коммуникации, полученного путем развития и обобщения результатов и методов прикладной фонетики и теории информационного моделирования речевой деятельности с привлечением данных теории психофизического шкалирования и теории дискретной передачи речевой информации.

Разработанный специфический комплекс теоретических и экспериментальных методов и средств исследования звучащей речи может послужить базой для построения самостоятельного раздела прикладной фонетики с условным названием "речевая акустика".

Конечно, не все изложенные в диссертации идеи и подходы удалось достаточно полно отразить в виде законченных результатов на базе избранных методов исследования. Например, для подтверждения гипотезы о различении фонем в речевом потоке по ранжированным групповым и част—ным различительным признакам потребуются дальнейшие типологические исследования. Вместе с тем мы надеемся,' что описание акустических коррелятов по этой модели может оказаться полезным не только для совершенствования систем автоматического распознавания, но и для углубления понимания механизмов восприятия звучащей речи.

Основное содержание диссертации изложено в следующих работах автора:

1. Информационные и статистические характеристики параметров устной речи. - М.: МГУ, 1992. - 160 с.

2. Измерение параметров речи. - М.: Радио и связь,1987. -168 с (в соавторстве с Л.В.Златоустовой).

3. Вокодерная св^зь (в соавторстве с М. А.Сапожковым) -М.: Радио и связь. 1983. - 247 с.

4. О точности артикуляционных измерений // Вопросы радиоэлектроники. 1967. - Сер. XI; - Вьи. 5. - С. 66-72.

5. Соответствие между общей оценкой качества синтезированной речи и ее разборчивостью // Вопросы радиоэлектроники, 1967. - сер. XI. - Вып.5. - С. 73-75.

6. К вопросу о регистрации колебаний голосовых связок // Вопросы радиоэлектроники. 1968. - Сер. XI. - Вып. 7. - С. 30-37 (в соавторстве с Н.А.Морозовым и Ю.Я.Волошенко). '

7. Оценка качества передачи методом парных сравнений // Вопросы электроники. 1970. - Сер. XI. - Вып.9. - С. 114-117.

8. О влиянии вида сигнала возбуждения на различимость согласных по признаку звоккий-глухой // Вопросы радиоэлектроники, 1972. - Сер. XI. - Вып.1. - С. 79-84.

9. Формантное распределение для мужских голосов русской речи // Акустический журнал. 1972. - Т. 18. - Вып. 1. - С. 63-67.

10. Аппаратурные методы измерения качества телефонной передачи // Зарубежная радиоэлектроника. 1973. - N5. - С. 25-32.

11. Синтетическое телефонирование // Радиоэлектроника и электронная техника, 1964. - С. 25 - 30 ( в соавторстве с Г. А. Коротаевым).

12. Современное состояние техники параметрического компа-нирования речи // Зарубежная радиоэлектроника, 1966. - N4 - С. 36-54 (в соавторстве с Г.А.Коротаевым).

13. Семинар по речевой связи в Стокгольме // Электросвязь. 1975. - N4. - С. 74-76.

14. Сравнительная эффективность вокодеров // Труды XIV конф. НТО РЭС им. А.С.Попова. - М., 1988.

15. Лингвистические алгоритмы определения просодической маркированности высказываний //Труды Вс. семинара по искусственному интеллекту.-Пзреславль-Залесский, 1988 (в соавторстве с Л.В.Златоустовой и Г.Е.Кедровой). •

16. Особенности аппаратно - программкой реализации автоматизированного учебного процесса РКИ для ПЭВМ // Труды IV Вс. семинара "Разработка и применение средств учебного назначения для ПЭВМ". - Симферополь. 1988 (в соавторстве с Л.В.Златоустовой и Г.Е.Кедровой).

17. Метод постановки задач для ЭВМ на основе структурных зхем // Труды Вс. конф. по использованию TCO и ЭВМ в системе дшверситетского образования. - М., 1985.

18. Автоматическое распознавание просодических характеристик речи Вс. совещ. по авт. расп. - Киев. 1988 //Тез. докл. (в соавторстве о Л.В.Златоустовой).

19. АС M • 19517 с приоритетом от 28.10.1958 г. (в соавторстве с С.С.Ващенко и А.П.Петерсоном).

20. АС К 182769 с приоритетом от 30.08.1965 г. Способ сопряжения речебых трактов типа вокодер.

Si. АС H 52778 с приоритетом от 25.08.1969 г. {в соавторства с А. Г. Голубковыи).

22. АС M 77697 с приоритетом от 11.09.1972 Г.

23. АС H 85124 с приоритетом от 24.12.1973 г. (в соавторстве с Н. А. Морозовым)

24. АС H 92695 с приоритетом от 05.11.1974 (в соавторстве з Н.А.Морозовым).

25. АС N 110759 с приоритетом от 12.11.1974 г. (в соавторстве с Н.А.Морозовым).

26. АС N 89979 с приоритетом от 05.11.1974 (в соавторстве : Н. А. Мйрозовым).

27. АС N 92754 с приоритетом от 24.12.1974 г. (в соавторстве с В.В.Буяновым и В.Б.Костанянцем).

28. АС N 88903 с приоритетом от 18.07.1974 г. (в соавторстве с В.В.Буяновым).

29. АС ТЯ 101733 с приоритетом от 03.04.1975 г. (в соавторстве с В. В. Буяновым).

30. АС H 94821 с приоритетом от 15.05.1975 г.

31. АС H 1550566 с приоритетом от 05.04.1988 г. Обучающее устройство.

32. Методы измерения разборчивости и качества синтезиро-занной речи // Труды МГДОЯ, 1992.

33. Параметрические модели речевой коммуникации. Системное описание физико-технических параметров речи// Труды МГИИЯ.1992.

34. Модель системного описания параметров устной речи // Гез. докл.Ее.конф."Автоматизированные системы в научных исследованиях, учебном процессе и управлении.// - М.:МГУ, 198Э.

35. Воздействие фактора вариативности на индентификаци! речевых высказываний // Труды ВНИИСЭ, 1990. - С. 80 - 88 (I соавторстве с м.В.Хитиной).

36. Алгоритм распознавания акцентных признаков высказывания по просодическим параметрам // Тез. докл. АР-С0-16,1991. -С. 168-169 (в соавторстве с С.А.Крейчи).

37. Модель многофакторной оценки качества синтезирований! речи // Тез. докл. АРСО-16, 1991. - С. 83- 84.

38. К ¿опросу оценки качества вокодерной связи // Электросвязь, 1991. - N5. - С. 37-38.

39. Методы оценки качества синтезированной речи по селективным признакам // Доклады XI Вс. акуст. конф. - Москва, 1991. - N5. - С. 37-38.

40. Статистическая модель ранжирования различительных признаков звуков речи //Тез.докл. АРС0-17, Ижевск,1992.- С.93-97.

41. КРЕС-пакет программ для 1ВМ РС по оцеке качества речевой связи // Тез. докл. АРС0-17, Ижевск, 1992. - С. 226-22£ (в соавторстве с Крейчи С.А. и др.).

42. Методы оценивания разборчивости и качества синтезированной речи //Тез.докл. АРСО-17, Ижевск, 1992,- С. 132-136.

43. Экспериментальная методика оценивания разборчивости синтезированной речи // Сб. Акустика в промышленности. - М.: РАО, 19Э2. - С. 112-114 ( в соавторстве с В.Г.Шумиловым).

44. Методы измерения разборчивости и качества .синтезированной речи // Электросвязь, 1992. - Но. - С. 35-38.

45. Методы автоматизации процедур оценки качества синтезированной речи // Электросвязь, 1993. - N7. - С.'10-12.

46. Экспериментальная интерпретация фонологической системы русского языка (перцептивный аспект) // Акустический журнал, 1993. - Т. 39. - М 5.

47. Методы оценки звуков по селективны;-! признакам // Сб. Методика преподавания иностранных языков. - М.: МГУ, 1992.' .

48. Основы речевой акустики - М.: Радио и связь - 32 п.л. (в печати) (в соавторстве с Р.К.Потаповой и Г.С.Рамишвили).