Устойчивость лингвистических признаков преобразованного речевого сигнала

Голошапова, Татьяна Ивановна

автореферат диссертации по филологии, специальность ВАК РФ 10.02.21
диссертация на тему: Устойчивость лингвистических признаков преобразованного речевого сигнала

Год: 2000
Автор научной работы: Голошапова, Татьяна Ивановна
Ученая cтепень: кандидата филологических наук
Место защиты диссертации: Москва
Код cпециальности ВАК: 10.02.21

Автореферат по филологии на тему 'Устойчивость лингвистических признаков преобразованного речевого сигнала'

Полный текст автореферата диссертации по теме "Устойчивость лингвистических признаков преобразованного речевого сигнала"

На правах рукописи

4-1 к \

Голощапова Татьяна Ивановна • Р Г 5 ОД

УСТОЙЧИВОСТЬ ЛИНГВИСТИЧЕСКИХ ПРИЗНАКОВ ПРЕОБРАЗОВАННОГО РЕЧЕВОГО СИГНАЛА

Специальность 10.02.21 - структурная, прикладная и математическая лингвистика

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата филологических наук

Москва - 2000

Диссертация выполнена на кафедре прикладной и экспериментальной лингвистики Московского ордена Дружбы народов государственного лингвистического университета.

Научный руководитель: доктор филологических наук,

профессор Р.К. Потапова

Официальные оппоненты: доктор филологических наук,

профессор А.И. Новиков

кандидат филологических наук, доцент Г.Е. Кедрова

Ведущая организация - Московский педагогический

университет

Защита диссертации состоится » 2000 г. в

часов на

заседании диссертационного совета Д 053.17.03 по защите диссертаций на соискание ученой степени доктора наук в Московском ордена Дружбы народов государственном лингвистическом университете по адресу: 119837, Москва, ГСП-3, ул. Остоженка, 38.

С диссертацией можно ознакомиться в библиотеке Московского ордена Дружбы народов государственного лингвистического университета.

Автореферат разослан

Ученый секретарь диссертационного совета

____________Реферируемая диссертация посвящена разработке одной из проблем прикладной и экспериментальной лингвистики - исследованию возможности проведения идентификационных исследований по фонограммам речевых сигналов применительно к русскому языку, прошедших специальную акустическую обработку на одноканальных и двухканальных средствах фильтрации шумов и помех.

С начала 90-х годов в России фонограммы речевых сигналов стали активно приниматься судами в качестве вещественного доказательства. Однако практика получения вещественных доказательств сегодня такова, что на фонограммах наряду с речевыми сигналами могут присутствовать различные шумовые помехи (шумы улицы, метро, бытовых приборов и т.д.), что ведет к существенному снижению качества речевого сигнала. Существуют специальные аппаратно-программные средства фильтрации шумов и помех, которые помогают существенно улучшить разборчивость речи. Вместе с тем ухудшается «качество» речи на выходе системы. Изучением влияния данных устройств на индивидуальные фонетические идентификационно значимые признаки речевого сигнала в России до последнего времени практически никто не занимался.

Актуальность темы диссертации определяется необходимостью выявления индивидуальных фонетических идентификационно значимых признаков, не изменяющихся в результате использования средств шумо-очистки, на основании которых возможно проведение отождествления личности по голосу и речи, что является основной задачей эксперта-фоноскописта, проводящего идентификационное исследование.

Автор диссертации выражает свою глубокую благодарность за консультации по вопросам технической реализации экспериментов кандидату технических наук Тимофееву И.Н. и Захарову А.Г.

Цель работы - исследование возможности использования фонограмм с низким качеством записи для решения задачи идентификации личности при условии обработки их аппаратно-программными средствами фильтрации шумов и помех, выявление идентификационных признаков, не изменяющихся в результате воздействия средств шумоочистки, а также значимости данных признаков в процессе идентификации.

Достижению поставленной цели служит решение следующих

задач:

- подобрать фонетически представительный сбалансированный текст, в котором функционировали ' бы по возможности все гласные и согласные фонемы русского языка и их позиционно-комбинаторные фонетические разновидности (аллофоны);

- составить фонотеку (базу данных) наиболее распространенных шумов, встречающихся в практике фоноскопической экспертизы;

- отфильтровать речевые фрагменты фонетически представительного сбалансированного текста с помощью специальных средств фильтрации шумов и помех и получить материал для идентификационного исследования;

- провести идентификационные исследования полученных речевых фрагментов методами аудитивного, акустического и лингвистического видов анализа;

- выявить индивидуальные фонетические идентификационно значимые признаки, сохраняющиеся после обработки речевого сигнала с помощью специальных аппаратно-программных средств.

Основная гипотеза формулируется следующим образом: в речевом сигнале, прошедшем специальную акустическую обработку с помощью средств фильтрации шумов и помех, могут быть средуцирова-ны, искажены либо утрачены индивидуальные фонетические идентификационно значимые признаки, которые позволяют проводить идентификацию личности по голосу.

Научная новизна диссертации состоит в том, что:

____________________- впервые изучено влияние средств фильтрации на «качество» речи

и на возможность проведения идентификационных исследований по «обработанной» речи;

- впервые на материале русского языка экспериментально исследован фонетически представительный сбалансированный текст, прошедший обработку с помощью аппаратуры шумоочистки;

- впервые предложена методика исследования речевых признаков, • сохраняющихся после их обработки с помощью специальной аппаратуры;

- впервые разработаны рекомендации по работе с зашумленным сигналом с целью его использования для дальнейшей идентификации.

Теоретическая значимость работы заключается в дальнейшем развитии теории языка применительно к звуковому строю последнего, теории сегментных и супрасегментных признаков звучащей речи в специальных условиях, теории экспериментальной и прикладной лингвистики, а также теории судебной фоноскопической экспертологии.

Практическая ценность диссертации заключается в следующем:

- результаты исследования могут быть учтены разработчиками средств фильтрации шумов и помех для улучшения качества работы создаваемых аппаратов;

- полученные данные могут быть использованы экспертами-фоноскопистами при проведении идентификационного исследования на материале низкого акустического качества;

- методика исследования изменения фонетических особенностей речи диктора может быть использована для тестирования любой аппаратуры, связанной с речью: регистраторов, магнитофонов и т.д.;

- результаты исследования могут использоваться при обучении экспертов-фоноскопистов, а также в вузовских курсах анализа и синтеза речи.

Материалом для эксперимента послужили:

- 10 исходных фонограмм фонетически представительного сбалансированного текста, в который были включены все гласные и согласные фонемы русского языка в сильной позиции и их позиционно-комбинаторные разновидности (аллофоны);

- 100 фонограмм этого же текста, пропущенные через одноканаль-ные и двухканальные средства фильтрации.

Основными методами исследования являлись следующие: методы аудитивного анализа, интегрального анализа, парных сравнений, статистического принятия решения, математические методы цифровой обработки сигналов.

Достоверность полученных данных обеспечивается применением точных методов исследования, а также достаточным объемом экспериментального материала, в качестве которого выступают заключения сравнительного интегрального анализа (п=100), сравнительного лингвистического анализа (п=100), слухового сравнительного анализа ударных гласных (п=600).

Апробация работы. Диссертация обсуждалась на заседании кафедры прикладной и экспериментальной лингвистики Московского ордена Дружбы народов государственного лингвистического университета. Основные положения работы нашли отражение в докладах на научных конференциях: Международная конференция «Информатизация правоохранительных систем» (Москва, Академия Управления МВД, 1997) и Международная конференция «Математические методы в технике и технологии» (Великий Новгород, 1999), на курсах повышения квалификации экспертов-фоноскопистов, проводившихся на базе Академии Управления МВД России (февраль, ноябрь, 1997; февраль, ноябрь, 1998; февраль, ноябрь, 1999, февраль 2000), на стажировках экспертов-фоноскопистов, проводившихся на базе ЭКЦ МВД России (1996-1999 гг.), в повседневной практике производства фоноскопических экспертиз и исследований экспертно-

криминалистических подразделений МВД России. Основные результаты и содержание диссертационного исследования отражены в 4 публикациях автора.

На защиту выносятся следующие основные положения:

1. Существующие аппаратно-программные средства фильтрации шумов и помех влияют на разборчивость речи, записанной в неблагоприятных условиях.

2. Методы фильтрации, применяемые в средствах шумоочистки, ведут к тому, что наряду с шумами удаляются из речи некоторые признаки, позволяющие достаточно точно идентифицировать речь определенного человека, что ведет к «сглаживанию» индивидуальных черт речи.

3. Наибольшему изменению под влиянием специальной обработки подвергаются признаки голоса, выполняющие, в основном, функцию «узнавания» при аудитивном восприятии речи.

4. Анализируемые группы согласных в силу своей акустической природы (основные спектральные составляющие находятся в области спектральных составляющих шумов) подвергаются существенным изменениям и теряют индивидуализирующие признаки.

5. В речевом сигнале, подвергшемся специальной обработке с помощью средств фильтрации шумов и помех, остаются некоторые признаки, которые сохраняют индивидуальные особенности говорящего, что позволяет их использовать при проведении фоноскопической экспертизы и идентификации личности по речи.

6. Темповые характеристики, особенности мелодики и паузации при воздействии средств шумоочистки остаются неизменными.

7. Система вокализма подвержена изменениям в незначительной степени, что позволяет использовать эти признаки, наряду с лексическими и синтаксическими, при проведении лингвистического анализа идентификационного исследования.

Структура диссертации. Работа состоит из введения, двух глав, заключения, библиографии и четырех приложений.

Во введении обосновывается целесообразность проведения данного исследования, его актуальность, определяется объект, подвергающийся анализу, предмет изучения, научная новизна, теоретическая значимость, практическая ценность и достоверность полученных результатов, формулируются цель и задачи работы.

Первая глава «Теоретические предпосылки для выделения и анали-•за идентификационно значимых признаков речевых сигналов, преобразованных с помощью средств фильтрации шумов и помех» состоит из пяти разделов.

В первой главе рассматриваются основные проблемы создания систем идентификации личности, критерии параметров, на анализе которых базируются современные автоматические и автоматизированные системы идентификации, дается краткий обзор искажений, которые могут сопутствовать речевому сигналу на фонограмме. В ней же представлена акустическая «картина» гласных и согласных звуков, основные критерии, позволяющие различать гласные и согласные звуки русского языка на осциллограмме, спектрограмме; даны основные артикуляционные и акустические корреляты гласных звуков.

Вторая глава «Экспериментальная проверка возможности проведения фоноскопических экспертиз по фонограммам, преобразованным с помощью средств фильтрации шумов и помех» состоит из четырех разделов.

В второй главе освещена методика эксперимента, количественный и качественный состав дикторов и аудиторов, технические характеристики и принцип работы аппаратно-программных средств фильтрации шумов и помех, описаны результаты, полученные при анализе основных индивидуальных идентификационно значимых признаков речи.

В заключении подведены итоги проведенного исследования и даны рекомендации по использованию отфильтрованного речевого сигнала в

процессе идентификации диктора.

____________В_ Приложении__ 1 _приведен лингвистически сбалансированный

текст.

В Приложении 2 дается инструкция аудитору по определению стимулов.

В Приложении 3 приведены протоколы интегрального акустического анализа.

В Приложении 4 представлены протоколы лингвистического анализа.

*****

Фонограмма речи как носитель информации об индивидуальных особенностях личности говорящего является многоплановым объектом,

обусловленным взаимодействием сложных многофакторных процессов речевого и неречевого характера. Фонограмма речи отражает результат деятельности речеобразующего аппарата и многочисленных «внешних воздействий». Сложность проблемы идентификации обусловлена тем, что все вышеперечисленные компоненты находятся в тесной взаимосвязи друг с другом, имеют одну и ту же физическую природу и описываются одними и теми же параметрами. В связи с этим создание систем, позволяющих проводить идентификационные исследования, представляет определенные трудности, связанные с решением целого комплекса проблем.

В настоящее время фоноскопические исследования проводятся с помощью полуавтоматических систем идентификации, например, таких как «Диалект» (Н.Ф. Попов и др. 1996). Анализ речевого сигнала проводится комплексно по двум направлениям: вычисление акустических признаков (в количественной форме отражающих физические характеристики, выделяемые и измеряемые в ПЭВМ с помощью программно-математического обеспечения) и выделение лингвистических признаков (описывающих механизм произнесения звуков, особенности употребления лексем, построе-

ние грамматических конструкций).

Как показал анализ реальных фонограмм, в практике фоноскопиче-ской экспертизы из всего многообразия помех, существующих в природе: узкополосных, широкополосных и импульсных, чаще всего встречаются широкополосные шумы: шум бытовых приборов, муниципальный шум, шум падающей воды, шум вестибюля метро. Для исследования были отобраны эти виды шумов. Анализ спектральных характеристик (средний и динамический спектры) этих шумов показал, что спектральные составляющие шума распределены- по всему частотному диапазону речи, что ведет к искажению индивидуальных идентификационно значимых характеристик речи.

В современных работах по проблемам фильтрации (С.Л. Коваль 1999; Г.С. Рамишвили 1981; В.Д. Сердюков 1987, 1998; В.Р. Женило 1995, 1998) указаны практически реализованные методы борьбы с шумовым фоном в системах идентификации диктора. Чаще всего в цифровой обработке речи используется метод фильтрации с помощью фильтров с конечной импульсной характеристикой, позволяющий создавать различные наборы фильтров с произвольной АЧХ (амплитудно-частотной характеристикой). Второй основной метод - метод спектрального вычитания в различных вариациях. Разработчики систем шумоподавления (ЦРТ г. С-Петербург) придерживаются комплексного подхода при создании своих «продуктов»: учитываются все имеющиеся на сегодняшний день методы фильтрации, что позволяет создать системы, работающие в разных режимах и устраняющие многообразные помеховые составляющие.

Комплексно изучением влияния систем фильтрации на идентификационно значимые признаки и возможностью проведения идентификации по отфильтрованным фонограммам до последнего времени никто не занимался. Лишь в работах Центра речевых технологий (ЦРТ г. С-Петербург), основного разработчика систем фильтрации шумов и помех, указываются отрывочные сведения о влиянии фильтров на значение основного тона, на

функцию пересечения нуля, на энергию сигнала, на кепстральные характеристики. ____________

Для решения поставленной задачи был использован фонетически представительный сбалансированный текст на материале русского языка, предложенный Р.К. Потаповой (Р.К. Потапова 1997). В диссертации освещены технические характеристики и принцип работы одноканальных средств шумоочистки «ПАКОРС», «Вензель-СП» и двухканальной цифровой адаптивной фильтрации «Золушка-ЗЬ>, через которые были пропущены тестовые речевые сигналы. Эти аппаратно-программные средства используются в практике работы экспертов-фоноскопистов ЭКЦ МВД России и региональных фоноскопических лабораторий. В диссертации освещена методика эксперимента, количественный и качественный состав дикторов и аудиторов.

В качестве дикторов выступали носители русского языка: мужчины 26-43 лет (7 человек) и женщины 24-29 лет (3 человека), не имеющие на момент исследования выраженных нарушений речевой функции и ЛОР заболеваний. Текст предоставлялся для предварительного просмотра и записывался при первом чтении.

В качестве аудиторов привлекались эксперты-фоноскописты женщины 23-26 лет со стажем экспертной практики от 1 до 3-х лет. Прослушивание проводилось индивидуально через головные телефоны. Стимулы для прослушивания предъявлялись в произвольном порядке желаемое число раз.

Экспериментальные исследования проводились в два этапа. На первом этапе речевые сигналы, прошедшие через одноканальные и двухка-нальные средства фильтрации, подвергались анализу методами интегрального акустического и сравнительного лингвистического видов анализа. На этом этапе стояла задача оценить характер искажений, вносимых средствами фильтрации шумов и помех в основные идентификационно значимые признаки, и определить наличие относительно устойчивых к фильтрации

признаков, которые должны подвергаться детальному анализу на втором этапе. Таковыми оказались ударные гласные, которые анализировались методом парного аудитивного сравнения специально натренированными аудиторами на втором этапе исследования.

Анализ экспериментальных данных показал, что обработка речевого сигнала с помощью одноканальной фильтрации приводит к серьезным искажениям в его структуре. При анализе отфильтрованных фонограмм учитывался такой параметр, как удобство прослушивания со стороны аудитора. После очистки от всех видов шумов наблюдается существенное снижение комфортности восприятия (по сравнению с исходной фонограммой), вызванное появлением музыкального шума. Это явление аудитивно воспринимается как случайно распределенные кратковременные чистые тона (0,1 - 0,7 с), обусловленные алгоритмом работы аппаратуры шумо-очистки ( наложение спектров, комбинационные помехи). При этом уровень разборчивости снижается (по сравнению с исходной фонограммой). В процессе очистки фонограммы от шумов улицы и вестибюля метро полностью отфильтровать помеховый сигнал не удалось, что также влияло на комфортность восприятия.

Экспериментальные исследования по идентификации исходных и очищенных фонограмм, проведенные на базе полуавтоматической системы "Диалект", подтверждают то, что акустическая структура речи в результате обработки на аппаратуре шумоочистки "ПАКОРС", «Вензель-СП» изменяется. Полученные значения искажений в акустических характеристиках сигнала, прошедшего одноканальную шумоочистку, не позволяют должным образом проводить идентификацию говорящего.

Как показал лингвистический анализ, признаки голоса подвергаются существенным изменениям. При сравнении с исходной фонограммой на отфильтрованной фонограмме наблюдается значительное повышение частоты основного тона голоса. Причем описанные изменения зависят от вида шумовой помехи: шум кондиционера, шум улицы и шум падающей воды

оказывают наибольшее влияние на эту характеристику. После очистки речевого сигнала от шума вестибюля метро или шума холодильника высота голоса подвергается незначительным изменениям ( по сравнению с исходной ).

Изменения силы голоса после очистки речевого сигнала независимо от вида помехи не наблюдается.

При анализе тембровых характеристик голоса установлено, что на фонограммах, прошедших шумоочистку, независимо от вида шума изменяется тембр голоса: он становится глуше и появляется назализованная окрашенность. Причем у дикторов, у которых назализованный тембр является индивидуализирующей характеристикой, проявление данного признака усиливается.

Анализ исходных и отфильтрованных фонограмм показал, что

артикуляционные признаки также подвержены изменениям. После шумо-очистки наблюдается эффект снижения уровня речевого сигнала (иногда близко к нулю звука). При этом снижается слогоразборчивость: отдельные слоги в заударных позициях не дифференцируются, что может быть воспринято при проведении идентификационного исследования как неудовлетворительная артикуляция.

При анализе темповых характеристик увеличения или снижения темпа речи не наблюдается, независимо от вида помехи.

Соотношение длительности пауз и их расстановка на исследуемых фонограммах не изменялись. Неизменным оставалось и лексическое заполнение пауз, нелексические элементы (например, причмокивание и т.д.), характерные для речи диктора на исходной фонограмме, отсутствуют на отфильтрованных сигналах, что ведет к потере индивидуализирующего признака.

Параметры ритмико-мелодических характеристик речи, в основном, изменялись. Стабильным оставался лишь ритм речи, то есть чередование ударных и безударных, долгих и кратких слогов. Существенно подвер-

жена изменениям интенсивность речи. На отфильтрованных фонограммах чередование сильного и слабого произнесения отдельных фрагментов речи наиболее выражено особенно после очистки от шума кондиционера, улицы, воды, вестибюля метро. При очистке сигнала от шума, производимого холодильником, данный эффект наименее заметен.

Фразовое и логическое ударения, служащие средством выделения речевых отрезков или отдельных слов во фразе, на исследуемых фонограммах не изменялись.

В фонетической группе признаков анализировались гласные и согласные звуки. Наименьшему изменению подвержены гласные. При анализе аудитивного восприятия ударных гласных не наблюдается каких-либо изменений в длительности звуков или характере артикуляции. При анализе безударных гласных наблюдается изменение степени качественной и количественной редукции звуков, присущей диктору.

Анализ согласных звуков производился по группам: губные согласные ([б], [п]), губно- зубные согласные ([в], [ф]), переднеязычные смычно- взрывные согласные ([т], [д]), переднеязычные щелевые согласные ([ш], [ж], [щ], [с], [з]), аффрикаты ([ч], [ц]), заднеязычные смычно-взрывные согласные ([к], [г]), заднеязычные щелевые ([х]), сонанты ([м], [н], [л], [р]) и среднеязычный щелевой согласный ([]]). Исследование данных групп согласных проводилось с учетом сильных (перед ударной гласной) и слабых (позиция конца слова, перед согласным) позиций.

При этом отмечается наибольшее изменение губно-зубных согласных, переднеязычных щелевых согласных, аффрикат и сонантов. Губные, переднеязычные смычно-взрывные, заднеязычные и среднеязычный согласные подвергаются изменению в меньшей степени.

После фильтрации губно- зубные согласные ( [в], [ф]) в позиции начала слова приобретают признак огубленности. Перед огубленным гласным [о] данный признак проявляется в наибольшей степени. При этом [в] произносится как губно- губной например, в слове "водников"

[\уодн'икъф]. Особенно сильно этот признак проявляется после очистки от шума кондиционера, воды и холодильника. При анализе переднеязычных щелевых согласных ([ш], [ж], [щ], [с], [з]) наблюдается проточное произнесение звуков [ш], [с], например, в словах "широчайшие", "страх".

При исследовании вибранта [р] после фильтрации на фоне музыкального шума определить количество ударов языка о небо не представляется возможным. Особенности артикуляции согласных звуков и особенности ассимиляции, характерные для произношения диктора, в основном, сохраняются.

Таким образом, анализ экспериментального материала показал, что проведение интегрального акустического анализа по фонограммам устной речи, прошедшей через одноканальные средства фильтрации, невозможно. Проведение лингвистического анализа возможно по лексическим и синтаксическим признакам (при условии достаточной длительности) и некоторым фонетическим признакам и признакам речевого потока (темп речи, длительность пауз и их расстановка, лексическое заполнение пауз, интонация, качество ударных гласных, качество некоторых групп согласных).

В результате анализа экспериментальных данных удалось показать, что обработка речевого сигнала с помощью двухканального фильтра приводит к некоторым искажениям в его структуре.

Субъективное восприятие речи, прошедшей двухканальную шумо-очистку, улучшается. Разборчивость речевого сигнала, по предварительным оценкам, увеличивается приблизительно на 15-20%. Однако, наблюдается устойчивая зависимость между качеством звучания очищенной речи и такими параметрами фильтра, как время задержки и коэффициент адаптации. При этом при больших значениях коэффициента адаптации увеличивается эффективность фильтрации, но ухудшается естественность звучания речи. Этот факт обусловлен уменьшением скорости адаптации фильтра, что позволяет ему более адекватно настроиться на помеховую составляющую в основном канале. Однако, при этом наблюдается увеличение искажений в

тонкой структуре речи, что и приводит к неестественности ее звучания. Тщательным подбором данных параметров адаптивного фильтра можно добиться достаточно полной фильтрации шумовой составляющей.

Экспериментальные исследования по идентификации исходных и очищенных фонограмм, проведенные на б азе полуавтоматической системы "Диалект", подтверждают то, что акустическая структура речи в результате обработки на аппаратуре шумоочистки "ЗолушкаЗГ' изменяется. Полученные значения искажений в акустических характеристиках сигнала, прошедшего двухканальную шумоочистку, не позволяют должным образом проводить идентификацию говорящего.

При анализе лингвистических характеристик также наблюдаются изменения признаков. На аудитивном уровне восприятия признаки голоса подвергаются существенным изменениям. При сравнении с исходной фонограммой на отфильтрованной фонограмме наблюдается снижение высоты голоса. Причем в наибольшей степени этот признак проявляется при очистке сигнала от шума холодильника.

Изменения силы голоса после очистки речевого сигнала независимо от вида помехи не наблюдается.

При анализе тембровых характеристик голоса прослеживается четкая зависимость изменения тембра от вида шумовой помехи. Шум кондиционера, шум улицы и шум падающей воды изменяют тембр голоса: он становится несколько глуше. Остальные виды исследуемых шумов не меняют тембральные характеристики.

Анализ исходных и отфильтрованных фонограмм показал, что артикуляционные признаки также подвержены изменениям. После шумоочистки наблюдается эффект снижения уровня речевого сигнала (иногда близко к нулю звука). При этом разборчивость речи по сравнению с исходным сигналом снижается; отдельные слоги в заударных позициях не дифференцируются, речь близка к "бормотанию".

При анализе темповых характеристик увеличения или снижения

темпа речи не наблюдается.

____________Соотношение длительности пауз и их расстановка на исследуемых

фонограммах не изменялись. Неизменным оставалось и лексическое заполнение пауз. Нелексические элементы (например, причмокивание и т.д.), характерные для речи диктора на исходной фонограмме, сохраняются на отфильтрованных сигналах.

Параметры ритмико- мелодических характеристик речи, в основном, изменялись. Стабильным оставался лишь ритм речи, то есть чередование ударных и безударных, долгих и кратких слогов.

При анализе отфильтрованных фонограмм учитывался также такой параметр, как удобство прослушивания со стороны аудитора. После очистки от всех видов шумов наблюдается существенное снижение комфортности восприятия (по сравнению с исходной фонограммой), вызванное появлением музыкального шума. Это явление аудитивно воспринимается как случайно распределенные кратковременные чистые тона (0,1 - 0,7 с), обусловленные алгоритмом работы аппаратуры шумооч истки (наложение спектров, комбинационные помехи). В процессе очистки фонограммы от шумов улицы полностью отфильтровать помеховый сигнал не удалось, что также влияло на комфортность восприятия.

В фонетической группе признаков анализировались гласные и согласные звуки. Наименьшему изменению подвержены гласные. При анализе аудитивного восприятия ударных гласных не наблюдается каких-либо изменений ни в длительности звуков, ни в артикуляции. Индивидуальные признаки, характерные для речи конкретного диктора, не изменяются. При анализе безударных гласных наблюдается изменение степени качественной и количественной редукции звуков, присущей диктору.

Исследование групп согласных производилось с учетом сильных

(перед ударной гласной) и слабых (позиция конца слова, перед согласным) позиций. При этом отмечается наибольшее изменение губно- зубных согласных, переднеязычных щелевых согласных, аффрикат и сонантов. Губные, переднеязычные смычно- взрывные, заднеязычные и среднеязычный согласные не подвергаются изменению.

После фильтрации губно-зубные согласные ( [в], [ф]) в слабой позиции (сочетание согласных, конец слова) выпадают. При анализе переднеязычных щелевых согласных ([ш], [ж], [щ], [с], [з]) наблюдается проточное произнесение звуков [ш], [с], [щ]; дефекты произнесения переднеязычных щелевых согласных, имеющиеся у диктора, усиливаются. При анализе аффрикат ([ч], [ц]) наблюдается "расщепление" звуков, причем фаза смычки более отчетлива. При исследовании вибранта [р] обнаружено, что после фильтрации имеющиеся у диктора особенности произнесения проявляются неясно.

Особенности артикуляции согласных звуков и особенности ассимиляции, характерные для произношения диктора, в основном, сохраняются.

Таким образом, на первом этапе исследования экспериментального материала удалось выяснить, что применение метода двухканальной адаптивной фильтрации позволяет достаточно эффективно очищать речевой сигнал от помеховой составляющей при условии адекватного выбора параметров адаптивного фильтра, вследствие чего повышается качество звучания отфильтрованной фонограммы по сравнению с зашумленной и улучшается субъективное восприятие речи, достаточное для понимания смысла сообщения. Однако, анализ основных идентификационно значимых параметров речи значительно затруднен вследствие появления искажений и дополнительных помеховых составляющих, особенно в области средних и высоких частот. Проведение фоноскопических экспертиз фонограмм в этом случае не позволяет получить однозначного вывода о принадлежности представленной фонограммы тому или иному конкретному лицу. Но в ходе

анализа результатов эксперимента удалось выявить некоторые признаки на фонетическом уровне, которые сохраняют относительную устойчивость (например, ударные гласные), что позволяет говорить о возможности проведения идентификации личности по этим признакам.

На втором этапе эксперимента подвергались анализу ударные гласные звуки. При анализе ударных гласных с фонограмм, прошедших одно-канальную шумоочистку, были получены следующие результаты. Все аудиторы отмечают дополнительную назализованность, появившуюся у всех гласных , независимо от типа шума. Причем, у диктора, у которого назализованность гласных была отмечена как индивидуальная особенность, аудиторами отмечается усиление данного признака. Также всеми аудиторами отмечается глухость всех гласных. Особенно сильно этот признак проявляется после очистки речевого сигнала от шума «падающей» воды и кондиционера. Этот признак является вновь приобретенным, так как ни у кого из дикторов на исходных фонограммах данный признак не был отмечен. Назализованность и глухость были отмечены всеми аудиторами для всех гласных.

Гласный [а] характеризуется как более передний на фонограммах, прошедших фильтрацию от шума кондиционера, холодильника, муниципального шума. При очистке от шума «падающей» воды, метро изменений по признаку «передний/задний» не отмечается. По признаку «открытый/закрытый» аудиторы характеризуют [а] как закрытый на фонограммах, прошедших фильтрацию от муниципального шума и шума метро. При очистке от остальных шумов этот признак не подвергается изменениям. Лабиализацию гласного [а] аудиторы отмечают на фонограммах, прошедших очистку от шума «падающей» воды, на остальных фонограммах изменений не отмечено. Каких-либо изменений по признакам «верхнего подъема/ нижнего подъема», «напряженный/ненапряженный», «долгий/краткий» никто из аудиторов для гласного [а] не отметил.

Гласный [о] характеризуется как более закрытый на фонограммах,

прошедших фильтрацию от всех видов шумов, за исключением шума «падающей» воды. Изменение по признаку «лабиализованный/нелабиализованный» аудиторы отмечают на фонограммах, прошедших фильтрацию от муниципального шума и шума «падающей» воды. Как более задний характеризуется гласный [о] на фонограммах, прошедших фильтрацию от шума кондиционера, метро и муниципального шума. При очистке от шумов холодильника и «падающей» воды никто из аудиторов не отмечает изменений по этому признаку. Аудиторы характеризуют как напряженный гласный [о] на фонограммах, отфильтрованных от шума кондиционера и холодильника. По признакам «верхнего подъема/ нижнего подъема», «долгий/краткий» никто из аудиторов для гласного [о] не отметил изменений.

Гласный [э] характеризуется как более закрытый на фонограммах, прошедших фильтрацию от всех видов шумов, за исключением шума «падающей» воды. На фонограммах, отфильтрованных от шума «падающей» воды, гласный [э] характеризуется как более задний, лабиализованный. Изменений по этим признакам («задний/передний», «лабиализованный/нелабиализованный» ) на фонограммах, отфильтрованных от других видов помех, аудиторы не отмечают. Каких-либо изменений по признакам «верхнего подъема/ нижнего подъема», «напряженный/ ненапряженный», «долгий/краткий» никто из аудиторов для гласного [э] не отметил.

Гласный [и] характеризуется как более открытый на фонограммах, прошедших фильтрацию от всех видов шумов, за исключением шума «падающей» воды. На фонограммах, отфильтрованных от шума «падающей» воды, гласный [и] характеризуется как более задний. Каких-либо изменений по остальным признакам («верхнего подъема/нижнего подъема», «напряженный/ненапряженный», «долгий/краткий», «лабиализованный/ нелабиализованный») никто из аудиторов для гласного [и] не отметил.

Гласный [у] характеризуется как менее лабиализованный на фонограммах, прошедших фильтрацию от шума «падающей» воды. На осталь-

ных фонограммах аудиторы не отмечают изменения степени лабиализации гласного [у]. На всех отфильтрованных фонограммах (за исключением очищенной от шума «падающей» воды) гласный [у] характеризуется как более открытый и продвинутый вперед. На фонограмме, прошедшей фильтрацию от шума «падающей» воды, эти признаки не отмечаются. Каких-либо изменений по остальным признакам («верхнего подъема/нижнего подъема», «напряженный/ненапряженный», «долгий/краткий») никто из аудиторов для гласного [у] не отметил.

Таким образом, обобщая результаты аудиторского сравнения качества ударных гласных [а], [о], [э], [и], [у] на исходных фонограммах и фонограммах, подвергавшихся фильтрации от шумов кондиционера, холодильника, метро, «падающей» воды, муниципального шума одноканаль-ными средствами шумоочистки, можно сделать вывод, что все без исключения гласные подвергаются каким-либо изменениям. Так, дополнительная глухость и назализованность появляются у всех гласных, независимо от вида шума. Фильтрация от шумов кондиционера, холодильника, метро, муниципального шума чаще всего влияет на такие признаки, как «открытость/ закрытость», «продвинутость вперед/назад», «напряжен-

ность/ненапряженность». Фильтрация от шума «падающей» воды чаще всего влияет на такие признаки, как «лабиализованный/ нелабиализованный», «открытый/закрытый». Не подвергается никаким изменениям лишь признак «долгий/краткий». Следовательно, основные идентификационно значимые признаки гласных звуков в результате воздействия средств одно-канальной фильтрации подвергаются существенным изменениям, что делает невозможным их использование при проведении идентификационных исследований.

При анализе ударных гласных с фонограмм, прошедших двухка-нальную шумоочистку, были получены следующие результаты.

Гласный [а] характеризуется как более закрытый на фонограммах, прошедших фильтрацию от шума метро и муниципального шума. При

очистке от остальных шумов признак «открытый/закрытый» не подвергается изменениям. По признаку «передний/задний» аудиторы отмечают продвинутость вперед [а] на фонограммах, очищенных от шума кондиционера и муниципального шума. При очистке от остальных шумов признак «передний/ задний» не подвергается изменениям. Легкую лабиализацию гласного [а] аудиторы отмечают на фонограммах, прошедших очистку от шума «падающей» воды, на остальных фонограммах изменений не отмечено. Каких-либо изменений по признакам «верхнего подъема/ нижнего подъема», «напряженный/ненапряженный», «долгий/краткий», «звонкий/ глухой», «назализованный/неназализованный» никто из аудиторов для гласного [а] не отметил.

Гласный [о] характеризуется как более закрытый на фонограммах, прошедших фильтрацию от шума кондиционера, холодильника и муниципального шума. Изменение по признаку «лабиализованный/нелабиализованный» аудиторы отмечают на фонограммах, прошедших фильтрацию от шума «падающей» воды. Как более задний характеризуется гласный [о] на фонограммах, прошедших фильтрацию от шума метро и муниципального шума. При очистке от шумов кондиционера, холодильника и «падающей» воды никто из аудиторов не отмечает изменений по этому признаку. По признакам «верхнего подъема/ нижнего подъема», «долгий/краткий», «напряженный/ненапряженный», «звонкий/глухой», «назализованный/неназализованный» никто из аудиторов для гласного [о] не отметил изменений.

Гласный [э] характеризуется как более закрытый на фонограммах, прошедших фильтрацию от всех видов шумов, за исключением шума «падающей» воды и кондиционера. На фонограммах, отфильтрованных от шума «падающей» воды, гласный [э] характеризуется как более задний, лабиализованный. Изменений по этим признакам («задний/передний», «лабиализованный/нелабиализованный») на фонограммах, отфильтрованных от других видов помех, аудиторы не отмечают. Каких-либо изменений

по признакам «верхнего подъема/нижнего подъема», «напряженный/ненапряженный», «долгий/краткий», «звонкий/глухой», «назализованный/неназализованный» никто из аудиторов для гласного [э] не отметил.

Гласный [и] характеризуется как более открытый на фонограммах, прошедших фильтрацию от всех видов шумов, за исключением шума «падающей» воды. Каких-либо изменений по остальным признакам («верхнего подъема/нижнего подъема», «задний/передний», «долгий/краткий», «звонкий/глухой», «лабиализованный/нелабиализованный», «назализованный/неназализованный», «напряженный/ненапряженный») никто из аудиторов для гласного [и] не отметил.

Гласный [у] характеризуется как менее лабиализованный на фонограммах, прошедших фильтрацию от шума «падающей» воды. На остальных фонограммах аудиторы не отмечают изменения степени лабиализации гласного [у]. Каких-либо изменений по остальным признакам («верхнего подъема/нижнего подъема», «задний/передний», «открытый/закрытый» «напряженный/ненапряженный», «долгий/краткий», «звонкий/глухой», «назализованный/ неназализованный») никто из аудиторов для гласного [у] не отметил.

Наибольшему изменению подвергаются гласные на фонограммах, отфильтрованных от шумов метро и муниципального шума. Эти шумы оказывают влияние на такие признаки, как «открытость/закрытость» и «про-двинутость вперед/назад». Эти шумы являются наиболее сложными по своей спектральной картине, они относятся к постоянно изменяющимся шумам, поэтому их достаточно сложно точно воспроизвести в реальных условиях и очень трудно полностью отфильтровать. В наибольшей степени эти

шумы влияют на «открытость/закрытость», «продвинутость вперед/назад» гласных [а], [о], [э]. Шум «падающей» воды в основном оказывает воздействие на признак «лабиализованный/ нелабиализованный» для гласных [а], [о], [э], [у]. Признаки «верхнего подъема/нижнего подъема», «напряженный/ненапряженный», «долгий/краткий», «назализованный/ неназализованный», «звонкий/глухой») остаются стабильными у всех гласных на фонограммах, очищенных от всех видов шумов. Наиболее устойчивыми к шумоочистке являются гласные [и], [у]. Следовательно, идентификационно значимые признаки гласных звуков в результате воздействия средств двух-канальной фильтрации, в основном, сохраняются, что позволяет учитывать их при проведении идентификационных исследований.

Таким образом, фонограммы, прошедшие через одноканальные средства шумоочистки, не могут использоваться для идентификационных исследований ни методами акустического , ни методами лингвистического видов анализа. Для этих фонограмм могут решаться лишь вопросы установления дословного содержания записанных разговоров, так как семантическая разборчивость повышается по сравнению с зашумленными сигналами.

Фонограммы, прошедшие через двухканальные средства шумоочистки, могут использоваться для идентификационных исследований методами лингвистического анализа. Проведение лингвистического анализа возможно по лексическим и синтаксическим признакам (при условии достаточной длительности), некоторым фонетическим признакам (качество ударных гласных, качество некоторых групп согласных) и признакам речевого потока (темп речи, длительность пауз и их расстановка, лексическое заполнение пауз, интонация). Семантическая разборчивость фонограмм, прошедших через двухканальные средства шумоочистки, существенным образом улучшается, что ведет к достоверному решению вопроса о дословном содержании записанных разговоров.

Основные положения диссертации отражены в следующих публикациях:

- Акустическая природа звукового состава естественного языка в аспекте фоноскопической экспертизы // Вопросы криминалистики и экс-пертно-криминалистические проблемы: Сборник научных трудов. - ЭКЦ МВД России, М., 1997. - 0,5 п.л.

- Возможности использования средств многоканальной шумоочи-стки речевого сигнала при проведении идентификационных исследований //Тезисы докладов Международной конференции «Информатизация правоохранительных систем». 2-3 июля 1997 г. - Академия Управления МВД России, М, 1997. - 0,1 п.л. (в соавт.)

- Возможности использования средств многоканальной шумоочи-стки речевого сигнала при проведении идентификационных исследований: Информационное письмо. - ЭКЦ МВД России, М., 1998. - 1,5 п.л. (в соавт.)

- Идентификационные исследования речевого сигнала, прошедшего через средства многоканальной фильтрации// Сборник трудов XII Международной научной конференции «Математические методы в технике и технологии» ММТТ-12, т.З. - Великий Новгород, 1999. - 0,1 п.л. (в соавт.)

автореферат диссертации по филологии, специальность ВАК РФ 10.02.21 диссертация на тему: Устойчивость лингвистических признаков преобразованного речевого сигнала

Полный текст автореферата диссертации по теме "Устойчивость лингвистических признаков преобразованного речевого сигнала"

Похожие темы диссертаций

автореферат диссертации по филологии, специальность ВАК РФ 10.02.21
диссертация на тему: Устойчивость лингвистических признаков преобразованного речевого сигнала