автореферат диссертации по филологии, специальность ВАК РФ 10.02.19
диссертация на тему:
Взаимодействие контекстной предсказуемости и частотности в процессе восприятия спонтанной речи

  • Год: 2010
  • Автор научной работы: Риехакайнен, Елена Игоревна
  • Ученая cтепень: кандидата филологических наук
  • Место защиты диссертации: Санкт-Петербург
  • Код cпециальности ВАК: 10.02.19
Диссертация по филологии на тему 'Взаимодействие контекстной предсказуемости и частотности в процессе восприятия спонтанной речи'

Полный текст автореферата диссертации по теме "Взаимодействие контекстной предсказуемости и частотности в процессе восприятия спонтанной речи"

Санкт-Петербургский государственный университет

На правах рукописи

Риехакайнен Елена Игоревна

ВЗАИМОДЕЙСТВИЕ КОНТЕКСТНОЙ ПРЕДСКАЗУЕМОСТИ И ЧАСТОТНОСТИ В ПРОЦЕССЕ ВОСПРИЯТИЯ СПОНТАННОЙ РЕЧИ (НА МАТЕРИАЛЕ РУССКОГО ЯЗЫКА)

Специальность 10.02.19 — Теория языка

Автореферат диссертации на соискание ученой степени кандидата филологических наук

- 2 Ш 2010

Санкт-Петербург — 2010

004614824

Работа выполнена на кафедре общего языкознания Филологического факультета Санкт-Петербургского государственного университета

Научный руководитель:

Официальные оппоненты:

доктор филологических наук, профессор Вадим Борисович Касевич

доктор филологических наук, профессор Елена Валентиновна Ерофеева

кандидат филологических наук Евгения Валентиновна Глазанова

Ведущая организация:

Институт русского языка им. В.В. Виноградова РАН

Защита состоится 8 декабря 2010 года в 16 часов на заседании совета Д 212.232.23 по защите докторских и кандидатских диссертаций при Санкт-Петербургском государственном университете по адресу: 199034, г. Санкт-Петербург, Университетская наб., д. 11, ауд. 191.

С диссертацией можно ознакомиться в научной библиотеке им. М. Горького Санкт-Петербургского государственного университета (199034, Санкт-Петербург, Университетская наб., 7/9).

Автореферат разослан « 03у> 2010 г.

Ученый секретарь

диссертационного совета Д 212.232.23 доктор филологических наук, профессор

Гб

К.А. Филиппов

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ Активное изучение процесса восприятия речи началось в 50-ые п\ XX века. За шестьдесят лет было опубликовано значительное число работ по данной проблематике, предпринимались неоднократные попытки создания действующей модели речевосприятия (в том числе компьютерной).1 Однако до сих пор не существует концепции, которая бы могла претендовать на полное и непротиворечивое описание того, каким образом слушающий распознает речевой сигнал. С одной стороны, это связано с тем, что долгое время исследования процесса восприятия речи проводились преимущественно на материале прочитанных изолированных слов или предложений и многие выводы, сделанные по результатам подобных исследований, оказались неприменимыми к распознаванию речи в естественных условиях.

С другой же стороны, отсутствие действующей модели восприятия речи объясняется желанием большинства исследователей разработать лишь одну глобальную стратегию распознавания речевого сигнала, в то время как экспериментально доказано, что «в разных условиях приема слушающие оперируют разным количеством оперативных единиц, их наборами и порядком по значимости»,2 т.е. применяют разные стратегии. Логично предположить, что в ситуации естественного общения значимость различных признаков, доступных слушающему, может изменяться под влиянием не только условий приема, но и множества других факторов (характеристик ситуации общения и коммуникантов, типа воспринимаемого сообщения и т.п.).

Объектом исследования, описываемого в данной работе, является процесс восприятия естественной русской речи носителями русского языка. Все полу-

1 См. об этом, например^ Венцов A.B., Касевич В.Б. Проблемы восприятия речи. М. : Едито-риал УРСС, 2003 (1994); Luce P.A., McLennan С.Т. Spoken Word Recognition: The Challenge of Variation // The Handbook of Speech Perception / eds. : D.B. Pisoni, R.E. Remez. Berlin, Oxford : Blackwell Publishing Ltd, 2005. P. 592-609; Залевская A.A. Введение в психолингвистику. M, : Российск. гос. гуманит. ун-т, 2007. С. 384-446 и др.

2 Штерн A.C. Перцептивный аспект речевой деятельности: (Экспериментальное исследование). СПб. : Изд. С.-Петерб. ун-та, 1992. С. 187.

3

ченные результаты интерпретируются с точки зрения их возможного применения к описанию распознавания подобного речевого сигнала.

В потоке естественной речи некоторые звуки могут качественно или количественно изменяться или вообще исчезать,3 что приводит к искажению фонетического облика словоформ и к появлению многочисленных отрезков речи, для однозначной интерпретации которых информации, представленной в акустическом сигнале, оказывается недостаточно. Тем не менее обычно это не является причиной коммуникативных неудач: даже неподготовленная речь хорошо воспринимается слушающим(и) и не вызывает переспросов. В качестве основных факторов, способствующих надежному распознаванию подобных фрагментов речи, обычно называются контекстная предсказуемость и частота употребления единиц в речи. При этом, как правило, в соответствии с описанной выше тенденцией, эти факторы рассматриваются независимо друг от друга.

Предметом настоящего исследования является взаимодействие стратегий, опирающихся на контекст и частотность, в процессе распознавания естественной русской речи, т.е. речи, элементы (словоформы) которой характеризуются «неполным типом произнесения».4

Обращение к естественному речевому сигналу в сочетании с пониманием восприятия речи как процесса, предполагающего взаимодействие различных стратегий, отличает данное исследование от многих предшествующих и определяет его актуальность.

Цель работы — подтвердить гипотезу, согласно которой в процессе восприятия речи слушающий пользуется стратегиями, опирающимися на контекст и частотность, и описать взаимодействие этих стратегий на материале русской спонтанной речи.

Сформулированная цель предполагает решение следующих задач: 1) дать качественную и количественную характеристику естественной звучащей речи с целью определения того, насколько часто для ее успешного рас-

3 Русская разговорная речь / под ред. Е.А. Земской. М.: Наука, 1973. С. 40.

4 Стили произношения и типы произнесения / Л.В. Бондарко [и др.] // Вопросы языкознания. 1974. №2. С. 65.

познавания необходимо привлечение дополнительной информации, помимо той, которая содержится в акустическом сигнале;

2) описать возможный механизм использования контекстной предсказуемости в процессе распознавания речи;

3) выявить признаки, на которые опирается слушающий в тех случаях, когда контекст не позволяет снять неоднозначность;

4) сравнить стратегии восприятия словоформ различной частотности.

Кроме того, для успешного осуществления исследования требуется решить

две методические задачи, а именно:

5) определить возможные источники получения материала для исследования восприятия естественной речи;

6) оценить существующие способы получения сведений о частоте встречаемости языковых единиц и выбрать из них те, которые наилучшим образом отражают частотность, представленную в словаре слушающего и используемую при распознавании речи.

Для решения указанных задач используется совокупность методов. Первая задача решается путем слухового и инструментального анализа фрагментов звучащей русской речи. Основным методом решения трех последующих задач является эксперимент по распознаванию слов на слух (dictation task), предполагающий прослушивание испытуемыми стимулов различной длительности и их письменную фиксацию в бланках ответов буквами русского алфавита. При подготовке стимулов для экспериментов используются различные методы инструментальной обработки звуковых сигналов, предоставляемые звуковыми редакторами. Для сравнения полученных в экспериментах результатов применяются статистические методы: вычисление доверительных интервалов на 5%-ом уровне значимости и корреляционный анализ на основе коэффициента корреляции рангов Спирмена. Оценка источников получения материала исследования и способов вычисления частотности языковых единиц, а также анализ научной литературы по обсуждаемым в работе темам осуществляются при помощи индуктивно-дедуктивного метода и метода критического анализа.

Исходный материал исследования — записи бытовых диалогов и телевизионных ток-шоу (участники — носители русского языка). В экспериментах в качестве стимулов используются фрагменты данных записей, а также прочитанные дикторами фразы (в исходном звучании или после предварительной инструментальной обработки).

Достоверность описания речевого сигнала обеспечивается сочетанием методов инструментального и слухового анализа. Проведение серии экспериментов, в которых приняли участие в общей сложности 425 человек, объем полученного материала (13176 реакций), а также применение статистических методов при анализе данных обеспечивают достоверность результатов экспериментальной части работы.

Научная новизна работы заключается в том, что в ней впервые предпринимается попытка детального описания механизма распознавания редуцированных словоформ, представленных в русской спонтанной речи, с учетом целого ряда факторов, ведущими из которых являются частотность и контекст.

Получение новых сведений о роли различных стратегий в процессе восприятия фрагментов речи, характеризующихся неполным типом произнесения, позволяет приблизиться к пониманию механизма распознавания естественной речи человеком и выдвинуть предположения об устройстве ментального лексикона слушающего, что определяет теоретическую значимость работы.

Результаты исследования могут применяться при создании моделей восприятия речи, а также при разработке методик обучения восприятию естественной речи взрослых и детей с нарушениями слуха, что свидетельствует о практической ценности работы.

Положения, выносимые на защиту:

1. При распознавании спонтанной речи, фонетический облик которой характеризуется значительной неполнотой (редуцированностью), слушающий может пользоваться различными стратегиями, опирающимися как на параметры акустического сигнала, так и на другие факторы, ведущими из которых являются контекстная предсказуемость и частотность.

2. Базовая стратегия распознавания редуцированных словоформ может быть описана следующим образом. В процессе восприятия редуцированной словоформы слушающий опирается на ряд сохранившихся в ее звуковой форме полезных признаков (прежде всего на консонантный «скелет») и выбирает из множества единиц перцептивного словаря, активированных на основе этих признаков, ту, которая более всего соответствует контексту.

3. При наличии нескольких единиц, в равной степени допускаемых контекстом и соответствующих входному сигналу, более сильную активацию могут получать более частотные словоформы, а также словоформы, входящие в частотные контексты. В случае грамматической неоднозначности на степень активации единиц могут также влиять кумулятивная частотность грамматической формы, под которой подразумевается суммарная частотность всех словоформ, образующих данный грамматический класс, а также количество потенциальных контекстов, в которых встречается словоформа.

4. В ряде случаев слушающий сразу соотносит услышанное с редуцированной реализацией, которая хранится в словаре в качестве самостоятельной единицы. На подобный статус могут претендовать лишь типичные реализации высокочастотных словоформ, количество которых, согласно полученным на данный момент сведениям, сравнительно невелико.

5. Результаты экспериментов позволяют предположить, что ментальный лексикон носителя русского языка представляет собой динамическую многомерную структуру, единицами которой являются словоформы, соединенные между собой связями, формирующимися на основе как парадигматических, так и синтагматических отношений. Сила связей определяется частотностью соответствующих единиц и их комбинаций.

6. Проведенное исследование дает все основания для выдвижения гипотезы о наличии единого глобального механизма распознавания речи, включающего в себя стратегии, описываемые в рамках различных моделей восприятия речи. Следовательно, оно не опровергает полностью ни один из существующих

подходов к описанию процесса соотнесения входного речевого сигнала с соответствующей ему единицей словаря слушающего.

Апробация работы. Основные положения и отдельные аспекты исследования обсуждались на заседаниях секции «Общее языкознание» Межвузовской научной конференции студентов-филологов (Санкт-Петербург, 2005, 2006, 2007), на заседании секции «Восприятие речи» конференции «Научные чтения Петербургского лингвистического общества» (Санкт-Петербург, 2006), на междисциплинарном семинаре «Анализ разговорной русской речи» (Санкт-Петербург, 2007,2010), на заседаниях выездной школы-семинара «Порождение и восприятие речи» (Череповец, 2007, 2008, 2009), на Третьей и Четвертой Международной конференции по когнитивной науке (Москва, 2008; Томск, 2010), на заседаниях секции «Психолингвистика» Международной филологической конференции (Санкт-Петербург, 2009, 2010), на заседании секции «Филология» (подсекция «Теоретическая и экспериментальная фонетика») XVI Международной научной конференции студентов, аспирантов и молодых ученых «Ломоносов» (Москва, 2009), на 13-ой Международной конференции "Speech and Computer" SPECOM'2009 (Санкт-Петербург, 2009), на заседании семинара «Акустика детской речи» в рамках секции физиологии речи Санкт-Петербургского общества физиологов, биохимиков, фармакологов им. И.М. Сеченова (Санкт-Петербург, 2009), а также на заседаниях кафедры общего языкознания Филологического факультета Санкт-Петербургского государственного университета (2008, 2009). Исследование поддержано следующими грантами: РФФИ №06-06-80152а, РФФИ №09-06-00244а, Министерства образования РФ №1590, Президента РФ №НШ-3688.2010.6. По теме диссертации опубликовано 15 работ.

Цели и задачи исследования определили структуру работы. Диссертация состоит из введения, шести глав, заключения, списка использованной литературы и 33 приложений. Звуковые файлы с тестовыми последовательностями всех экспериментов, результаты которых описываются в работе, представлены на CD-носителе.

КРАТКОЕ СОДЕРЖАНИЕ РАБОТЫ Во Введении приводится общая характеристика работы: обосновывается актуальность исследования, формулируются его предмет, объект, цели и задачи, описываются применяемые методы.

Глава I. Частотность, восприятие речи, контекст: основные понятия. Цель первой главы — дать определение ключевым понятиям, которые будут использоваться в работе, и установить, на какие источники можно опираться для получения сведений о той частотности, которой пользуются слушающие в процессе восприятия речи.

В первом разделе рассматриваются возможные трактовки термина «частотность», анализируются существующие источники сведений о частотности слов русского языка (частотные словари и корпусы текстов) и формулируются вопросы, на которые необходимо ответить, чтобы определить, что будет пониматься под частотностью в рамках настоящего исследования. Ответы на них даются в следующих четырех разделах по мере конкретизации области исследования.

Восприятие речи понимается в работе как «приписывание языковой структуры речевому сигналу»,3 при этом признается возможность различной глубины восприятия. В исследовании, описываемом в диссертации, сигнал считается воспринятым, если установлено соответствие между его звучанием и внутриязыковым смыслом, т.е. фонетическое описание соотнесено с единицей / единицами словаря слушающего.6

Словарь (ментальный лексикон) слушающего трактуется в работе как динамическая система, состоящая из единиц, соединенных многочисленными многомерными связями, обеспечивающими взаимную активацию связанных элементов в процессе распознавания речи. В качестве низшего уровня ментального лексикона слушающего, на котором представлен только план выражения

s Венцов A.B., Каеевич В.Б. Проблемы восприятия речи. С. 53.

6 В качестве синонима термина «восприятие» в работе используется преимущественно термин «распознавание».

его единиц, выделяется т.н. перцептивный словарь.7 Основной единицей словаря слушающего применительно к русскому языку признается словоформа, поскольку в русском языке словоформы, относящиеся к одной и той же лексеме, могут значительно различаться по форме и иметь различные акцентные контуры, которые чаще всего невозможно вывести из исходной (словарной) формы.8 Существует несколько классификаций моделей, описывающих процесс доступа к словарю.9 По механизму соотнесения они могут быть разделены на модели параллельной активации и последовательного поиска, однако большинство современных моделей восприятия речи являются «гибридными», т.е. предполагают предварительную активацию ряда кандидатов на распознавание и их последующую конкуренцию. Та или иная степень формального сходства обязательна при распознавании звучащих слов. В качестве источников активации (перцептивно значимых элементов) предлагаются начало слова, ударный гласный, ритмическая структура, количество и порядок следования согласных. В зависимости от роли высших уровней ментального лексикона в процессе распознавания модели делятся на автономные, в которых грамматическая и семантическая информация о словоформе становится доступной только после выбора единственного возможного по формальным характеристикам кандидата, и интерактивные, предполагающие влияние семантико-синтаксической информации на выбор одного из кандидатов в процессе распознавания.

7 Венцов А.В. Восприятие устной речи и ментальный лексикон // Русская языковая личность: Материалы шестой выездной школы-семинара / отв. ред. Е.В. Грудева, P.JI. Смулаковская. Череповец: ГОУ ВПО «Череповецкий государственный университет», 2007. С, 65.

8 См. об этом: Венцов А.В., Касевич В.Б. Словарь для модели восприятия речи Н Вестник Санкт-Петербургского университета. Сер. 2, вып. 3.1998. №16. С. 32-39; Венцов А.В., Касевич В.Б., Ягунова Е.В. Корпус русского языка и восприятие речи // Научно-техническая информация. Сер. 2: Информационные процессы и системы. 2003. №6. С. 25-32 и др. работы этих авторов.

9 См. обзоры в: Tyler L.K., Frauenfelder U.H. The Process of Spoken Word Recognition: An Introduction // Spoken Word Recognition / eds. : U.H. Frauenfelder, L. K. Tyler. Cambridge, MA : MIT Press, 1987. P. 1-20; Yelland G.W. Word Recognition and Lexical Access // The Encyclopedia of Language and Linguistics. Vol. 9 I eds.: R.E. Ashei, J.M.Y. Simpson. Oxford, etc.: Perga-mon, 1994. P. 5009-5014; Luce P.A., McLennan C.T. Spoken Word Recognition: The Challenge of Variation. P. 592-609 и др.

В рамках диссертации доступ к словарю описывается через понятия активации и конкуренции, в ходе которых слушающий может использовать многочисленные источники информации для выбора единственно возможной единицы словаря. Принципиальным при этом является наличие у слушающего целого набора стратегий оперирования данными источниками, наиболее значимыми из которых являются формальное (фонетическое) сходство, частотность, контекст.

Контекст рассматривается в работе как комплексное явление — совокупность семантической и лексико-грамматической информации, доступной слушающему при распознавании речи.

В силу того что основной единицей словаря слушающего применительно к русскому языку решено считать словоформу, при описании экспериментов будет учитываться прежде всего частотность словоформ и, по мере необходимости, их сочетаний.

Поскольку частотность единиц ментального лексикона является субъективным фактором и не может быть определена точно, в рамках диссертации было решено использовать в качестве ее аналога частотность, получаемую по данным корпусов русского языка значительного объема. В зависимости от целей каждого конкретного эксперимента в качестве источников этих сведений будут использоваться основной корпус или один из подкорпусов Национального корпуса русского языка (далее — НКРЯ)10 или «Частотный словарь словоформ русского языка», созданный на базе Корпуса русского литературного языка (далее — КРЛЯ).11 Другие частотные словари русского языка (включая словари русской разговорной речи) не могут претендовать на адекватное отражение частотности словоформ в силу различных причин: недостаточного количества источников, несбалансированности их по жанрам и/или отсутствия в выборке современных текстов.

10 иКЬ: http://www.ruscorpora.ru/

11 иЛЬ: http://www.narusco.ru/

Для удобства сопоставления частотностей анализируемых единиц в качестве единицы измерения используется количество словоупотреблений на миллион — ipm (instances per million words).

Глава П. Спонтанная речь: обоснование выбора материала исследования. Во второй главе описывается основной материал исследования — спонтанная речь: дается определение понятия и приводятся результаты анализа фонетического облика словоформ в спонтанной речи, на основе которых выдвигаются гипотезы о возможных стратегиях восприятия последней.

Под спонтанной речью в диссертации понимается диалогическая или монологическая устная литературная речь, характеризующаяся той или иной степенью неподготовленности по форме. Таким образом, спонтанность рассматривается как градуальный признак. Эталоном спонтанной речи считается разговорная речь.

Одной из особенностей спонтанной речи является наличие значительного количества редуцированных словоформ — форм слов, представленных на сегментном уровне меньшим количеством элементов, чем в полном варианте, предусматриваемом нормами кодифицированного литературного языка. Редуцированные словоформы являются примером неполного речевого сигнала, для адекватной интерпретации которого слушающий должен использовать дополнительную информацию, помимо непосредственно содержащейся в речевом сигнале (например, частотность и разные типы контекста).

В ходе исследования были проанализированы два типа спонтанной речи: 1) 9 бытовых диалогов общей продолжительностью звучания 16 минут 33 секунды и 2) фрагмент ток-шоу «Культурная революция» (телеканал «Культура») от 23.06.2005 продолжительностью звучания 14 минут 51 секунда.

В этих записях было подсчитано количество словоформ, фонетический облик которых отличается от полного типа произнесения. Кроме случаев выпадения фонетических элементов словоформ, учитывались также качественные из-

менения согласных и ударных гласных,12 а также перестановки фонем в рамках словоформы (метатеза) и появление дополнительных звуков в фонетическом облике словоформы (эпентеза).

Всего в проанализированных записях было зафиксировано 1070 реализаций, подвергшихся изменению (22,3% от общего числа словоупотреблений). Словоформы с измененным фонетическим обликом встречаются в речи практически всех дикторов независимо от темпа произнесения. В бытовых диалогах изменениям подверглись 459 реализаций 258 различных словоформ, в ток-шоу — 611 реализаций 416 словоформ. Большая часть словоформ (73,3% в диалогах и 79,3% в ток-шоу) встретилась в измененном виде только один раз. Из словоформ, встретившихся в измененном виде более одного раза, 75,5% имеют несколько реализаций (от 2 до 10), при этом предсказать степень редукции в каждом конкретном случае не представляется возможным.

Изменения затронули словоформы, относящиеся ко всем частям речи. В большинстве случаев словоформы с качественной или количественной редукцией входят в основную структуру предложения, т.е. являются значимыми для понимания смысла высказывания. Дискурсивными словами13 или их элементами можно считать только 128 словоупотреблений (27,9%) в бытовых диалогах и 67 словоупотреблений (11,0%) в ток-шоу.

Сделанные наблюдения, а также описанные в главе результаты экспериментов по восприятию редуцированных словоформ, извлеченных из голландской спонтанной речи,14 ставят под сомнение возможность функционирования

12 Качественная редукция безударных гласных не учитывалась, поскольку, как показал опыт сплошного транскрибирования спонтанной речи, во многих случаях определение качества гласного в безударной позиции является затруднительным даже с применением методов инструментального анализа.

15 Дискурсивными словами в рамках данного исследования считались единицы, которые не входят в пропозициональную структуру высказывания, не являются членами предложения и не относятся при этом к обращениям, союзам и междометиям. См. подробнее: Риехакай-нен Е.И., Слепокурова H.A. Дискурсивные слова в русской спонтанной диалогической речи: предварительные итоги исследования // Материалы XXXVIII Международной филологической конференции 16-21 марта 2009 г. Общее языкознание / под ред. H.A. Слепокуровой. СПб.: Факультет филологии и искусств СПбГУ, 2009. С. 36-43.

14 Ernestus М., Baayen Н., Schreuder R. The Recognition of Reduced Word Forms // Brain and Language. 2002. Vol. 81 (1-3). P. 162-173.

в перцептивном словаре в качестве самостоятельных единиц редуцированных вариантов большинства словоформ. Предполагается, что основным фактором, обеспечивающим надежное распознавание, является контекст.

На уровне тенденции можно говорить о том, что согласные (кроме /j/) являются более предпочтительными кандидатами на роль перцептивно значимых элементов словоформы, поскольку гласные (в том числе ударные) имеют тенденцию качественно редуцироваться и выпадать чаще, чем согласные. Редукции в середине и на конце словоформ более распространены, чем редукции в начале словоформ, что является косвенным подтверждением гипотезы о перцептивной значимости начала слова.15

Проведенный анализ позволяет считать редуцированные словоформы удобным материалом для изучения роли контекста в процессе распознавания речи. При этом отдельного внимания заслуживает рассмотрение вопроса о том, одинаковой ли является значимость контекстной информации при распознавании частотных и нечастотных редуцированных реализаций. Таким образом, в ходе изучения механизмов распознавания редуцированных словоформ становится возможным получение сведений о взаимовлиянии контекстной предсказуемости и частотности в процессе восприятия спонтанной речи, что и является целью данной работы.

В Главе Ш «Базовая стратегия распознавания редуцированных словоформ» анализируются результаты серии экспериментов, направленных на описание основной стратегии, которой может пользоваться слушающий при распознавании редуцированных словоформ, и определение роли контекста и частотности в рамках этой стратегии. В качестве исходного материала для всех экспериментов использовались записи девяти спонтанных диалогов на русском языке, описанных в Главе II. Испытуемым предлагалось прослушать фрагменты диалогов и записать их буквами русского алфавита. Каждый стимул повторялся три раза, после чего участникам эксперимента давалось несколько секунд на

15 Ср. Marslen-Wilson W.D., Welsh A. Processing Interactions during Word Recognition in Continuous Speech // Cognitive Psychology. 1978. Vol. 1. №1. P. 29-63 и др.

его отражение в бланке ответов. Испытуемыми были студенты и преподаватели Филологического и Восточного факультетов Санкт-Петербургского государственного университета.

Предварительный эксперимент, в котором 10 испытуемым были предложены для прослушивания и последующей записи 4 фрагмента исходных диалогов продолжительностью звучания от 10 до 25 секунд, показал, что диалоги, являющиеся материалом экспериментального исследования, и редуцированные формы слов в них воспринимаются испытуемыми достаточно надежно. Участники эксперимента склонны опускать лишь повторы, неполные слова, прерываемые паузами хезитации ([абсол...), и некоторые малоинформативные дискурсивные слова (вот, вроде, то есть, знаешь, понимаешь).

Целью следующего эксперимента являлась проверка предположения о том, что редуцированные словоформы не хранятся в словаре слушающего в качестве самостоятельных единиц, а должны восстанавливаться до полных реализаций с опорой на контекст.

Стимулы для тестовой последовательности были составлены на основе 24 различных редуцированных словоформ. В первой части эксперимента испытуемым предъявлялись изолированные редуцированные словоформы, во второй — они же в контексте.

Испытуемые были разделены на две группы: в инструкции для одной из них было указано, что в первой части эксперимента будут предъявлены фрагменты русской речи (группа А, 42 человека), для другой же было уточнено, что это будут слова или короткие словосочетания (группа Б, 40 человек).

В ходе эксперимента подтвердилась гипотеза о том, что редуцированные словоформы, которые практически не распознаются при изолированном предъявлении, намного лучше воспринимаются в контексте:

Рис. 1. Сравнение надежности распознавания словоформ, предъявляемых изолированно и в контексте

100 -90 -во -70 1 |б0 -

|sD -

-

зо -20 г ю -о -

В ipymaB

И восприятс словоформ в контассте

Достоверных различий в восприятии стимулов между группами А и Б выявлено не было.

Результаты проведенного эксперимента позволяют говорить о том, что редуцированные словоформы не хранятся в перцептивном словаре слушающего, и считать наличие контекста важным фактором, обеспечивающим надежное восприятие редуцированных форм слов в речи.

Гипотеза об определяющей роли контекста была проверена в эксперименте на распознавание редуцированных словоформ из предыдущего эксперимента в увеличенном, сокращенном или измененном контексте.

Процедуре увеличения контекста были подвергнуты словоформы, которые в предыдущем эксперименте не имели левого контекста и воспринимались плохо, сокращены же были те стимулы, редуцированные словоформы в которых были распознаны хорошо в предыдущем эксперименте.

Процедура изменения контекста заключалась в том, что хорошо распознававшиеся в первом эксперименте редуцированные словоформы были помещены в контекст, который должен был спровоцировать их неправильную интер-

I

п J II Б 1 'Я -1* РИ J, 1, ■ " ■

иретацию. Например, редуцированная словоформа просят /ргоэ'1/16 помещалась в контекст просят живет, и ожидалось, что испытуемые будут слышать пусть живет.

В тестовую последовательность вошли 25 стимулов. В эксперименте приняли участие 78 человек.

Проведенный эксперимент показал, что семантическая и грамматическая нагруженность контекста существенно влияет на качество распознавания редуцированных словоформ. С одной стороны, редуцированные словоформы воспринимались намного надежнее при увеличении их исходного контекста в предъявляемых стимулах, а с другой — при изменении исходных контекстов и при их сокращении наблюдалось появление новых интерпретаций редуцированных форм слов, «правильных» же ответов становилось меньше. Например, словоформа говорит в контексте а она говорит: «Да, но это не в первый раз» была верно распознана 83% испытуемых. В контексте говорит не в первый раз количество правильных распознаваний снизилось до 38,5%, в контексте говорит свечку ответы говорит составили лишь 6,4%, но при этом появились также ответы гасит, гасить, гореть (более 10%), активизированные контекстом свечку. В стимуле же свечка говорит ни один из испытуемых не соотнес редуцированный вариант со словоформой говорит, ответ же горит встретился у 33,3% испытуемых. Эксперименты показали, что и левый, и правый контекст играет активную роль в процессе восприятия речи, причем как в грамматическом, так и в лексико-семантическом аспекте.

По результатам распознавания словоформ при изолированном предъявлении и при предъявлении в измененном контексте, наиболее перцептивно устойчивыми оказываются элементы консонантного «скелета» редуцированной словоформы: порядок следования согласных, начальный согласный и ряд устойчи-

16 За основу используемой здесь и далее фонематической транскрипции была принята фонетическая транскрипция, предложенная Л.В. Щербой (см., например: Бондарко Л.В. Фонетика современного русского языка. СПб. : Изд. С.-Петерб. ун-та, 1998. С. 272-273). Знак «+» в транскрипции указывает на ударность предшествующего гласного.

17

вых для восприятия согласных (смычные шумные согласные, щелевые /§/, /§':/, аффриката /с/, а также сонант /п/, являющийся суффиксом наречий).

Таким образом, полученные результаты позволяют предложить в качестве базовой следующую стратегию распознавания редуцированных словоформ. Сталкиваясь в процессе речевосприятия с редуцированной словоформой, слушающий опирается на ряд сохранившихся в ее звуковой форме полезных признаков (по-видимому, на консонантный «скелет») и выбирает из набора активированных на основе этих полезных признаков единиц ту, которая более всего соответствует контексту. Если же в данном контексте возможны несколько словоформ, то предпочтительной оказывается наиболее частотная из них, что подтверждается при сопоставлении частотностей словоформ, встретившихся в ответах испытуемых.

Однако предположение о роли частотности нуждается в дополнительной проверке, поскольку в описанных экспериментах на выбор той или иной единицы могла повлиять не только частотность конкурирующих единиц, а целая совокупность факторов. Например, нельзя исключать того, что в рассмотренных экспериментах некоторые испытуемые предпочитали ту или иную словоформу не в силу ее большей частотности, а потому, что она более других соответствовала воспринимаемому сигналу по фонетической структуре.

Проверка гипотезы о решающей роли частотности при выборе из нескольких единиц перцептивного словаря, которые в равной степени соответствуют входному сигналу и допускаются существующим контекстом, является целью эксперимента, описываемого в Главе IV «Распознавание словоформ в условиях отсутствия контекста, снимающего неоднозначность».

В качестве стимулов были выбраны 4 типа омофонов: лексические:

(1) существительные в форме Им.п. ед.ч., заканчивающиеся на глухой согласный: например, /гок/ (рог-рок), /так/ (маг-мак) и т.д.;

грамматические:

(2) формы глаголов прош.вр. ед.ч. с безударным окончанием /а/: ^о+Па/ {стоило-стоило), /Бкта+кз'/ (сломалосъ-сломалась) и т.д.;

(3) словоформы, которые могут быть интерпретированы как наречия и краткие прилагательные ср.р. или краткие прилагательные ж.р.: /ийа+Бпа/ (ужасно-ужасна), /гаЬо+ЙЧуа/ (заботливо-заботлива) и т.д.;

(4) формы глаголов 3 л. наст.вр. с безударным окончанием: /уо+гЧ£/ (возит-возят), /с!ги+2ы1/ (дружит-дружат) и т.д.

В условиях устно-письменного эксперимента на интерпретацию изолированных омофонов могла повлиять не только частотность, но и степень соответствия между произнесением и написанием (например, существительные, на конце которых пишется буква, соответствующая глухому согласному, оказываются ближе к произношению, чем существительные, оканчивающиеся на букву, соответствующую звонкому согласному). С учетом этого для Типов 1, 2 и 4 были подобраны следующие пары:

- омофон, орфографическая запись которого ближе к произношению, является более частотным, чем второй омофон данной пары;

- омофон, орфографическая запись которого ближе к произношению, является менее частотным, чем второй омофон данной пары.

Для Типа 3 удалось подобрать только те пары, в которых более частотным является омофон, написание которого отличается от произношения (т.е. вариант, заканчивающийся на -о). Всего было отобрано 40 пар.

Частотность определялась по данным основного корпуса НКРЯ (162 132 407 словоупотреблений на момент обращения).

Поскольку получение стимульного материала из записей спонтанной речи представлялось невозможным, в первую очередь, в силу ограниченного объема существующих корпусов спонтанной русской речи, все омофоны извлекались из фраз, прочитанных двумя дикторами (мужчиной и женщиной).

Тестовая последовательность предъявлялась испытуемым для прослушивания через наушники. Каждый стимул, представлявший собой изолированный омофон, звучал только один раз.

Испытуемые были разделены на две группы. Первой из них предлагалось просто записать услышанное, участники же, вошедшие во вторую группу, должны были составить любую фразу с каждым стимулом. В эксперименте приняли участие 85 человек в возрасте от 15 до 54 лет: 50 — в первой группе и 35 — во второй.

На большей части материала подтвердилась гипотеза о том, что при наличии нескольких единиц перцептивного словаря, в равной степени соответствующих входному сигналу, наиболее вероятным кандидатом на распознавание будет та из них, которая является более частотной. В частности, об этом свидетельствуют данные, полученные для большинства омофонов Типа 1 и Типа 2: если омофон являлся более частотным, выбор делался в его пользу, даже если его графический облик не соответствовал звучанию. При этом количество ответов, содержащих разные омофоны, достоверно не различается для тех пар, в которых омофоны встречаются в речи с примерно равной частотой (например, ^ок/, /так/, /зШса+1а/).

Для ряда грамматических омофонов (некоторых стимулов Типа 2, заканчивающихся на /аэ'/, и стимулов Типа 4) более значимой оказалась не частотность словоформ, а кумулятивная частотность грамматической формы, под которой подразумевается суммарная частотность всех словоформ, образующих данный грамматический класс. Более частотные в речи формы 3 л. ед.ч. выбирались большим количеством испытуемых независимо от соотношения частотностей в конкретной паре омофонов, формы же на -ось и на -ась для стимулов ЫапмгНаз'/, /гакты+кэ'/ и /з^са+кэ'/ оказались представленными в ответах примерно в равном количестве, что соответствует соотношению суммарных частотностей всех форм на -ось и на -ась в НКРЯ, а не конкретных словоформ в парах. Для грамматических омофонов Типа 3 соотношение частотностей сло-

воформ в каждой паре совпадало с кумулятивной частотностью класса, поэтому нельзя было определить, какая именно частотность оказала большее влияние.

Результаты, полученные на второй группе испытуемых, свидетельствуют о том, что количество и частотность потенциальных контекстов, в которых может встречаться словоформа, также могут оказывать влияние на степень ее активации. Так, в ответах на омофоны Типа 2 для семи из десяти стимулов возрастает количество форм ж.р. (на -ла или -лась), что, по-видимому, объясняется более высокой вероятностью сочетания личной формы глагола с существительным ж.р. в позиции подлежащего. В некоторых случаях на выбор интерпретации влияет также наличие частотных сочетаний с конкретными глаголами (например, дверь закрылась, всё получилось, машина сломалась). Следовательно, чем сильнее связь между двумя единицами, тем сильнее будет их взаимная активация в процессе распознавания речи.

Таким образом, проведенный эксперимент показал, что в условиях отсутствия контекста, снимающего неоднозначность, слушающий может пользоваться несколькими стратегиями, опирающимися на частотность как отдельных единиц, так и их классов и комбинаций.

Глава V. К вопросу о существовании стратегий, отличных от базовой, при распознавании редуцированных словоформ. Данная глава посвящена проверке предположения о том, что в ряде случаев при интерпретации редуцированной словоформы слушающий не соотносит ее с полным вариантом, хранящимся в перцептивном словаре, опираясь на контекст, а пользуется стратегиями, отличными от базовой.

Рассматриваются два фактора, которые могут повлиять на выбор стратегии:

(1) частотность словоформ. Рабочая гипотеза заключается в том, что стратегия распознавания высокочастотных редуцированных словоформ может отличаться от стратегии распознавания низкочастотных редуцированных словоформ;

(2) синтаксическая функция, которую выполняет словоформа. Предполагается, что в тех случаях, когда редуцированная словоформа оказывается не связанной с контекстом синтаксическими связями, слушающий опирается не на контекст, а на другие факторы.

Проверка выдвинутых предположений требует систематически отобранного материала, получение которого по существующим на сегодняшний день корпусам спонтанной русской речи не представляется возможным. Результаты эксперимента, описанного в первом разделе главы, свидетельствуют о том, что для проведения подобных исследований можно использовать т.н. искусственно созданные редуцированные словоформы, полученные в результате инструментальной обработки прочитанных диктором текстов.

В качестве материала для исследования роли частотности словоформ в процессе их распознавания были выбраны глагольные формы 3 л. ед.ч., имеющие структуру С(С)У+сГУС,17 с выпадением звонкого переднеязычного согласного ЛГ/ в интервокальной позиции: высокочастотная словоформа будет, частотные словоформы ходит и видит, низкочастотные словоформы водит, гладит, будит, судит.

Были подготовлены 15 стимулов, которые представляли собой употребления данных словоформ в контекстах различной длины и семантической нагру-женности: от минимального он ... (например, он водим) до полного (например, он водит нас к психологу). Во всех глагольных формах 3 л. ед.ч. был удален гласный /с17.

Для проверки того, зависит ли надежность распознавания редуцированной словоформы от синтаксической функции, которую она выполняет, были выбраны шесть словоформ, которые могут входить в основную структуру предложения и употребляться в вводных конструкциях или в оборотах, вводящих прямую речь: понимаешь, может, кажется, слушай (слышь), говорю, говорит. Для каждой словоформы были составлены два контекста: в одном из них словоформа выступала в функции вводного слова, которая, по данным НКРЯ, яв-

17 С — согласный, V — гласный, У+ — ударный гласный.

22

ляется наиболее типичной для всех отобранных словоформ, в другом — нет. Словоформы были инструментально сокращены до наиболее редуцированных вариантов, встретившихся в спонтанных диалогах, анализ которых представлен в Главе II, и в материалах «Фонетического словаря высокочастотных слов русской разговорной речи».18

Оба типа стимулов были включены в один эксперимент. Для уменьшения влияния друг на друга сигналов с одинаковыми словоформами материал эксперимента был разделен на две тестовые последовательности, которые впоследствии были предъявлены различным группам испытуемых. В рамках одной тестовой последовательности стимулы, направленные на решение различных задач, чередовались. В эксперименте принял участие 71 испытуемый (35 девушек и 36 юношей, учащиеся одной из общеобразовательных школ Санкт-Петербурга). Первую тестовую последовательность прослушали 38 человек, вторую — 33.

Полученные результаты показали, что не существует строгой зависимости между надежностью распознавания сильно редуцированных словоформ и их синтаксической позицией. Высокий уровень распознавания может быть достигнут при восприятии и вводных слов, и словоформ, входящих в основную структуру предложения, за счет использования различных стратегий. Распознаванию редуцированной словоформы в функции вводного слова может способствовать не влияние контекста, а частота ее употребления в данной функции. При этом, по-видимому, для этой стратегии степень соответствия фонетического облика редуцированной словоформы каноническому варианту является более значимой, чем для стратегии с опорой на контекст.

На существование нескольких стратегий указывают и результаты распознавания стимулов с выпадением интервокального /сГ/. В минимальном контексте те словоформы, которые были отнесены к низкочастотным на основе данных, представленных в корпусах русского языка, были распознаны достоверно

18 Фонетика спонтанной речи / Л.В. Бондарко [и др.]. Л. : Изд-во Ленингр. ун-та, 1988. С. 240-245.

хуже, чем частотные ходит и видит и высокочастотная будет. При увеличении же семантической нагруженности контекста роль фактора частотности ослабляется, что свидетельствует о том, что слушающий опирается на контекст при распознавании низкочастотных словоформ.

По результатам эксперимента можно предположить, что типичные редуцированные реализации частотных словоформ (например, /ho+it/ для ходит, /bu+it/ для будет) могут храниться в перцептивном словаре в качестве самостоятельных вариантов и, следовательно, для их распознавания слушающему не нужно соотносить услышанное с полной реализацией с опорой на контекст. Проверка этого предположения требует исследования фонетического облика частотных словоформ в спонтанной речи и выявления их типичных реализаций. Начальный этап подобного исследования, описанный в последнем разделе Главы V, показал, что редуцированные варианты высокочастотных словоформ отличаются большим разнообразием: для 624 проанализированных словоупотреблений было получено 169 различных реализаций, при этом количество редуцированных вариантов отдельно взятой словоформы колеблется от 4 для всё-таки до 15 для значит. Для большинства проанализированных словоформ наиболее распространенным является полный вариант произнесения, среди редуцированных же реализаций преобладают варианты с выпадением одного звука, которые достаточно легко соотнести с полными вариантами. Особую стратегию, предполагающую хранение в перцептивном словаре редуцированных реализаций, а не их соотнесение с полными с опорой на контекст и консонантный «скелет», на нашем материале можно предположить только для нескольких словоформ, которые имеют типичные редуцированные реализации, встречающиеся в речи чаще, чем полные, или хотя бы чаще, чем другие редуцированные реализации (например, /s':as/ для сейчас, /t'a/ для тебя, /gbit/ для говорит).

Глава VI «Различные подходы к описанию восприятия речи: мнимые противоречия» является обобщающей. В ней полученные результаты рассматриваются с точки зрения основных подходов к описанию распознавания естественного речевого сигнала.

В целом результаты представленного в диссертации исследования не указывают на реалистичность одного подхода к описанию процесса распознавания речи и несостоятельность других, а позволяют в большей мере говорить о существовании некоего глобального механизма восприятия звучащей речи, в котором, в сущности, могут быть учтены положения всех подходов. В каждом конкретном случае слушающий пользуется одной из возможных стратегий, опираясь на те признаки, которые оказываются наиболее перцептивно значимыми применительно к данному речевому сигналу и в данных условиях общения. Сама же структура процесса распознавания, по-видимому, является единой независимо от стратегии и предполагает активацию некоторого множества единиц словаря на основе каких-либо перцептивно устойчивых элементов и последующий выбор из них «лучшего кандидата».

В Заключении подводятся итоги проведенной работы, которые являются основой положений, выносимых на защиту, и формулируются некоторые перспективы исследования.

ОСНОВНЫЕ ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ

1. Риехакайнен Б.И. Влияние частотности словоформ на надежность распознавания их редуцированных вариантов // Вестник Санкт-Петербургского университета. Серия 9: Филология, востоковедение, журналистика. 2009. №4. С. 116-121.

2. Риехакайнен Е.И. Влияние потенциального контекста на распознавание изолированных омофонов // Вестник Пермского университета. Российская и зарубежная филология. 2010. №4(10). С. 40-45.

3. Венцов A.B., Риехакайнен Е.И., Слепокурова H.A. Ментальный лексикон и восприятие редуцированных форм // Труды первого междисциплинарного семинара «Анализ разговорной русской речи» (АР3 - 2007). СПб. : ГУАП, 2007. С. 21-24.

4. Риехакайнен Е.И. Распознавание редуцированных словоформ в процессе восприятия спонтанной речи // Русская языковая личность: Материалы шес-

той выездной школы-семинара / отв. ред. Е.В. Грудева, Р.Л. Смулаковская. Череповец : ГОУ ВПО «Череповецкий государственный университет», 2007. С. 105-112.

5. Риехакайнен Е.И. Роль фактора частотности в процессах порождения и восприятия редуцированных словоформ // VII выездная школа-семинар «Проблемы порождения и восприятия речи»: Материалы / отв. ред. Е.В. Грудева, Р.Л. Смулаковская. Череповец : ГОУ ВПО «Череповецкий государственный университет», 2008. С. 53-60.

6. Риехакайнен Е.И. Стратегии восприятия редуцированных словоформ (на материале русской спонтанной речи) // Научные чтения — 2006. Материалы конференции. 13-14 ноября 2006. СПб. : Факультет филологии и искусств СПбГУ, 2008. С. 52-59.

7. Риехакайнен Е.И. Перцептивно значимые элементы редуцированных словоформ // Речевые технологии. 2009. №3. С. 77-92.

8. Риехакайнен Е.И. Стратегии восприятия омофонов носителями русского языка // Материалы XXXVIII Международной филологической конференции 11-13 марта 2009 г. Психолингвистика / отв. ред. Т.В. Черниговская. СПб. : Факультет филологии и искусств СПбГУ, 2009. Ч. 2. С. 8-15.

9. Riekhakaynen E.I. Récognition of Russian homophones: possible stratégies // Proceedings of the 13th International Conférence "Speech and Computer" SPE-COM'2009. St. Petersburg : SUAI, 2009. P. 547-551.

10. Венцов A.B., Риехакайнен Е.И. Восприятие омофонов и структура ментального лексикона // Анализ разговорной русской речи» (АРЗ - 2010): Труды четвертого междисциплинарного семинара. СПб. : ГУАП, 2010. С. 1215.

11. Риехакайнен Е.И. Фонетика спонтанной речи в перцептивном аспекте // Материалы XXXIX Международной филологической конференции 15-20 марта 2010 г. Психолингвистика / отв. ред. Т.В. Черниговская. СПб. : Филологический факультет СПбГУ, 2010. С. 57-61.

ОНУТ Филологического факультета СПбГУ Санкт-Петербург, Университетская наб., 11 Подписано в печать 28.10.2010 Тираж 150 экз.

 

Оглавление научной работы автор диссертации — кандидата филологических наук Риехакайнен, Елена Игоревна

Введение.

Глава I. Частотность, восприятие речи, контекст: основные понятия.

1.1. Частотность: определение в вопросах.

1.2. Восприятие речи: определение области исследования.

1.3. Ментальный лексикон слушающего.

1.3.1. Определение.

1.3.2. Ментальный лексикон говорящего и слушающего.

1.3.3. Структура и единицы.

1.4. Модели доступа к словарю слушающего.

1.4.1. Последовательный перебор или параллельная активация.

1.4.2. Источники активации.

1.4.3. Роль контекста: автономные уб. интерактивные модели.

1.5. Частотность в словаре слушающего.

Выводы.

Глава II. Спонтанная речь: обоснование выбора материала исследования.

2.1. Определение.

2.2. Фонетические особенности спонтанной речи.

2.3. Редуцированные словоформы в спонтанной речи: общий обзор.

2.4. Статистический анализ редуцированных словоформ в спонтанных текстах.

2.4.1. Материал исследования.

2.4.2. Принципы анализа материала.

2.4.3. Результаты: общая характеристика словоформ, подвергшихся изменению.

2.4.4. Результаты: степень редукции словоформ.

2.4.5. Сопоставление полученных результатов с орфоэпической нормой современного русского языка.

2.4.6. Количество редуцированных реализаций в речи разных коммуникантов.

2.4.7. Значение полученных результатов для описания процесса восприятия речи.

Выводы.:.

Глава III. Базовая стратегия распознавания;редуцированных словоформ.

3.1. Общий обзор.—.

3.2. Предварительный эксперимент.

3.2.1. Материал и методика предварительного эксперимента.

3.2.2. Результаты.

3.3: Изолированное и контекстное восприятие редуцированных словоформ

3.3.1. Цель эксперимента.

3 .3 .2. Материал.:.

3.3.3. Методика проведения эксперимента.

3.3.4. Основные принципыюбработки данных

3.3.5. Результаты эксперимента: восприятие изолированных словоформ. 3.3.6. Результаты эксперимента: восприятие словоформ в контексте в сопоставлении с данными по восприятию изолированных словоформ.

3.3.7. Результаты эксперимента: перцептивно значимые элементы редуцированных словоформ.

3.3.8. Результаты эксперимента: роль частотности в процессе восприятия редуцированных словоформ.

3.4. Роль контекста в распознавании редуцированных словоформ.

3;4.1. Цели и задачи.

3.4.2. Материал экспериментального исследования.

3.4.3. Методика проведения эксперимента.

3.4.4. Основные принципы обработки данных.

3.4.5. Результаты эксперимента: общий обзор.

3.4.6. Результатыэксперимента: сокращение контекста.

3.4.7. Результаты эксперимента: увеличение:контекста.

3 ;4.8: Результаты эксперимента: изменение контекста.

Выводы.

Глава IV. Распознавание словоформ в условиях отсутствия контекста, снимающего неоднозначность.

4.1. Цель исследования.

4.2. Материал эксперимента.

4.3. Методика проведения эксперимента и испытуемые.

4.4. Принципы обработки результатов.

4.5. Результаты эксперимента.

4.5.1. Общий обзор.

4.5.2. Распознавание омофонов Типа 1.

4.5.3. Распознавание омофонов Типа 2.

4.5.4. Распознавание омофонов Типа 3.

4.5.5. Распознавание омофонов Типа 4.

4.5.6. Стратегия с опорой на фонетический принцип орфографии.

 

Введение диссертации2010 год, автореферат по филологии, Риехакайнен, Елена Игоревна

Активное изучение процесса восприятия речи началось в 50-ые гг. XX века. За шестьдесят лет было опубликовано значительное число работ по данной проблематике, предпринимались неоднократные попытки создания действующей модели речевосприятия (в том числе компьютерной) (см. об этом, например, [Венцов, Касевич 2003 (1994); Luce, McLennan 2005; Залевская 2007: 384446; Ягунова 2008]). Однако до сих пор не существует концепции, которая бы могла претендовать на полное и непротиворечивое описание того, каким образом слушающий распознает речевой сигнал. С одной стороны, это связано с тем, что долгое время исследования процесса восприятия речи проводились преимущественно на материале прочитанных изолированных слов или предложений и многие выводы, сделанные по результатам подобных исследований, оказались неприменимыми к распознаванию речи в естественных условиях.

С другой же стороны, отсутствие действующей модели восприятия речи объясняется желанием большинства исследователей разработать лишь одну глобальную стратегию распознавания речевого сигнала, в то время как экспериментально доказано, что «в разных условиях приема слушающие оперируют разным количеством оперативных единиц, их наборами и порядком по значимости» [Штерн 1992: 187], т.е. применяют разные стратегии. Логично предположить, что в ситуации естественного общения значимость различных признаков, доступных слушающему, может изменяться под влиянием не только условий приема, но и множества других факторов (характеристик ситуации общения и коммуникантов, типа воспринимаемого сообщения и т.п.).

Объектом исследования, описываемого в данной работе, является процесс восприятия естественной русской речи носителями русского языка. Все полученные результаты интерпретируются с точки зрения их возможного применения к описанию распознавания подобного речевого сигнала.

В потоке естественной речи некоторые звуки могут качественно или количественно изменяться или вообще исчезать [РРР 1973: 40], что приводит к искажению фонетического облика словоформ и к появлению многочисленных отрезков речи, для однозначной интерпретации которых информации, представленной в акустическом сигнале, оказывается недостаточно. Тем не менее обычно это не является причиной коммуникативных неудач: даже неподготовленная речь хорошо воспринимается слушающим(и) и не вызывает переспросов. В качестве основных факторов, способствующих надежному распознаванию подобных фрагментов речи, обычно называются контекстная предсказуемость и частота употребления единиц в речи. При этом, как правило, в соответствии с описанной выше тенденцией, эти факторы рассматриваются независимо друг от друга.

Предметом настоящего исследования является взаимодействие стратегий, опирающихся на контекст и частотность, в процессе распознавания естественной русской речи, т.е. речи, элементы (словоформы) которой характеризуются «неполным типом произнесения» [Стили произношения. 1974: 65].

Обращение к естественному речевому сигналу в сочетании с пониманием восприятия речи как процесса, предполагающего взаимодействие различных стратегий, отличает данное исследование от многих предшествующих и определяет его актуальность.

Цель работы — подтвердить гипотезу, согласно которой в процессе восприятия речи слушающий пользуется стратегиями, опирающимися на контекст и частотность, и описать взаимодействие этих стратегий на материале русской спонтанной речи.

Сформулированная цель предполагает решение следующих задач:

1) дать качественную и количественную характеристику естественной звучащей речи с целью определения того, насколько часто для ее успешного распознавания необходимо привлечение дополнительной информации, помимо той, которая содержится в акустическом сигнале;

2) описать возможный механизм использования контекстной предсказуемости в процессе распознавания речи;

3) выявить признаки, на которые опирается слушающий в тех случаях, когда контекст не позволяет снять неоднозначность;

4) сравнить стратегии восприятия словоформ различной частотности.

Кроме того, для успешного осуществления исследования требуется решить две методические задачи, а именно:

5) определить возможные источники получения материала для исследования восприятия естественной речи;

6) оценить существующие способы получения сведений о частоте встречаемости языковых единиц и выбрать из них те, которые наилучшим образом отражают частотность, представленную в словаре слушающего и используемую при распознавании речи.

Для решения указанных задач используется совокупность методов. Первая задача решается путем слухового и инструментального анализа фрагментов звучащей русской речи. Основным методом решения трех последующих задач является эксперимент по распознаванию слов на слух {dictation task), предполагающий прослушивание испытуемыми стимулов различной длительности и их письменную фиксацию в бланках ответов буквами русского алфавита. При подготовке стимулов для экспериментов используются различные методы инструментальной обработки звуковых сигналов, предоставляемые звуковыми редакторами. Для сравнения полученных в экспериментах результатов применяются статистические методы: вычисление доверительных интервалов на 5%-ом уровне значимости и корреляционный анализ на основе коэффициента корреляции рангов Спирмена. Оценка источников получения материала исследования и способов вычисления частотности языковых единиц, а также анализ научной литературы по обсуждаемым в работе темам осуществляются при помощи индуктивно-дедуктивного метода и метода критического анализа.

Исходный материал исследования — записи бытовых диалогов и телевизионных ток-шоу (участники — носители русского языка). В экспериментах в качестве стимулов используются фрагменты данных записей, а также прочитанные дикторами фразы (в исходном звучании или после предварительной инструментальной обработки).

Достоверность описания речевого сигнала обеспечивается сочетанием методов инструментального и слухового анализа. Проведение серии экспериментов, в которых приняли участие в общей сложности 425 человек, объем полученного материала (13176 реакций), а также применение статистических методов при анализе данных обеспечивают достоверность результатов экспериментальной части работы.

Научная новизна работы заключается в том, что в ней впервые предпринимается попытка детального описания механизма распознавания редуцированных словоформ, представленных в русской спонтанной речи, с учетом целого ряда факторов, ведущими из которых являются частотность и контекст.

Получение новых сведений о роли различных стратегий в процессе восприятия фрагментов речи, характеризующихся неполным типом произнесения, позволяет приблизиться к пониманию механизма распознавания естественной речи человеком и выдвинуть предположения об устройстве ментального лексикона слушающего, что определяет теоретическую значимость работы.

Результаты исследования могут, применяться при создании моделей восприятия речи, а также при разработке методик обучения восприятию естественной речи взрослых и детей с нарушениями слуха, что свидетельствует о практической ценности работы.

Цели и задачи исследования определили структуру работы. Диссертация состоит из введения, шести глав, заключения, списка использованной литературы и приложений.

 

Заключение научной работыдиссертация на тему "Взаимодействие контекстной предсказуемости и частотности в процессе восприятия спонтанной речи"

Выводы

1. Описанные в данной главе эксперименты позволяют говорить о существовании трех стратегий распознавания редуцированных словоформ:

1.1. Различия в восприятии высоко- и низкочастотных словоформ с одинаковым типом редукции наблюдаются только при отсутствии достаточного контекста. В тех же случаях, когда редуцированные словоформы употреблялись в естественном для них контексте, различий между данными группами словоформ выявлено не было, что свидетельствует об использовании слушающим стратегии с опорой на контекст при распознавании низкочастотных словоформ. Значимость контекста подтверждается также тем, что сильноредуцированные реализации словоформ, часто выступающие в качестве вводных или дискурсивных слов, в составе основной структуры высказывания распознаются лучше (по крайней мере на уровне тенденции), чем в функции вводных слов.

1.2. Сопоставимый с распознаванием в контексте процент для данных словоформ в функции вводных слов позволяет предположить, что распознаванию может способствовать употребление словоформы в наиболее частотной для нее функции. При этом, по-видимому, для данной стратегии степень соответствия фонетического облика редуцированной словоформы каноническому варианту, является более значимой, чем для стратегии с опорой на контекст.

1.3. Для некоторых словоформ, которые имеют типичные редуцированные реализации, встречающиеся в речи чаще, чем полные, или хотя бы чаще, чем другие редуцированные реализации, по-видимому, оправданно наличие особой стратегии, предполагающей хранение в перцептивном словаре редуцированных реализаций, а не их соотнесение с полными с опорой на контекст и консонантный «скелет». При этом в первую очередь это должно относиться к сильноредуцированным вариантам словоформ.

Для большинства проанализированных в рамках исследования высокочастотных словоформ наиболее распространенным является полный вариант произнесения, редуцированные же реализации многочисленны и разнообразны и среди них преобладают варианты с выпадением одного звука, которые достаточно легко соотнести с полными реализациями.

2. Помимо ответов на теоретические вопросы, результаты описанных экспериментов свидетельствуют о возможности использования искусственно созданных редуцированных словоформ в качестве материала для подобного рода исследований.

Однако, несомненно, более объективные данные, в полной мере отражающие реальные механизмы, которыми может пользоваться слушающий при распознавании спонтанной речи, могут быть получены только в результате анализа больших массивов спонтанных текстов.

Глава VI. Различные подходы к описанию восприятия речи: мнимые противоречия

В Главе I процесс восприятия (распознавания) речи был определен как приписывание языковой структуры речевому сигналу посредством соотнесения последнего с единицами словаря слушающего.

Одним из основных результатов экспериментов, описанных в главах III—V, является подтверждение предположения о множественности стратегий, которыми может пользоваться слушающий, воспринимающий звучащую речь, т.е. реализующий сформулированную выше задачу. Указанные эксперименты проводились на материале распознавания редуцированных словоформ и омофонов — и уже сама по себе специфика материала, как можно полагать, определяла, соответственно, специфику выбора стратегий речевосприятия.

Однако некоторые положения можно попытаться интерпретировать с точки зрения восприятия речи в целом, и в этой связи представляется целесообразным сопоставить результаты проведенного исследования с существующими подходами к описанию распознавания речевого сигнала (см. раздел 1.4.).

Как было отмечено в §1.4.1., в зависимости от того, каким образом описывается механизм извлечения единиц из МЛ, модели восприятия речи традиционно подразделялись на модели последовательного поиска и параллельной активации, однако большинство современных моделей являются «гибридными», поскольку предполагают первоначальную активацию ряда кандидатов с опорой на некоторые перцептивно значимые признаки и последующий выбор из них наиболее вероятного в данном контексте. По-видимому, примером такой модели является Модель когорты: образование когорты кандидатов на распознавание на основе совпадения начальных элементов и есть не что иное, как активация ряда единиц, имеющих общие признаки. Стратегии, описанные в работе, строятся на основе именно «гибридного» механизма.

При этом наиболее перцептивно значимым элементом при распознавании редуцированных словоформ, извлеченных из русской спонтанной речи, оказал

233 ся консонантный «скелет». Этот вывод не исключает использования стратегий, опирающихся на другие элементы фонетического облика словоформ (ударный гласный, количество слогов и т.п.), например, при восприятии нередуцированных словоформ или фрагментов речи не на русском языке. Более того, даже применительно к распознаванию редуцированных форм слов следует говорить о том, что опора на количество и порядок следования согласных является ведущей, но не единственной стратегией. Так, низкий процент распознавания редуцированного варианта словоформы понимаешь, звучавшего как /pes/, в функции вводного слова, по-видимому, свидетельствует о перцептивной значимости ударного гласного (во всех остальных словоформах, которые были распознаны лучше, ударный гласный не подвергался качественной редукции; см. §5.3.7.).

Подобный подход согласуется с моделями, основанными на радикальной активации (например, Shortlist, Neighborhood Activation Model; см. §1.4.2.) и, на первый взгляд, противоречит положению о ведущей роли начала слова, которое постулируется в ранних версиях Модели когорты. Однако при более внимательном рассмотрении это противоречие оказывается мнимым. Описанные в диссертации эксперименты показали, что начальный согласный, как правило, воспринимается испытуемыми достаточно надежно и является одним из опорных элементов при распознавании. Если же принять во внимание тот факт, что большинство слов в русском языке начинаются с согласных (по данным НКРЯ, более 80% всех словоупотреблений), то стратегия с опорой на начало может трактоваться как частный случай стратегии, опирающейся на консонантный скелет. Кроме того, косвенным подтверждением важности начала являются результаты анализа фонетического облика редуцированных словоформ в спонтанной речи, согласно которым выпадения звуков (как гласных, так и согласных) в начале словоформ встречается намного реже, чем в середине или в конце (см. §2.4.4.).

К осознанию необходимости совмещения различных подходов приходят и сами разработчики моделей восприятия речи. Так, сторонники гипотезы о радикальной активации признают особую роль начала слова: по их мнению, единицы, начальные элементы которых* совпадают с входным сигналом, имеют преимущество над единицами, соответствующими входному сигналу не по началу, а по каким-либо другим элементам [Luce, McLennan 2005: 595]. Сторонники же Модели когорты, которая изначально была основана только на совпадении начал слов, признают возможность активации кандидатов и по другим признакам (см., например, [Marslen-Wilson 1996 (1989)]).

Таким образом, результаты описанных в работе экспериментов позволяют предположить наличие единого механизма распознавания, в котором в большей или меньшей степени будут учтены положения всех существующих подходов к описанию процесса восприятия речи. В каждом конкретном случае слушающий пользуется одной из возможных стратегий, опирающейся на те признаки, которые оказываются наиболее перцептивно значимыми применительно к данному речевому сигналу и в данных условиях общения. Сама же структура процесса распознавания, по-видимому, является единой независимо от стратегии и предполагает активацию некоторого количества единиц словаря на основе каких-либо перцептивно значимых элементов и последующий выбор из них «лучшего кандидата».

Что касается описания процесса конкуренции, т.е. того, каким образом происходит выбор наиболее вероятного кандидата из активированного множества, то полученные результаты в значительной степени согласуются с интерактивным подходом: надежное распознавание большинства редуцированных словоформ оказывается невозможным без опоры на контекст. Кроме того, было показано, что на степень активации кандидатов также влияет информация о частотности словоформ, их классов и комбинаций. Вместе с тем можно предполагать, что некоторые высокочастотные редуцированные реализации хранятся в словаре слушающего и, следовательно, для их распознавания привлечение контекста не играет критической роли. Таким образом, применительно к процессу конкуренции представляется оправданным также говорить о том, что в каждой конкретной ситуации слушающий «выбирает» тот набор опорных признаков, который позволяет наиболее эффективно произвести процедуру отбора.

Интерактивные стратегии при этом оказываются, по-видимому, ведущими, но в ряде случаев, например, когда входному акустическому сигналу может соответствовать только одна единица перцептивного словаря, возможно распознавание и по «автономной» модели.

Проведенное исследование позволяет также сделать некоторые предположения, касающиеся устройства словаря слушающего, а именно инвентаря его единиц и характера связей между ними. Все полученные результаты подтверждают гипотезу о словоформе как об основной единице словаря слушающего для русского языка. Кроме того, как уже было отмечено выше, велика вероятность того, что в перцептивном словаре слушающего наряду с полными вариантами словоформ представлены некоторые типичные редуцированные реализации. Признание словоформы основной единицей словаря слушающего не отвергает возможности того, что в ментальном лексиконе носителя другого языка или в «генеративном» словаре говорящего на русском языке инвентарными единицами являются не словоформы, а, например, морфемы. Более того, наличие самого механизма членения словоформ на морфемы в процессе их восприятия, по-видимому, следует признать необходимым, поскольку только это может позволить распознать новые для слушающего слова. Таким образом, склоняясь в целом к коннекционистскому (односистемному) подходу к описанию ментального лексикона, мы не исключаем того, что в ряде случаев более реалистичной окажется теория, выдвигаемая сторонниками двусистемного подхода.

В задачи исследования, описываемого в диссертации, не входило определение статуса неоднословных единиц.68 Однако на уровне гипотезы можно говорить о том, что данные словосочетания представлены в словаре не самостоятельными единицами, а совокупностью единиц (словоформ), между которыми

Однако обсуждение данного вопроса выходит за рамки проблем, рассматриваемых в диссертации. См. обзор работ по данной теме в [Butterworth 1983].

68 В данном случае речь идет не о «составных словах» в понимании A.B. Венцова и Е.В. Грудевой (например, потомучто, вобнимку, другдруга; см. [Венцов, Грудева 2007]), которые почти наверняка являются единицами словаря слушающего, а об устойчивых сочетаниях словоформ, идиоматических выражениях и т.п. существуют тесные связи. Экспериментальные данные, приведенные в работе, свидетельствуют о наличии связей между словоформами, относящимися к одному грамматическому классу, и между словоформами, которые часто употребляются совместно, но не исключают наличия других связей. Изучение того, какие связи оказываются более значимыми в каждом конкретном случае, должно быть объектом отдельного исследования. В рамках же данной главы важно в очередной раз обратить внимание на динамичность ментального лексикона. По-видимому, результатом обработки каждого употребления словоформы слушающим является перераспределение связей данной словоформы с другими единицами МЛ. Учет этих связей при соотнесении услышанного с единицами словаря и является обращением к языковым уровням, более высоким, чем фонологический (морфологическому, синтаксическому, семантическому). При этом чем частотнее становится сама словоформа, тем более автономный статус она приобретает: тем меньшую роль в ее распознавании играют связи, основанные на парадигматических и синтагматических отношениях с другими единицами словаря слушающего (ср., например, распознавание омофонов на -лась/-лось (§4.5.3)). Таким образом, в формировании структуры ментального лексикона одну из ключевых ролей играет частотность единиц и их комбинаций, что отражено во всех современных моделях речевосприятия.

В целом же, результаты представленного в диссертации исследования не указывают на реалистичность одного подхода к описанию процесса распознавания речи и несостоятельность других, а позволяют в большей мере говорить о существовании некоего глобального механизма восприятия звучащей речи, в котором до известной степени могут быть учтены положения всех подходов.

Заключение

Основным результатом проведенного исследования стало подтверждение гипотезы о множественности стратегий, которыми может пользоваться слушающий в процессе восприятия речи.

Безусловно, сделанные выводы носят во многом предварительный характер и говорить об их подтверждении можно будет только после попытки применения полученных данных для создания действующей модели восприятия речи. Кроме того, выдвинутые предположения ограничиваются использованным в экспериментах материалом.

Тем не менее описанное в диссертации исследование позволило сформулировать некоторые принципы механизма восприятия естественного речевого сигнала, которые отражены в положениях, выносимых на защиту:

1. При распознавании спонтанной речи, фонетический облик которой характеризуется значительной неполнотой (редуцированностью), слушающий может пользоваться различными стратегиями, опирающимися как на параметры акустического сигнала, так и на другие факторы, ведущими из которых являются контекстная предсказуемость и частотность.

2. Базовая стратегия распознавания редуцированных словоформ может быть описана следующим образом. В процессе восприятия редуцированной словоформы слушающий опирается на ряд сохранившихся в ее звуковой форме полезных признаков (прежде всего на консонантный «скелет») и выбирает из множества единиц перцептивного словаря, активированных на основе этих признаков, ту, которая более всего соответствует контексту.

3. При наличии нескольких единиц, в равной степени допускаемых контекстом и соответствующих входному сигналу, более сильную активацию могут получать более частотные словоформы, а также словоформы, входящие в частотные контексты. В случае грамматической неоднозначности на степень активации единиц могут также влиять кумулятивная частотность грамматической формы, под которой подразумевается суммарная частотность всех словоформ, образующих данный грамматический класс, а также количество потенциальных контекстов, в которых встречается словоформа.

4. В ряде случаев слушающий сразу соотносит услышанное с редуцированной реализацией, которая хранится в словаре в качестве самостоятельной единицы. На подобный статус могут претендовать лишь типичные реализации высокочастотных словоформ, количество которых, согласно полученным на данный момент сведениям, сравнительно невелико.

5. Результаты экспериментов позволяют предположить, что ментальный лексикон носителя русского языка представляет собой динамическую многомерную структуру, единицами которой являются словоформы, соединенные между собой связями, формирующимися' на основе как парадигматических, так и синтагматических отношений. Сила связей определяется частотностью соответствующих единиц и их комбинаций.

6. Проведенное исследование дает все основания для выдвижения гипотезы о наличии единого глобального механизма распознавания речи, включающего в себя стратегии, описываемые в рамках различных моделей восприятия речи. Следовательно, оно не опровергает полностью ни один из существующих подходов к описанию процесса соотнесения входного речевого сигнала с соответствующей ему единицей словаря слушающего.

Несмотря на то что представленный в диссертации материал позволяет сделать ряд интересных, как нам кажется, выводов, для исчерпывающего описания роли частотности и контекста в процессе восприятия речи необходимо проведение дополнительных исследований.

Дальнейшая работа с уже имеющимися данными может быть разделена на две части.

Аналитическая часть предполагает в первую очередь детальный анализ результатов распознавания омофонов, полученных на той группе испытуемых, участники которой должны были составить фразу с каждым из услышанных стимулов. Последовательное сопоставление предложенных испытуемыми контекстов с частотностью соответствующих сочетаний в различных корпусах русского языка позволит проверить реалистичность концепций, в которых постулируется ведущая роль коллокаций в процессе восприятия речи, а также пошагово смоделировать процесс выбора одной из интерпретаций омофоничного сигнала.

Методическая часть заключается в совершенствовании методики и материала некоторых экспериментов: например, в проведении экспериментов по распознаванию редуцированных словоформ, предъявляемых изолированно и в контексте, на системно отобранном материале; в добавлении филлеров в тестовые последовательности; в повторении тех экспериментов, в которых материал предъявлялся испытуемым на аналоговом носителе и через громкоговорители, в более совершенных условиях (цифровая запись, головные телефоны). Кроме того, представляется полезной сплошная расшифровка записей спонтанных бытовых диалогов, описанных в Главе II, для проверки уже имеющихся сведений о количестве словоформ, фонетический облик которых подвергся изменению.

Последняя задача тесно связана с другим, более глобальным направлением дальнейшей работы, цель которого заключается в получении новых сведений о фонетическом облике словоформ в спонтанной речи путем расшифровки записей спонтанных текстов и создания «двуязычных» (орфографически-транскрипционных) словарей на их основе. Как уже упоминалось (см. разделы 1.1., 2.1. и примечание к §3.3.8.), многоуровневая обработка большого массива спонтанных текстов (в том числе и с целью последующего создания словаря фонетических реализаций словоформ) осуществляется в рамках проекта «Один речевой день», «двуязычный» же словарь небольшого объема уже создан участниками проекта «Разработка принципов и методов описания акустических реализаций редуцированных словоформ при моделировании восприятия спонтанной речи».

Подобные корпусы и словари позволят уточнить имеющиеся сведения о возможных типах редукции различных словоформ и о частоте их встречаемости в речи. Полученные данные могут быть применены для решения ряда теоретических проблем в области восприятия речи. В частности, может быть продолжено исследование, начальный этап которого описан в §5.4.: с помощью эксперимента по распознаванию вариантов высокочастотных словоформ с различной степенью редукции можно будет установить, какие редуцированные реализации могут быть представлены в словаре слушающего в качестве самостоятельных единиц.

Отдельной исследовательской задачей, требующей теоретического осмысления и последующей экспериментальной проверки, является определение того, частотность каких единиц (словоформ, их классов, словосочетаний) является более значимой в тех или иных условиях восприятия.

 

Список научной литературыРиехакайнен, Елена Игоревна, диссертация по теме "Теория языка"

1. Научная литература:

2. Аванесов Р.И. Русское литературное произношение. М. : Просвещение, 1972.415 с.

3. Александров Л.Г., Гейльман Н.И. Нужно ли учить фонетике частых слов? // Слух и речь в норме и патологии : сб. науч. ст. Вып. 6 / под ред. Л.Р. Зиндера, Л.В. Бондарко, А.П. Велицкого. Л. : Ленинградский восстановительный центр ВОГ, 1986. С. 20-26.

4. Алексеев П.М. Частотные словари : уч. пособие. СПб. : Изд-во С.-Петерб. ун-та, 2001. 156 с.

5. Анохин П.К. Принципиальные вопросы общей теории функциональных систем // Принципы системной организации функций. М. : Наука, 1973 (1970). С. 5-61.

6. Ахманова О.С. Словарь лингвистических терминов. Изд. 4-ое. М. : КомКни-га, 2007 (1966). 576 с.

7. Баранов А.Н., Плунгян В.А., Рахилина Е.В. Путеводитель по дискурсивным словам русского языка. М. : Помовский и партнеры, 1993. 207 с.

8. Богданова Н.В. Аллегровые формы русской речи как источник пополнения современного лексикона // Фонетика сегодня : Материалы докладов и сообщений V международной научной конференции 8-10 октября 2007 года. М. : Институт русского языка, 2007. С. 23-26.

9. Богданова Н.В. Живые фонетические процессы русской речи : учеб.-метод. пособие по современному русскому литературному языку. СПб. : Филологический факультет СПбГУ, 2001. 186 с.

10. Болотова О.Б. Гласные в спонтанной речи и при чтении связного текста (экспериментально-фонетическое исследование на материале русского языка) : дис. . канд. филол. наук. СПб., 2005. 284 с.

11. Большой психологический словарь / сост. и общ. ред. Б.Г. Мещеряков,

12. B.П. Зинченко. Изд. 4-ое. М. : ACT МОСКВА; СПб. : Прайм-ЕВРОЗНАК, 2009. 811 с.

13. Бондарко Л.В. Фонетика современного русского языка : уч. пособие. СПб. : Изд-во С.-Петерб. ун-та, 1998. 276 с.

14. Бондарко JI.B., Вербицкая JI.A. О фонетических характеристиках заударных флексий в современном русском языке // Вопросы языкознания. 1973. №1.1. C. 37-49.

15. Бондарко JI.B., Вербицкая Л.А., Гордина М.В. Основы общей фонетики. Изд. 4-ое. СПб. : Филологический факультет СПбГУ, М. : Изд. центр «Академия», 2004. 160 с.

16. Бондарко Л.В., Саламатина Н.В., Юдина Л.С. Фонетические характеристики корневых морфов русского языка (по данным автоматической обработки словаря) // Экспериментально-фонетический анализ речи. Проблемы и методы. Вып. 1. Л. : Изд-во ЛГУ, 1984. С. 65-74.

17. Венцов A.B. Восприятие устной речи и ментальный лексикон // Русская языковая личность: Материалы шестой выездной школы-семинара / отв. ред. Е.В. Грудева, Р.Л. Смулаковская. Череповец : ГОУ ВПО «Череповецкий государственный университет», 2007. С. 63-69.

18. Венцов A.B., Касевич В.Б. Проблемы восприятия речи. Изд. 2-ое. М. : Еди-ториал УРСС, 2003 (1994). 240 с.

19. Венцов A.B., Касевич В.Б. Словарь для модели восприятия речи // Вестник Санкт-Петербургского университета. Сер. 2, вып. 3. 1998. №16. С. 32-39.

20. Венцов A.B., Касевич В.Б., Ягунова Е.В. Корпус русского языка и восприятие речи // Научно-техническая информация. Сер. 2: Информационные процессы и системы. 2003а. №6. С. 25-32.

21. Вербицкая JI.A. Давайте говорить правильно! М. : Высшая школа, 1993. 144 с.

22. Вербицкая JI.A. Давайте говорить правильно! Изд. 2-ое. М. : Высшая школа, 2001.239 с.

23. Вишнякова Т.А. Некоторые количественные характеристики русской разговорной речи : автореф. дис. . канд. филол. наук. М. : Ун-т Дружбы народов, им. Патриса Лумумбы, 1967. 19 с.

24. Гаспаров M.JI. Язык, память, образ. Лингвистика языкового существования. М. : Новое литературное обозрение, 1996. 352 с.

25. Гришина Е.А. Национальный корпус русского языка,как источник сведений об устной речи // Речевые технологии. 2008. №3. С. 43-52.

26. Дискурсивные слова русского языка. Опыт контекстно-семантического описания / под ред. Д. Пайара, К.Л. Киселевой. М.: Метатекст, 1998. 446 с.

27. Дукельский Н.И. Принципы сегментации речевого потока. М., Л. : Изд-во Академии Наук СССР, 1962. 138 с.

28. Джапаридзе З.Н. Перцептивная фонетика. Тбилиси : Мецниереба, 1985. 118 с.

29. Ермоленко Г.В. Лингвистическая статистика : Краткий очерк и библиографический указатель. Алма-Ата : б.и., 1970. 156 с.

30. Залевская A.A. Введение в психолингвистику : учебник. М. : Российск. гос. гуманит. ун-т, 2007. 560 с.

31. Залевская A.A. Слово в лексиконе человека: психолингвистическое исследование. Воронеж : Изд-во Воронеж, гос. ун-та, 1990. 206 с.

32. Засорина JI.H. Введение // Частотный словарь русского языка / под ред. JI.H. Засориной. М. : Русский язык, 1977. С. 5-23.

33. Земская Е.А. Городская устная речь и задачи ее изучения // Разновидности городской устной речи : сб. науч. тр. / отв. ред. Д.Н. Шмелев, Е.А. Земская. М.: Наука, 1988. С. 5-44.

34. Земская Е.А. Русская разговорная речь: Лингвистический анализ и проблемы обучения. Изд. 4-ое. М.: Флинта, Наука, 2006 (1979). 240 с.

35. Земская Е.А. Русская разговорная речь : проспект. М.: Наука, 1968. 99 с.

36. Земская Е.А., Китайгородская М.В., Розанова H.H. Русская разговорная речь: Фонетика. Морфология. Лексика. Жест. М. : Наука, 1983. 240 с.

37. Земская Е.А., Китайгородская М.В., Ширяев E.H. Русская разговорная речь: Общие вопросы. Словообразование. Синтаксис. М. : Наука, 1981. 276 с.

38. Зимняя И.А. Смысловое восприятие речевого сообщения // Смысловое восприятие речевого сообщения (в условиях массовой коммуникации) / отв. ред. Т.М. Дридзе, A.A. Леонтьев. М.: Наука, 1976. С. 5-33.

39. Зиндер JI.Р. Общая фонетика и избранные статьи. СПб. : Филологический факультет СПбГУ; М. : Издательский центр «Академия», 2007 (1979). 576 с.

40. Ицкович В.А. От редактора // Штейнфельдт Э.А. Частотный словарь современного русского литературного языка. Таллин : Типография «Юхисэлу», 1963. С. 5-8.

41. Касаткина Р.Ф. Компрессированные формы слов и фразовые позиции в русской речи // Фонетика сегодня : Материалы докладов и сообщений V международной научной конференции 8-10 октября 2007 года. М. : Институт русского языка, 2007. С. 99-102.

42. Касевич В.Б. Морфонология. Л. : Изд-во Ленингр. ун-та, 1986. 160 с.

43. Касевич В.Б. Семантика. Синтаксис. Морфология // Труды по языкознанию : В 2 т. : Т. 1 / под ред. Ю.А. Клейнера. СПб. : Филологический факультет СПбГУ, 2006 (1988). С. 373-612.

44. Касевич В.Б. Фонологические проблемы общего и восточного языкознания // Труды по языкознанию : В 2 т. : Т. 1 / под ред. Ю.А. Клейнера. СПб. : Филологический факультет СПбГУ, 2006 (1983). С. 11-238.

45. Касевич В.Б., Ягунова Е.В. Контекстная предсказуемость слов в тексте (на материале русского и французского языков) // Вестник Пермского университета. Вып. 3. 2006. С.61-70.

46. Кодзасов С.В., Кривнова О.Ф. Общая фонетика : учебник. М. : Рос. гос. гу-манит. ун-т, 2001. 592 с.

47. Комовкина Е.П. «Идиоматизмы» в спонтанной разговорной речи: дипломная работа. СПб., 2008. 110 с.

48. Комовкина Е.П., Слепокурова H.A. Об опыте составления частотного словаря устного спонтанного текста // Труды первого междисциплинарного семинара «Анализ разговорной русской речи» (АР3 2007). СПб. : ГУАП, 2007. С. 43-48.

49. Кросс-модальный морфологический прайминг: данные русского языка / Т.И. Свистунова и др.. // Материалы XXXVIII Международной филологической конференции 11-13 марта 2009 г. Психолингвистика. Часть 2. СПб :

50. Факультет филологии и искусств СПбГУ, 2009. С. 16-21.

51. Лакин Г.Ф. Биометрия М. : Высшая школа, 1980. 293 с.

52. Лаптева O.A. Живая русская речь телеэкрана. Разговорный пласт телевизионной речи в нормативном аспекте. М.: Едиториал УРСС, 2003. 520 с.

53. Разговорная речь в системе функциональных стилей современного русского литературного языка. Грамматика / под ред. О.Б. Сиротининой. Саратов: Изд-во Саратовского ун-та, 1992. 312 с.

54. Разговорная речь в составе функциональных стилей современного русского литературного языка. Лексика / под ред. О.Б. Сиротининой. Изд. 3-е. М. : Книжный дом «ЛИБРОКОМ», 2003 (1983). 256 с.

55. Реформатский A.A. Неканоничная фонетика // Развитие фонетики современного русского языка / под ред. С.С. Выготского, М.В. Панова, .В.Н. Сидорова. М. : Наука, 1966. С. 96-109.

56. Речь. Артикуляция и восприятие / Л.А. Чистович и др.. М., Л. : Наука, 1965.242 с.

57. Русская разговорная речь / под ред. Е.А. Земской. М. : Наука, 1973. 486 с.

58. Русская разговорная речь. Тексты / под ред. Е.А. Земской, Г.А. Бариновой, Л.А. Капанадзе. М. : Наука, 1978. 307 с.

59. Сапунова Е. М. Неподготовленное чтение как разновидность устного спонтанного монолога: дипломная работа. СПб., 2006. 83 с.

60. Сиротинина О.Б. Современная разговорная речь и ее особенности. М. : Просвещение, 1974. 144 с.

61. Стили произношения и типы произнесения / Л.В. Бондарко и др. // Вопросы языкознания. 1974. №2. С. 64-70.

62. Турко Л.А. Частотный словарь русской разговорной речи // Статистика речи / под ред. Р.Г. Пиотровского. Л.: Наука, 1968. С. 191-199.

63. Физиология речи. Восприятие речи человеком / JI.A. Чистович и др.. JI. : Наука, 1976. 388 с.

64. Филиппов К.А. Лингвистика текста. СПб. : Изд-во С.-Петерб. ун-та, 2003. 336 с.

65. Фонетика спонтанной речи / Л.В. Бондарко и др.; под ред. Н.Д. Светозаровой. Л. : Изд-во Ленингр. ун-та, 1988. 248 с.

66. Фонология речевой деятельности / Л.В. Бондарко и др.; отв. ред. Л.В. Бондарко. СПб. : Изд-во С.-Петерб. ун-та, 2000. 158 с.

67. Фролова O.E. Спонтанный текст: структура и типология // Международная конференция «Теория и практика речевой коммуникации»: 7-9 сентября 2004 года, Москва, МГУ им. М.В. Ломоносова : Тезисы докладов. М. : МАКС Пресс, 2004. С. 145-148.

68. Чугаева Т.Н. Звуковой строй языка в перцептивном аспекте (экспериментальное исследование на материале английского языка): дис. . д. филол. наук. СПб., 2009. 346 с.

69. Шаров С.А., Ляшевская О.Н. Введение к новому частотному словарю русской лексики. 2008. URL: http://dict.ruslang.ru/freq.pdf/.

70. Штейнфельдт Э.А. Предисловие // Штейнфельдт Э.А. Частотный словарь современного русского литературного языка. Таллин : Типография «Юхисэ-лу», 1963. С. 9-36.

71. Штерн A.C. Перцептивный аспект речевой деятельности: (Экспериментальное исследование). СПб. : Изд-во С.-Петерб. ун-та, 1992. 236 с.

72. Щерба Л.В. К вопросу о русской орфоэпии // Избранные работы по русскому языку. М. : Учпедгиз, 1957. С. 141-143.

73. Щерба Л.В. О разных стилях произношения и об идеальном фонетическомсоставе слов // Избранные работы по русскому языку. М. : Учпедгиз, 1957 (1915). С. 21-26.

74. Щерба JI.B. Современный русский литературный язык // Избранные работы по русскому языку. М. : Учпедгиз, 1957 (1939). С. 110-129.

75. Ягунова Е.В. Вариативность стратегий восприятия звучащего текста (экспериментальное исследование на материале русскоязычных текстов разных функциональных стилей). Пермь : Изд-во Перм. ун-та, 2008. 395 с.

76. Ягунова Е.В. Восприятие согласных фонем и их дифференциальных признаков (экспериментально-фонетическое исследование на материале русского языка): дис. канд. филол. наук. СПб, 1994. 261 с.

77. Aitchison J. Words in the Mind: An Introduction to the Mental lexicon. 3rd ed. Berlin, Melbourne, Oxford : Blackwell Publishing Ltd., 2003 (1987). 314 p.

78. Alegre M., Gordon P. Frequency Effects and the Representational Status of Regular Inflections // Journal of Memory and>Language. 1999. Vol. 40. P. 41-61.

79. Arnon I., Snider N. More than Words: Frequency Effects for Multi-Word Phrases // Journal of Memory and Language. 2010. Vol. 62. P. 67-82.

80. Bartsch S. Structural and Functional Properties of Collocations in English. Tübingen : Gunter Narr Verlag, 2004. 231 p.

81. Bernstein L.E., Auer E.T. Speech Perception and Spoken Word Recognition // Deaf Studies, Language, and Education / eds. : M. Marschark, P.E. Spencer. Oxford, New York, 2003. P. 379-390.

82. Bond Z.S. Slips of the Ear // The Handbook of Speech Perception / eds.: D.B. Pi-soni, R.E. Remez. Berlin, Oxford : Blackwell Publishing Ltd., 2005. P. 290-310.

83. Bonin P. The Mental Lexicon: "Some Words To Talk About Words" // Mental Lexicon: Some Words to Talk about Words / ed. : P. Bonin. New York : Nova

84. Science Publishers, 2003. P. vii-x. •

85. Bonin P., Meot A., Boyer B. Where Are Age of Acquisition (AoA) Effects in Written Picture Naming // Mental Lexicon: Some Words to Talk about Words / ed.: P. Bonin. New York : Nova Science Publishers, 2003. P. 95-124.

86. Bradley D.C., Forster K.I. A Reader's View of Listening // Cognition. 1987. Vol. 25. P. 103-134.

87. Brysbaert M., Van Wijnendaele I. The Importance of Phonological Coding in Visual Word Recognition: Further Evidence from Second-language Processing // Psychologica Belgica. 2003. Vol. 43. P. 249-258.

88. Butterworth B. Lexical Representation // Language Production. Vol. 2. Development, Writing and Other Processes / ed. : B. Butterworth. London, etc. : Academic Press, 1983. P. 257-294.

89. Bybee J. Cognitive Processes in Grammaticalization // The New Psychology of Language: Cognitive and Functional Approach to Language Structure (vol. 2) / ed. : M. Tomasello. New Jersey : Lawrence Erlbaum Publishers, 2003. P. 145168.

90. Bybee J. Morphology: A Study of Relation Between Meaning and Form. Philadelphia, PA : John Benjamins, 1985. xii+234 p.

91. Bybee J. Phonology and Language Use. Cambridge : Cambridge University Press, 2003 (2001). xviii+238 p.

92. Bybee J. Regular Morphology and the Lexicon // Morphology. Critical Concepts, in Linguistics / ed. : F. Katamba. USA, Canada : Routledge, 2004 (1995). P. 41-70.

93. Bybee J., Perkins R., Pagliuca W. The Evolution of Grammar: Tense, Aspect and Modality in the Language of the World. Chicago : University of Chicago Press, 1994. 420 p.

94. Chernigovskaya T., Gor K. The Complexity of Paradigm and Input Frequencies in Native and Second Language Verbal Processing: Evidence from Russian // Language and Language Behavior. 2000. Vol. 3 (II). P. 20-38.

95. Clarke C.M. Lexical Neighborhood Properties of the Original and Revised Speech perception in Noise (SPIN) Tests // Research on Spoken Language Processing. Progress Report #24. Indiana University, 2000. P. 305-320.

96. Cleary M., Pisoni D.B. Speech Perception and Spoken Word Recognition: Research and Theory // Blackwell Handbook of Perception / ed.: E.B. Goldstein. Maiden, Oxford : Blackwell Publishers Ltd., 2001. P. 499-534.

97. Croft W., Cruse D.A. Cognitive Linguistics. Cambridge : Cambridge University Press, 2004. 372 p.

98. Cutler A., Norris D. The Role of Strong Syllables in Segmentation for Lexical Access // Journal of Experimental Psychology: Human Perception and Performance. 1988. Vol. 14. №1. P. 113-121.

99. Dahan D., Gaskell M.G. The Temporal Dynamics of Ambiguity Resolution: Evidence from Spoken-word Recognition // Journal of Memory and Language. 2007. Vol. 57 (4). P. 483-501.

100. Dahan D., Magnuson J.S., Tanenhaus M.K. Time Course of Frequency Effects in Spoken-Word Recognition: Evidence from Eye Movements // Cognitive Psychology. 2001. Vol. 42. P. 317-367.

101. Dewhurst S.A., Brandt K.R., Sharp M.S. Intention to Learn Influences the Word Frequency Effect in Recall but not in Recognition Memory // Memory and Cognition. 2004. Vol. 32 (8). P. 1316-1325.

102. Ellis A., Beattie G. The Psychology of Language and Communication. New York : Guilford, 1986. ix+374 p.

103. Emmorey K.D., Fromkin V.A. The Mental Lexicon // Linguistics: The Cambridge Survey. Vol. 3: Language: Psychological and Biological Aspects / ed.: F.J. Newmeyer. Cambridge : Cambridge University Press, 1989. P. 124-149.

104. Ernestus M., Baayen H., Schreuder R. The Recognition of Reduced Word Forms //Brain and Language. 2002. Vol. 81 (1-3). P. 162-173.

105. Firth J. Sounds and Prosodies // Papers in Linguistics 1934-1951. London : Oxford University Press, 1957. P. 121-138.

106. Flores d'Arcais G.B. Language Perception // Linguistics: The Cambridge Survey. Vol. 3 : Language: Psychological and Biological Aspects / ed. : F J. New-meyer. Cambridge : Cambridge University Press, 1989. P. 97-123.

107. Forster K. Basic Issues in Lexical Processing // Lexical Representations and Process / ed. : W. Marslen-Wilson. Cambridge, MA : MIT Press, 1996 (1989). P. 75-107.

108. Freitas T., Santos F. CORP-ORAL: Spontaneous Speech Corpus for European Portuguese // Proceedings of LREC 2008. URL: http://www.iltec.pt/pdf/co/co4.pdf.

109. Garman M. Psycholinguistics (Cambridge Textbooks in Linguistics). Cambridge : Cambridge University Press, 1990. 536 p.

110. Glanzer M., Ehrenreich S.L. Structure and Search of the Internal Lexicon // Journal of Verbal Learning and Verbal Behavior. 1979. Vol. 18 (4). P. 381-398.

111. Goldinger S. D. Words and Voices: Episodic Traces in Spoken Word Identification and Recognition Memory // Journal of Experimental Psychology: Learning, Memory, and Cognition. 1996. Vol. 22. №5. P. 1166-1183.

112. Gor K., Chernigovskaya T. Rules in the Processing of Russian Verbal Morphology // Current Issues in Formal Slavic Linguistics / eds.: G. Zybatow et al.. Frankfurt/Main : Peter Lang, 2001. P. 528-536.

113. Hare M.L., Ford M., Marslen-Wilson W.D. Ambiguity and Frequency Effects in Regular Verb Inflection // Frequency and the Emergence of Linguistic Structure / eds. : J. Bybee, P. Hopper. Philadelphia, PA : John Benjamins, 2001.1. P. 181-200.

114. Hill T. The Technique of Prosodic Analysis // In Memory of J. Firth / ed. : C.E. Bazell et al. London : Longmans, 1966. P. 198-226.

115. Hillis A.E. The Organization of the Lexical System // The Handbook of Cognitive Neuropsychology: What Deficits Reveal About the Human Mind / ed. : B. Rapp. Philadelphia, PA : Psychology Press, 2000. P. 185-210.

116. Houston D.M. Speech Perception in Infants // The Handbook of Speech Perception / eds. : D.B. Pisoni, R.E. Remez. Berlin, Oxford : Blackwell Publishing Ltd, 2005. P. 417—448.

117. Howes D.H., Solomon R.L. Word Frequency, Personal Values, and Visual Duration Thresholds // Psychological Review. 1951. Vol. 58. P. 256-270.

118. Itevitch M.S. All Neighborhoods are not Created Equal: the Phonological P-Metric and Spoken Word Recognition // Research on Spoken Language Processing, Progress Report #22. Indiana University, 1998. P. 317-329.

119. Jande P.-A. Phonological Reduction in Swedish // Proceedings of the 15th International Congress of Phonetic Sciences (ICPhS). Barcelona : Universität

120. Autönoma de Barcelona, 2003. P. 2557-2560.

121. Jensvoll M. The Acquisition of Past Tense in English/Norwegian Bilingual Children Single versus Dual Mechanisms // Nordlyd: Tromso university working papers on language and linguistics. 2004. Vol. 31 (3). P. 545-557.

122. Jescheniak J.D., Levelt W.J.M. Word Frequency Effects in Speech Production: Retrieval of Syntactic Information and of Phonological Form // Journal of Experimental Psychology: Learning, Memory, and Cognition. 1994. Vol. 20. №4. P. 824-843.

123. Kassevich V.B., Ventsov A.V., Yagounova E.V. The Simulation of Continuous Text Perceptual Segmentation: A Model for Automatic Segmentation of Written Text // Language and Language Behavior. 2000. Vol. 3 (II). P. 48-59.

124. Konopka A.E., Bock A.E. Lexical or Syntactic Control of Sentence Formulation? Structural Generalizations from Idiom Production // Cognitive Psychology. 2009. Vol. 58. P. 68-101.

125. Krause J.C., Braida L.D. Investigating Alternative Forms of Clear Speech: The Effects of Speaking Rate and Speaking Mode on Intelligibility // The Journal of the Acoustic Society of America. 2002. Vol. 112. №5 (1). P. 2165-2172.

126. Levelt W.J.M. Speaking: From Intention to Articulation. Cambridge, MA : MIT Press, 1989. 566 p.

127. Liu Sh., Zeng F.-G. Temporal Properties in Clear Speech Perception // The Journal of the Acoustic Society of America. 2006. Vol. 120. №1. P. 424-432.

128. Luce P.A., McLennan C.T. Spoken Word Recognition: The Challenge of Variation // The Handbook of Speech Perception / eds. : D.B. Pisoni, R.E. Remez. Berlin, Oxford : Blackwell Publishing Ltd, 2005. P. 592-609.

129. Luce P.A., Pisoni D.B. Recognizing Spoken Words: the Neighborhood Activation Model // Ear Hear. 1998. Vol. 19 (1). P. 1-36.

130. Manning Ch.D., Schütze H. Foundations of Statistical Natural Language Processing. Cambridge, MA : MIT Press, 2003 (1999). 620 p.

131. Marslen-Wilson W.D. Access and Integration: Projecting Sound onto Meaning // Lexical Representation and Process / ed. : W.D. Marslen-Wilson. Cambridge, MA : MIT Press, 1996 (1989). P. 3-24.

132. Marslen-Wilson W.D., Welsh A. Processing Interactions during Word Recognition in Continuous Speech // Cognitive Psychology. 1978. Vol. 1. №1. P. 2963.

133. Mattys S., Samuel A. Implications of Stress Pattern Differences in Spoken Word Recognition // Journal of Memory and Language. 2000. Vol. 42. №4. P. 571-596.

134. McClelland J.L., Elman J.L. The TRACE Model of Speech Perception // Cognitive Psychology. 1986. Vol. 18. P. 1-86.

135. McClelland J.L., Rumelhart D.E. Levels Indeed! A Response to Broadbent //Journal of Experimental Psychology. 1985. Vol. 114. №2. P. 193-197.

136. Meunier F., Segui J. Frequency Effects in Auditory Word Recognition: The Case of Suffixed Words // Journal of Memory and Language. 1999. Vol. 41. P. 327-344.

137. Morton J. Interaction of Information in Word Recognition // Psychological Review. 1969. Vol. 76. №2. P. 165-178.

138. Murphy M.L. Semantic Relations and the Lexicon: Antonymy, Synonymy, and other Paradigms. Cambridge : Cambridge University Press, 2003. 304 p.

139. Norris D. Shortlist: A Connectionist Model of Continuous Speech Recognition // Cognition. 1994. Vol. 52. P. 189-234.

140. Oldfield R.C. Things, Words, and the Brain // Quarterly Journal of Experimental Psychology. 1966. Vol. 18. P. 340-353.

141. Oppermann D., Burger S. What Makes Speech Data Spontaneous? // International Congress of Phonetic Sciences. San Francisco, California, USA, June 1999. URL: http://www.is.cs.cmu.edu/papers/speech/ICPhS99/ICPhS99-dani.pdf

142. Osgood Ch. E. Lectures on Language Performance // Springer Series in Language and Communication. Vol. 7. New York, etc. : Springer Verlag, 1980. 276 p.

143. Peere L., Ziegler J.C. On-line Activation of Orthography in Spoken Word Recognition // Brain Research. 2008. Vol. 1188. P. 132-138.

144. Pinker S. Words and Rules: The Ingredients of Language. New York : HarperCollins Publishers, 1999. 349 p.

145. Pisoni D.B. Speech Perception in Deaf Children with Cochlear Implants // The Handbook of Speech Perception / eds. : D.B. Pisoni, R.E. Remez. Berlin, Oxford : Blackwell Publishing Ltd, 2005. P. 494-523.

146. Pluymaekers M., Ernestus M., Baayen R.H. Articulatory Planning Is Continuous and Sensitive to Informational Redundancy // Phonetica. 2005. Vol. 62. P. 146-159.

147. Porzig W. Wesenhafte Bedeutungsbeziehungen // Beiträge zur deutschen Sprache und Literatur. 1934. Vol. 58. P. 70-97.

148. Probabilistic Relations between Words: Evidence from Reduction in Lexical Production / D. Jurafsky et al. // Frequency and the Emergence of Linguistic Structure / eds. : J. Bybee, P. Hopper. Philadelphia PA : John Benjamins, 2000. P. 229-254.

149. Processing Reduced Word Forms: The Suffix Restoration Effect / R. Kemps et al. I I Brain and Language. 2004. №90. P. 117-127.

150. Protopapas A. Perspectives of Syllables, Stress, and Interactions in Speech Perception: Experimental and Connectionist Approaches : Theses for the Degree of Doctor of Philosophy. Brown University, 1997. 183 p.

151. Radnaeva L. Statistic Research and Database Parameters // Proceedings of the 13th International Conference "Speech and Computer" SPECOM'2009. St. Petersburg : SUAI, 2009. P.527-532.

152. Richey C. An Introduction to Speech Corpora. Stanford, 2004. URL: http://www.bcs.rochester.edu/people/fj aeger/teaching/tutorials/tricheyspeech% 20corpora.pdf

153. Savin H.B. Word-Frequency Effect and Errors in the Perception of Speech // Journal of the Acoustical Society of America. 1963. Vol. 35. №2. P. 200-206.

154. Sherstinova T. Quantitative Data Processing in the ORD Speech Corpus of Russian Everyday Communication // Proceedings of International Quantitative Linguistics Conference QUALICO 2009. Graz, 2009. P. 56-57.

155. Simonsen H.G. Past Tense Acquisition and Processing in Norwegian: Experimental Evidence // Language and Language Behavior. 2000. Vol. 3 (II). P. 86101.

156. Sinclair J. Corpus Concordance and Collocation (Describing English Language). Oxford : Oxford University Press, 1991. 179 p.

157. Speech Corpus of Russian Everyday Communication "One Speaker's Day" (the ORD Corpus) / T. Sherstinova et al.. // Proceedings of the 13th International Conference "Speech and Computer" SPECOM'2009. St. Petersburg : SUAI, 2009. P. 521-526.

158. Spencer, N.J., Wollman N. Lexical Access for Phonetic Ambiguities // Language and Speech. 1980. Vol. 23 (2). P. 171-198.

159. Sprenger S., Levelt W.J.M., Kempen G. Lexical Access during the Production of Idiomatic Phrases // Journal of Memory and Language. 2006. Vol. 54. P. 161184.

160. Stemberger J.P., McWhinney B. Frequency and the Lexical Storage of Regularly Inflected Forms // Memory and Cognition. 1986. Vol. 14. P. 17-26.

161. Stevens K.N. Features in Speech Perception and Lexical Access // The Handbook of Speech Perception / eds. : D.B. Pisoni, R.E. Remez. Berlin, Oxford : Blackwell Publishing Ltd, 2005. P. 125-155.

162. Sundaram Sh., Narayanan Sh.S. An Empirical Text Transformation Method for Spontaneous Speech Synthesizers // Proceedings of Eurospeech-2003. P. 12211224.

163. Taft M. Exploring the Mental Lexicon // Australian Journal of Psychology. 1984. Vol. 36. P. 35-46.

164. The Effects of Collocational Strength and Contextual Predictability in Lexical Production / M.L. Gregory et al. // CLS 35. 1999. URL: http://www.stanford.edu/~jurafsky/CLS99.doc

165. Torreira F., Adda-Decker M., Ernestus M. The Nijmegen Corpus of Casual French // Speech Communication. 2010. Vol. 52. P. 201-212. URL: http://mirjamernestus.ruhosting.nl/Ernestus/NCCFr/NCCFrdraft.pdf

166. Torreira F., Ernestus M. Probabilistic Effects on French t. Duration // Proceedings of the 10th Annual Conference of the International Speech Communication Association (Interspeech 2009). Causal Productions Pty Ltd, 2009. P. 448451.

167. Toward Spontaneous Speech Synthesis-utilizing Language Model Information in TTS / S. Werner et al. // Speech and Audio Processing. 2004. Vol. 12 (4). P. 436-445.

168. Tyler L.K., Frauenfelder U.H. The Process of Spoken Word Recognition: An Introduction // Spoken Word Recognition / eds. : U.H. Frauenfelder, L. K. Tyler. Cambridge, MA : MIT Press, 1987. P. 1-20.

169. Vacar N.P. A Word Count of Spoken Russian. The Soviet Usage. Columbus : Ohio State University Press, 1966. xii + 367 p.

170. Wray A. Formulaic Language and the Lexicon. Cambridge : Cambridge University Press, 2002. 348 p.

171. Wright R. Lexical Competition and Reduction in Speech: A Preliminary Report // Research on Spoken Language Processing. Progress Report #21. Indiana University, 1997. P. 471-486.

172. Yelland G.W. Word Recognition and Lexical Access // The Encyclopedia of Language and Linguistics. Vol. 9 / eds.: R.E. Asher, J.M.Y. Simpson. Oxford, etc. : Pergamon, 1994. P. 5009-5014.

173. Венцов A.B., Грудева E.B. Частотный словарь словоформ русского языка: проект. Череповец : Изд-во ЧТУ, 2008. 204 с.

174. Ефремова Т.Ф. Новый словарь русского языка. Толково-словообразовательный : В 2-х т. М. : Русский язык, 2000. 1233 с.

175. Лённгрен Л. Частотный словарь современного русского языка. Упсала, 1993. 188 с.

176. Ляшевская О.Н., Шаров С.А. Новый частотный словарь русской лексики. 2008. URL: http://dict.ruslang.ru/freq.php

177. Слепов С.Н. Частотный словарь. 2009. URL: http://morpher.ru/Russian/Stats.aspx

178. Словарь русского языка : В 4-х т. / под ред. А.П. Евгеньевой. Изд. 2-ое. М. : Русский язык, 1981-1984. 2985 с.

179. Частотный словарь русского языка. Около 40000 слов / под ред. JI.H. Засо-риной. М. : Русский язык, 1977. 936 с.

180. Шаров С.А. Частотный словарь русского языка. 2001. URL: http://www.artint.ru/projects/frqlist.asp

181. Штейнфельдт Э.А. Частотный словарь современного русского литературного языка. Таллин : Типография «Юхисэлу», 1963. 316 с.

182. Leech G., Rauson P., Wilson A. Word Frequencies in Written and Spoken English: Based on the British National Corpus: Companion Website. URL: http://ucrel.lancs.ac.uk/bncfreq1. Сетевые ресурсы;

183. Корпус русского литературного языка. 2009. URL: http://narusco.ru/

184. Национальный корпус русского языка. 2010. URL: http://ruscorpora.ru/

185. American National Corpus. 2009. URL: http://www.anc.org/

186. British National Corpus. 2009. URL: http://www.natcorp.ox.ac.uk/

187. Corpus Gesproken Nederlands. 2004. URL: http://lands.let.kun.nl/cgn/

188. Corpus of Spontaneous Japanese.

189. URL: http://www.kokken.go.jp/katsudo/seika/corpus/public/#2

190. Kiel Corpus of Spontaneous Speech. URL: http://www.ipds.uni-kiel.de/publikationen/kcssp.en.html

191. Nijmegen Corpus of Casual French. URL: http://mirjamernestus.ruhosting.nl/Ernestus/NCCFr/index.html

192. Stanford University, Department of Linguistics: Corpus Resources. 2010. URL: http://www.stanford.edu/dept/linguistics/corpora/

193. Используемые в работе сокращения названий элементов библиографического списка:

194. РРР — Русская разговорная речь

195. MAC — Словарь русского языка в 4-х т. под ред. А.П. Евгеньевой

196. ANC — American National Corpus

197. BNC — British National Corpus

198. CGN — Corpus Gesproken Nederlands

199. CSJ — Corpus of Spontaneous Japanese