автореферат диссертации по филологии, специальность ВАК РФ 10.02.21
диссертация на тему: Лингвистическое обеспечение процедуры извлечения имплицитной информации при проведении семантических экспертиз
Полный текст автореферата диссертации по теме "Лингвистическое обеспечение процедуры извлечения имплицитной информации при проведении семантических экспертиз"
004613479
На правах рукописи
КОНДРАШОВА Дарья Сергеевна
ЛИНГВИСТИЧЕСКОЕ ОБЕСПЕЧЕНИЕ ПРОЦЕДУРЫ ИЗВЛЕЧЕНИЯ ИМПЛИЦИТНОЙ ИНФОРМАЦИИ ПРИ ПРОВЕДЕНИИ СЕМАНТИЧЕСКИХ ЭКСПЕРТИЗ
Специальность 10.02.21. - прикладная и математическая лингвистика
АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата филологических наук
1 8 НОЯ 2010
Москва 2010
004613479
Работа выполнена на кафедре теоретической и прикладной лингвистики филологического факультета ФГОУ ВПО «Московский государственный университет имени М. В. Ломоносова».
Научный руководитель:
доктор филологических наук, профессор
Официальные оппоненты:
доктор филологических наук, профессор
кандидат филологических наук
Ведущая организация:
Кобозева Ирина Михайловна
Кукушкина Ольга Владимировна
Лаборатория общей и компьютерной лексикологии и лексикографии и кафедра русского языка филологического факультета ФГОУ ВПО «Московский государственный университет имени М. В. Ломоносова»
Котов Артемий Александрович
Отдел когнитивных исследований ФГУ «Российский научный центр «Курчатовский институт» (г. Москва)»
Учреждение Российской академии наук «Институт проблем информатики РАН»
Защита состоится «2Н» нсЛ£РД_ 2010 г. в часов 00 минут на заседании диссертационного совета Д.501.001.24 при ФГОУ ВПО «Московский государственный университет имени М. В. Ломоносова» по адресу: 119991, Москва, Ленинские горы, МГУ им. М. В. Ломоносова, 1-й корпус гуманитарных факультетов, филологический факультет.
С диссертацией можно ознакомиться в читальном зале 1-го корпуса гуманитарных факультетов ФГОУ ВПО «МГУ им. М. В. Ломоносова».
Автореферат разослан «¿9» ОКТЯБРЯ 2010 г.
Ученый секретарь диссертационного совета
А. М. Белов
КондраиюваД.С. Автореф. дис.... к.ф.н. М.: 2010 ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Реферируемая диссертация посвящена проблеме скрытых смыслов в естественно языковых текстах и принадлежит к числу работ прикладного характера, проводимых в области лингвистической семантики.
Феномен имплицитного в языке не раз привлекал внимание лингвистов, логиков и философов. Среди отечественных ученых к ним, в частности, относятся Е. Г. Борисова, К. А. Долинин, Анна А. Зализняк, В. А. Звегинцев, Л. В. Лисоченко, Ю. С. Мартемьянов, А. А. Масленникова, И. М. Кобозева, Е. В. Падучева, Ю. К. Пирогова, а среди зарубежных авторов - П. Грайс, Дж. Р. Серль, Р. С. Сталнакер, Г. Фреге, Л. Картуннен, Е. Л. Кинэн, П. Ф. Строусон, Ч. Филлмор, Р. Ван дер Сандт, Н. Эшер и А. Ласкаридес и другие. С появлением все новых работ, направленных на постижение сущности этого феномена, концепт имплицитного становился все более и более определенным и получал более адекватное представление. Параллельно с разработкой классификаций имплицитной информации были выявлены различные аспекты имплицитного как языкового явления: неоднородность, сосуществование с эксплицитным планом выражения, извяекаемость, важность учета контекстуальной информации при анализе, градуированность степени имплицитною. Однако, несмотря на существующие подходы к пониманию этого феномена (ср., например, работы Е. В. Падучевой, Л. В. Лисоченко, А. А. Масленниковой, анализируемые в настоящем исследовании), до сих пор еще не было предложено единой концепции интерпретации имплицитно выраженного содержания, в том числе и в аспекте реализации компьютерного извлечения имплицитной информации моделями автоматического понимания текста (АПТ).
Актуальность исследования определяется, таким образом, тем, что в ходе данной работы предпринята попытка создания лингвистического обеспечения процедуры извлечения имплицитной информации из текста, ориентированной на реализацию системами АПТ и направленной на решение практических задач, возникающих при проведении судебных лингвистических экспертиз. В разработке лингвистического обеспечения такой процедуры и заключается конечная цель работы. Потребность в лингвистических экспертизах - особенно семантических, например, связанных с делами по защите чести и достоинства - все время возрастает, что делает разработку их методик актуальнейшей задачей. Не менее актуальным в настоящее время является автоматизация деятельности человека в различных областях. Поскольку главной подзадачей семантической экспертизы является смысловой анализ текста, то решение проблемы автоматизации экспертной деятельности следует искать в рамках проблемной области АПТ.
Материалом для исследования послужили тексты реальных судебных семантических экспертиз (т. е. тексты экспертных исследований, составленные экспертами), сопровождаемые текстами, подвергнутыми экспертизе (т. е. текстами, которые анализировали эксперты при проведении этих экспертиз). К рассмотрению
принимались экспертные исследования монологических текстов наиболее частотного типа - анализ текста с целью выявления наличия в нем негативной информации о деятельности кого-либо.
Основным источником материала послужили экспертные исследования, любезно предоставленные сотрудниками Государственного учреждения РОССИЙСКИЙ ФЕДЕРАЛЬНЫЙ ЦЕНТР СУДЕБНОЙ ЭКСПЕРТИЗЫ ПРИ МИНИСТЕРСТВЕ ЮСТИЦИИ РОССИЙСКОЙ ФЕДЕРАЦИИ. Также в качестве источника материала была использована литература, содержащая аналогичные сведения.
Таким образом, объектом исследования является имплицитная информация, содержащаяся в тексте на ЕЯ, в аспекте его автоматической обработки. Предметом исследования является процесс моделирования извлечения имплицитной информации из текста.
Достижение указанной цели работы с учетом специфики выбранного языкового материала для проведения исследования подразумевает решение следующих задач:
• определение современного уровня развития систем, для которых разрабатывается лингвистическое обеспечение вышеупомянутой процедуры;
• сопоставление существующих подходов к имплицитной информации и к классификации ее типов;
• выявление типовых семантических задач, решаемых в ходе экспертной деятельности;
• формулирование подхода к имплицитной информации как к объекту моделирования;
• соотнесение с каждым выделяемым типом имплицитной информации определенного модуля в составе системы АПТ;
• внесение предложений по реализации и / или собственно реализация одного или нескольких модулей в рамках произвольной и / или заданной автоматической системы.
Методы исследования. При решении данных задач использовался метод сопоставления и критического анализа существующих подходов к имплицитной информации и к классификации ее типов; проводился многоаспектный семантический анализ языкового материала: лексико-семантический, сиптактико-ссмантический, контекстный семантический, а также формально-семантический (к анализу отдельных случаев привлекалась теория сегментной репрезентации дискурса).
Научная новизна работы заключается в том, что здесь впервые намечаются возможные пути решения проблемы автоматизированной обработки всех проявлений имплицитного плана содержания ЕЯ текста применительно к задачам судебной семантической экспертизы и предлагаются способы решения ряда подзадач этой многогранной проблемы.
Положения, выносимые на защиту:
1. Имплицитный уровень выражения смысла представляет собой целый комплекс явлений в речевой деятельности, обладающий внутренними взаимосвязями, это особая подсистема в рамках языковой системы.
2. Понятие пресуппозиции следует рассматривать не просто как разновидность имплицитной информации, но как конститутивный компонент имплицитной информации и как системообразующий элемент имплицитного уровня выражения смысла.
3.В современном российском судопроизводстве назрела необходимость создания единой экспертной методики анализа спорных текстов, позволяющей наряду с эксплицитно выраженными смыслами анализировать имплицитный план содержания и в то же время обеспечивать объективность семантической экспертизы.
4. В качестве основы такой методики может быть использована идеология теории сегментной репрезентации дискурса.
В работе получены следующие результаты:
1. Выявлен комплекс типовых семантических задач, встающих перед экспертами-лингвистами при проведении исследования спорного текста по делам о защите чести, достоинства и деловой репутации.
2. Проведено систематизированное разграничение типов имплицитной информации, предназначенное для использования экспертом-лингвистом при исследовании спорного текста на предмет наличия в нем негативной информации о деятельности кого-либо.
3. Разработана архитектура лингвистического обеспечения процедуры извлечения имплицитной информации при проведении семантических экспертиз, представляющая собой комплекс модулей семантического компонента системы АПТ, оказывающих поддержку экспертного анализа имплицитного плана содержания спорного текста на предмет наличия в нем негативной информации о деятельности кого-либо.
4. Предложен вариант модели автоматического определения тональности высказываний в адрес политических деятелей, реализованный в рамках отечественной системы извлечения знаний (МоэМтег™.
Результаты работы могут в дальнейшем иметь как теоретическое, так и практическое применение. Теоретическая значимость работы состоит в том, что выдвинутые положения могут быть использованы специалистами в области семантической теории. Данное исследование также может представлять интерес для лингвистов, разрабатывающих модели семантического анализа текстов на естественном языке, в частности, для разработчиков систем, нацеленных на извлечение из текста скрытой информации; а также для лингвистов-экспертов, проводящих семантические исследования спорных текстов, что составляет практическую значимость работы.
Апробация работы. Основные результаты исследования были представлены и прошли обсуждение в ходе докладов на всероссийских и международных конференциях: VIII Международной конференции «Cognitive Modeling in Linguistics» (Болгария, г. Варна, сентябрь 2005 г.), Международной конференции «Диалог 2006» (Бекасово (Московская область), июнь 2006 г.), Международной конференции «Скрытые смыслы в языке и коммуникации» (Москва, Институт лингвистики Российского государственного гуманитарного университета, октябрь 2006 г.), И Международной конференции «Язык средств массовой информации как объект-междисциплинарного исследования» (Москва, февраль 2008 г.), а также в рамках дискуссий на ESSLLI-2005 (17th European Summer School in Logic, Language and Information, Шотландия, Эдинбург, Университет Heriot-Watt, август 2005 г.) и на заседаниях Кафедры теоретической и прикладной лингвистики филологического факультета МГУ им. М. В. Ломоносова за 2003-2006 гг.
Структура диссертации определяется ее целью и задачами. Работа состоит из введения, трех глав, заключения, пяти приложений и списка использованной литературы.
ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ
Во введении обоснована актуальность исследования, его научная новизна, теоретическая и практическая значимость, сформулирована цель работы и приведено краткое содержание диссертации по главам.
Первая глава «Имплицитная информация в спорных текстах и вопрос автоматизации процесса ее извлечения» состоит из трех разделов.
В первом разделе даются исходные представления о задачах судебной семантической экспертизы; о центральном понятии настоящего исследования -имплицитной информации; о моделях автоматического понимания текста, привлекаемых к решению проблемы имплицитного в спорных текстах; определяется место семантического компонента в структуре таких моделей.
Семантическая экспертиза главным образом нацелена на выявление смыслов, передаваемых исследуемыми текстами, и анализ этих смыслов с разных точек зрения.
Согласно общепринятому мнению, далеко не вся информация, содержащаяся в том или ином естественно-языковом сообщении, находит непосредственное выражение в поверхностной структуре текста. Следовательно, в задачи семантической экспертизы входит и задача выявления в тексте имплицитной информации.
В наиболее общем понимании имплицитная информация представляет собой неоднородную по своему составу часть совокупной информации, передаваемой произвольным текстом естественного языка, не содержащуюся в тексте в явном виде, но сосуществующую с непосредственно выраженной (эксплицированной лексико-синтаксической структурой текста) информацией, которую можно извлечь из данного
текста (непроизвольным образом или приложив некоторые усилия) - вне зависимости от ее характера, актуальности для того или иного участника общения и ее «запланированное™» адресантом, а также от того, проявляется ли эта информация в тексте, когда он рассматривается в изолированном виде, или только при включении данного текста в более широкий контекст.
Поскольку смысл может присутствовать в тексте в явной (эксплицитной) и в скрытой (имплицитной) форме, а эксплицитным считается смысл, получивший в тексте буквальное и однозначное словесное выражение, то все прочие смыслы, содержащиеся в тексте, являются имплицитными. В этой связи важно отметить, что имплицитность смысла - понятие градуируемое.
При этом нельзя сказать, что эксплицитное имеет свое выражение, а имплицитное не имеет. Оба они имеют свое выражение, причем именно языковое, но только разного рода: прямое, непосредственное и непрямое опосредованное (Багдасарян 1983). В целях достижения адекватного понимания сущности языка как феномена социальной жизни человека и объективной оценки возможностей языковой коммуникации предлагается выделять специальный языковой уровень выражения смысла - имплицитный (наряду с эксплицитным уровнем, традиционно изучаемым лингвистами). Если отказать языку в двуплановости в эксплицитно-имплицитном отношении, то он обратится в механическую систему одно-однозначных соответствий, лишенную всех тайн и загадок феномена естественного языка. Такое понимание имплицитного - как целого уровня выражения смысла в рамках языковой системы и, следовательно, как целого комплекса явлений в речевой деятельности, противопоставленное фрагментарному рассмотрению отдельных фактов наличия дополнительной смысловой нагрузки в тех или иных случаях, - представляется чрезвычайно существенным (привлечение понятия 'уровень' призвано подчеркнуть наличие внутренних системных отношений между способами имплицитного выражения смысла и особых закономерностей, присущих имплицитному выражению смысла как таковому).
Любое содержание, информация, передаваемая посредством языка, входит в компетенцию лингвистической семантики, поэтому задачу извлечения имплицитной информации (интегральную часть «задачи слушающего / читающего») следует представить как задачу семантической теории. Поскольку автоматизация интеллектуальной деятельности человека в современном мире с каждым днем приобретает все большую актуальность и становится все более востребованной, наиболее перспективным направлением исследования в области анализа имплицитной информации является путь моделирования ее извлечения в рамках систем автоматического понимания текста. Для решения семантических задач центральную роль играет семантический компонент таких систем.
Во втором разделе первой главы дается аналитический обзор существующих подходов к классификации типов имплицитной информации, а также предлагается
разграничение типов имплицитной информации, ориентированное на решение задач судебной семантической экспертизы на основе вышеупомянутого Обзора и собственно анализа конфликтных текстов и продуктов их экспертных исследований.
Три наиболее интересные классификации рассматриваются подробно: типы имплицитной информации, выявленные Е. В. Падучевой (1981) на основании сопоставления с понятием презумпции, - как традиционное разграничение, и две классификации другого характера, в которых за исходную точку принимается системность имплицитного уровня выражения смысла и делается попытка определить некий объединяющий параметр для явлений этого уровня, - это типология имплицитного Л. В. Лисоченко (1992) и типология скрытых смыслов А. А. Масленниковой (1999).
Аналитический обзор демонстрирует весьма значительные расхождения исследователей в выборе параметров и основания классификации, а также собственно в составе выделяемых типов, поэтому для ответа на вопрос Что из невыраженного в тексте в явной форме может оказаться существенным и повлиять на результаты, которые войдут в экспертное заключение, т. е. в выводы экспертного анализа, а чем эксперт может пренебречь? проводится первичный анализ набранного корпуса экспертных семантических исследований и проверяется применимость рассмотренных подходов к разграничению типов имплицитной информации на практике.
На начальном этапе анализа материала рассмотрение типовых вопросов, задаваемых экспертам при назначении семантических экспертиз выбранного типа, позволило определить типовые семантические задачи, встающие перед экспертами при проведении исследования спорного текста:
- определение актуального значения лексических единиц, входящих в высказывание;
- выявление коннотаций и оценочных компонентов в значении лексических единиц, входящих в высказывание;
- выявление и толкование метафорических выражений (и других риторических приемов, см. далее), входящих в высказывание;
- определение экспрессивной оценки, привносимой в конфликтное высказывание метафорическим выражением;
- установление референциалъных отношений в нетривиальных случаях;
- разрешение анафоры в нетривиальных случаях;
- установление текстуальной связности в нетривиальных случаях;
- определение смысла целого на основе смысла составляющих;
- привлечение контекстуальных знаний для определения смысла высказывания;
- привлечение фоновых знаний для определения смысла высказывания;
- объяснение операции естественно-логического вывода из конфликтного текста или его фрагмента;
- определение информационной природы конфликтного высказывания;
- определение иллокутивной функции анализируемого текста (выявление
прагматического значения); - а также решение частных семантических задач (толкование значения слов и словосочетаний; установление наличия / отсутствия отношений синонимии и антонимии между языковыми выражениями; установление гипо-гиперонимических отношений).
Первичный анализ материала имел неожиданный результат. Оказалось, что в экспертной деятельности затребовано не так уж и много типов имплицитной информации, хотя изначально было высказано предположение, что в силу существующих расхождений во мнениях по вопросу таксономии изучаемого феномена, система типов, разрабатываемая для экспертной деятельности лингвисга, должна быть чрезвычайно разветвленной и многокомпонентной. Тем не менее, материал свидетельствует об обратном (этот вывод закрепился также благодаря появившемуся у автора собственному небольшому опыту проведения экспертиз анализируемого типа). Детализованные и проводимые по разным параметрам классификации, несомненно, имеют право на существование. Однако они скорее служат цели более глубокого понимания сущности рассматриваемого языкового феномена, нежели способствуют упрощению практики анализа и интерпретации ЕЯ текстов. Последней задаче больше соответствуют более традиционные понятия, по большей части присутствующие в классификации Е. В. Падучевой и имеющие долгую историю разработки, а также, что немаловажно, - практику использования в системах анализа и порождения текстов на ЕЯ.
Что касается упомянутых выше подходов Л. В. Лисоченко и А. А. Масленниковой, то при всех своих достоинствах (главным из которых является системность в отображении уровня имплицитного), оба подхода обладают определенными недостатками и упущениями. В частности, в обоих случаях понятие пресуппозиции сильно размыто и скорее соответствует ЕЯ выражениям 'подразумеваемое' или 'предпосылка', в зависимости от контекста. Нечеткость и терминологическая неоднозначность неприемлемы для разработок по моделированию АПТ в связи с возникающими при этом сложностями в формализации.
Тем не менее, 7 различаемых данной классификацией типов неэксплицитной информации также нельзя принять за необходимый и достаточный перечень понятий, которыми должен оперировать семантист при проведении анализа плана содержания спорного текста. Поэтому был проведен повторный анализ материала исследования. В опоре на выявленные семантические задачи, встающие перед экспертом, и приняв за основу классификацию Е. В. Падучевой, мы предприняли попытку выявить недостающие компоненты искомого комплекса и исключить лишние, руководствуясь данными экспертных исследований и наработками, систематизированными в других классификациях, синтезировав, таким образом, всю собранную на начальном этапе исследования информацию.
В результате был получен следующий Комплекс типов имплицитной
информации, за работу с которыми должно отвечать моделируемое лингвистическое обеспечение процедуры извлечения имплицитной информации из текста:
1. (сентенциальные) пресуппозиции (семантические и прагматические);
2. импликации, следствия;
3. импликатуры дискурса;
4. условия успешности речевого акта;
5. лексические пресуппозиции, коннотации, ассоциативная информация;
6. скрытые смыслы, порождаемые метафорами и другими риторическими приемами.
Чтобы убедиться, что полученный Комплекс является полным - необходимым и достаточным - для лингвиста-эксперта, работающего со спорными текстами, или, в противном случае, выявить недостающие типы, было принято решение обогатить Комплекс системными взаимоотношениями входящих в его состав элементов, поскольку только при наличии таких взаимоотношений можно говорить о целостной, единой системе - языковом уровне выражения смысла (см. выше).
Из всех понятий, тем или иным образом соотносимых с понятием имплицитной информации, наиболее часто привлекаемым к обоснованию выводов экспертов о наличии в тексте негативной информации в скрытой форме, является понятие пресуппозиции. Это же понятие является центральным и для большинства теоретических (лингвистических) работ, посвященных исследованию феномена наличия скрытой информации в текстах ЕЯ. Эта ситуация далеко не случайна. Как представляется, пресуппозиции имеют особый статус, особую функциональную значимость, позволяющие нам высказать следующее предположение, идущее, на первый взгляд, вразрез с лингвистической традицией, но, тем не менее, находящее аналоги и в работах других исследователей.
По-видимому, несмотря на то, что содержание пресуппозиций присутствует в сознании коммуникантов в виде пропозиции, понятие пресуппозиции следует рассматривать не просто как разновидность имплицитной информации, а как конститутивный компонент имплицитной информации, с опорой на который, в частности, могут возникать те или иные ее типы, разновидности. Иначе говоря, пресуппозиции - это системообразующий элемент имплицитного уровня выражения смысла.
Мы полагаем, что такое видение роли пресуппозиции позволяет наметить пути интеграции подходов системного типа с понятиями, разработанными и используемыми в практике создания систем анализа и порождения текстов на ЕЯ. Поясним эту позицию в применении к комплексу типов имплицитной информации, сформированному в результате анализа материалов исследования, когда за отправную точку для выявления релевантных типов имплицитной информации были взяты, с одной стороны, семантические задачи, решаемые при проведении экспертизы спорных текстов, а с другой - высокая частотность использования понятия пресуппозиции при обосновании выводов экспертов о наличии в спорном тексте
негативной информации в скрытой форме. Если следовать логике рассуждения, выстраиваемой по ходу анализа, то для полученного Комплекса типов пресуппозиции, действительно, можно считать его «ядром» - ядерным элементом, образующим вокруг себя систему. Именно на основе всестороннего анализа этого понятия, рассмотрения всех его граней и сопоставления каждой из них с типами, соответствующими грани по уровню анализа, был сформирован Комплекс типов. Так, при рассмотрении такой разновидности пресуппозиций, как лексические, выявляемые на уровне анализа лексем, был сделан вывод, в частности, о необходимости учета коннотаций, которые могут быть получены на этом же уровне анализа. Совсем иные выводы были получены при рассмотрении разновидностей сентенциальных пресуппозиций - семантических и прагматических: первые (Р—& ><3) позволяют привлечь импликации, подчиняющиеся закону контрапозиции (Р—*<3 & -Ч}—»-р) - в плане учета логико-семантических отношений между предложениями, а вторые - прагматические (то, что подается говорящим как известное, само собой разумеющееся) встают в один ряд со следствиями (истинность которых однозначно вытекает из утверждаемого говорящим).
Что касается вопроса о возможности порождения этим конститутивным элементом других элементов системы, то таким примером могут послужить фоновые знания, которые может помочь извлечь пресуппозиция. Этот тип имплицитной информации не был включен нами в комплекс типов. Нет его и в классификации Е. В. Падучевой. Считая это упущением, мы приняли решение о включении фоновых знаний в Комплекс типов имплицитной информации, необходимый лингвисту-эксперту для анализа спорных текстов. Этот тип взаимосвязан, в первую очередь, с пресуппозициями - как с лексическими, так и с сентенциальными, - и с различными актуальными оттенками лексического значения (коннотации, ассоциации). Он же может служить одним из источников возникновения метафорических и др. риторических значений. На уровне функциональной значимости фоновые знания можно связать также с условиями успешности РА, поскольку в прагматическом плане последние выполняют ту же роль, чго и первые в плане семантическом. Так как семантические и прагматические пресуппозиции были объединены в единый класс в полученном нами Комплексе, фоновые знания будет логично включить в один класс с условиями успешности РА.
Последнее наблюдение, касающееся семантико-прагматической интеграции, свойственной естественно-языковым текстам и появившейся в нашем комплексе типов опять же благодаря понятию пресуппозиции, также привносит системообразующую черту в полученное нами представление уровня имплицитного выражения смысла.
В результате была получена следующая картина системного взимоотношения типов имплицитной информации (см. Рис. 1).
Рис.1. Блок-схема разграничения типов имплицитной информации,
предназначенная для использования экспертом-лингвистом при исследовании спорного текста на предмет наличия в нем негативной информации о деятельности кого-либо
'Мягкое понимание' [jleouniaem 2006/. ориентированное на тгтоаые вопросы, поатт/енные ни разрешение эксперту
Модифидир-ный модуль словарной поддержки
i \ .тскслчсскис лреп •
оцепочп. коми-ты
! коннотация
I ассоциации
Модуль экира-лицгвистической поддержки
Алгоритм интерпретации метафорических выражений
Г^ ] Кондрашова 2004]_j
Интерпретация риторических приемов
j релевантные fТО 1 I базы длнных. j базы знаний.
! 0Н10.10П1И
Ч___ _____
Кластеры условий успешности
изх:
;тя ка-лдого типа РА
I I
Оценка тональности выск-й
I лава j паст. иссл.
в частности:
прсп анализ & анализ импликатур
SDRT [Asher. l.ascuvides 2003]; j Глава 2 наст. иссл. I
Правила естественно-логического вывода
! i
Рис.2. Блок-схема модулей семантического компонента системы АПТ,
оказывающих поддержку экспертного анализа имплицитного плана содержания спорного текста на предмет наличия в нем негативной информации о деятельности кого-либо
В третьем разделе первой главы на основании результатов анализа языкового материала, проведенного во втором разделе, выявляется необходимый состав модулей семантического компонента модели АПТ, ориентированной на решение задач судебной семантической экспертизы, с точки зрения содержащейся в спорных текстах имплицитной информации, а также поднимается вопрос о необходимости создания единой экспертной методики семантического анализа.
Современная степень развития систем автоматического понимания текста и объект исследования в совокупности определяют необходимость разработки процедуры извлечения имплицитной информации для системы, обеспечивающей поддержку деятельности лингвиста-эксперта, проводящего семантические исследования. Учитывая существующие ограничения, процедура может отвечать только за проведение базовых (релевантных запросу) смысловых операций над текстом, результат которых потом должен быть проанализирован экспертом (только после этого на основании анализа будет составляться экспертное заключение).
В рамках реферируемого исследования разработано лингвистическое обеспечение процедуры извлечения имплицитной информации из текста в виде особых модулей или модификаций существующих модулей семантического компонента системы АПТ. Поскольку для каждой семантической задачи, решаемой в ходе экспертизы, были определены те типы имплицитной информации, которые должны быть вовлечены в процесс ее разрешения, модули семантического компонента призваны поддерживать каждый такой процесс.
На Рис. 2 представлена сводная таблица разработанных модулей.
Общий принцип, заложенный в функционирование объединенных семантическим компонентом модулей, заключается в том, что система должна реализовывать мягкое понимание, т. е. должна обладать определенной гибкостью, чтобы обеспечить возможность варьирования работы в зависимости от запросов пользователя, иными словами, должна быть обеспечена возможность настройки системы для каждого конкретного случая (по типам вопросов к экспертам).
Первая модификация, которая необходима для реализации анализа имплицитного плана содержания, - это модификация модуля словарной поддержки, являющегося неотъемлемой составляющей любой системы АПТ. Предлагаемая модификация заключается во включении в словарь информации об ингерентых пресуппозициях лексем, информации о наличии в значении лексемы оценочных компонентов и различных коннотативных характеристик, включая ассоциативную информацию.
Второй предлагаемый нами модуль должен отвечать за работу алгоритма интерпретации метафорических выражений, подробно не затрагиваемого в данной работе, но описанного в работе автора реферируемой диссертации (2004).
Следующий модуль призван осуществлять учет пресуппонируемой информации и отвечать за выявление импликатур дискурса. В основу методики
КондрсгмоваД.С. Аатореф. дис.... к.ф.н. М: 2010 иресуппозиционного анализа и анализа импликатур предлагается положить теорию сегментной репрезентации дискурса, разработанную Н. Эшером и Л. Ласкаридес (1998-2003).
Еще один модуль должен реализовывать композицию оценки целого на основе оценок составляющих. По-видимому, для целей обеспечения возможности такой композиции должна быть разработана особая логика оценки.
Данный модуль предусмотрен для поддержки экспертного анализа, направленного на решение таких вопросов, как определение коммуникативной направленности текста в целом или отдельных его фрагментов.
С другой стороны, ответ на этот же вопрос должен поддерживаться модулем, облегчающим задачу определения иллокутивной функции. Мы полагаем, что в структурном отношении он должен представлять собой реляционную базу данных, содержащую кластеры условий успешности для каждого типа РА.
Однако вопрос, связанный с оценочной составляющей спорного текста, не следует ограничивать исключительно задачей выявления сложной оценки целого. При проведении экспертных исследований не менее актуальной может оказаться проблема выявления частных случаев негативной оценки деятельности физического или юридического лица. Задача автоматизации процесса определения тональности высказывания в составе произвольного ЕЯ текста по отношению к заданному объекту может быть рассмотрена как подмодуль модуля композиционного вычисления оценки целого текста.
Еще одним неотъемлемым модулем произвольной системы АПТ (наряду с модулем словарной поддержки) являются всевозможные релевантные для проблемной области базы знаний и базы данных. В первую очередь, в соответствии с задачами экспертизы, нацеленной на выявление негативной информации о деятельности кого-либо, для разрабатываемой процедуры необходим список ценностей в БД (что такое 'хорошо' / 'плохо'), напрямую связанный с модулем, отвечающем за выведение оценочной характеристики целого текста и его фрагментов. Поскольку выбранный тип экспертиз в качестве материала обычно предполагает газетные публикации или стенограммы эфирных теле- / радио- выступлений, отражающие информационные конфликты между чиновниками, руководителями различного уровня, политическими деятелями и под., то, соответственно, в разрабатываемый компонент следует включить базы знаний по устройству российских административных систем, политической системы, базы данных по персоналиям, «табель о рангах», а также сведения законодательного характера. Кроме того, вносится предложение об обогащении модуля экстралингвистической поддержки такой составляющей как база прецедентных текстов, часто необходимых для интерпретации конфликтных газетных публикаций.
Последний модуль, который мы считаем необходимым для реализации анализа имплицитного плана содержания, - это модуль, осуществляющий процедуру,
имитирующую естественно-логические выводы, которые могли бы быть сделаны потенциальным адресатом из данного текста. Сопутствующая разработке этого модуля задача алгоритмизации операций естественной логики весьма нетривиальна, но, тем не менее, в определенных случаях выполнима, что может существенно облегчить деятельность эксперта. В частности, ряд выводов, наиболее часто встречающихся при понимании ЕЯ дискурса, может быть задан аксиоматически. В качестве примера такой аксиоматизации правил вывода можно рассмотреть аксиомы связующей логики, предполагаемой теорией сегментной репрезентации дискурса.
В заключение первой главы обосновывается необходимость создания особой единой экспертной методики анализа спорных текстов, позволяющей наряду с эксплицитно выраженными смыслами анализировать имплицитный план содержания и в то же время обеспечивать объективность семантической экспертизы.
Вторая глава «Основа методики анализа имплицитного плана содержания спорных текстов» представляет собой разработку одного из выявленных в первой главе модулей в применении к материалу текстов судебных семантических экспертиз. Здесь предложена методика анализа пресуппозиций и импликатур дискурса в спорном тексте на основе теории сегментной репрезентации дискурса (формальная динамическая теория семантической интерпретации ЕЯ-текстов, применение которой может быть реализовано системой АПТ).
Основываясь на конститутивном и системообразующем статусе пресуппозиции для имплицитного уровня выражения смысла и ключевой роли этого понятия в реферируемой работе, мы считаем, что пресуппозиционный анализ спорных текстов может стать логичной основой методики анализа их имплицитного плана содержания. В первых параграфах второй главы дается краткий аналитический обзор последних достижений лингвистической науки в области изучения этого феномена с целью формирования понимания тонкого механизма работы пресуппозиции в структуре связного текста. Здесь рассматривается проблема проекции пресуппозиций, трактовка пресуппозиции как трехместного отношения Р. Ван дер Сандта (1988), анафорическая теория пресуппозиций Р. Ван дер Сандта (1992), модель пресуппозиционного анализа О. В. Выборновой (2002) и, наконец, концепция Н. Эшера и А. Ласкаридес (1998), которая, на наш взгляд, отличается наибольшей адекватностью в отражении пресуппозиционных механизмов естественного языка.
Эта концепция - теория сегментной репрезентации дискурса (Segmented Discourse Representation Theory, сокращенно SDRT) - представляет собой формальный подход к анализу пресуппозиций. SDRT является динамической семантической теорией интерпретации дискурса и представляет собой попытку моделирования семантико-прагматического интерфейса: особое внимание уделяется тому, каким образом при интерпретации высказывания происходит обогащение его композиционалыюй и лексической семантики дополнительным содержанием, что позволяет объяснить несколько взаимосвязанных явлений дискурса, в частности,
разрешение анафоры различных типов (включая пресуппозиции), разрешение лексической полисемии и выведение импликатур дискурса.
Охарактеризовать теорию можно при помощи двух ее основных черт: 1) авторы принимают анафорическую концепцию пресуппозиций, но дают ей новый поворот: предполагается, что пресуппозиции, как и другие анафорические выражения имеют недоопределенное семантическое содержание (в терминах У. Райла (1993)), которое требует разрешения при интерпретации1 пресуппозиций в контексте; 2) семантическая недоопределенпость в пропозиции разрешается путем риторического связывания = установления смысловой связи этой пропозиции с контекстом в терминах теории риторических структур В. Манн и С. Томпсон (1987).
В тексте реферируемой работы на развернутом примере, представляющим собой часть статьи, ставшей объектом экспертного анализа по делу о защите чести, достоинства и деловой репутации, демонстрируется, как может быть использована идеология ЗОЯТ в решении задач семантической интерпретации. При этом вОЯТ позиционируется как основа экспертной методики, необходимость которой была обоснована выше. Предложенный детальный анализ текста имеет ряд отличий от оригинальной версии применяемой теории, с одной стороны, и от традиционного экспертного анализа, с другой.
ЭОКЛ представляет собой сугубо формальную модель репрезентации дискурса. В проведенном анализе формализм использован фрагментарно. В случае экспертных семантических исследований полная формальная репрезентация спорного текста, которую можно получить при применении 8ГЖТ, не составит желаемого результата, тогда как промежуточное объяснение, из какой части анализируемого фрагмента и каким образом может быть получена та или иная информация, намного лучше отвечает задачам, стоящим перед экспертом.
Важную особенность 50КТ составляет тот факт, что эта теория была разработана на материале английского языка, при этом в работах авторов теории практически весь иллюстративный материал составляют достаточно короткие и простые с точки зрения синтаксической структуры примеры, большинство из которых состоит из двух-трех-четырех простых предложений. В настоящем исследовании впервые предлагается использовать БВЯТ для интерпретации развернутых естественных монологических текстов на русском языке, объем которых существенно превышает указанный (как правило, это различного объема газетные публикации). Очевидно, что вручную построить структуру представления для целого текста значительного объема не представляется возможным по причине ее колоссальных размеров. Поэтому описание процесса интерпретации в опоре на идеологию теории более приемлемо и с этой точки зрения.
Преимущества 5011Т-анализа обосновываются исходя из сопоставления предложенной версии анализа и экспертного анализа этого же фрагмента текста. Применение ЙВЯТ требует тщательного внимания к деталям текста и предоставляет
возможности для детальной и на всех этапах обоснованной интерпретации не только имплицитного, но и эксплицитного плана содержания текста, и, таким образом, представляет собой необходимый инструмент для проведения экспертных семантических исследований. В тексте работы приводятся наиболее существенные моменты расхождения интерпретаций, полученных при двух вариантах анализа. Во всех приведенных случаях традиционный экспертный анализ серьезно уступает предлагаемой интерпретации.
Рассмотрим, как может быть использована идеология SDRT в решении задач семантической интерпретации на примере (q) из реальной судебной экспертизы (предложение (р) является непосредственным предтекстом (q)).
(р) В Химкинском районе есть возможности для решенья социальных проблем стариков, детей и других незащищенных категорий граждан.
(q) Только на открытии комплекса «Мега» глава района Стрелъченко получил от шведов чек на миллион долпаров.
Для клаузы (q) связующая логика, предусмотренная в SDRT для обновления текущей структуры представления дискурса, диктует выбор риторического отношения Развитие Elaboration (р, q): раскрывается заданная в (р) тема наличия возможностей (возм) для разрешения упомянутых проблем (наличие проблем для определенных категорий граждан составляет пресуппозицию (р)) и устанавливается наличие отношения «часть-целое» Part-of {млн-,, возм)\
Таким образом, с точки зрения SDRT-интерпретации, следующий фрагмент экспертного анализа дает неверную интерпретацию предложения (q), поскольку не было учтено риторическое соотнесение (q) с контекстом:
«В процитированном предложении (q) использована частица только в значении, которое может быть сформулировано как «показательный пример» [здесь эксперты ссылаются на издание «Дискурсивные слова русского языка: опыт контекстно-семантического описания» (1998)]. В этом значении частица только указывает, что содержащаяся в предложении информация является одним из примеров того, что происходит обычно. Таким образом, используя эту частицу, автор предложения исходит из предположения, что В. В. Стрельченко получал денежные средства не только на открытии комплекса «Мега», но и в других ситуациях».
Согласно SDRT-анализу, последовательно учитывающему контекстную связность, благодаря лексеме 'только' в данном случае выводится отношение «(значительная) часть-целое» между чеком на миллион долларов и (материальными) возможностями для решения социальных проблем граждан района, существование которых постулируется в предыдущем предложении, т. е. возможна такая перифраза:
' Набор риторических отношений в ЯПЯТ отличается ог принятого в известной теории риторических структур. В ЭОЯТ отношение рассматривается как самостоятельное, только если оно оказывает влияние на условия истинности элементов, которые оно связывает, и это влияние не может быть объяснено другими средствами. Поэтому в 8(ЖТ нет отношений Конкретизации или Примера.
в районе есть возможности для решения проблем..., например,... миллион долларов, помимо прочего. Таким образом, лексема 'только' действительно вводит «показательный пример», но не пример получения денежных средств главой города, а пример их наличия.
Применение ЯВЯТ дает гарантию, что какая-нибудь важная для суда информация не будет случайно пропущена (поскольку динамическая теория подразумевает пошаговую интерпретацию целого текста по мере его развертывания), тогда как, согласно материалу исследования, в настоящее время анализ текстов при производстве экспертиз проводится по следующей схеме: эксперт знакомится с предоставленными ему материалами дела и прочитывает текст, чтобы составить о нем первичное представление, затем выбирает контекст, необходимый для анализа одной из фраз, фигурирующих в вопросе, поставленном перед экспертизой (выбор производится в опоре на интуицию эксперта). После чего для объяснения смысла выбранного отрывка эксперт, как правило, прибегает к перефразированию, т. е. объясняет понятый им как носителем РЯ смысл иными словами в соответствии со сформировавшимся у него первичным представлением о тексте в целом. Затем в опоре на словари и специальные знания эксперт прибегает к толкованию отдельных слов и конструкций, ключевых для понимания данного отрывка, или же вызывающих вопрос - с целью пояснить или обосновать свою парафразу. Процедура повторяется для каждой из фраз, фигурирующих в постановлении о назначении экспертизы; все остальное остается, как правило, без внимания, если эксперт случайно не заметит в тексте что-либо, что может иметь отношение к делу.
Таким образом, применение элементов ББЯТ позволяет алгоритмизировать процесс семантического анализа произвольного ЕЯ текста и, таким образом, существенно повысить степень объективности семантической экспертизы, одновременно с этим сделав возможной частичную автоматизацию экспертной деятельности.
В третьей главе «Опыт разработки автоматического определения тональности высказываний в адрес политических деятелей» представлено описание принципа работы реализованного автором настоящего исследования автоматического определения тональности высказываний на платформе семейства мультиязычных систем извлечения знаний ОпЮэМтег™, что является разработкой (и реализацией) еще одного из выявленных в рамках исследования необходимых модулей семантического компонента модели А11Т, ориентированной на решение задач судебной семантической экспертизы.
Одной из подзадач, подлежащих разрешению в ходе проведения экспертных исследований по делам о защите чести, достоинства и деловой репутации, является задача определения тональности высказываний, входящих в состав спорного текста.
Тональностью высказывания в компьютерной лингвистике принято называть его позитивную / негативную оценочную модальность. При этом задача определения
тональности может быть рассмотрена в двух ракурсах: объектно-ориентированое определение тональности (тональность публикации относительно объекта) У8 определение общей тональности текста как целого. С точки зрения задач семантической экспертизы спорного текста особый интерес представляет объекгно-ориентированный вариант решения этой задачи, поскольку истец, как правило, обращает внимание суда именно на те фрагменты текста, которые содержат, по его мнению, негативную и противоречащую действительности информацию о нем и / или его деятельности - что и ставится на рассмотрение экспертам.
Выдвигаемая концепция решения задачи обусловлена устройством отечественной системы ОпккМтег, в рамках которой была разработана и реализована подсистема объектно-ориентированного определения тональности. Данная система позволяет на основе использования онтологии применять правила лингвистического программирования для анализа произвольного естественно языкового текста: автоматически на основе заданной предметной области в тексте выявляются объекты и отношения между ними, в результате чего соответствующим фрагментам текста присваиваются аннотации. На выходе пользователь системы получает набор концептуально структурированных данных, которые удобны с точки зрения дальнейшей автоматической обработки и могут быть визуализованы в виде семантических сетей. Таким образом, самые разнообразные неструктурированные данные, содержащиеся в СМИ, становятся «машиночитаемыми».
Для того чтобы выявить в спорном тексте тональные высказывания о заданном объекте, в первую очередь необходимо выявить все вхождения самого объекта. В данном случае, релевантный класс объектов - это персоны и организации. Система выявляет их с высокой точностью в произвольном естественно-языковом тексте на основе эвристик. Затем при помощи сложной системы лингвистических правил между выявленными объектами устанавливаются различные связи (семантические отношения), которые могут быть специфичными для каждой проблемной области. Например, отношение 'работать^, связывающее персону с некоторой организацией; симметричное отношение 'бытъ родственником' между двумя персонами и подобные. Релевантная в данном случае предметная область должна быть представлена онтологией, ориентированной на извлечение знаний в области бизнеса и политики.
Поскольку задача определения тональности была специфицирована как объектно-ориентированная, то возникла идея представить тональность в виде особого семантического отношения, направленного на целевой объект, т. е. Персону или Организацию, которые могли бы фигурировать в спорном тексте, представленном на экспертизу. Эта идея и была реализована. Кратко продемонстрировать схему генерации тонального отношения можно следующим образом.
(а) В российском правительстве произошел острый конфликт в связи с формированием госкорпорации "Ростехнологии". Вице-премьер правительства и министр финансов РФ Алексей Кудрин выступил против передачи корпорации более 70 активов, обвинив ее главу Сергея Чемезова в попытках скрытой приватизации.
File Option» Tools Help
¡^ ф # & m \fi
(5 GATE Messages OntosMmer FEST . Чубайс, Веслам ! =] Кудрин !
" Jj^fc Applications 1 OntosMinc 1?, Language Resources ¡Annotation Sets j [Annotations' Со-referenc« Editor ;Text- r-|
В российском правительстве произошел острый конфликт в связи с формированием госкорпорации "Ростехмолсгии" Вице-прсмьгр правительстве и министр финансов ; РФ Алексей Кулрии выступил против передачи корпорации более 70 активов. □ i QJ NotQuctr ; ■ ; □ Qr^GenforT or. ... ;
'•-■• Беслан обвинив ее главу Сергея ч eueso ва в попытках скрытой приватизации □ mm
J} Чубайс 4? TEST Processing Resources □ ШМв s
fijpData stor« П Q*m_y
□ Own_area.l Г] Own _ are a. 3 Q 0wn_area.4
I Туре 10 Set Starr End Features
renalEtemtfrtd 1721 ; 52^АССР1--6, ANIM-man, CAS-nom, Concepts-¡http. йвШНМИ □ 1 !□ . «.
TonaJEIemenr' 1722 44i 52 (ACCPL'6, ANIM-iosn, CAS-acc, Concepts = [http:/
Organization :2077; Person ; 928, ' 9ll 157' 106i{Jview.nameS«Poci6XHonorHM. ACCPL-0, ANIM-i' 1 71:<iview_.iarr,e$-AfleKceii Кудрин, ANIM-anirn, TAS;
Onjaniza'ion ' 123 5{ 197; ~ 207i(fview.name$»PocTexHOflorwH. ACCPL-7. ANIM-i1
DlXMATC^j TonalElementi 1736; 226j 233!{ACCPL-6, ASP-pf, Cor;cepts-[hctp://RusGazffacc: □ Pfcr<_ger.. ;
TmConte Person 12079' 2431 2 58:{$view_nameS>-Cepreft Чемезов, ANlM=--anin., CAS ¡□ШШЙВаШШ ;
..tripled : keyword; jl вЯШЖ 1 Д Persons 4 >
virtualMa j 7 Annotations (0 selected) New
ч i] ► =; ; Document Editor ; Inioalisati or: Par —ers "
Как видно на приведенной иллюстрации, во фрагменте (а) система выявит два объекта типа Персона - Алексей Кудрин и Сергей Чемезов - и один объект типа Организация - Ростехнологии (а также второе вхождение этого объекта, выраженного анафорическим употреблением слова корпорация). Об этом система сигнализирует соответствующим типу цветным выделением (предусмотренным для каждой генерируемой аннотации в правой части рабочего окна) и перечнем в нижней части рабочего окна с указанием ГО объектов, начальной и конечной позиций о последовательности символов и целого ряда атрибутов, приписываемых объектам на разных этапах анализа. Таким же образом система просигнализирует о наличии в тексте тонально окрашенных элементов: конфликт и обвинив, поскольку в ходе разработки они были включены в словарь подсистемы и помечены в нем как таковые.
Такова исходная ситуация, в которой системе предстоит определить три негативных момента: негативную тональность, ориентированную на объект типа Организация (в связи с произошедшим конфликтом, о чем эксплицитно упоминается в первом высказывании, и в связи с выступлением члена правительства) и негативную
тональность, ориентированную на объект типа Персона (в связи с обвинением Сергея Чемезова).
Тогда если в следующих фазах анализа будут содержаться шаблоны: (ша1) негативный тональный элемент /конфликт/ + {предложная конструкция в
связи с) + [Организация в творительном падеже]; (ша2.1) [Персона в именительном падеже] + {единица словаря с исходной формой выступить в сочетании с предлогом против} + [Организация в винительном падеже];
(гиа2.2) [Персона в именительном падеже] + негативный тональный элемент
/обвинить/ + [Персона в винительном падеже], то во фрагменте (а) (а также во всех аналогичных случаях, подходящих под данные шаблоны) система установит наличие отношений, фиксирующих негативную тональность по отношению к объектам типа Организация в первом предложении и в первой части второго предложения, а также к объекту типа Персона в придаточной части второго предложения. Эти объекты получат соответствующую аннотацию, свидетельствующую о результатах обработки предложения системой со встроенным модулем автоматического определения тональности.
Высказанная идея представляет собой достаточно простое решение поставленной задачи, обусловленное собственно средой реализации, однако воплощение даже такого решения требует определенных временных и интеллектуальных затрат и не исключает ряда трудностей.
На первом этапе работы производился сбор материала среди новостных интернет-публикаций, освещающих сферу политических взаимоотношений в нашей стране. На втором этапе проводилась последовательная размегка тональных элементов в отобранных текстах и составление соответствующего словаря. На следующем этапе велась работа по выявлению реально выраженной тональности высказывания по отношению к фигурирующему в нем объекту (Персоне / Организации): на данных собранного языкового материала разрабатывалась система шаблонов для выделения положительных / отрицательных новостей (сведений) о Персоне / Организации, в основе которой лежит исчисление различных вариантов сочетаний языковых выражений, кодирующих семантику тонально окрашенного отношения к заданному объект)'. Заключительный этап разработки состоял в генерации на каждом шаблоне соответствующего отношения.
В результате проведенной работы было создано более 40 фаз для автоматического анализа тональности высказываний в сфере политических и экономических / финансовых новостей русскоязычных электронных СМИ (каждая фаза представляет собой п-ое количество правил (п> 1), на вход которых подается один и тот же тип данных; в отдельном файле прописан порядок применения фаз при обработке текста). В качестве объектов тональных высказываний рассматривались преимущественно политические деятели, политические партии, а также
КондратомД.С. Автореф. дис.... к.ф.п. М.: 201!) коммерческие организации. Большая часть разработанных фаз направлена на выявление именно негативной тональности. Это обстоятельство обусловлено в первую очередь общей тональностью современных СМИ, в особенности, русскоязычных, а, соответственно, и количественным преимуществом собранных примеров на негатив по сравнению с позитивом.
Основные шаблоны, призванные выявлять высказывания с негативной тональностью в отношении ключевого объекта, базируются на использовании таких ключевых лексем, как обвинять, критиковать, упрекать. Эти и подобные им лексемы составили ядро разработанной системы. При создании шаблонов активно использовались также словосочетания и целые выражения, за которыми в русской языковой картине мира закрепилась негативная тональная окраска: возбудить уголовное дело против/в отношении..., нечистый на руку, воспользоваться служебным положением, иметь связи в криминальном мире и под. Аналогичное ядро было заложено и в основу создания шаблонов, нацеленных на извлечение позитива (и составляющих =15% от общего объема разработанных).
В виду огромного количества потенциальных способов выражения позитива / негатива в естественном языке проделанную работу по созданию шаблонов следует считать начальным этапом разработки модуля, который при необходимой доработке сможет выдавать хорошие результаты по таким параметрам как точность и полнота выявления объектно-ориентированнного позитива и негатива в произвольном русскоязычном тексте (имеется ввиду 100%-ная точность и полнота в пределах 0,7 - 0,8 (если за единицу принять все искомые случаи) в связи с невозможностью учета ряда уникальных и индивидуальных способов выражения).
Таким образом, на основе проведенного исследования заданной области знаний (тональность как оценочная модальность высказываний о Персоне / Организации) в реферируемой работе было предложено решение задачи автоматического определения тональности и была проведена пробная реализация, которая продемонстрировала работоспособность лежащей в основе данного решения идеи.
В заключении эксплицируются результаты исследования и намечаются перспективы дальнейшей работы в области автоматического анализа имплицитного содержания текстов на ЕЯ.
В процессе исследования были выявлены типовые семантические задачи, решаемые в ходе экспертной деятельности; был сформулирован подход к имплицитной информации как к объекту моделирования; а также было осуществлено соотнесение с каждым выделяемым типом имплицитной информации определенного модуля семантического компонента системы АПТ, предназначенной для автоматизации экспертной деятельности и объективизации результатов экспертных исследований. В результате был получен комплекс, состоящий из 7 новых или модифицированных модулей, которые должны войти в семантический компонент такой системы.
Также была обоснована необходимость создания единой экспертной методики, основанной на современных достижениях лингвистической науки, которая могла бы обеспечить объективность результатов, всесторонность и полноту экспертного исследования (что предполагает, в частности, учет имплицитного плана содержания), а также представлять собой инструмент для подробного описания исследовательского процесса. В качестве основы такой методики была выбрана теория сегментной репрезентации дискурса. Была продемонстрирована возможность применения этой теории к русскоязычному материалу (в реферируемой работе 81ЖТ впервые применяется к развернутым естественным монологическим текстам на русском языке) и описали преимущества такого анализа. С точки зрения задач АПТ предлагаемая теоретическая основа методики может пониматься как общая стратегия семантического анализа, т. е. как одна из неотъемлемых составляющих семантического компонента системы. Дальнейшее развитие предложенной схемы семантического компонента, обеспечивающего процедуру извлечения имплицитной информации, предполагает детальную разработку каждого из выявленных модулей.
Помимо вышесказанного в рамках проведенного исследования была также осуществлена реализация автоматического определения тональности высказываний на платформе семейства мультиязычных систем извлечения знаний ОхЛовМтет, что демонстрирует реальную возможность использования современных прикладных лингвистических технологий для оптимизации процесса решения задач судебной семантической экспертизы.
Дальнейшее совершенствование алгоритма объектно-ориентированного определения тональности напрямую связано с совершенствованием общей модели автоматического семантического анализа входного текста.
ПУБЛИКАЦИИ
Основные результаты, полученные при выполнении диссертационного исследования, опубликованы в 6 печатных работах, включая публикацию в издании, рекомендованном ВАК.
1. Кондрашова Д. С. Опыт разработки автоматического определения тональности высказываний // Вестник Московского университета. Сер. 9. Филология. 2010. № 3. - С. 144-151.
2. Кондрашова Д. С. Теория сегментной репрезентации дискурса как средство повышения объективности семантической экспертизы текстов массовой коммуникации // Язык средств массовой информации как объект междисциплинарного исследования: Материалы 2-й Международной конференции (Москва, филологический факультет МГУ имени М.В.Ломоносова, 14-16 февраля 2008 г.) / Сост. М. Н. Володина. - М.: МАКС Пресс, 2008. - С. 187-191.
3. Кондрашова Д. С. Имплицитная информация в аспекте проблем судебной лингвистической экспертизы Н Скрытые смыслы в языке и коммуникации: Сб. науч. ст. / Ред.-сост. И. А. Шаронов. - М.: Российск. гос. гуманит. ун-т, 2007. - С. 193-214.
4. Кондрашова Д. С. Теория сегментной репрезентации дискурса для решения задач судебной лингвистической экспертизы при извлечении из текста имплицитной информации. // Компьютерная лингвистика и интеллектуальные технологии: Труды международной конференции «Диалог 2006» (Бекасово, 31 мая - 4 июня 2006 г.). / Под. ред. Н. И. Лауфер, А. С. Нариньяни, В. П. Селегея. - М.: Изд-во РГГУ, 2006. -С. 275-279.
5. Кондрашова Д. С. К проблеме классификации типов имплицитной информации. II Обработка текста и когнитивные технологии: Сборник статей. № 11. (Материалы VIII Международной конференции 'Cognitive Modelling in Linguistics', Varna, 2005). / Под ред. В. Соловьева и др. — Казань: Каз. гос. университет, 2006. -Т. 1.--С. 245-252.
6. Кондрашова Д. С. Опыт построения алгоритма интерпретации метафор на основе динамической иерархии типов. И Интерпретатор и текст: проблемы ограничений в интерпретационной деятельности: Материалы Пятых Филологических чтений (20-22 октября 2004). / Под ред. Т. А. Трштольской, М. А. Лагшо, О. А. Маркосовой. - Новосибирск: Изд. НГПУ, 2004. - Ч. II. - С. 128-134.
Отпечатано в копицентре « СТ ПРИНТ » Москва, Ленинские горы, МГУ, 1 Гуманитарный корпус, e-mail: globus9393338@yandex.ru тел.: 939-33-38 Тираж 100 экз. Подписано в печать 15.10.2010 г.
Оглавление научной работы автор диссертации — кандидата филологических наук Кондрашова, Дарья Сергеевна
ВВЕДЕНИЕ.
Глава 1. ИМПЛИЦИТНАЯ ИНФОРМАЦИЯ В СПОРНЫХ ТЕКСТАХ И ВОПРОС
АВТОМАТИЗАЦИИ ПРОЦЕССА ЕЕ ИЗВЛЕЧЕНИЯ.
Раздел 1. Исходные представления.
1. Семантическая экспертиза.
2. Имплицитное как языковой уровень выражения смысла.
3. Системы автоматического понимания текста.
4. Семантический компонент модели АПТ.
Раздел 2. Различные подходы к анализу типов имплицитной информации.
1. Типы имплицитной информации по Е. В. Падучевой.
2. Примеры системного подхода к классификации типов имплицитного.
2.1. Концепция Л. В Лисоченко.
2.2. Типология скрытых смыслов А. А. Масленниковой.
3. Разграничение типов имплицитной информации, ориентированное на решение задач судебной семантической экспертизы.
3.1. Анализ конфликтных текстов и продуктов их экспертных исследований.
3.1.1. Негативная информация и порочащие сведения.
3.1.2. Типовые вопросы экспертам.
3.1.3. Типовые семантические задачи.
3.1.4. Типы имплицитной информации, влияющие на экспертное заключение.
3.2. Что считать имплицитным?.
Раздел 3. Состав модулей семантического компонента модели, ориентированной на решение задач судебной семантической экспертизы.
1. Характер модели. Существующие ограничения.
2. МОДУЛИ семантического компонента, оказывающие поддержку экспертного анализа имплицитного плана содержания.
3. Необходимость создания методики анализа спорных текстов. 98 л
Глава 2. ОСНОВА МЕТОДИКИ АНАЛИЗА ИМПЛИЦИТНОГО ПЛАНА СОДЕРЖА
НИЯ СПОРНЫХ ТЕКСТОВ.
1. Еще немного о пресуппозициях. Новейшая история.
2. Проблема проекции пресуппозиций (Projection Problem).
3. Трактовка пресуппозиции как трехместного отношения Р. Ван дер Сандта (1988).
4. Анафорическая теория пресуппозиций Р. Ван дер Сандта (1992).
5. Модель пресуппозиционного анализа О. В. Выборновой (2002).
6. Концепция Н. Эшера и А. Ласкаридес (1998).
7. Теория сегментной репрезентации дискурса как основа методики анализа имплицитного плана содержания спорных текстов.
Глава 3. ОПЫТ РАЗРАБОТКИ АВТОМАТИЧЕСКОГО ОПРЕДЕЛЕНИЯ ТОНАЛЬНОСТИ ВЫСКАЗЫВАНИЙ В АДРЕС ПОЛИТИЧЕСКИХ ДЕЯТЕЛЕЙ.
1. Задача определения тональности.
2. Идея реализации автоматического определения тональности в рамках системы OntosMiner.
3. Этапы разработки.
4. Результаты реализации и текущее состояние модуля.
Введение диссертации2010 год, автореферат по филологии, Кондрашова, Дарья Сергеевна
Данное исследование посвящено проблеме скрытых смыслов в естественно языковых текстах и принадлежит к числу работ прикладного характера, проводимых в области лингвистической семантики.
Феномен имплицитного в языке не раз привлекал внимание лингвистов, логиков и философов. Среди отечественных ученых к ним, в частности, относятся Е. Г. Борисова, К. А. Долинин, Анна А. Зализняк, В. А. Звегинцев, Л. В. Лисоченко, Ю. С. Мартемьянов, А. А. Масленникова, И. М. Кобозева, Е. В. Падучева, Ю. К. Пирогова, а среди зарубежных авторов - П. Грайс, Дж. Р. Серль, Р. С. Сталнакер, Г. Фреге, Л. Картуннен, Е. Л. Кинэн, П. Ф. Строусон, Ч. Филлмор, Р. Ван дер Сандт, Н. Эшер и А. Ласкаридес и другие. С появлением все новых работ, направленных на постижение сущности этого феномена, концепт имплицитного становился все более и более определенным и получал более адекватное представление. Параллельно с разработкой классификаций имплицитной информации были выявлены различные аспекты имплицитного как языкового явления: неоднородность, сосуществование с эксплицитным планом выражения, извлекаемость, важность учета контекстуальной информации при анализе, градуированность степени имплицитного. Однако, несмотря на существующие подходы к пониманию этого феномена (ср., например, работы Е. В. Падучевой, Л. В. Лисоченко, А. А. Масленниковой, анализируемые в настоящем исследовании), до сих пор еще не было предложено единой концепции интерпретации имплицитно выраженного содержания, в том числе и в аспекте реализации компьютерного извлечения имплицитной информации моделями автоматического понимания текста (АПТ).
Актуальность исследования определяется, таким образом, тем, что в ходе настоящей работы предпринята попытка создания лингвистического обеспечения процедуры извлечения имплицитной информации из текста, ориентированной на реализацию системами АПТ и направленной на решение практических задач, возникающих при проведении судебных лингвистических экспертиз. В разработке лингвистического обеспечения такой процедуры и заключается конечная цель работы.
Материалом для исследования послужили тексты реальных судебных семантических экспертиз (т. е. тексты экспертных исследований, составленные экспертами), сопровождаемые текстами, подвергнутыми экспертизе (т. е. текстами, которые анализировали эксперты при проведении этих экспертиз). К рассмотрению принимались экспертные исследования монологических текстов наиболее частотного типа - анализ текста с целью выявления наличия в нем негативной информации о деятельности кого-либо.
Основным источником материала послужили экспертные исследования, любезно предоставленные сотрудниками Государственного учреждения РОССИЙСКИЙ ФЕДЕРАЛЬНЫЙ ЦЕНТР СУДЕБНОЙ ЭКСПЕРТИЗЫ ПРИ МИНИСТЕРСТВЕ ЮСТИЦИИ РОССИЙСКОЙ ФЕДЕРАЦИИ. Также в качестве источника материала была использована книга [Цена Слова 2002].
Достижение указанной цели работы с учетом специфики выбранного языкового материала для проведения исследования подразумевает решение следующих задач:
• определение современного уровня развития систем, для которых разрабатывается лингвистическое обеспечение вышеупомянутой процедуры;
• сопоставление существующих подходов к имплицитной информации и к классификации ее типов;
• выявление типовых семантических задач, решаемых в ходе экспертной деятельности;
• формулирование подхода к имплицитной информации как к объекту моделирования;
• соотнесение с каждым выделяемым типом имплицитной информации определенного модуля в составе системы АПТ;
• внесение предложений по реализации и / или собственно реализация одного или нескольких модулей в рамках произвольной и / или заданной автоматической системы.
Методы исследования. При решении данных задач использовался метод сопоставления и критического анализа существующих подходов к имплицитной информации и к классификации ее типов; проводился многоаспектный семантический анализ языкового материала: лексико-семантический, синтактико-семантический, контекстный семантический, а также формально-семантический (к анализу отдельных случаев привлекалась теория сегментной репрезентации дискурса).
Научная новизна работы заключается в том, что здесь впервые намечаются возможные пути решения проблемы автоматизированной обработки всех проявлений имплицитного плана содержания ЕЯ текста применительно к задачам судебной семантической экспертизы и предлагаются способы решения ряда подзадач этой многогранной проблемы.
Теоретическая и практическая значимость работы состоят в том, что ее результаты могут в дальнейшем иметь как теоретическое, так и практическое применение: она может быть использована специалистами в области семантической теории; лингвистами, разрабатывающими модели семантического анализа текстов на естественном языке, в частности, разработчиками систем, нацеленных на извлечение из текста скрытой информации; а также лингвистами-экспертами, проводящими семантические исследования спорных текстов.
Структура и содержание работы. Диссертационная работа состоит из настоящего введения, трех глав, заключения и приложений.
В первом разделе первой главы дается исходное представление о задачах судебной семантической экспертизы; о центральном понятии настоящего исследования — имплицитной информации; о моделях автоматического понимания текста, привлекаемых к решению проблемы имплицитного в спорных текстах; определяется место семантического компонента в структуре таких моделей.
Во втором разделе первой главы дается аналитический обзор существующих подходов к классификации типов имплицитной информации, а также предлагается разграничение типов имплицитной информации, ориентированное на решение задач судебной семантической экспертизы на основе вышеупомянутого обзора и собственно' анализа конфликтных текстов и продуктов их экспертных исследований.
В третьем разделе первой главы на основании результатов анализа языкового материала, проведенного во втором разделе, выявляется необходимый состав модулей семантического компонента модели АПТ, ориентированной на решение задач судебной семантической экспертизы, с точки зрения содержащейся в спорных текстах" имплицитной информации, а также поднимается вопрос о необходимости создания единой экспертной методики семантического анализа.
Вторая глава представляет собой разработку одного из выявленных модулей в применении к материалу текстов судебных семантических экспертиз. Здесь предложена методика анализа пресуппозиций и импликатур дискурса в спорном тексте на основе теории сегментной репрезентации дискурса (формальная динамическая теория семантической интерпретации ЕЯ-текстов, применение которой может быть реализовано системой АПТ).
В третьей главе представлено описание принципа работы реализованного автором настоящего исследования автоматического определения тональности высказываний на платформе семейства мультиязычных систем извлечения знаний (МозМтег, что является разработкой (и реализацией) еще одного из выявленных в рамках исследования необходимых модулей семантического компонента модели АПТ, ориентированной на решение задач судебной семантической экспертизы.
В заключении эксплицируются результаты исследования и намечаются перспективы дальнейшей работы в области автоматического анализа имплицитного содержания текстов на ЕЯ.
В Приложении 1 содержится краткая история понятия пресуппозиции. Эта информация соотнесена рядом отсылок со вторым разделом первой главы, а также является предпосылкой первой части второй главы.
Приложение! содержит примеры экспертного анализа, не вошедшие в текст второй главы, и служит дополнительным подтверждением типичности и частоты встречаемости выявляемых типовых семантических задач, встающих перед лингвистом-экспертом, и типов имплицитной информации, влияющих на экспертное заключение.
Также здесь содержится дополнительный иллюстративный материал к третьей главе.
Приложение 3 содержит примеры комплексов вопросов, задаваемых экспертам при назначении экспертизы по ст. 152 ГК РФ, составленные по данным материала исследования.
Приложение 4 представляет собой характеристику эмпирической базы исследования.
Приложение 5 представляет собой список используемых в тексте работы сокращений.
Заключение научной работыдиссертация на тему "Лингвистическое обеспечение процедуры извлечения имплицитной информации при проведении семантических экспертиз"
ЗАКЛЮЧЕНИЕ
Потребность в лингвистических экспертизах (особенно семантических, например, связанных с делами по защите чести и достоинства) все время возрастает, что делает разработку их методик актуальнейшей задачей. Не менее актуальным в настоящее время является автоматизация деятельности человека в различных областях. Поскольку главной подзадачей семантической экспертизы является смысловой анализ текста, то решение проблемы автоматизации экспертной деятельности следует искать в рамках проблемной области АПТ.
В настоящей работе основным центром нашего внимания являлся имплицитный пласт содержания подвергающихся экспертному исследованию текстов.
Результаты проведенного исследования. В процессе исследования были выявлены типовые семантические задачи, решаемые в ходе экспертной деятельности; был сформулирован подход к имплицитной информации как к объекту моделирования; а также было осуществлено соотнесение с каждым выделяемым типом имплицитной информации определенного модуля семантического компонента системы такой АПТ, которая могла бы использоваться для частичной автоматизации экспертной деятельности и объективизации результатов экспертных исследований.
В результате исследования был получен комплекс, состоящий из 7 новых или модифицированных модулей, которые должны войти в семантический компонент такой" системы.
Также была обоснована необходимость создания единой экспертной методики, основанной на современных достижениях лингвистической науки, которая могла бы обеспечить объективность результатов, всесторонность и полноту экспертного исследования (что предполагает, в частности, учет имплицитного плана содержания), а также представлять собой инструмент для подробного описания исследовательского процесса.
В качестве основы такой методики была выбрана теория сегментной репрезентации дискурса. Мы продемонстрировали возможность применения этой теории к русскоязычному материалу (в настоящей работе ББКТ впервые применяется к развернутым естественным монологическим текстам на русском языке) и описали преимущества такого анализа.
С точки зрения задач АПТ предлагаемая теоретическая основа методики может пониматься как общая стратегия семантического анализа, т. е. как одна из неотъемлемых составляющих семантического компонента системы.
Дальнейшее развитие предложенной схемы семантического компонента, обеспечивающего процедуру извлечения имплицитной информации, предполагает детальную разработку каждого из выявленных модулей.
Помимо вышесказанного в рамках проведенного исследования была также осуществлена реализация автоматического определения тональности высказываний на платформе семейства мультиязычных систем извлечения знаний ОпйэзМтег, что демонстрирует реальную возможность использования современных прикладных лингвистических технологий для оптимизации процесса решения задач судебной семантической экспертизы.
Результаты, полученные в ходе данной работы, могут впоследствии быть использованы и для систем, предназначенных для решения более широких задач (однако, повторимся, сейчас это не актуально, если судить по общему уровню разработанности подобных систем, - все они работают в рамках заранее определенной проблемной области (см. [Леонтьева 2006])).
Отдельно хотелось бы еще раз отметить, что в основе всей диссертационной работы лежало исследование и анализ существующих концепций понимания того, что есть имплицитный уровень выражения смысла в ЕЯ и какова его возможная типология. Очевидно, что при разработке лингвистического обеспечения процедуры извлечения имплицитной информации необходимо учитывать весь комплекс явлений, соотносимый с понятием имплицитного. Мы полагаем, что подробный обзор существующих подходов позволил нам грамотно подойти к решению данной проблемы. В результате был получен фундамент, который должен быть положен в основание модели имплицитного уровня выражения смысла средствами ЕЯ. Как отмечалось ранее в тексте работы, моделирование данного уровня чрезвычайно значимо как с теоретической, так и с практической точек зрения. В последнем случае, обеспечение возможности практического применения модели в системах синтеза / анализа речи и, шире, в системах ИИ позволит значительно улучшить результаты работы этих систем.
Автор выражает надежду, что настоящее исследование может внести вклад как в практическое решение обсуждаемых в работе задач судебной семантической экспертизы и проблем создания лингвистического обеспечения систем понимания связного текста, так и в теоретическое осмысление семантики естественного языка, в частности, касающееся имплицитного плана содержания дискурса.
Закончить данную работу нам бы хотелось словами Е. В. Падучевой, мысленно расширив понятие пресуппозиции до родового понятия имплицитной информации в данном контексте: «.понятие презумпции остается важным инструментом в системе средств семантического анализа, так что механизмы образования и использования презумпций должна моделировать любая система, предназначенная для понимания естественного языка, т.е. любая система представления смысла текста или предоставления знаний» [Падучева 1981: 29, подчеркивание наше —Д. /С].
Список научной литературыКондрашова, Дарья Сергеевна, диссертация по теме "Прикладная и математическая лингвистика"
1. Багдасарян 1983. — Багдасарян В. X. Проблема имплицитного. Ереван, 1983.
2. Баранов 2007. — Баранов А. Н. Лингвистическая экспертиза текста: теория и практика: учеб. пособие. М.: Флинта: Наука, 2007.
3. Баранов, Кобозева 1983. Баранов А. Н., Кобозева И. М. Семантика общих вопросов в русском языке (категория установки) II Изв. АН СССР. Сер. лит. и яз. 1983. № 3. С. 263-274.
4. Бахтин 1997. — Бахтин М." М. Проблема речевых жанров.I М. М. Бахтин. Собрание соч. в 7 томах. Т 5. - М.: Русские словари, 1997.
5. БТС. Большой толковый словарь русского языка I Гл. ред. С. А. Кузнецов. СПб.: «Норинт», 2002.
6. Булыгина, Крылов 1990. Т. В. Булыгина, С. А. Крылов. Категория языковая. II Лингвистический энциклопедический словарь. Гл. ред. В. Н. Ярцева. М.: «Советская энциклопедия», 1990.
7. Возможности производства судебной экспертизы. 2004. И. М. Кобозева,
8. Выборнова 2002. — Выборнова О. В. Пресуппозиционный компонент общения и его прикладное моделирование. II Труды международного семинара Диалог'2002 по компьютерной лингвистике и ее приложениям. Том 1. Теоретические проблемы, с.63-67. М., 2002.
9. Грайс 1985. — П. Грайс. Логика и речевое общение. // Новое в зарубежной лингвистике. Вып. XVI: Лингвистическая прагматика, с.217-237. М., Прогресс, 1985.
10. Демьянков 1989. — Демьянков В. 3. Интерпретация, понимание и лингвистические аспекты их моделирования на ЭВМ. М.: Изд-во Моск. ун-та, 1989. 172 с.
11. Долинин 1983. — Долинин К. А. Имплицитное содержание высказывания. И Вопросы языкознания. № 6, с.37-47. 1983.
12. Звегинцев 1976. — Звегинцев В. А. Предложение и его отношение к языку и речи. М.: МГУ, 1976.
13. Иванкова 2007. Иванкова И. В. Реализация категории имплицитности в современном русском художественном тексте (на фоне немецкого языка): Автореф. дис. . канд. филол. наук. Волгоград: 2007.
14. Имплицитность в языке и речи.1 Имплицитность в языке и речи. / Отв. ред. Е. Г. Борисова, Ю. С. Мартемьянов. — М: «Языки русской культуры», 1999.
15. Катц 1981. Дж. Катц. Семантическая теория. II Новое в зарубежной лингвистике. Вып. X, с.33-49. М., Прогресс, 1981.
16. Кобозева 1986. — Кобозева И. М. Перформативность глагола и его лексическое значение. И Linuistishe Arbeitsberichte. В. 54/55. Leipzig, 1986, s.176-189
17. Кобозева 2000. — Кобозева И. М. Лингвистическая семантика. М., Эдиториал УРСС, 2000.
18. Кобозева, Лауфер 1988. — Кобозева И. М., Лауфер Н. И. Об одном способе косвенного информирования. Изв. АН СССР, сер. лит. и яз., 1988, №3.
19. Кобозева, Лауфер 1994. — Кобозева И. М., Лауфер Н. И. Интерпретирующие речевые акты // Логический анализ языка. Язык речевых действий. / Под ред. Н. Д. Арутюновой, Н. К. Рябцевой. М.: Наука, 1994. С. 63-71.
20. Кондаков 1975. Кондаков Н. И. Логический словарь-справочник. М.: Наука, 1975.
21. Лисоченко 1992. Лисоченко Л. В. Высказывания с имплицитной семантикойлогический, языковой и прагматический аспекты). Ростов-на-Дону, 1992. Масленникова 1999. —Масленникова A.A. Лингвистическая интерпретация скрытых смыслов. СПб, 1999.
22. Нефедова 2001. — Нефедова Л. А. Когнитивно-деятелъностный аспект импликативнойкоммуникации / Челяб. гос. ун-т. Челябинск, 2001. 151 с. Падучева 1976. ПадучеваЕ. В. Понятие презумпции в лингвистической семантике.
23. И Семиотика и информатика. Вып. 8, с.91-124. М., ВИНИТИ, 1976. Падучева 1981. — Падучева Е. В. Презумпции и другие виды неэксплицитной информации.
24. Серль 1986. Дж. Р. Серль. Что такое речевой акт? И Новое в зарубежной лингвистике.
25. Вып. XVII, с.151-169. М., Прогресс, 1986. Сталнакер 1970. — Столнейкер Р. С. Прагматика. II Новое в зарубежной лингвистике. Вып. XVI. Лингвистическая прагматика. / Общ ред. Е. В. Падучевой. С. 399-405. М., «Прогресс», 1985.
26. Тагильцева 2006. Тагильцева Ю. Р. Субъективная модальность и тональность в политическом интернет-дискусе: Автореф. дис. . канд. филол. наук. Екатеринбург: 2006.
27. Фреге 1997. — Г. Фреге. Смысл и денотат. // Семиотика и информантика. Вып. 35 'Opera selecta', с.352-379. М., «Языки русской культуры», 1997.
28. Хворостин 2006. — Хворостин Д. В. Скрытые компоненты смысла высказывания: принцип выявления: Автореф. дис. канд. филол. наук. Челябинск: 2006.
29. Хоанг Фэ 1985. — ХоангФэ. Семантика высказывания. //Новое в зарубежной лингвистике. Вып. XVI. Лингвистическая прагматика. / Общ ред. Е. В. Падучевой. С. 399-405. М., «Прогресс», 1985.
30. ЦС2002. Цена слова: Из практики лингвистических экспертиз текстов СМИ в судебных процессах по защите чести, достоинства и деловой репутации. / Под ред. проф. М. В. Горбаневского — 3-е изд., испр. и доп. М., «Галерия», 2002.
31. Шендельс 1977. — ШендельсЕ. И. Имплицитностъ в грамматике И Вопросы романо-германской филологии: Синтаксическая семантика: Сборник научных трудов Московского гос. пед. ин-та им. Мориса Тореза. М., 1977. Вып. 112.
32. Asher 1993. Asher, N. Reference to Abstract Objects in Discourse. Dordrecht, Kluwer Academic Publishers, 1993.
33. Asher, Lascarides 1998. — Asher, N. & Lascarides, A. The Semantics and Pragmatics of Presupposition. II Journal of Semantics. Vol.15. № 3, pp.239-299. 1998.
34. Asher, Lascarides 2003. Asher, N. & Lascarides, A. Logics of conversation. Cambridge etc.: Cambridge university press, 2003.
35. Atlas 1977. Atlas, J. Negation, ambiguity, and presupposition. II Linguistics and Philosophy, № l,pp. 321-336, 1977.
36. Clark 1977. Clark, H. H. Bridging. I I Thinking: Readings in Cognitive Science. Johnson-Laird, P. N. and Wason, P. S. (eds.), pp. 411-420. Cambridge university press, 1977.
37. Fillmore 1969. — Fillmore, C. Types of lexical information. II Studies in Syntax and Semantics. Kiefer, F. (ed). NY, Humanities Press, 1969.
38. Gazdar 1979. — Gazdar, G. Pragmatics, Implicature, Presupposition, and Logical Form. NY, Academic Press, 1979.
39. Kamp, Reyle 1993. Kamp, H. & Reyle, U. From Discourse to Logic: Introduction to Modeltheoretic Semantics of Natural Language, Formal Logic and Discourse Representation Theory. Dordrecht, Kluwer Academic Publishers, 1993.
40. Kamp & Reyle reviewed 1995. Kamp, Reyle 1993] reviewed by V. Akman // Computational Linguistics. Vol. 21. № 2. 1995.
41. Karttunen 1973. — Karttunen, L. Presuppositions of compound sentences. II Linguistic Inquiry, №4, pp. 167-193, 1973.
42. Karttunen 1974. — Karttunen, L. Presuppositions and linguistic context. II Theoretical Linguistics, № 1, pp. 181-194, 1974.
43. Karttunen & Peters 1976. — Karttunen, L. & Peters, S. What indirect questions conventionally implicate. II Papers from the Xll-th Regional meeting of the Chicago linguistic Society. Chicago, 1979.
44. Karttunen & Peters 1979. Karttunen, L. & Peters, S. Conventional implicature. II Syntax and Semantics 11: Presupposition. Oh, C.-K. & Dinneen, D. (eds). NY, Academic Press, 1979.
45. Katz, Fodor 1964. -Katz, J. J. & Fodor, J. A. The Structure of a Semantic Theory. II The Structure of Language / Ed. by J. A. Fodor, J. J. Katz. Englewood Cliffs, 1964.
46. Keenan 1971. — Keenan, E. L. Two kinds of presupposition in natural language. II Studies in Linguistic Semanics. Fillmore, Ch. J. & Langendoen, D. T. (eds.). NY, Academic Press, 1971.
47. Keenan 1972. — Keenan, E. L. On semantically based grammar. II Linguistic Inquiry, № 3, pp. 413-461, 1972.
48. Mann & Thompson 1987. Mann, W. C. & Thompson, S. A. Rhetorical Structure> Theory: A Frameworkfor the Analysis of Texts. IIIPRA Papers in Pragmatics, Vol. 1, 1987.
49. Reyle 1993. — Reyle, U. Dealing with Ambiguities by Underspecijication: Construction, Representation and Deduction. II Journal of Semantics. Vol.10. № 2, pp.123-179. 1993.
50. Sellars 1954. Sellars, W. Presupposing. // Philosophical Review, № 63, pp. 197-215, 1954.
51. Seuren 1985. Seuren, P. A. M. Discourse Semantics. Oxford, Blackwell, 1985.
52. Soames 1979. — Soames, S. A projection problem for speaker presuppositions. II Linguistic Inquiry, № 10, pp. 623-666, 1979.
53. Soames 1982. — Soames, S. How presuppositions are inherited: a solution to the projection problem. II Linguistic Inquiry, № 13, pp. 483-545, 1982.
54. Sperber & Wilson 1986. Sperber, D. & Wilson, D. Relevance. Blackwells, 1986.
55. Stalnaker 1973. — Stalnaker, R. C. Presuppositions. I I Journal of Philosophical Logic, № 2, pp. 447-457, 1973.
56. Stalnaker 1974. Stalnaker, R. C. Pragmatic presuppositions. II Semantics and Philosophy. Munits, M. K. & Unger, P. K. (eds). NY University Press, 1974.
57. Strawson 1952. — Strawson, P. F. Introduction To Logical Theory. L., 1952.
58. Van der Sandt 1988. — Van der Sandt, Rob A. Context and presupposition. London, Groom Helm, cop. 1988.
59. Van der Sandt 1992. — Van der Sandt, Rob A. Presupposition projection as anaphora resolution. II Journal of Semantics. Vol. 9. № 4, p.333-377. 1992.
60. Van Fraassen 1968. Van Fraassen, В. С. Presupposition, implication and self-reference.
61. Journal of Philosophy, № 65, pp. 136-152, 1968. Wilson 1975. — Wilson, D. M. Presupposition and Non-Truth-Conditional Semantics. NY, Academic Press, 1975.
62. Аллюзия — Электронная энциклопедия "Кругосвет", 2001. http://www.kxugosvet.ru/articles /76/1007655/1007655а1 .htm