автореферат диссертации по филологии, специальность ВАК РФ 10.02.21
диссертация на тему: Лингвистические методы атрибуции и датировки литературных произведений
Полный текст автореферата диссертации по теме "Лингвистические методы атрибуции и датировки литературных произведений"
ооз
На правах рукописи УДК 81'32
РОДИОНОВА Елена Сергеевна
ЛИНГВИСТИЧЕСКИЕ МЕТОДЫ АТРИБУЦИИ И ДАТИРОВКИ ЛИТЕРАТУРНЫХ ПРОИЗВЕДЕНИЙ (К ПРОБЛЕМЕ «КОРНЕЛЬ - МОЛЬЕР»)
Специальность 10 02 21 - прикладная и математическая лингвистика
АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата филологических наук
%
Санкт-Петербург 2008
1 6 кюн 2003
003172028
Работа выполнена на кафедре математической лингвистики Федерального государственного образовательного учреждения высшего профессионального образования «Санкт-Петербургский государственный университет»
Научный руководитель доктор филологических наук, профессор
МАРУСЕНКО Михаил Александрович
Официальные оппоненты доктор филологических наук, профессор
БЕЛЯЕВА Лариса Николаевна
кандидат филологических наук, старший научный сотрудник ДМИТРИЕВА Нина Львовна
Ведущая организация Балтийский государственный технический
университет «Военмех» им Д Ф. Устинова
Защита состоится «//» Циокя 2008 г в /У ч на заседании диссертационного совета Д 212.199.17 по защите диссертаций на соискание ученой степени доктора наук в Российском государственном педагогическом университете им А И Герцена по адресу. 191186, г Санкт-Петербург, наб р Мойки, д. 48, корп. 14, ауд 314
С диссертацией можно ознакомиться в фундаментальной библиотеке Российского государственного педагогического университета им А И Герцена
Автореферат разослан « &» ÁACL& 2008 г.
Ученый секретарь диссертационного совета доктор филологических нау] профессор
Л. А. Пиотровская
Общая характеристика работы
Реферируемая диссертация посвящена разработке языковедческой теории в области атрибуции и датировки литературных произведений на материале стихотворных пьес, приписываемых Мольеру.
Вопрос об авторстве комедий, опубликованных под псевдонимом Мольера, был поднят в начале XX века и на сегодняшний день широко обсуждается как во Франции, так и за ее пределами. Согласно существующим гипотезам, в число возможных авторов пьес, приписываемых Мольеру, входят такие известные французские драматурга, как П Корнель и Ф Кино. В разные годы исследователи творчества Мольера приводили различные литературные и биографические доводы, подтверждающие ту или иную точку зрения [Р Louys, H Poulaille, H. Wouters, G Forestier] Наиболее жаркие дебаты разгорелись вокруг возможного написания П Корнелем лучших комедий в стихах, приписываемых Мольеру Гипотеза о принадлежности перу П Корнеля произведений, приписываемых Мольеру, в трудах различных исследователей стала традиционно обозначаться как проблема «Корнель - Мольер» Одно из последних исследований этой проблемы было проведено Д Лаббе, чья работа базируется на изучении лексического состава языка обоих писателей Однако анализ одного лишь лексического уровня не может служить достаточно достоверным основанием для атрибуции текстов, поскольку именно лексический состав языка, связанный с темой повествования, лучше всего поддается имитации. Возникла ситуация, когда лингвистическая задача не может быть решена методами, базирующимися исключительно на филологическом анализе, или с использованием методов количественного описания лексического состава текстов.
Описание индивидуальных авторских стилей с целью перевода информации, содержащейся в неформализованном виде в тексте, на формализованный искусственный язык на основе математической статистики заключается в выявлении специфических языковых признаков текста и использовании строгих правил параметризации [H А Морозов, В В Виноградов, П Вашак, И. П. Севбо, JI В Милов, Ю В Сидоров и др.] Параметризация стихотворных текстов XVII века на французском языке с использованием априорного словаря параметров синтаксического уровня представляет собой особую лингвистическую задачу
Вопрос датировки пьес, приписываемых Мольеру, неизменно возникает при рассмотрении проблемы авторства При установлении времени написания литературных произведений возможны различные приемы, связанные с графологическим и лексическим анализами [Д. С. Лихачев, К Ф Тарановский, M И Шапир] На сегодняшний день отсутствуют универсальные методики датировки, основанные на математическом описании авторских стилей
Актуальность темы исследования определяется проблематикой, связанной с математическим моделированием текстов при помощи многомерных классификаций и с автоматизацией лингвистических исследований. В диссертации методы математического моделирования и количественного описания индивидуально-авторских стилей на синтаксическом уровне нашли свое применение при решении проблемы «Корнель - Мольер» Особое значение работа приобретает в связи с возросшим за последнее время интересом к проблеме «Корнель - Мольер» и большой значимостью вопроса об истинном авторстве комедий, приписываемых Мольеру, как для французской литературы, так и для мировой культуры в целом
Актуальность исследования связана также с разработкой нового математического метода датировки на основе стилеразличающих синтаксических параметров с учетом тренда параметров индивидуального авторского стиля, под которым в данной работе понимается основная тенденция изменения параметров индивидуального авторского стиля на протяжении литературного творчества писателя, очищенная от случайных влияний и индивидуальных особенностей отдельных периодов С помощью нового метода датировки в работе осуществляется датировка стихотворных пьес, приписываемых Мольеру, и проверяется выдвинутая автором гипотеза о существовании тренда параметров индивидуального авторского стиля
Таким образом, диссертационная работа, посвященная атрибуции и датировке стихотворных пьес, приписываемых Мольеру, соответствует современной научной проблематике и является актуальной
Теоретической основой исследования являются следующие положения Индивидуальный авторский стиль представляет собой сложную иерархическую систему и должен описывагься набором стилеразличающих параметров методом многомерной классификации. Проблема атрибуции анонимных и псевдонимных текстов представляет собой одну из задач распознавания образов [С Ватанабе, М А. Марусенко]
В настоящее время стиль рассматривается прежде всего как категория структурно-синтаксическая [А И Ефимов, И. П. Севбо, Г. М Мартыненко] Особенности индивидуального авторского стиля наиболее отчетливо проявляются в синтаксисе в отборе конструкций, их расположении и объединении в сложное целое
Индивидуальный авторский стиль может меняться как с годами, так и в зависимости от жанра [И. П Севбо, М. А. Марусенко] Проблема датировки может решаться как задача ранжирования многомерных математических моделей с учетом тренда параметров индивидуального авторского стиля
Объектом исследования являются характеристики индивидуальных авторских стилей Мольера, П Корнеля и Ф Кино
Предметом исследования в данной работе является установление авторства и датировка спорных произведений, приписываемых Мольеру
В диссертации выдвигаются три гипотезы.
1 Сложная атрибуционная гипотеза
- тексты стихотворных пьес, приписываемых Мольеру, полностью принадлежат Мольеру (нулевая гипотеза);
- тексты стихотворных пьес, приписываемых Мольеру, полностью принадлежат П Корнелю (первый вариант альтернативной гипотезы);
- тексты стихотворных пьес, приписываемых Мольеру, являются произведениями П Корнеля, Ф Кино и одного или нескольких неизвестных авторов (второй вариант альтернативной гипотезы)
2 Существует тренд параметров индивидуального авторского стиля, выражающийся в том, что на протяжении литературного творчества писателя значения параметров устойчиво изменяются в одном направлении
3 Стихотворные пьесы, входящие в театр Мольера, были написаны ранее, чем предполагалось
Основная цель работы состоит в применении математического метода атрибуции анонимных и псевдонимных произведений для решения проблемы «Корнель - Мольер» Другой целью работы является разработка математического метода датировки и установление действительной последовательности написания спорных стихотворных пьес
Достижение поставленных целей предполагает решение следующих конкретных задач
1 ) провести обзор состояния проблемы «Корнель - Мольер», выбрать объект атрибуции и сформировать атрибуционную гипотезу,
2) сравнить и систематизировать существующие лингвистические методы атрибуции с целью обоснования применения математического метода атрибуции анонимных и псевдонимных произведений, основанного на теории распознавания образов,
3) сформировать априорные классы и априорный словарь параметров с перечислением правил параметризации стихотворных текстов XVII века на французском языке с примерами для каждого параметра,
4) с помощью специально разработанного программного обеспечения определить информативный набор параметров, обеспечивающих разбиение объектов на классы, и создать математические модели анализируемых текстов путем описания объектов на языке информативных параметров,
5) осуществить проверку атрибуционной гипотезы,
6) изучить существующие лингвистические методы датировки и разработать универсальный алгоритм датировки литературных произведений,
7) установить последовательность написания стихотворных пьес, приписываемых Мольеру, с помощью нового метода датировки литературных произведений.
Материалом для данного исследования стали следующие тексты.
1)13 комедий в стихах, приписываемых Мольеру ("L'Étourdi", "Le dépit amoureux", "Sganarelle", "Dom Garcie de Navarre", "L'École des maris", "Les
Fâcheux", "L'École des femmes", "La Princesse d'Élide", "Tartuffe", "Le Misanthrope", "Méhcerte", "Pastorale comique", "Les Femmes savantes"),
2) 11 комедий в стихах П Корнеля ("Méhte", "La Veuve", "La Galerie du Palais", "La Suivante", "La Place royale", "Comédie des Tuileries", "L'Illusion comique", "Le Menteur", "La Suite de Menteur", "Don Sanche d'Arago", "Tite et Bérénice"),
3) 3 комедии в стихах Ф Кино ("Les Rivales", "L'Amant Indiscret", "La Mere Coquette")
Методы исследования. В работе изучаются возможности применения математических и прикладных методов к исследованию языка и используется семиотическое и математическое моделирование естественного языка на основе теории вероятностей и математической статистки Кроме того, в работе применяются методы обработки данных, стилеметрии, лингвостатистики, системно-описательный метод, а также методы филологического анализа, в частности методы анализа состава и структуры предложения
Основные положения, выносимые на защиту.
1. Стихотворные пьесы, приписываемые Мольеру, являются произведениями П Корнеля ("Le dépit amoureux", "Sganarelle", "L'Ecole des maris", "Les Fâcheux", "L'École des femmes", "Tartuffe", "Le Misanthrope", "Méhcerte", "Pastorale comique", "Les Femmes savantes"), Ф Кино ("L'Étourdi) и неизвестного автора ("Dom Garcie de Navarre", "La Princesse d'Élide").
2. Предложенная методика определения значений параметров на материале текстов XVII века на французском языке позволяет решать задачу определения авторства анонимных и псевдонимных текстов данного периода
3 Существует тренд параметров индивидуального авторского стиля, выражающийся в том, что на протяжении литературного творчества писателя значения параметров устойчиво изменяются в одном направлении
4. Метод датировки на основе стилеразличающих синтаксических параметров, предложенный в работе, позволяет решать задачи по установлению последовательности написания литературных текстов и может использоваться в дальнейших исследованиях
5 В результате датировки спорных пьес, атрибутированных П Корнелю и Ф Кино, подтверждена гипотеза о более раннем написании стихотворных пьес, входящих в театр Мольера
Научная новизна работы заключается в следующем
- осуществлена атрибуция стихотворных пьес, приписываемых Мольеру, методами математического анализа текстов с применением теории распознавания образов,
- разработаны правила параметризации текста на материале текстов XVII века па французском языке,
- выявлены новые возможности автоматизации лингвистического исследования в области установления авторства,
- разработан метод датировки литературных произведений,
- новый метод датировки применен при установлении последовательности написания пьес, приписываемых Мольеру
Теоретическая значимость проведенного исследования заключается в том, что в нем решена проблема авторской принадлежности текстов классиков французской литературы Результаты исследования способствуют развитию математических и прикладных методов изучения языка и вносят вклад в развитие теории и практики атрибуции литературных произведений методами распознавания образов, а также теории и практики датировки литературных произведений математическими методами
Практическая значимость исследования состоит в возможности использования полученных данных о составе априорного словаря параметров в качестве примера при составлении правил параметризации текстов на французском материале Полученные данные о существовании тренда параметров индивидуального авторского стиля могут использоваться в дальнейших работах по определению последовательности написания литературных произведений с целью их датировки
Рекомендации по использованию результатов исследования. Полученные в ходе работы результаты можно использовать при чтении специальных курсов «Анализ данных» и «Лингвистические методы атрибуции анонимных и псевдонимных произведений», а также курсов по прикладной лингвистике, квантитативной стилистике и истории французской литературы
Апробация работы. Основные положения диссертационного исследования обсуждались на заседаниях кафедры математической лингвистики филологического факультета Санкт-Петербургского государственного университета (2005-2007 гг ) и прошли апробацию в ряде докладов, прочитанных на XXXV и XXXVI Международных филологических конференциях (СПбГУ, 2006-2007), на Всероссийской научной конференции «Квантитативная лингвистика исследования и модели» (Новосибирск, 2005), Всероссийской научной конференции с международным участием «Актуальные проблемы теоретической и прикладной лингвистики и оптимизация преподавания иностранных языков» (Тольятти, 2005), на Международной научной конференции «МедаЬт§'2007 Горизонты прикладной лингвистики и лингвистических технологий» (Украина, Партенит, 2007), а также получили отражение в 7 публикациях общим объемом 2 п л.
Объем и структура работы. Диссертационное исследование содержит 183 страницы машинописного текста, оно состоит из введения, четырех глав с выводами в конце каждой, заключения, библиографии, включающей 128 наименований, из них 46 на иностранных языках, и списка источников Основные результаты исследования обобщены в 41 таблице и 1 рисунке В качестве приложения приводятся таблицы, описывающие состав театров Мольера, П. Корнеля и Ф Кино.
Построение работы определяется целями, задачами и материалом исследования.
Основное содержание работы
Во введении обосновывается актуальность исследования, дается обзор последних работ по его проблематике, определяются объект, предмет, гипотезы, цель задачи и материал исследования, перечисляются методы исследования, раскрывается его научная новизна, теоретическая и практическая значимость, предлагаются рекомендации об использовании его результатов, формулируются положения, выносимые на защиту
В первой главе «К истории вопроса» произведен обзор состояния проблемы «Корнель — Мольер», выбран объект атрибуции и сформирована атрибуционная гипотеза
Проблема «Корнель - Мольер» была впервые затронута в 1919 году известным французским поэтом П Луи, большим знатоком поэзии XVII века Досконально изучив творчество великого французского драматурга П Корнеля (1606-1684), автора 34 стихотворных пьес, он неожиданно для себя обнаружил большое сходство его стихов со стихами другого знаменитого драматурга Ж-Б Поклена (1622-1673), работавшего под псевдонимом Мольер Театр Мольера составляют 33 произведения, написанных как в стихотворной, так и в прозаической форме Исходя из стилистических характеристик работ двух драматургов, он приписал П Корнелю работу над такими шедеврами Мольера, как "Le Misanthrope". "L'École des femmes", "Tartuffe", "Dom Juan". П Луи высказал предположение, что одной из причин, по которой П Корнель мог отказаться от своих произведений в пользу актера Мольера, было его желание рассказать в комедиях о своей любви, жизни, чувствах, но сделать это анонимно, не раскрывая истинного своего имени
Основные тезисы, намеченные в статьях П Луи, были доработаны и обоснованы в 1957 году в книге романиста А Пулайля «Корнель под маской Мольера» А Пулайль пишет альтернативную биографию Мольера, начиная с его раннего детства Исследователь сопоставляет факты биографий Мольера и П. Корнеля и доказывает возможность и несомненность этого творческого союза В качестве основной причины, побудившей величайшего поэта своего времени П. Корнеля воспользоваться услугами Мольера, А Пулайль называет желание П Корнеля свести счеты со своими многочисленными врагами, изобразив их в злободневных сатирических пьесах
Эта работа не нашла в свое время отклика ни у простых почитателей таланта Мольера и П. Корнеля, ни у профессиональных мольеристов и корнелистов, и до 1990 года, когда проблема авторства театра Мольера была вновь поднята двумя адвокатами из Брюсселя, И Вутером и К де Билль де Гуйе, лишь немногие исследователи французской литературы XVII века слышали о гипотезе П Луи
В своей работе И Вутер и К. де Вилль де Гуйе подробно останавливаются на идейно-стилистических характеристиках таких пьес, как "Les Précieuses ridicules", "Les Fâcheux", "L'École des femmes", "Tartuffe",
"Dom Juan", "Amphitryon", и, принимая во внимание также историю написания этих пьес, доказывают невозможность авторства Мольера Создание длинного списка работ, подписанных Мольером, потребовало бы от него усиленной работы с утра до вечера, но Мольер никак не располагал таким количеством времени, поскольку постоянно работал в качестве директора театра, режиссера-постановщика и актера Исследователи указывают также на затрудненное финансовое положение II Корнеля, связанное с зависимостью от королевских денежных выплат Именно финансовая зависимость от двора, по их млению, заставила П Корнеля высмеивать своих врагов под чужим псевдонимом Помимо П Корнеля, в числе возможных авторов, работавших под именем Мольера, они называют драматурга Ф. Кино, чей стиль близок комедиям-балетам, приписываемым Мольеру
В приложении к этой книге находится работа выдающегося этнолога Ф Вернауда Проведя лексикографическое и стилистическое исследование пьес, он обнаружил большое сходство текстов Корнеля и Мольера сходство словаря, стихосложения и стиля Например, в пьесах Мольера им были обнаружены нормандские термины и большое число терминов и выражений, связанных с юриспруденцией, которые мог использовать только П Корнель, житель Руана и блестящий юрист Кроме того, в них содержатся цитаты из мало известных произведений на латыни и ссылки на религиозную литературу, которая отсутствует в библиотеке Мольера и которую, несомненно, хорошо изучил набожный П Корнель. Между текстами пьес Мольера и П Корнеля Ф Вернауд находит такие совпадения, как ссылки на Аристотеля и Горация, упоминания Армении или армян, использование редкого имени Никандр и другие
Современные литературоведы и театральные деятели отзываются об этих исследованиях очень критично и приводят свои контраргументы Наиболее полный критический обзор основных положений сторонников сотрудничества Мольера и П Корнеля был проведен заведующим кафедрой исследований театра XVII века в Сорбонне Ж Форестье По его мнению, театр Мольера является достаточно однородным по своему составу, несмотря на обилие жанровых подвидов в любой большой комедии Мольера можно найти влияние фарсов. Способность Мольера писать большое количество пьес в сжатые сроки Ж Форестье объясняет тем, что многие из его работ представляют собой короткие дивертисменты и написаны в прозе
Однако у сторонников атрибуции П. Корнелю пьес Мольера, помимо идейно-стилистических и биографических аргументов, появилось первое математическое доказательство
В 2001 году профессор Института политических исследований в Гренобле, специалист по анализу речи Д Лаббе предложил математический метод атрибуции, заключающийся в вычислении «межтекстового расстояния». В 2003 году он применил новый метод при исследовании лексического состава театров Мольера и П Корнеля Вычисление
«межтекстового расстояния» позволило ему атрибутировать П. Корнелю около 18 комедий, подписанных Мольером
Исследование Д Лаббе получило широкую огласку во Франции и за ее пределами и вызвало огромный интерес со стороны специалистов различных областей знаний - как математиков, так и литературоведов. Кроме того, работа Д Лаббе послужила толчком к новым исследованиям проблемы авторства театра Мольера
В 2003 году гипотеза тайного сотрудничества Мольера и П Корнеля была подтверждена результатами расследования Ф Видаля, проведенного на основе анализа биофафических данных двух драматургов
Еще через год вышла в свет книга Д Буасье, представляющая собой наиболее полное и структурированное досье по делу Мольера Вслед за предыдущими исследователями творчества Мольера и П Корнеля, Д Буасье утверждает, что пьесы, составляющие его театр, были получены им тремя путями часть пьес была составлена его сотрудниками из французских, испанских и итальянских комедий, другая часть была куплена у различных поэтов, нуждавшихся в деньгах, или у их вдов, и, наконец, какая-то часть пьес была заказана у П Корнеля
Гипотеза о тайном сотрудничестве Мольера и П Корнеля стала столь популярна, что официально вошла в историю литературы: в 2005 году в учебное пособие по истории французской литературы был включен соответствующий параграф под заголовком «Написал ли Корнель пьесы Мольера7»
Проведенный обзор истории вопроса атрибуции театра Мольера свидетельствует о все возрастающем интересе к данной проблеме и о существовании разных подходов к ее решению
В реферируемом исследовании, исходя из требования соблюдения жанрово-стилевой однородности текстов, в класс атрибутируемых объектов были включены 13 комедий в стихах, приписываемых Мольеру (см с 5)
При формировании атрибуционной гипотезы в число возможных авторов М01ут быть включены драматурги Мольер, П Корнель, Ф Кино и неопределенное число неизвестных авторов Литературно-критическая атрибуционная гипотеза может быть сформулирована следующим образом
Нулевая гипотеза (Н0) тексты стихотворных пьес, приписываемых Мольеру, полностью принадлежат Мольеру
Альтернативная гипотеза имеет следующий вид
тексты стихотворных пьес, приписываемых Мольеру, полностью принадлежат П. Корнелю,
(Но) тексты стихотворных пьес, приписываемых Мольеру, являются произведениями П Корнеля, Ф Кино и одного или нескольких неизвестных авторов В этом случае необходимо определить число авторов и возможную долю участия каждого из них
Вторая глава носит название «Методы атрибуции» В ней произведен анализ субъективных и объективных методов атрибуции, рассмотрены методы атрибуции, основанные на анализе лексики и синтаксических структур, изучены некоторые аспекты применения автоматической обработки данных и обосновано применение математического метода атрибуции анонимных и псевдонимных работ
Долгое время в практике атрибуции доминировали историко-докумептальные и филологические методы исследования Для выявления авторских особенностей применялась субъективная методика атрибуции, в соответствии с которой субъективно отбирались внешние детали авторского стиля, такие как любимые слова, термины, выражения
Первым отечественным ученым, использовавшим математический аппарат для решения задачи атрибуции, считается Н А Морозов, опубликовавший в 1915 г статью «Лингвистические спектры» В отличие от предшествующих исследователей, филологов-классиков, опиравшихся при атрибуции на частоту употребления знаменательных слов, Н А Морозов полагал, что для индивидуального стиля писателя показательными являются именно служебные слова, поскольку они никак не связаны с темой и содержанием книги Метод, предложенный Н. А. Морозовым, лег в основу многих исследований по лексическому составу языка писателей, однако не может служить основой для полного достоверного стилистического исследования, поскольку не выходит за рамки лексического анализа и состава предложения Критические обзоры метода и результатов исследования Н А Морозова были сделаны А А Марковым и В Э Сеземаном
В классификации методов атрибуции, предложенной академиком В В Виноградовым, были противопоставлены субъективные и объективные принципы, применяемые в целях атрибуции В этой работе группа объективных принципов выделялась в рамках традиционной лингвистики, а объективным лингвостатистическим методам атрибуции отводилась лишь вспомогательная роль, поскольку к началу 60-х годов XX века отсутствовали эффективные методы атрибуции, основанные на формальном математическом аппарате
С 60-70-х годов XX века при описании индивидуального стиля лингвоматематические методы стали применяться все шире, благодаря чему накапливались данные о свойствах единиц языка и формировался специальный научный аппарат атрибуции текстов Работы А Л Гришунина, А Якубайтис, А Н. Скляревича, А П Василевича посвящены применению методов статистики к лексике и грамматике
Использование специально разработанных индексов для оценки лексической структуры текста было обусловлено стремлением разработать новый универсальный аппарат для объективного анализа лексики Многие ученые разрабатывают новые оценки лексического состава, отличающиеся теми или иными недостатками, не рассматривая уже готовые, существующие решения в смежных областях знания, например в математике, где для
описания объектов различной природы давно и успешно применяется теория распознавания образов
Опыт квантитативно-лингвистических исследований был обобщен в монографии Ю Тулдавы в 1987 году В этой работе Ю Тулдава сформулировал два основных принципа изучения лексики в квантитативном аспекте принцип системности и вероятностно-статистический характер организации лексики, а также высказал идею о связи признаков, которая явилась предпосылкой для разработки математического аппарата оценки связей между параметрами.
Одно из последних исследований по атрибуции текстов, основанных на лексическом анализе, было проведено Д Лаббе, предложившим в 2001 году формулу вычисления «межтскстового расстояния», которое подразумевает анализ лексического состава двух текстов и определение меры их близости или удаленности друг от друга по следующей формуле
У4ал)
(1)
где ш - частота вокабулы г из множества А, £„(„) - математическое ожидание вокабулы г
В работах Д Лаббе лексический анализ текстов происходит с помощью автоматической процедуры морфологического анализа, в соответствии с которой каждое слово представляется в виде записи, состоящей из трех компонентов словоформы, вокабулы и соответствующей части речи По полученным данным вычисляется «межтекстовое расстояние», и результаты отображаются в виде древовидной классификации Исследования Д Лаббе обнаруживают серьезные недостатки методологического и статистико-вероятностного характера, связанные в первую очередь с недостоверностью результатов атрибуции, осуществленной на основе анализа одного лишь лексическою уровня При стилистическом анализе в целях атрибуции изучение лексического состава текста должно быть дополнено данными и о других языковых уровнях, и в первую очередь - о синтаксической структуре анализируемого текста
В 70-е - 80-е годы XX века в отечественной лингвистике был проведен ряд исследований, посвященных квантитативно-структурному изучению текстов на синтаксическом уровне Методы стилистической диагностики, основанные на анализе графов синтаксических связей, представлены в исследованиях И П Севбо и Г Я Мартыненко Диагностические параметры, предложенные И 11 Севбо, и меры сложности, анализируемые в работах Г Я Мартыненко, связаны с характеристиками предложения, а не текста, но именно анализ текста должен лежать в основе эффективной методики фиксации авторского стиля
Период с конца 70-х годов XX века до настоящего времени отмечен бурным развитием вычислительной техники и программного обеспечения, в связи с чем все больше исследователей проявляют интерес к применению
компьютерной обработки данных при анализе текстов, как в синтаксическом, так и в грамматическом, лексическом аспектах Одна из первых методик установления авторства, основанная на анализе текста с автоматизированным получением частотных словарей и статистических данных, была предложена в работе норвежского филолога Г Хетсо в 1978 году В исследованиях древних текстов, проводимых под руководством Л. В Милова, обработка текстового материала заключается в построении графов «сильных связей» по матрице частот парной встречаемости грамматических классов слов и происходит с помощью специально разработанной компьютерной программы Обязательное применение автоматической обработки данных в целях определения авторства лежит в основе работ Ю В Сидорова, И О Тарнопольской, Д В Хмелева
Стремление ученых к применению автоматической стилистической диагностики и автоматизированного поиска индивидуальных характеристик авторского стиля приводит к тому, что предпочтение в стилистических исследованиях отдается анализу любых других языковых уровней, кроме синтаксического Зависимость стилистического анализа от компьютерной обработки данных и от методов, для пее предназначенных, приводит к упрощению методологической основы исследований, что, в конечном итоге, делает методы атрибуции текста менее эффективными
В диссертационной работе, исходя из требований объективности и полноты описания авторского стиля, в основу исследования по определению авторства пьес Мольера была положена методика атрибуции анонимных и псевдонимных произведений, разработанная М А Марусенко, которая предусматривает применение многомерной классификации, основанной на теории распознавания образов, и описание индивидуального авторского стиля в синтаксическом аспекте Данная методика позволяет определять характеристики текста, а не отдельного предложения на разных уровнях языковой системы На этапе описания атрибутируемых объектов на языке параметров из априорного словаря параметров предусмотрена ручная обработка данных Статистическая обработка полученных данных и реализация алгоритма проверки атрибуционной гипотезы производится с помощью компьютерных программ
Третья глава диссертационной работы «Атрибуция стихотворных пьес Мольера» посвящена проверке атрибуционной гипотезы и интерпретации ее результатов
Проверка атрибуционной гипотезы предусматривает отбор информативных параметров из априорного словаря параметров и процедуру распознавания
Инвентарь параметров, составляющих исходное описание, был составлен из 51 параметра, релевантного для описания текстов XVII века на французском языке Язык параметров представляет собой систему определения и фиксации ряда наиболее существенных структурных особенностей организации предложений Значения параметров, полученные
в результате описания априорных классов, являются признаками, характеризующими соответствующие классы
В работе сформулированы общие правила анализа текста на французском материале и введены правила параметризации текста по каждому параметру
Состав априорного алфавита классов определяет математические модели априорных классов, относительно которых производится атрибуция спорных произведении В данной работе сформированы два априорных класса П Корнеля - О^СогпеШе) и Ф Кино - ¡^((Зитаик), мощностью 11 и 3 текста соответственно
Для определения информативного набора параметров был проведен эксперимент по описанию априорных классов на языке параметров из априорного словаря параметров, для чего были сделаны «прикидочные» случайные выборки объемом по 100 предложений Результаты эксперимента были представлены в виде двух объектно-признаковых матриц данных размерностью ихЛ^100х51, где п - число параметров, а Ы-число объектов
При формировании набора информативных параметров была применена схема М М Бонгарда, предусматривающая двухступенчатое свертывание параметрического пространства. На первом этапе происходит разбиение априорного набора информативных параметров на два подмножества параметров, релевантных и нерелевантных для различения априорных классов Релевантность параметров для различения двух априорных классов определяется по /-критерию Стыодента (формула 2), пороговое значение которого при уровне значимости а=0,05 равно 1,96
где Х\, х2 - средние арифметические, , °2 - стандартные отклонения, а П], Н2 — размеры выборок
Значения /-критерия для пяти параметров оказались больше критического, что позволило определить параметры Х02 (число элементарных предложений), Х04 (число сочиненных предложений), Х21 (число спрягаемых форм глагола), Х31 (число подлежащих), Х32 (число местоимений-подлежащих) как информативные.
Второй этап схемы М М Бонгарда предусматривает процедуру свертывания параметрического пространства на подмножестве информативных параметров Результаты вычисления с помощью программного обеспечения критерия эффективности каждого параметра показали, что дальнейшего уменьшения числа диагностирующих параметров не произошло, и информативный набор составили пять параметров, полученных на первом этапе
1 =
(2)
п2)
Этап перехода от реального объекта к его математической модели заключается в описании этого объекта на языке параметров рабочего словаря системы распознавания Следующим этапом исследования стало формирование матриц данных атрибутируемых объектов и априорных классов, чей объем был заранее определен Полученные координаты эталонов классов приведены в табл 1
Таблица 1 Координаты эталонов классов на 0-и итерации
Параметр Класс
о0 (Corneille) "2 (Quinault)
О", х, <7,
Х02 1,91 1,08 2,02 1,38
Х04 0,56 0,98 0,92 1,31
Х21 1,90 1,25 2,01 1,49
Х31 1,69 1,13 1,83 1,44
Х32 1.25 1,01 1,40 1,16
7V=1122 jV=465
Алгоритм распознавания включает в себя детерминированную и вероятностную атрибуцию Детерминированный алгоритм распознавания определяет принадлежность атрибутируемых объектов к тому или иному классу текстов В качестве классифицирующей функции детерминированного алгоритма распознавания использовался Г-критерий Стьюдента (формула 2 на с 14) Положительное решение об отнесении объекта к тому или иному классу принималось только в том случае, если наблюдаемые значения î-критерия меньше критического во всех пяти измерениях пространства классификации Классификация объектов при помощи детерминированного алгоритма распознавания является итерационной процедурой, в которой после каждой итерации происходит изменение состава и мощности классов, а также перерасчет координат классов Остановка детерминированного алгоритма произошла на 3-ей итерации В результате работы детерминированного алгоритма была определена авторская принадлежность шести из тринадцати анализируемых объектов пьесы "Le dépit amoureux", "L'École des mans", "Les Fâcheux", "L'École des femmes", "Tartuffe", "Les Femmes savantes" были атрибутированы П Корнешо с вероятностью, находящейся в интервале между 0,95 и 0,95+0,05 , причем реальное значение вероятности ближе к правой границе интервала.
После остановки детерминированного алгоритма остались не отнесенными ни к одному классу семь атрибутируемых объектов Реализация вероятностного алгоритма распознавания предусматривает преобразование исходной матрицы данных в матрицу евклидовых расстояний между априорными классами и неатрибутированными объектами
Исходная матрица данных строится по средним значениям ^ каждого из пяти диагностирующих параметров
Поскольку значения используемых диагностирующих параметров могут заметно отличаться, для приведения всех параметров к единой шкапе необходимо привести матрицу данных к стандартному виду, при котором средние значения всех параметров равны нулю, а дисперсии равны единице Стандартизованная матрица (см табл 2) обозначается какХ—{х9} Таблица 2 Стандартизованная матрица данныхX— {ху}
Параметр
х2 х4 х21 х31 х32
1М 0,39 1,18 0,12 0,30 0,73
ЗМ -1,13 -0,77 -1,22 -1,17 -1,08
й 4М 1,65 0,01 1,57 1,49 1,29
■А Ю О 8М 1,17 0,29 1,39 1,20 0,45
ЮМ -0,05 -0,55 -0,16 0,16 0,64
ИМ -0,80 -0,94 -0,97 -0,77 -0,80
12М -1,32 -1,05 -1,01 -1,45 -1,73
Класс п. -0,17 -0,10 -0,05 -0,13 -0,10
С12 0,24 1,91 0,33 0,37 0,59
С помощью функции евклидова расстояния (формула 3) на основе полученной стандартизованной матрицы данных была построена матрица евклидовых расстояний между априорными классами и неатрибутированными объектами (см табл 3)
4а,Ь) =
П
0,5
/=1
(3)
где п - размерность евклидова пространства, а и Ъ - две точки в пространстве Еп с координатами о(ха1, ха2, ,хт),б(хм ,хЬ2,. ,хЬп).
Таблица 3. Матрица евклидовых расстояний между классами и неатрибутированными объектами ¿(Х^П,)
¿{X, А)
Объект
Класс 1М ЗМ 4М 8М ЮМ ИМ 12М
1,70 2,18 3,24 2,47 0,93 1,69 2,75
о2 0,79 4,08 2,97 2,30 2,53 3,76 4,66
Вероятность принадлежности ]-го объекта к г-тому классу (см табл 4) вычисляется на основе матрицы евклидовых расстояний между объектами и априорными классами по следующей формуле
' Г"
(4)
Р'-1
JI
V У
где - расстояние между у-тым объектом и г-тым классом, а ]к.. расстояние междуу-тым объектом и остальными классами классификации
Таблица 4 Матрица вероятностей принадлежности объектов априорным
классам е )
Объект
Класс 1М 1 ЗМ 4М 8М ЮМ ИМ 12М
0,32 0,65 0,48 0,48 0,73 0,69 0,63
п2 0,68 0,35 0,52 0,52 0,27 0,31 0,37
При наличии двух априорных классов решающее правило может быть сформулировано следующим образом
0,5 (5)
При данном решающем правиле пороговое значение вероятности принадлежности объекта к одному из априорных классов должно равняться или превышать 0,5 В результате работы вероятностного алгоритма распознавания Ф Кино были атрибутированы пьесы "L'Etourdi", "Dom Garcie de Navarre" и "La Princesse d'Elide", а П Корнелю были приписаны пьесы "Sganarelle", "Le Misanthrope", "Melicerte", "Pastorale comique"
Заключительным этапом процедуры распознавания стала оценка качества полученной классификации, основанная на выявлении закономерностей для каждого класса
Для признания законченности процедуры распознавания необходимо добиться выполнения условия соответствия полученного разбиения на классы содержательному понятию кластера и условия, при котором полученный кластер может называться сгущением Кластер и сгущение - две качественные градации, которые позволяют определить, насколько тесно расположены объекты внутри класса по сравнению с расположением объектов внутри всей исходной совокупности Образованные в процессе действия распознающего автомата классы будуг отвечать содержательному понятию кластера в том случае, если средний квадрат расстояния между объектами класса будет меньше среднего квадрата расстояния между объектами исходной совокупности, т е d2(Cln) < d2(ClN) Сгущение в таком
случае реализуется, когда максимальный квадрат расстояния между объектами данного класса меньше среднего квадрата расстояния между
объектами исходной совокупности, то есть ¿/тах2(Ол) На этом
этапе были подтверждены выводы, сделанные по результатам вероятностного алгоритма распознавания
Следующим этапом оценки качества классификации стало сравнение однородности априорных и апостериорных классов В качестве критерия однородности было использовано среднее расстояние между объектами с!(Он) Оценка однородности состава априорных классов полностью подтвердила результаты, полученные в ходе детерминированного и вероятностного алгоритма распознавания для класса П^СогпеШе), которому с разной степенью вероятности были атрибутированы 10 объектов Что касается ^(Очтаик), то по результатам проведенного анализа качества классификации из трех атрибутированных классу объектов лишь один объект, пьеса "Ь'ЕШигск" может быть атрибутирована ему с вероятностью 0,68 Два других объекта формируют отдельный апостериорный класс Цз, как не принадлежащие ни одному из априорных классов, но составляющие один класс, удовлетворяющий условиям кластера и сгущения
Итак, в результате проведенного исследования получила свое
подтверждение гипотеза (Нтексты пьес Мольера являются произведениями П Корнеля, Ф Кино и неизвестного автора
Представим полученные данные в виде матрицы решений, где 0 - отказ от распознавания, 1 - положительное решение по детерминированному алгоритму атрибуции, Г - положительное решение по вероятностному алгоритму атрибуции (см табл 5)
Таблица 5 Матрица решений
Код Наименование П, (Corneille) ÎÎ2 (Quinault) fi3
1М L'Etourdi 0 1* 0
2М Le dépit amoureux 1 0 0
ЗМ Sganarelle 1* 0 0
4M Dom Garcie de Navarre 0 0 1*
5М L'Ecole des maris 1 0 0
6М Les Fâcheux 1 0 0
7М L'Ecole des femmes 1 0 0
8М La Princesse d'Elide 0 0 1*
9М Tartuffe 1 0 0
ЮМ Le Misanthrope 1* 0 0
11М Mélicerte 1* 0 0
12М Pastorale comique 1* 0 0
13М Les Femmes savantes 1 0 0
В четвертой главе «Датировка стихотворных пьес Мольера» проведен обзор методов датировки литературных произведений, предложен математический метод датировки на основе стилеразличающих параметров и рассмотрен вопрос датировки пьес, приписываемых Мольеру
Полная датировка произведения заключается в установлении времени написания и публикации произведения В случае с театром Мольера даты написания пьес точно установить невозможно, поскольку не сохранилось пи одной рукописи Мольера Время написания комедий, составляющих его театр, определяется исходя из сведений о первых их постановках Однако у многих исследователей его творчества возникали сомнения по поводу правильности принятого способа датировки Так, Вольтер считал, что комедия "Les Précieuses ridicules" впервые была поставлена еще в провинции, а не 15 ноября 1659 года И. Вутер указывает на то, что пьеса "Le dépit amoureux", постановка которой произошла годом позже, сильно уступает комедии "L'Étourdi" по стилю, что свидетельствует о более позднем написании "L'Étourdi". Известно также, что придворные драматурги старались подготовить часть пьес заранее, чтобы быстро реагировать на желания короля ставить новые пьесы на придворные празднования Возможно, что и комедии, приписываемые Мольеру, руководившему «труппой короля», были написаны несколько в иной последовательности, чем полагается в настоящее время Наиболее спорная гипотеза была вдвинута П Луи, который приписывает П Корнелю авторство лучших пьес Мольера, и датирует их годами молчания П Корнеля в 30-е и 50-е годы XVII века
Итак, существуют различные мнения о датировке пьес, составляющих театр Мольера, анализ которых позволяет выдвинуть гипотезу о том, что стихотворные пьесы, приписываемые Мольеру, были созданы ранее, чем предполагалось
В настоящее время практически отсутствуют работы, посвященные математическому анализу авторского стиля с целью определения его развития во времени В разные годы исследования по датировке литературных произведений были проведены В M Жирмунским, К Ф Тарановским, M И Шапиром Ввиду отсутствия универсальных методик датировки в рамках настоящей работы был разработан новый математический метод датировки на основе стилеразличающих синтаксических параметров, в основе которого лежит гипотеза о существовании тренда параметров индивидуального авторского стиля на протяжении литературного творчества автора Проверка этой гипотезы предусматривает выполнение следующих процедур отбор объектов, последовательность создания которых надлежит установить (ниже -датируемый объект), отбор информативных параметров, формирование математических моделей датируемых объектов, ранжирование объектов на основании стандартизованной матрицы данных и сопоставление результатов датировки с начальными данными
Непосредственно процедура определения датировки литературных произведений осуществляется путем построения стандартизованной матрицы данных на основе которой производится ранжирование значений7-го
параметра по каждому объекту Затем значения рангов суммируются, и по полученной сумме рангов происходит ранжирование датируемых объектов, которое и определяет последовательность их написания Датировка происходит при сопоставлении полученной последовательности работ автора с первоначальными сведениями о времени их написания и публикации Результатом может стать новая гипотеза о написании литературных произведений раньше или позже предполагаемого срока
С помощью метода датировки на основе стилеразличающих синтаксических параметров проведен анализ двух совокупностей пьес, полученных по итогам работы алгоритма распознавания в третьей главе Одна совокупность сформирована из пьес, принадлежащих П Корнелю, и из атрибутированных ему произведений из театра Мольера Другая совокупность состоит из работ Ф Кино и атрибутированной ему пьесы Мольера "L'Étourdi" Под датировкой в данном случае понимается установление последовательности написания комедий и сопоставление полученных результатов с общепринятой датировкой по годам их первых постановок
При анализе работ Ф Кино и атрибутированной ему пьесы из театра Мольера "L'Étourdi" на основе стандартизованной матрицы данных была построена таблица ранжированных значений пяти диагностических парамегров по каждому объекту (см табл 6) Затем было произведено ранжирование датируемых объектов по ранговым суммам £ (см табл 7)
Таблица 6 Ранжирование объектов класса ¿^(Quinault) и атрибутируемого объекта 1М (L'Étourdi) по значениям параметров х2, х4, х21, х31, х32
Объект х2 Ранг х4 Ранг х21 Ранг х31 Ранг х32 Ранг
х2 х4 х21 х31 х32
1Q 1,41 1 1,50 1 1,47 1 1,43 1 1,35 1
2Q -0,54 3 -0,60 4 -0,59 3 -0,45 3 -0,37 3
3Q -0,85 4 -0,47 3 -0,69 4 -0,86 4 -1,02 4
1М -0,01 2 -0,42 2 -0,19 2 -0,13 2 0,05 2
Таблица 7 Ранжирование объектов класса i22(Qumault) и атрибутируемого объекта 1М (L'Étourdi) по значениям ранговых сумм
Объект Автор Наименование Год постановки z Ранг
1Q Кино Les Rivales 1653 5 1
1М «Мольер» L'Étourdi 1658 10 2
2Q Кино L'Amant Indiscret 1654 16 3
3Q Кино La Mere Coquette 1665 19 4
Результаты применения метода датировки при анализе комедий Ф Кино свидетельствуют, что временное направление совпадает с увеличением ранга Таким образом, был установлен повышательный тренд параметров, под которым в данной работе понимается изменение тренда параметров индивидуального авторского стиля в сторону увеличения значений параметров Полученные данные позволяют говорить о возможном написании пьесы "L'Etourdi" драматургом Ф Кино до 1654 года
Совокупность пьес, принадлежащих П Корнешо, и атрибутированных ему произведений из театра Мольера оказалась разделенной на три группы первую группу составили ранние пьесы и героические комедии П Корнеля, вторую группу - пьесы, принадлежащие П Корнелю и приписываемые Мольеру, постановки которых происходили в 1631-1643 годы и 1658-1672 годы соответственно, и в третью группу вошли наиболее слабые пьесы, приписываемые Мольеру
С одной стороны, подобное смешение дат может быть обусловлено большим разнообразием жанровых подвидов пьес, составляющих данную совокупность, и сильной зависимостью результатов эксперимента от однородности и качества исследуемого материала С другой стороны, близость пьес П Корнеля, написанных в 30-е годы, с атрибутированными ему пьесами из театра Мольера может указывать на то, что лучшие стихотворные пьесы, приписываемые Мольеру, были созданы П Корнелем задолго до их постановки на сцене, а именно в период с 1630 до 1650-х годов С некоторой долей уверенности можно говорить о подтверждении в ходе исследования гипотезы, выдвинутой П. Луи, о более раннем, чем принято считать, создании ряда комедий, приписываемых Мольеру
Заключение
В заключении обобщаются результаты проведенного исследования, намечаются перспективы дальнейших исследований в данной области и делаются следующие выводы
1 Изучение документально-исторических фактов и данных филологического анализа позволило сформировать сложную атрибуционную гипотезу, описывающую возможность написания спорных пьес, приписываемых Мольеру, П Корнелем, Ф Кино и неизвестными авторами Класс атрибутируемых объектов составили 13 комедий в стихах, приписываемых Мольеру
2 Обзор истории развития научной мысли в области параметризации авторского стиля позволяет выделить следующие основные тенденции переход от одномерных классификаций к описанию объектов в многомерном признаковом пространстве, все более широкое использование компьютерной обработки данных, а также возникший в последние десятилетия интерес исследователей к применению синтаксического анализа при описании авторского стиля Эффективный метод стилистического анализа в целях определения авторства подразумевает применение многомерных
классификаций, определение характеристик текста, а не отдельною предложения, и описание текста на разных уровнях языковой системы с учетом как лексического состава текста, так и его структуры Всем эгим требованиям отвечает математический метод атрибуции анонимных и псевдонимных произведений, основанный на теории распознавания образов
3 В работе представлен опыт применения математических методов атрибуции на основе теории распознавания образов при атрибуции текстов на французском языке Предложенная методика определения значений параметров на материале текстов XVII века на французском языке позволила решить задачу определения авторства спорных пьес, приписываемых Мольеру. Априорный словарь параметров составили 51 параметр
Два априорных класса — Qi(Corneille) и Q2(Quinault) — составили 11 комедий в стихах П Корнеля и 3 комедии в стихах Ф Кино соответственно
4 Набор информативных параметров составили 5 параметров Х02 (число элементарных предложений), Х04 (число сочиненных предложений), Х21 (число спрягаемых форм глагола), Х31 (число подлежащих), Х32 (число местоимений-подлежащих) Проведенная атрибуция подтвердила высокую информативность и стиледифференцирующие возможности параметров синтаксического уровня На этапе отбора информативных параметров в работе показана возможность автоматизации лингвистического исследования в области установления авторства
5 В результате работы детерминированного алгоритма была определена авторская принадлежность шести из тринадцати анализируемых объектов пьесы "Le dépit amoureux", "L'École des mans", "Les Fâcheux", "L'École des femmes", "Tartuffe", "Les Femmes savantes" были атрибутированы П Корнелю с вероятностью больше 0,95 В результате работы вероятностного алгоритма распознавания Ф Кино была атрибутирована пьеса "L'Étourdi", а П Корнелю были приписаны пьесы "Sganarelle", "Le Misanthrope", "Mélicerte", "Pastorale comique" с разной степенью вероятности (от 0,63 до 0,73) Результаты вероятностного алгоритма были откорректированы в процессе процедуры оценки качества классификации Две пьесы, "Dom Garcie de Navarre" и "La Princesse d'Élide", составили апостериорный класс Итак, получил свое подтверждение вариант
альтернативной гипотезы (Hтексты пьес, приписываемые Мольеру, являются произведениями П Корнеля, Ф Кино и одного неизвестного автора
6 Произведенный обзор существующих методов датировки текстов показал отсутствие универсальных математических методов установления последовательности написания текстов. Применение предложенного метода датировки на основе стилеразличающих синтаксических параметров показало целесообразность такого подхода, а также позволило установить возможность математической оценки тренда параметров индивидуального авторского стиля на протяжении литературного творчества писателя
7 В результате датировки пьес, атрибутированных П Корнелю и Ф Кино, была подтверждена гипотеза о более раннем написании стихотворных пьес, входящих в театр Мольера
Перспективы дальнейшего исследования состоят в разработке проблем описания индивидуальных авторских стилей и датировки литературных произведений с использованием предложенного в данной работе математического метода датировки
Основные положения диссертационной работы нашли отражение в следующих публикациях.
1 Марусенко M А, Мельникова Е Е, Родионова Е С Атрибуция анонимных и псевдонимных статей, опубликованных в журналах «Время» и «Эпоха» в 1861 - 1865 годах // Квантитативная лингвистика исследования и модели (КЛИМ-2005) материалы Всероссийской научной конференции (6 -10 июня 2005 г) / редкол • А А Поликарпов, Г Г Сильницкий, В В Поддубный - Новосибирск Новосибирский гос пед ун-т, 2005 -С 283-294 (0,45 п л , авт текст - 0,2 п л )
2 Марусенко M А, Мельникова Е Е , Родионова Е С. Об авторстве статей, приписываемых Ф M Достоевскому // Актуальные проблемы теоретической и прикладной лингвистики и оптимизация преподавания иностранных языков материалы Всероссийской научной конференции с международным участием (11 - 13 октября 2005 г ) / сост Ю И Горбунов, Г В Артамонова, Т H Андреюшкина - Тольятти Тольяттинский гос. ун-т, 2005 - С 23-29 (0,3 п. л., авт текст - 0,15 п л )
3 Родионова Е С Проблема авторства драматургических произведений Мольера // Материалы XXXV Международной филологической конференции (13 - 18 марта 2006 г) - СПб Филол фак С-Петерб гос ун-та, 2006 -Вып 21 Секция математической лингвистики / отв ред А С Герд, Т Г Скребцова в2ч -Ч.2.-С. 11-16(0,25 п л)
4. Родионова Е.С. Параметризация стилей: отбор информативных параметров при атрибуции пьес Мольера // Вестник Санкт-Петербургского университета. Сер. 9. Филология. Востоковедение. Журналистика. - Вып. 2. - Ч. 2. - 2007. - С. 61-67 (0,5 п. л.).
5 Родионова Е С Отбор информативных параметров при атрибуции стихотворных пьес Мольера // Материалы XXXVI Международной филологической конференции (12 - 17 марта 2007 г) - СПб Филол фак С -Петерб гос ун-та, 2007 - Вып 10 . Прикладная и математическая лингвистика / под ред Т Г Скребцовой С 67-74 (0,3 п л )
6 Родионова ЕС Атрибуция стихотворных пьес Мольера методами распознавания образов // MegaLing'2007 Горизонты прикладной лингвистики и лингвистических технологий • доклады международной научной конференции, 24-28 сентября 2007 г, Украина, Крым, Партенит = Honzones of Applied Linguistics And Linguistic Technologies proceedings of international conference, 24 - 28 September 2007, Ukraine, Crimea, Parthenit /
ред В А Широков, С С. Дикарева -Симферопль ДиАйПи, 2007 -С 313— 314(0,15 п л)
7. Родионова Е. С. Проблема «Корнель - Мольер»: к вопросу об авторстве и датировке стихотворных пьес, приписываемых Мольеру // Известия Российского государственного педагогического университета им. А. И. Герцена. - 2008. - № 27 (61) [ апрель ]. - С. 216 - 220 (0,45 п. л.).
Подписано в печать 06 05 200В Формат 60x84 1/16 Бумага офсетная Печать офсетная Уел печ л 1,4 Тираж 100 экз. Заказ № 821
Отпечатано в ООО «Издательство "ЛЕМА"»
199004, Россия, Санкт-Петербург, В О , Средний пр , д 24, тел /факс 323-67-74 e-mail izd lema@mail га
Оглавление научной работы автор диссертации — кандидата филологических наук Родионова, Елена Сергеевна
ВВЕДЕНИЕ.
ГЛАВА I. К ИСТОРИИ ПРОБЛЕМЫ «КОРНЕЛЬ-МОЛЬЕР».
1.1. Проблема авторства пьес, приписываемых Мольеру.
1.2. Объекты атрибуции.
1.3. Формирование атрибуционной гипотезы.
1.4. Выводы.
ГЛАВА II. МЕТОДЫ АТРИБУЦИИ.
2.1. Субъективные и объективные методы атрибуции.
2.2. Лексический анализ при исследовании стилистики текстов.
2.3. Синтаксический анализ с применением теории графов.
2.4. Применение автоматической обработки данных.
2.5 Атрибуция текстов методами теории распознавания образов.
2.6. Выводы.
ГЛАВА III. АТРИБУЦИЯ СТИХОТВОРНЫХ ПЬЕС МОЛЬЕРА.
3.1. Постановка задачи.
3.2. Определение априорного словаря параметров.
3.3. Формирование априорного алфавита классов.
3.4. Определение информативных параметров.
3.5. Определение координат распознаваемых объектов и эталонов априорных классов.
3.6. Работа распознающего автомата.
3.6.1. Детерминированная атрибуция.
3.6.2. Вероятностная атрибуция.
3.6.3. Оценка качества классификации.
-33.6.3.1. Оценка качества разбиения на классы множества атрибутируемых объектов.
3.6.3.2. Оценка однородности априорных классов.
3.7. Интерпретация результатов атрибуции.
3.8. Выводы.
ГЛАВА IV. ДАТИРОВКА СТИХОТВОРНЫХ ПЬЕС, ПРИПИСЫВАЕМЫХ МОЛЬЕРУ.
4.1. К вопросу о датировке пьес, приписываемых Мольеру.
4.2. Методы датировки литературных произведений.
4.3. Математический метод датировки на основе стилеразличающих синтаксических параметров.
4.4. Датировка пьес, приписываемых Мольеру.
4.5. Выводы.
Введение диссертации2008 год, автореферат по филологии, Родионова, Елена Сергеевна
Актуальность темы исследования. Проблема атрибуции какого-либо произведения заключается в определении его автора, причем под произведением может пониматься любой связанный набор знаков, в том числе фильм, картина, аудио-произведение, письмо. Проблема установления авторства в литературе связана с существованием анонимных и псевдонимных текстов и представляет собой одну из древнейших филологических задач, входящих в область текстологии.
До середины XV века, когда было изобретено книгопечатание^ все произведения литературы оставались в виде рукописей, которые только в самых редких случаях были автографами или просмотренными и исправленными автором копиями. Ни одного автографа не дошло до нашего времени от произведений античной литературы, и авторство произведений Платонаг и Аристотеля является весьма спорным: В средневековой литературе почти каждое произведение имело сложную историю текста и целый ряд авторов, причем часто древнейший из дошедших до нас списков отделялся несколькими столетиями от времени создания произведения. Например, «Песнь о Роланде», возникшая в конце XI века, представлена только одним списком конца XII века и большим количеством списков XIII—XIV веков. Существуют различные версии и об авторе величайшего памятника средневековой русской литературы конца XII века «Слова о полку Игореве» [Зализняк, 2007].
После появления книгопечатания проблема атрибуции текстов сохранилась, поскольку значительная часть литературных произведений либо остается 1 неопубликованной при жизни автора, либо бывает опубликована с неточностями и искажениями как вследствие небрежности, так и сознательно, например, по условиям цензуры. Отсутствие рукописей, точных данных, необычная биография порождают -множество гипотез об «истинном» авторстве произведений У.Шекспира [Гилилов, 2007]. Неопубликованные в печати произведения часто существуют в ряде списков, из которых ни один нельзя предпочесть другому по достоверности, как в случае с «Горем от ума» A.C. Грибоедова. В разные годы по биографическим данным и стилистическому анализу анонимные произведения, были приписаны М.В. Ломоносову, А.Н. Радищеву, Н.М. Карамзину.
Решение вопроса об авторстве литературных произведений становится очень важным при создании собраний сочинений писателей, и нередко наиболее спорными становятся публицистические работы. Немало вопросов возникло у различных исследователей при изучении критико-литературного творчества A.C. Пушкина, Ф.М. Достоевского, Н.Г. Чернышевского, В.Г. Белинского.
К спорным произведениям XX века относятся некоторые работы А.П. Чехова, В.В. Маяковского, М.А. Булгакова. Большой общественный резонанс получила атрибуция «Тихого Дона» М.А. Шолохова [В поисках потерянного автора, 2001]. Согласно одной из гипотез литературной мистификацией являются произведения Э. Ажара, под псевдонимом которого работал французский писатель Р. Гари.
Вопрос об авторстве комедий Мольера был поднят в начале XX века, и на сегодняшний день широко обсуждается как во Франции, так и за ее пределами. Согласно существующим гипотезам в число возможных авторов пьес, приписываемых Мольеру, входят такие французские драматурги, как П. Корнель и Ф. Кино. Наиболее жаркие дебаты разгорелись вокруг возможного написания П. Корнелем лучших комедий в стихах Мольера. Гипотеза о принадлежности перу П. Корнеля произведений, приписываемых Мольеру, в трудах различных исследователей стала традиционно обозначаться как проблема «Корнель-Мольер». Одним из последних исследований, результаты которого подтверждают эту гипотезу, стала работа Д. Лаббе, основанная на анализе лексического состава языка писателей [D. Labbe, 2003]. Однако анализ одного лишь лексического уровня не может служить достаточно достоверным критерием атрибуции текстов, поскольку именно лексический состав языка, связанный с темой повествования, лучше всего поддается имитации. Остальные исследователи творчества Мольера в разные годы приводили различные литературные и биографические доводы, подтверждающие ту или иную точку зрения [Louys, 1919; Poulaille, 1957; Wouters, 1990; Forestier, 2001]. Возникла ситуация, когда лингвистическая задача не может быть решена методами, базирующимися исключительно на филологическом анализе, или с использованием методов количественного описания лексического состава текстов.
Как известно, для признания принадлежности произведения какому-либо конкретному автору необходимо, чтобы аргументы характеризовали его с трех сторон: биографической, идеологической и стилистической, при этом описание и анализ индивидуально-авторских стилей является необходимым этапом любой атрибуции [Берков, 1958]. Главная задача при анализе художественных* произведений в процессе атрибуции заключается в выявлении специфических признаков языка автора и сопоставлении, их со специфическими признаками всех предполагаемых авторов., Описание индивидуальных авторских стилей с целью перевода информации, содержащейся в неформализованном виде в! тексте, на* формализованный искусственный язык на основе математической статистики заключается в выявлении специфических языковых признаков текста и использовании строгих' правил параметризации. До 70-х годов в практике атрибуции господствовали историко-документальные и филологические методы исследования, во многом базирующиеся йа субъективном восприятии и анализе литературного произведения исследователем. В.В. Виноградов выделил 11 принципов атрибуции анонимных и псевдонимных произведений, разделив их на группу объективных и субъективных. В число объективных принципов им были включены лингвостатистические [Виноградов, 1961]. Математический аппарат и, в частности, лингвостатистические принципы стали широко применяться при атрибуции литературных произведений с 80-х годов. История развития методов атрибуции привела к пониманию того, что эффективный метод стилистического анализа в целях определения авторства должен охватывать разные уровни языковой системы и включать в себя применение многомерных классификаций. Описание индивидуальных авторских стилей с целью перевода информации, содержащейся в неформализованном виде в тексте, на формализованный искусственный язык на основе математической статистики заключается в выявлении специфических языковых признаков текста и использовании строгих правил параметризации [Морозов, 1915; Виноградов, 1961; Вашак, 1974; Севбо, 1981; От Нестора до Фонвизина, 1994; Сидоров, 2002 и др.]. Параметризация стихотворных текстов XVII века на французском языке с использованием априорного словаря параметров синтаксического уровня представляет собой особую лингвистическую задачу.
Актуальность исследования определяется проблематикой, связанной с разработкой проблем математического моделирования текстов с помощью многомерных классификаций и автоматизацией лингвистических исследований. В диссертации методы математического моделирования, и количественного описания. индивидуально-авторских стилей на синтаксическом уровне нашли свое применение при решении проблемы «Корнель-Мольер». Особое значение работа приобретает в связи с возросшим за последнее время интересом к проблеме «Корнель-Мольер» и большой значимостью вопроса об истинном авторстве комедий, приписываемых Мольеру, как для французской литературы, так и для мировой культуры в целом.
При рассмотрении проблемы авторства пьес, приписываемых Мольеру, неизменно встает вопрос об их датировке. Полная датировка произведения заключается в .установлении времени написания и публикации произведения.
В случае с театром Мольера даты написания пьес точно установить невозможно, поскольку не сохранилось ни одной рукописи Мольера. Время написания комедий, составляющих его театр, устанавливается исходя из сведений о первых их постановках, однако действительная последовательность написания пьес, составляющих театр Мольера, может несколько отличаться от общепринятой.
При установлении времени написания литературных произведений возможны различные приемы, связанные с графологическим и лексическим анализами [Лихачев, 2001; Тагапоуэку, 1982]. Однако на сегодняшний день отсутствуют универсальные методики датировки, основанные на математическом описании авторских стилей. Актуальность и новизна настоящей работы связана с разработкой нового математического метода датировки на основе стилеразличающих синтаксических параметров с учетом тренда параметров индивидуального авторского стиля, под которым в данной работе понимается основная тенденция изменения параметров индивидуального авторского стиля на протяжении литературного творчества писателя, очищенная от случайных влияний и индивидуальных особенностей отдельных периодов. С помощью нового метода датировки в работе осуществляется датировка стихотворных пьес, приписываемых Мольеру, и проверяется выдвинутая автором* гипотеза о существовании тренда параметров индивидуального авторского стиля.
Таким образом, диссертационная работа, посвященная атрибуции и датировке стихотворных пьес, приписываемых Мольеру, соответствует современной научной проблематике и является актуальной.
Теоретической основой исследования являются следующие положения: Индивидуальный авторский стиль представляет собой сложную иерархическую систему и должен описываться набором стилеразличающих параметров методом многомерной классификации. Проблема атрибуции анонимных и псевдонимных текстов представляет собой одну из задач распознавания образов [С. Ватанабе, М.А. Марусенко].
В настоящее время стиль рассматривается прежде всего как категория структурно-синтаксическая [А.И. Ефимов, И.П. Севбо, Г.М. Мартыненко]. Особенности индивидуального авторского стиля наиболее отчетливо проявляются в синтаксисе: в отборе конструкций, их расположении и объединении в сложное целое.
Индивидуальный авторский стиль может меняться как с годами, так и в зависимости от жанра [И.П. Севбо, М.А. Марусенко]. Проблема датировки может решаться как задача ранжирования многомерных математических моделей с учетом тренда параметров индивидуального авторского стиля.
Объектом исследования являются характеристики индивидуальных авторских стилей Мольера, П.Корнеля и Ф.Кино.
Предметом.- исследования в данной работе является . установление 'авторства и датировка спорных произведений, приписываемых Мольеру.
В диссертации выдвигаются три гипотезы.
1. Сложная атрибуционная гипотеза: тексты стихотворных пьес, приписываемых Мольеру, полностью принадлежат Мольеру (нулевая гипотеза); тексты стихотворных пьес, приписываемых Мольеру, полностью принадлежат П. Корнелю (первый вариант альтернативной гипотезы); • тексты стихотворных пьес, приписываемых Мольеру, являются произведениями П. Корнеля, Ф. Кино и одного или нескольких неизвестных авторов (второй вариант альтернативной гипотезы).
2. Существует тренд параметров индивидуального авторского стиля, выражающийся в том, что на протяжении литературного творчества писателя значения параметров устойчиво изменяются в одном направлении.
3. Стихотворные пьесы, входящие в театр Мольера, были написаны ранее, чем предполагалось.
Основная цель работы состоит в применении математического метода атрибуции анонимных и псевдонимных произведений для решения проблемы «Корнель-Мольер». Другой целью работы является разработка математического метода датировки и установление действительной последовательности написания спорных стихотворных пьес.
Достижение поставленных целей предполагает решение следующих конкретных задач:
1) провести обзор состояния проблемы «Корнель-Мольер», выбрать объект атрибуции и сформировать атрибуционную гипотезу;
2) сравнить и систематизировать существующие лингвистические методы атрибуции с целью- обоснования применения математического метода атрибуции анонимных и псевдонимных произведений, основанного на теории распознавания образов, в данной работе;
3) сформировать априорные классы и априорный словарь параметров с перечислением правил параметризации стихотворных текстов XVII века на французском языке с примерами для каждого параметра;
4) с помощью специально разработанного программного обеспечения определить информативный набор параметров, обеспечивающих разбиение объектов на классы, и создать математические модели анализируемых текстов путем описания объектов на языке информативных параметров;
5) осуществить проверку атрибуционной гипотезы;
6) изучить- существующие лингвистические методы датировки и разработать универсальный алгоритм датировки ч литературных произведений;
7) установить последовательность написания стихотворных пьес, приписываемых Мольеру, с помощью нового метода датировки литературных произведений.
Материалом для данного исследования стали следующие тексты:
1) 13 комедий в стихах, приписываемых Мольеру ("L'Étourdi", "Le dépit amoureux", "Sganarelle", "Dom Garcie de Navarre", "L'École des maris", "Les Fâcheux", "L'École des femmes", "La Princesse d'Élide", "Tartuffe", "Le Misanthrope", "Mélicerte", "Pastorale comique", "Les-Femmes savantes");
2) 11 комедий в стихах П. Корнеля ("Mélite", "La Veuve", "La Galerie du Palais", "La Suivante", "La Place royale", "Comédie des Tuileries", "L'Illusion comique", "Le Menteur"', "La Suite de Menteur", "Don Sanche d'Arago", "Tite et Bérénice");
3) 3 комедии в стихах Ф. Кино ("Les Rivales", "L'Amant Indiscret", "La Mère Coquette") .
Методы исследования. В работе изучаются возможности- применения математических и прикладных методов к исследованию языка, и используется семиотическое и математическое моделирование естественного языка на основе теории вероятностей и математической статистки. Кроме того, в работе применяются методы обработки данных, стилеметрии, лингвостатистики, системно-описательный метод, а также методы филологического анализа, в частности методы анализа состава и структуры предложения.
Основные положения, выносимые на защиту.
1. Стихотворные пьесы, приписываемые Мольеру, являются произведениями П. Корнеля ("Le dépit amoureux", "Sganarelle", "L'École des maris", "Les Fâcheux", "L'École des femmes", "Tartuffe", "Le Misanthrope", "Mélicerte", "Pastorale comique", "Les Femmes savantes"), Ф. Кино ("L'Étourdi) и неизвестного автора ("Dom Garcie de Navarre", "La.Princesse d'Élide").
2. Предложенная методика определения значений параметров на материале текстов XVII века на французском языке позволяет решать задачу определения авторства анонимных и псевдонимных текстов данного периода.
3. Существует тренд параметров индивидуального авторского стиля, выражающийся в том, что на протяжении литературного творчества писателя значения параметров устойчиво изменяются в одном направлении.
4. Метод датировки на основе стилеразличающих синтаксических параметров, предложенный в работе, позволяет решать задачи по установлению последовательности написания литературных текстов и может использоваться в дальнейших исследованиях.
-125. В результате датировки спорных пьес, атрибутированных П.Корнелю и Ф.Кино, подтверждена гипотеза о более раннем написании стихотворных пьес, входящих в театр Мольера.
Научная новизна работы заключается в следующем:
- осуществлена атрибуция стихотворных пьес, приписываемых Мольеру, методами математического анализа текстов с применением теории распознавания образов;
- разработаны, правила параметризации текста на материале текстов XVII века на* французском языке;
- показана возможность автоматизации-лингвистического исследования в области установления авторства;
- разработан метод датировки литературных произведений;
-новый метод датировки применен при установлении, последовательности написания пьес, приписываемых Мольеру.
Теоретическая значимость проведенного исследования; заключается в том; что в нем решена проблема авторской принадлежности текстов; классиков французской: литературы. Результаты исследования способствуют-развитию математических и прикладных методов изучения, языка и вносят вклад в развитие теории и практики атрибуции литературных произведений методами распознавания образов, а также теории: и практики датировки литературных.произведений математическими методами-.
Практическая значимость, исследования состоит в возможности использования полученных данных о составе априорного словаря параметров' в качестве примера при составлении правил параметризации текстов на французском материале. Полученные данные о существовании тренда: параметров индивидуального авторского стиля могут использоваться в дальнейших работах по определению последовательности написания литературных произведений с целью их датировки.
Рекомендации по использованию результатов исследования. Результаты исследования^ могут быть, использованы при чтении специальных курсов
Анализ данных» и «Лингвистические методы атрибуции анонимных и псевдонимных произведений», а также курсов по прикладной лингвистике, квантитативной стилистике и истории французской литературы.
Апробация работы. Основные положения диссертационного исследования обсуждались на заседаниях кафедры математической лингвистики филологического факультета Санкт-Петербургского государственного университета (2005-2007 гг.) и прошли апробацию в ряде докладов, прочитанных на XXXV и XXXVI Международных филологических конференциях (СПбГУ, 2006-2007), на Всероссийской научной конференции «Квантитативная лингвистика: исследования и модели» (Новосибирск, 2005), Всероссийской научной конференции с международным участием «Актуальные проблемы теоретической и прикладной лингвистики и оптимизация преподавания иностранных языков» (Тольятти, 2005), на Международной научной конференции «MegaLing'2007. Горизонты прикладной лингвистики и лингвистических технологий». (Украина, Партенит, 2007), а также получили отражение в 7 публикациях общим объемом 2,0 п.л.
Объем и структура работы. Диссертационное исследование содержит 183 страницы машинописного текста, оно состоит из введения, четырех глав с выводами в конце каждой, заключения, библиографии, включающей 128 наименований, из них 46 на иностранных языках, и списка источников. Основные результаты исследования обобщены в 41 таблице и 1 рисунке. В качестве приложения приводятся таблицы, описывающие состав театров Мольера, П.Корнеля и Ф.Кино.
Заключение научной работыдиссертация на тему "Лингвистические методы атрибуции и датировки литературных произведений"
4.5. Выводы
Полученные результаты позволяют говорить о возможности и целесообразности применения метода датировки на основе стилеразличающих синтаксических параметров с учетом тренда параметров индивидуального авторского стиля. Результаты его применения подтверждают выдвинутую нами гипотезу о существовании тренда параметров индивидуального авторского стиля. Метод показал высокую эффективность при анализе комедий Ф. Кино.
В целом новый метод датировки представляется весьма перспективным и может использоваться в дальнейших исследованиях тренда параметров индивидуального авторского стиля и при решении > аналогичных задач, связанных с датировкой литературных произведений.
ЗАКЛЮЧЕНИЕ
В ходе диссертационного исследования получены следующие результаты.
1. Изучение документально-исторических фактов и данных филологического анализа позволило сформировать сложную атрибуционную гипотезу, описывающую возможность написания спорных пьес, приписываемых Мольеру, П. Корнелем, Ф. Кино и неизвестными авторами. Класс атрибутируемых объектов составили 13 комедий в стихах, приписываемых Мольеру.
2. Обзор истории развития научной мысли в области параметризации авторского стиля позволяет выделить следующие основные тенденции: переход от одномерных классификаций к описанию объектов в многомерном признаковом пространстве, все более широкое использование компьютерной обработки данных, а также возникший в последние десятилетия интерес исследователей к применению синтаксического анализа при описании авторского стиля. Эффективный метод стилистического анализа в целях определения авторства подразумевает применение многомерных классификаций, определение характеристик текста, а не отдельного предложения, и описание текста на разных уровнях языковой системы с учетом как лексического состава текста, так и его структуры. Всем этим требованиям отвечает математический метод атрибуции анонимных и псевдонимных произведений, основанный на теории распознавания образов.
3. В работе представлен опыт применения математических методов атрибуции на основе теории распознавания образов при атрибуции текстов на французском языке. Предложенная методика определения значений параметров на материале текстов XVII века на французском языке позволила решить задачу определения авторства спорных пьес, приписываемых Мольеру. Априорный словарь параметров составили 51 параметр. Два априорных класса — ^(СогпеШе) и 02(С)итаи11;) - составили 11 комедий в стихах П.Корнеля и 3 комедии в стихах Ф. Кино соответственно.
-1674. Проведенная атрибуция подтвердила высокую информативность и стиледифференцирующие возможности параметров синтаксического уровня. Информативный набор параметров составили 5 параметров: Х02 (число элементарных предложений), Х04 (число сочиненных предложений), Х21 (число спрягаемых форм глагола), Х31 (число подлежащих), Х32 (число местоимений-подлежащих). На этапе отбора информативных параметров в работе показана возможность автоматизации лингвистического исследования в области установления авторства.
5. В рёзультате работы детерминированного алгоритма была определена авторская принадлежность шести из тринадцати анализируемых объектов: г г пьесы "Le dépit amoureux", "L'Ecole des maris", "Les Fâcheux", "L'Ecole des femmes", "Tartuffe", "Les Femmes savantes" были атрибутированы П. Корнелю с вероятностью больше 0,95. В результате работы вероятностного алгоритма распознавания Ф. Кино была атрибутирована пьеса "L'Étourdi", а П. Корнелю были приписаны пьесы "Sganarelle", "Le Misanthrope", "Mélicerte", "Pastorale comique" с разной степенью вероятности (от 0,63 до 0,73). Результаты вероятностного алгоритма были откорректированы в процессе процедуры оценки качества классификации. Две пьесы, "Dom Garcie de Navarre" и "La Princesse d'Élide", составили апостериорный класс. В результате проведенного исследования получил свое подтверждение вариант альтернативной гипотезы (На): тексты пьес, приписываемые
Мольеру, являются произведениями П. Корнеля, Ф. Кино и одного неизвестного автора.
6. Произведенный обзор существующих методов датировки текстов показал отсутствие универсальных математических методов установления последовательности написания текстов. Применение предложенного метода датировки на основе стилеразличающих синтаксических параметров показало целесообразность такого подхода, а также позволило установить возможность математической оценки тренда параметров индивидуального авторского стиля на протяжении литературного творчества писателя.
-1687. В результате датировки пьес, атрибутированных П.Корнелю и Ф.Кино, была подтверждена гипотеза о более раннем написании стихотворных пьес, входящих в театр Мольера.
Перспективы дальнейшего исследования состоят в разработке проблем описания индивидуальных авторских стилей и датировки литературных произведений с использованием предложенного в данной работе математического метода датировки.
Список научной литературыРодионова, Елена Сергеевна, диссертация по теме "Прикладная и математическая лингвистика"
1. Адмони В. Г. Теоретическая грамматика немецкого языка : строй современного немецкого языка Текст. : учеб. пособие для пед. ин-тов / В. Г. Адмони. М. : Просвещение, 1986. - 333 с.
2. Алексеев П. М. Квантитативная типология текста Текст. : учеб. пособие к спецкурсу / П. М. Алексеев. — Л. : Ленингр. гос. пед. ин-т, 1988.-76 с.
3. Бабайцева В. В. Синтаксис. Пунктуация Текст. : учеб. пособие для студентов / В. В. Бабайцева. М. : Просвещение, 1981.-271 с.
4. Балли Ш. Общая лингвистика и вопросы французского языка Текст. / Ш. Балли. -М. : Эдиториал, 2001.-416 с.
5. Бектаев К. Б. Математические методы в языкознании Текст. : учеб. пособие / К. Б. Бектаев, Р. Г. Пиотровский. Алма-Ата : КазГу,1973. — Ч. 1 : Теория вероятностей и моделирование нормы языка. 281 с. 1!
6. Бектаев К. Б. Математические методы в языкознании Текст. : учеб. пособие / К. Б. Бектаев, Р. Г. Пиотровский. Алма-Ата : КазГУ,1974. — Ч. 2 : Математическая статистика и моделирование текста. — 334 с.
7. Берков П. Н. Об установлении авторства анонимных и псевдонимных произведений XVIII века Текст. / П. Н. Берков // Русская литература / отв. ред. П.Н. Берков. Л. : Ин-т русской литературы АН СССР, 1958. - №2.-С. 180-189.
8. Большая советская энциклопедия : в 30 томах Текст. / гл. ред. А. М. Прохоров. Изд. 3-е, т. 21. М. : Советская Энциклопедия, 1972. — 546 с.
9. Бонгард М. М. Проблемы узнавания Текст. / М. М. Бонгард. — М. : Наука, 1967. 320 с.
10. Браверманн Э. М. Структурные методы обработки эмпирических данных Текст. / Э. М. Баверман, И. Б. Мучник. М. : Наука, 1983. -464 с.
11. В поисках потерянного автора: этюды атрибуции Текст. / М. А. Марусенко, Б. Л. Бессонов, Л. М. Богданова и др. СПб. : Филол. фак. С.-Петерб. гос. ун-та, 2001. - 209 с.
12. М.Василевич А. П. Цветонаименования как характеристика языка писателя Текст. / А. П. Василевич // Ученые записки Тартуского государственного университета. Тарту, 1981. - Вып. 585 : Лингвистика текста и стилистика. - С. 42—51.
13. Ватанабе С. Оценка и отбор параметров в задачах распознавания образов Текст. / С. Ватанабе, П. Ламберт // Автоматический 'анализ сложных изображений / под ред. Э. М. Бравермана. М. : Мир, 1969. - С. 234-309.
14. Вашак П. Длина слова и длина предложения в текстах одного автора Текст. / П. Вашак // Вопросы статистической стилистики / под ред. Б. Н. Головина. Киев : Наукова думка, 1974. - С. 12-31.
15. П.Виноградов В. В. Проблема авторства и теория стилей Текст. / В. В. Виноградов. М. : Гослитиздат, 1961. - 614 с.
16. Виноградов В. В. История слов Текст. /В.В.Виноградов; РАН, Ин-т. рус. яз. -М. : Толк, 1994. 1138 с.
17. ГакВ. Г. Теоретическая грамматика французского языка Текст. / В. Г. Гак. М.: Добросвет, 2000. - 832 с.
18. Гилилов И. М. Игра об Уильяме Шекспире, или Тайна Великого Феникса Текст. / И. М. Гилилов. М. : Междунар. отношения, 2007. -536 с.
19. Герасимович А. И. Математическая статистика Текст. : учеб. пособие / А. И1 Герасимович. 2-е изд., перераб. и доп. - Минск : Вышэйшая школа, 1983.-279 с.„
20. Гликман И. Д. Мольер. Критико-биографический очерк Текст. / И. Д. Гликман. М.; Л. : Художественная литература, 1966. - 279 с.
21. Горелик А. Л. Методы.распознавания Текст. : учеб. пособие для вузов / А. Л. Горелик. М. : Высш. шк., 1984. - 208 с.
22. Грамматика русского языка : в 2 т. Текст. / отв. ред. В. В. Виноградов М. : Изд-во Акад. наук СССР, 1960. - Т. 2 : Синтаксис. Ч. 1. - 783 с.
23. Грамматика русского языка : в 2 т. Текст. / ред. В. В: Виноградова — М. : Изд-во Акад. наук СССР, 1960. Т. 2 : Синтаксис. Ч. 2. - 440 с.
24. Гринбаум О. Н. Компьютерные аспекты стилеметрии Текст. / О. Н. Гринбаум // Прикладное языкознание : учебник / ред. Л. В. Бондарко; Л. А. Вербицкая, А. С. Герд. — СПб. : С.-Петерб. гос. ун-т, 1996.-С. 454-464. '
25. Гришунин А. Л. Опыт обследования употребительности языковых дублетов, в целях атрибуции Текст. / А. Л. Гришунин // Вопросы текстологии : сб. статей / отв. ред. В. С. Нечаева. М: : Изд. Акад. наук СССР, 1960. - Вып. 2 : Вопросы текстологии. - С. 28-41.
26. Дерффель К. Статистика в аналитической химии Текст. / К. Дерффель; пер.с нем. Л. Н. Петровой. М. : Мир, 1994. - 267 с.
27. Енюков И. С. Методы, алгоритмы, программы многомерного статистического анализа: пакет ППСА Текст. / И. С. Енюков. М. : Финансы и статистика, 1986. — 231 с.
28. Кукушкина О. В. Определение авторства текста с использованием буквенной и грамматической информации Текст. / О. В. Кукушкина, А. А. Поликарпов, Д. В. Хмелев // Проблемы передачи информации. — М., 2001.-Т. 37.-№2.-С. 96-08.
29. Лихачев Д. С. Вопросы атрибуции произведений древнерусской литературы Текст. / Д. С. Лихачев // Труды отдела древнерусской литературы /АН СССР. -М.; Л., 1961.-№ 17.-С. 37-59.
30. Лихачев Д. С.Текстология на материале русской литературы X—XVII веков Текст. / Д. С. Лихачев ; РАН, Ин-т рус. лит. 3-е изд., перераб. и доп. - СПб.: Алетейя, 2001.-758 с.
31. Манциус К.-Мольер. Театры, публика, актеры его времени Текст. / К. Манциус ; пер. с фр. Ф. Каверина. -М. : Госиздат, 1922. 172 с.
32. Марков А. А. Об одном применении статистического метода Текст. /А. А. Марков // Известия Императорской Академии наук. Сер. 6. -1916.-Т. 10, №4. -С. 239-242.
33. Мартыненко Г. Я. Многомерный синтаксический анализ художественной прозы Текст. / Г. Я. Мартыненко // Структурная и прикладная лингвистика : межвуз. сборник / под ред. А. С. Герда. — Л. : Изд-во Ленингр. ун-та, 1983. Вып.2. - С. 47-61.
34. Мартыненко Г. Я. Основы стилеметрии Текст. / Г. Я. Мартыненко. -Л. : Изд-во Ленингр. ун-та, 1988. 173 с.
35. Марусенко М. А. Об измерении связи отраслевых терминосистем с применением ЭВМ Текст. / М. А. Марусенко // Ученые записки Тартуского университета. — Тарту, 1981. — Вып. 7. — С. 74-81.
36. Марусенко М. А. Атрибуция анонимных и псевдонимных литературных произведений методами распознавания образов Текст. / М. А. Марусенко. — Л. : Изд-во Ленингр. ун-та, 1990. 164 с.
37. Мейер Д. Теория реляционных баз данных Текст. / Д. Мейер ; пер. с англ. М. К. Валиева и др. М. : Мир, 1987. - 608 с.
38. Мещанинов И. И. Эргативная конструкция предложения в языках различных типов Текст. / И. И. Мещанинов. Л. : Наука, 1967. - 248 с.
39. Миркин Б. Г. Анализ качественных признаков и структур = Analysis of qualitative attributes and structures Текст. / Б. Г. Миркин. — M. : Статистика, 1980. 319 с.
40. Ожегов С. И. Словарь русского языка Текст. / С. И. Ожегов ; под ред. Шведовой Н. Ю. М. : Рус. яз., 1984. - 797 с.
41. От Нестора до Фонвизина. Новые методы определения авторства Текст. / Л. В. Милов, Л. И. Бородкин, Т. И. Иванова и др. М. : Прогресс, 1994.-443 с.
42. Поршнева О. С К вопросу об атрибуции текстов записей солдатских разговоров С. 3. Федорченко Текст. / О. С. Поршнева, С. В. Поршнев // Информационный бюллетень ассоциации «История и компьютер» / отв. ред. Л.И. Бородкин. М., 2002. - № 30. - С. 31- 44.
43. Святец Ю. А. Сюрпризы эргодической теории Текст. / Ю.А.Святец // Информационный бюллетень ассоциации «История и компьютер» / отв. ред. Л.И. Бородкин. М., 2002. - № 30. - С.147-149.
44. Севбо И. П. Исследование зависимости между длиной фразы и количеством уровней в графе Текст. / И. П. Севбо, С. М. Алешкипа // Структурная и математическая лингвистика / отв. ред. Ф. А. Никитина.- Киев : Вища школа, 1974. Вып. 2. - С. 101-179.
45. Севбо И. П. Графическое представление синтаксических структур и стилистическая диагностика Текст. / И. П. Севбо. — Киев : Наукова думка, 1981.- 192 с.
46. Сеземан В. Э. «Лингвистические спектры» г. Морозова и Платоновский вопрос Текст. / В. Э. Сеземан // Известия отделения русского языка и словесности Императорской Академии наук. — 1918. — Т. 22, кн. 2.-С. 21-34.
47. Синелева А. В. Атрибуция «Романа с кокаином» : лингвостатистическое исследование Текст. : автореф. дис. . канд. филол. наук : 10.02.21 / Синелева Анастасия Васильевна ; Санкт-Петербургский гос. ун-т. СПб : изд-во СПбГУ, 2001. — 22 с.
48. Современный русский язык Текст. : учеб. для филол. спец. высших учеб. заведений / В. А. Белошапкова, Е. А. Брызгунова, Е. А. Земская [ и др. ] ; под ред. В. А. Белошапковой. М. : Азбуковник, 1999. -928 с.
49. Справочник по вероятностным расчетам Текст. / Г. Г. Абезгауз, А. П. Тронь, Ю. Н. Копенкин и др. М. : Воениздат, 1970. - 407 с.
50. Тарнопольская И. О. Диграммная энтропия текста и атрибуция анонимных текстов : результаты тестирования методики Текст. / И. О. Тарнопольская // Информационный бюллетень ассоциации
51. История и компьютер» / отв. ред. JI. И. Бородкин. М., 1998. — № 23. - С. 65—68.
52. B. Н. Владимиров, И. М. Гарскова. М., 2000. - № 26. - С. 29-35.
53. Терехина А. Ю. Анализ данных методами многомерного шкалирования Текст. / А. Ю. Терехина. М. : Наука, 1986. - 166 с.
54. Тимашев А. Н. Атрибутор // Текстология.ги Электронный ресурс. -2002. Режим доступа : http ://www.textology.ru/atrresum.html. — Загл. с экрана.
55. Томашевский Б. В. Стилистика Текст. : учеб. пособие /
56. Б. В. Томашевский. JI. : Изд-во Ленингр. ун-та, 1983-. — 288 с. /
57. Тулдава Ю. А. Проблемы и методы квантитативно-системногоисследования лексики Текст. / Ю. А. Тулдава. Тарту : Тартуский гос. ун-т, 1987.-203 с.
58. Фукс В. По всем правилам искусства : точные методы в исследованиях литературы, музыки и изобразительного искусства Текст. / В.Фукс // Искусство и ЭВМ / под ред. Р. X. Зарипова. М. : Мир, 1975. - С. 134356.
59. Хетсо Г. Кто написал «Тихий Дон»? : (проблема авторства «Тихого Дона») Текст. / Г. Хетсо, С. Густавссон, Б. Бекман. — М. : Книга, 1989. — 192 с.
60. Хетсо Г. Принадлежность Достоевскому : к вопросу об атрибуции Ф. М. Достоевскому анонимных статей в журналах «Время» и «Эпоха» Текст. / Г. Хетсо. Oslo: Solum Forlag A.S , 1986. - 82 с.
61. Хмелев Д. В. Лингвоанализатор Электронный ресурс. М., 2002. -Режим доступа: http://www.rusf.ru/books/analysis/. - Загл. с экрана.
62. Хмелев Д. В. Распознавание автора текста с использованием цепей А. А. Маркова Текст. / Д. В. Хмелев // Вестник Московского университета. Сер. 9, Филология. - 2000. - № 2. - С. 115-126.
63. Хозяинов С. А. Проблема авторства публицистических произведений
64. Чепига В. П. Проблема «Ромен Гари Эмиль Ажар»: атрибуция романов, опубликованных под псевдонимом Эмиль Ажар Текст. /
65. B. П. Чепига // Известия Российского государственного педагогического университета им. А. И. Герцена. 2007. - № 19.1. C. 284-290.
66. Шапир М. И. Феномен Батенькова и проблема мистификации Текст. / М. И. Шапир // Philologica. 1997. - Т. 4, №8 /10. - С. 85-134.
67. Шахматов А. А. Синтаксис русского языка Текст. / А. А. Шахматов. -М. : Эдиториал УРСС, 2001. 620 с.
68. Шварц Г. Выборочный метод : руководство по применению статистических методов оценивания Текст. / Г. Шварц ; пер. с нем. Я. Ш. Паппэред. М. : Статистика, 1978. - 213 с.
69. Якубайтис Т. А. Вероятностная атрибуция типа текста по нескольким морфологическим признакам Текст. / Т. А. Якубайтис, А. Н. Скляревич. Рига : ИЭВТ, 1982. - 53 с.
70. Arrivé M. La grammaire Text. / M. Arrivé, J.-Cl. Chevalier. Paris : Klincksieck, 1970.-425 p.
71. Boissier D. L'Affaire Molière, la grande supercherie littéraire' Text. / D. Boissier. Paris : Jean-Cyrille Godefroy, 2004. - 315 p.
72. Brondal V. Théorie des prépositions. Introduction à une ■ Sémantique rationnelle Text. / V. Brondal. Copenhague : Munksgaard, 1950.
73. Brunet E. Où l'on mesure la distance entre les distances Electronic resource. / E. Brunei // Texto! [Site] mars 2004. — Mode of access : http://www.revue-texto.net/Inedits/Brunet/BrunetDistance.html. —, Текст на экране на фр. - Загл. с экрана.
74. Bruno F. La pensée et la langue, méthode, principes et plan d'une théorie nouvelle du langage appliquée au français Text. / F. Bruno. — Paris : Masson et Cie, 1965. 984 p.
75. Burrows J. F. Not Unless You Ask Nicely : the Interpretative Nexus Between Analysis and Information Text. / J.F. Burrows // Literary and Linguistic Computing / ed. G. Leitner. — Oxford University Press, 1992. -Vol. 7.-P. 91-109.
76. Campbell L. The Sophisties and Polilicus of Plato Text. / L. Campbell. -Oxford : Clarendon, 1867. 170 p.
77. Cardinne-Petit R. Pierre Louys, inconnu Text. / R. Cardinne-Petit. Paris : L'Elan, 1948.-256 p.
78. Dubois J. Grammaire structurale du français : nom et pronom Text. / J. Dubois. Paris : Larousse, Langue et langage, 1965. - 192 p.
79. Dubois J. Eléments de linguistique française : Syntaxe Text. / J. Dubois, F. Dubois-Charlier. Paris : Larousse, 1970. - 294 p.
80. Duchêne R. Molière Text. / R. Duchêne. Paris : Fayard, 1998. - 790 p.
81. Garde-Tamine Y. La stylistique Text. / Y. Garde-Tamine. Paris : Colin, 1992.-630 p.
82. Galichet G. Grammaire structurale du français moderne Text. / G. Galichet.- Paris : Larousse, 1970. 285 p.
83. Goujon J.-P. Pierre Louys, une vie secrete 1870-1925 Text. / J.-P. Goujon -Paris : Fayard, 1988. 872 p.
84. Grammaire d'aujourd'hui. Guide alphabétique de linguistique française Text. / Ed. M. Arrivé, F. Cadet, M. Galmiche. Paris : Flammarion, 1986. -380 p.
85. Grammaire Larousse du français contemporain Text. / Ed. J. C. Chevalier, C. Blanche Benveniste, P. Arrive Paris : Larousse, 1964. - 495 p.
86. Grevisse M. Le bon usage. Grammaire française Text. / M. Grevisse.- Ed. A. Goosse. Paris and Louvain-la-Neuve : Duculot, 1993. - 1806 p.
87. Gutmann R.-A. Introduction à la lecture des poètes français Text. / R.-A. Gutmann Paris : R. Lacoste, 1961. - 394 p.'
88. Henkels R. M. Using computer generated concordanca to analyse and document stylistic devices in Robert Pinget's fable Text. / R. M. Henkels, E.R. Egea // Computer and the Humanities. 1977. - Vol. 11. - P. 56-73.
89. Holmes, D.I. The Evolution of Stylometry in Humanities Scholarship Text. / D. I. Holmes // Literary and Linguistic Computing / ed. M. Deegan,
90. S. Lee. London : Oxford University Press, 1998. - Vol. 13. - No. 3. -P. 111-117.
91. Hupert P. Vocabulary richness. Text. / P. Hupert, D. Labbé // Lexicometrica. 1997. - № 0. - P. 164-178.
92. Julaud J.-J. La Littérature française pour les nuls Text. / J.-J. Julaud. Paris : Jean-Joseph Editions, 2005. - 660 p.
93. L'affaire Corneille-Molière Site. 2006. Mode of access: http://www.comeille-moliere.org. - Текст на экране на фр. — Загл. с экрана.
94. Labbé С. Inter-textual distance and authorship attribution Corneille and Molière. Text. / С. Labbé, D. Labbé // Journal of Quantitative Lingustics.-2001.-Vol. 8.-№3.-P. 213-231.
95. Labbé C. La distance intertextuelle. Text. / С. Labbé, D. Labbé // Corpus. — 2003. — № 2. P. 95-118.
96. Labbé D. Corneille dans l'ombre de Molière. Histoire d'une recherché Text. / D. Labbé. Paris ; Bruxelles : Les Impression nouvelles, 2003. -144 p. 1
97. Lewino F. Corneille Molière. L'affaire rebondit Text. / F. Lewino // Le Point.-2003.-№1595.-P. 102.
98. Louys P. Corneille est-il l'auteur d'Amphitryon? Reponse Text. / P. Louys // L'Intermédiare des chercheurs et curieux. 1919. - № 1505. -P. 123.
99. Louys P. Textes fondateurs de Pierre Louys Electronic resource. / P. Louys // L'affaire Corneille-Molière [Site] 2006. - Mode of access: http://corneille-moliere.org/pageshtml/iextesdepien-elouvs.htm — Текст на экране на фр. — Загл. с экрана.
100. Louys P. Le Problème Corneille-Molière vu par P. Louys (contribution au dossier définitif) Text. / P. Louys // Broutilles, recueillies par Frédéric Lachèvre. Paris, 40, rue Beaujon, 1938. - 103 p.
101. Merriam T. An Application of Authorship Attribution by Intertextual Distance in English Text. / T. Merriam // Corpus. 2003. - №2. - P. 142168.
102. Mallet F. Molière Text. / F. Mallet. Paris : Grasset, 1986. - 478 p.
103. Muller C. Principes et méthodes de statistique textuelle Text. / С. Muller -Paris : Hachette, 1977. -478 p.
104. Plan P.-P. Molière et ses œuvres Text. / P.-P. Plan // Mercure de France. 1919. - Vol. CX1II. - №505. - P. 43-46.
105. Poulaille, H. Corneille sous le masque de Molière Text. / H. Poulaille. Paris : Grasset, 1957. - 400 p.
106. Taranovsky K. The Rhythmical Structure of the Notorious Russian Poem Luka Text. / K. Taranovsky // International Journal of Slavic Linguistics and Poetics / ed. D. S. Worth, E. Stankiewicz. Columbus, Ohio, 1982. - vol. XXV/XXVI - P. 429—432.
107. Vergnaud F. Appendice II Text. / F. Vergnaud // Wouters H., de Ville de Goyet C. Molière ou l'auteur imaginaire? Bruxelles : Complèxe, 1990.-P. 131-150.
108. Vidal P. Molière-Corneille, les mensonges d'une légende Text. / P. Vidal. Paris : Lafon, 2001. - 211 p.
109. Visé de J. D. Molière jugé par ses contemporains Text. / J. D. Visé de, M. Brécaut de, L. Grange. Paris : Isidore Liseux, 1877. - 148 p.
110. Voltaire. Vie de Molière Text. / Voltaire. Amsterdam : Catuffe, 1739.-347 p.-182127. Wilmet M. Grammaire critique du français Text. / M. Wilmet.
111. Paris ; Bruxelles : Duculot, 1998. 704 p. 128. Wouters H. Molière ou l'auteur imaginaire? Text. / H. Wouters, de G. de Ville. -Bruxelles : Complèxe, 1990. - 151 p.список источников
112. Quinault Ph. Le théâtre de Mr Quinault, contenant ses tragédies, comédies et opéras. — 5 Vol. / éd. par G. Boffrand. Paris : la Compagnie des Libraires, 1739. - Vol. 1 : 543 p. ; Vol. 2 : 516 p. ; Vol. 3 : 399 p. ; Vol. 4 : 407 p. ,; Vol. 5 : 482 p.