автореферат диссертации по филологии, специальность ВАК РФ 10.02.01
диссертация на тему:
Автоматический анализ метрики русского стиха

  • Год: 1996
  • Автор научной работы: Брейдо, Евгений Маркович
  • Ученая cтепень: кандидата филологических наук
  • Место защиты диссертации: Москва
  • Код cпециальности ВАК: 10.02.01
Автореферат по филологии на тему 'Автоматический анализ метрики русского стиха'

Полный текст автореферата диссертации по теме "Автоматический анализ метрики русского стиха"

РОССИЙСКАЯ АКАДЕМИЯ НАУК ИНСТИТУТ РУССКОГО ЯЗЫКА им. В.В.ВИНОГРАДОВА

РГЗ 0/1

На правах рукописи

Г. '

БРЕЙДО Евгений Маркович

АВТОМАТИЧЕСКИЙ АНАЛИЗ МЕТРИКИ РУССКОГО СТИХА

Специальность 10.02.0! - Русский язык

Автореферат диссертации на соискание ученой степени кандидата филологических наук

Москва 1996

Работа выполнена в Институте русского языка РАН им. В.В.Вшюградова

Научные руководители:

доктор филологических наук, академик РАН МЛ.Гаспаров доктор филологических наук, профессор В.П.Григорьев

Официальные оппоненты:

доктор филологических наук, профессор А.Я.Шайкевнч доктор филологических наук, профессор Ю.Б.Орлишсий

Ведущая организация

Санкт-Петербургский государственный университет

/J ••

Зашита состоится " /|-/ __1996 г.

на заседании специализированного совета Д.002.19.0Г при Институте русского языка РАН им. В.В.Виноградова по адресу: 121019 Москва, Волхонка, 18/2

С диссертацией можно ознакомиться в бисшиотеке Института русского языка РАН им. В.В.Виноградова

Автореферат разослан

1996 г.

Ученый секретарь специализированного совета доктор филологических наук

В.Г.Демьянов

Общая характеристика работы

Основная задача данной работы - дать систематическое формальное описание русской метрики, пригодное для компьютерного анализа текста. Предлагаемый подход подразумевает детальное рассмотрение всех характерных черт и особенностей метрической структуры, с учетом того, что понимается человеком, тем более стихо цело м-исследователем, носителем профессионального языка и культуры, по умолчанию, и, следовательно, не становится вовсе предметом научного анализа. Лингвистическое описание в идеале должно охватывать языковую систему полностью, с максимальной степенью подробности, не ограничиваясь разбором отдельных интересных случаев или, наоборот, рассмотрением наиболее типичных явлений. В этом отношении компьютерная модель, сделанная не с инженерной точки зрения, а исходя из логики данной науки, - редкая возможность строгого, точного и полного описания метрической системы. Постановка такой задачи вкупе с построением модели кажутся не только правомерными, но абсолютно необходимыми при нынешнем состоянии стиховедческих исследований, и определяют HOjiinny подхода, предлагаемого в реферируемой работе. Таким образом, наша цель заключается в том, чтобы соединить стиховедение (или, по крайней мере, некоторую его часть) с computer science и заложить основы новой дисциплины на стыке стиховедческих проблем с традиционными задачами компьютерной лингвистики, информатики и искусственного интеллекта.

Актуальность. Две вещи в современном мире оказали колоссальное влияние на сближение филологии и информатики: появление глобальной мировом сети INTERNET и электронной полиграфии. Информатика реально меняет облик культуры, и это определяется в основном двумя простыми вещами: тем, что базы данных по различным отраслям знаний, в том числе по филологии, стали доступны всем в режиме "on-line", и в еще большей степени тем, что СГ)-ГЮМные издания практически везде тесня г бумажную полиграфию (по средним статистическим оценкам сейчас примерно треть мировой печатной продукции выпускается на CD-ROMax). Значение этих вещей трудно переоценить: они означают выход информационных технологий за пределы традиционных областей инженерии, техники, и начало завоевания ими мирового культурного пространства, проникновение во все и вся, изменение самой структуры, внутреннего строения культуры. Началось это, разумеется, с развлекательной сферы, как наиболее динамичной, но сегодня уже захватило п самые консервативные, фундаментальные области. Носители традиционной книжной культуры - филологи (и в первую очередь не лингвисты, а литературоведы, текстологи, по роду занятий едва ли не дальше всех отстоящие от новых технических веяний) оказались вынуждены вместе с программистами и разного рода специалистами по

информатике трансформировать нашу книжную культуру в электронный пид. Если раньше только лексикография и некоторые узкие области лингвистики были слиты с информатикой и один клубок, то теперь это можно уже отнести к филологии в целом, и надо думать, взаимовлияние будет сказываться не только в сфере современных информационных технологий, но и в изменении фундаментальных научных представлений. Тема данной работы приобретает особую актуальность в связи с появлением электронной полиграфии и надобностью в моделях и методах, позволяющих работать с новыми аналогами книги и осмыслить само явление электронного текста, который вовсе не тождествен тексту бумажному (но это предмет специальных исследований). Теоретическая значимость. В реферируемой диссертации построена формальная модель (названная интервальной), описывающая русскую метрику ог силлабо-тоники до границы с прозой, чего не делалось рапсе. Эта модель позволяет открывать новые формы стиха непосредственно в тексте без привлечения дополнительной информации. В результате ее применения к русскому акцентному стиху (на примере Маяковского), было открыто два новых типа стиха - строгий и многоинтервальныи акцентный стих. Основанные на интервальной модели алгоритм компьютерного анализа метрики позволяют автоматически и полуавтоматически распознавать любые метрические формы русского стиха и определять основные понятия метрики, исходя из алгоритмов анализа. Наконец, принцип, положенный в основу интервальной модели, позволяет сформулировать новую гипотезу о ритмической организации прозаических текстов.

Практическое значение. Разработанные алгоритмы и программы могут быть использованы при создании электронных метрических справочников поэтов (как это сделано в диссертации для Пастернака), что крайне важно при современном развитии электронных изданий на СЭ - ЯОМах, при разработке баз данных и знаний по стиховедению в ближайшем будущем, при написании компьютерных обучающих программ по русскому стиху, а также при подготовке обычных учебных курсов.

Апробация работы. Результаты апробировались на семинаре по искусственному интеллекту Диалог (1990), на Всесоюзных конференциях в Тарту (Компьютерная лингвистика, 1990), Симферополе (Проблемы обучения языкам, 1991) и Киеве (Проблсми створення машинних фондш мов, 1991), научных докладах и курсе лекций, прочитанных в Поиском университете (Германия) (1992, 1993, 1994), на семинаре кафедры русской литературы Московского государственного педагогического университета (1994), на Международном семинаре Диалог-95 (1995) и на семинаре в отделе стилистики и языка художественной литературы Института русского языка РАН (1995)

Структура работы. Диссертация состоит из введения, четырех глав (Компьютерный подход к описанию метрики стиха, Интервальная модель

русской метрики, Акцептный стих Маяковского и Апгорнтмм компьютерного анализа поэтического текста), заключения, приложении и списка использованной литературы.

Краткое содержание работы

Во Введении сформулиропаны осиопные адачи рабогы, дается характеристика разных полходоп и методов исследования.

В первой главе, названной Компьютерный подход к описанию метрики стиха, обосновываются принципы описания метрики с тчки зрения computer science и дается краткий обзор основных направлении искусственного интеллекта, компьютерной лингвистки и стшнсшческнч методов, используемых в стиховедении. Реферируемая работ лежит на пересечении этих грех направлений, поэтому каждое in них нашло отражение в обзоре.

Вторая глава - Интервальная модель русской метрики - посвяшепа построению формальной модели метрики. Напомним, что мы различаем системы стихосложения в зависимости от признаков, по которым сравниваются стихотворные строки. В спллабике строки сопоставляются по числу слогов, в тонике - по числу ударений, в силлабо-тоннкс - по числу стоп.

С юна - повторяющееся сочетание сильного и слабых мест. Стопа в силлабо-тонике может быть двусложной (одно сильное место и одно слабое) и трехсложной (одно сильное место и два слабых). Число слогов в стопе постоянно.

В дольнике и та кто пике принцип чередования сильных и слабых мест был применен к стиху другой структуры (см. работы М Л.Гасиарова. в частности, книгу "Современный русский стих: метрика и ритмика". М, "Наука", 1974, с.220 - 371). Оказалось, что он работе г. только имеет постоянной стопы мы получили переменные, х<ня и регулярно повторяющиеся, группы сильных и слабых mcci (доли, гакты), вместо одного типа интервала между сильными местами (единица для лпусложииков и двойка для трехсложников) - несколько (два для дольника и три для тактовика). Будем впредь называть такой подход силлабо-тоническим.

Слоговой объем междуиктового интервала будем также называть сю типом. Как только что было сказано, дольник имеет два типа интервала -как правило, один и два слога, а тактовик три типа - чаше всею. один, два и три слога. Пользоваться термином тип ишперааш метдолошчеекп удобнее, чем словами объем интервала, т.к. объемы интервалов внутри одной формы стиха могут меняться, а количество типов всегда постоянно Так, дольник всегда содержит два типа межлуиктовот интервала. \<mi сами интервалы бывают не только I и 2. но и 0 и I ело). и лаже 0 и 1 слога, хотя и очень редко. Более того, если бы вдруг начали писан, ешхом с интервалами, например, I и 4 слога, он также был бы сочтен дольником

но родовому признаку - двум типам интервалов. Таким образом, термин шип иипшршии [Kuaojiuet фиксировать универсальные, отличительные признаки сгихопшрной формы.

1акое понимание метрической формы несколько отличается от обшеприняюто, покольку традиционно дольником принято считать просто стих с междуиктоными интервалами один и дна слога, а тактовиком стих с интерналами один, дна и три слога. Мы формализуем понятие интервала, выделяя И) нею дна параметра: тип интервала и количество разных интервальных типов в тексте. Первое служит для определения метрической формы н целом, втрое для уточнения этою определения, например, lakioBtiK (1,2,3) или тактовик (0,1,2). Благодаря такой формализации параметра н nauieii классификации определяются как равноправные Mapimnuiuiue формы, например, такие как мандслыитамовский логаэд "Сеюдня дурной день" (дольник (2,0)) пли стихотворение Маяковского "Марш комсомольца" (тактовик (0,1,2)).

КалеIси ееiест венным использовать силлабо-тонический подход и дальше - для акпенпюю стиха. Следуя данному принципу, мы предположили, что н акцентом стихе сущеавукл группы с разным количеством интервальных шпон в тексте. В результате обследования стиха Маяковскою было выделено две ipyinibi, названные строгим и мнотишервальпым акцентным стихом. Одна труппа - строгий акцентный ешх -71 СТИЧ01 норение, 3420 строк, другая - многоинтернальный стих - 59 ешчотноренпй, 2Х2У строк. Термин строгий акцентный стих заимствован у Дж ben iii (он назвал термином strict accentual verse тактовик, а мы, ешраясь не вводитI, новых терминов, используем его для обозначения следующей промежуточной формы стиха). Покажем на примере, о чем нде| речь:

Но Красному морю тычут каторжане (Амф 4) IIк Красному мо/но тычут ртбойннки (Дк 4) Но Красному морю тычут американцы (Тк 4) Но Красному морю тычут пулрторикапи,ы (Акц(С))

Мы переделывали строчку Маяковскою, последовательно конаруируя разные типы стиха Первые три - известные метрические I руины соотсгавепно с одним (амфибрахий), двумя (дольник), фемя (тактовик) пшамп интервалов. (И пашем условном примере каждый раз добавляется HoHi.ni Iнп ишервала.) В последней строчке появляется четырехсложный интервал - при щлк нового типа стиха.

С'фогим акцентным стихом мы называем стих с четырьмя швами

итернадов (как правило, 1,2,3,4), например:

Гы, который трудишься, сапоги ли чистишь, Акц(С)

оухлытер ила оухгалтероча помощница,

ты, чье лицо от дел и тощищи

помшпое и мясное, как трешница.

Н.Маяковский " Теплое слово кое-каким порокам" Ритмическая схема:

.1.4.1.1 1.4.4.2 .2.1.2.1 1.4.3.2

(В четверостишии есть межлуударные интервалы четырех типов -1.2,3,4. но за пределы четырех слогов междуударный интервал нигде не выхолит.) Многоинтервальный акцентный стих - стих с пнп.ю и более гипамн интервалов. Пример многоинтервального акцентного стиха:

И солнце интересуется, и апрель еще, Акц(М)

даже заинтересовало трубочиста черного удивительное, необыкновенное зрелище -фигура знаменитого ученого.

В.Маяковский "Гимн ученому" Ритмическая схема: 1.4.4.1. .6.3.1.2 2.7.2.2 1.3.3.2

(Диапазон междуударных интервалов здесь больше четырех, во второй и третьей строке появляются интервалы 6 н 7, причем вторая строка четырехуларная, что в случае Маяковского позволяет считать ее полноударной формой.)

Дольник и тактовик достаточно .хорошо описаны, главным обра юм М.Л.Гасиаропым, поэтому не станем приводить примеров.

Мшим данные о формах стиха можно свести и следующую таблицу:

Таблица 1

Силлабо-тоника Промежуточные формы Мнопнштгрвальныи

2-пик З-пик Дольник Тактовик Строгий акцептный стих акцептный стих

Типы интервалов 1 2 0,1,2 0,1,2,3 0.1,2,3,4 0,1.2.3,4,5...

Количество типоп интервалов в тексте 2 3 4 5 и более

Итак, мы получили классификацию стихотворных форм от силлабо-тоиики до чистой тоники (т.е. до границы с прозой), построенную по одному принципу, и общий метод выделения разных групп стиха для систем стихосложения, основанных на чередовании сильных и слабых мест. Перейдем теперь собственно к построению формальной модели.

Рассмотрим один из подходов к внутреннему устройству стихотворной метрики. Для этого нам понадобится ввести две логические операции. Назовем их операциями редукции и наращения.

Предположим, что у нас есть несколько строчек, написанных дактилем: Дактиль 4 Вот поднимаются медленно « гору.

Чудная даль открывается взору (Н.А.Некрасов, "Псовая охота")

Ритмическая схема: .2.2.2.1 .2.2.2.1

Как сделать из него дольник? Ответ прост : дактиль - трехсложный мегр. т.е. стих с постоянным междуиктовым интервалом, равным двум; чтобы получить из него дольник, нужно редуцировать одно слабое место в строке, и тем сделать междуиктовым интервал переменным - равным единице или двойке. Например, это может выглядеть так: Дольник 4 Вот поднимаются медленно в гору. Чудная даль открылась тут тору

Ритмическая схема: .2.2.2.1 .2.1.2.1

Убрав один лишний безударный слог (слабое место) по второй строчке, мы сделаем ее дольниковой. Будем эту операцию называть редукцией слабого места - Очевидно, что любой трехсложник отличается от дольника

типа (1,2) на одно слабое место (или, для русского языка, на один обычно безударный слог).

Получить из трехсложника тактовик можно противоположной операцией -добавлением одного слабого места (безударного слога) к двусложному междуиктовому интервалу, например:

Анапест 3: Полюбил, и не дал бы совета.

Ритмическая

схема 2.2.2.!

Тактовик 3: Полюбил, и не спрашивал совета. (С.Фсдорченко)

Ритмическая

схема 2.2.3.1

Такую операцию будем называть наращением слабого места - А(и).

Очевидно, что с помощью операций редукции и наращения можно переходить от одной стихотворной формы к другой. Это означает, что зная интервальные формулы силлабо-тонических метров (с учетом возможных пропусков метрических ударений), можно легко написать такие формулы для нссиллабо-тонических форм стиха. Решение этой задачи равносильно построению формальной модели русской метрики, которую мы по имени главного героя повествования назовем интервальной. Рассмотрим ее. 'Задача распадается на две части:

1) Определение структуры междуударного интервала для силлабо-тонических метро».

2) Написание на их основе интервальных формул для несиллабо-тоническоп метрики.

Начнем с первой. Рассмотрим сначала двусложные силлабо-тонические метры - ямб и хорей. Метрический интервал для двусложников равен единице. Легко видно, что при пропуске метрического ударения безударными оказываются 3 слога: обычный междуударный интервал плюс двусложная стопа с пропущенным ударением. При следующем пропуске ударения добавляются еще 2 безударных слога и т.д. Отсюда легко возникает формула для расчета интервала: ¡=2п+1, где : - объем интервала (в слогах), 2 - величина стопы (2 слога), п - число пропущенных ударений, 1 - величина метрического интервала. Приведем пример (все примеры для демонстрации силлабо-тонических" формул взяты из "Начальной поры" 11асгерпака):

1) Я 4 : Февраль.'Достать чернил и плакать... Ритмическая схема: 1.1.1.1.1 (Полноударная строка.)

2) Я 4: Писать о феврале навзрыд... Ритмическая схема: 1.3.1.

(Строка с пропуском ударения на второй стопе.)

3) /¡специи венецианкой... (Венеции) Ритмическая схема: ¡.5.1

(Строка с пропусками ударений на второй и третьей стопе.) Полученные междуударные интервалы соответственно 1,3 и 5. Если подставить значения в формулу, получим:

1) 11=0 (иолноударная строка), ¡=>2x0+1 = 1

2) п=1 (строка с пропуском одного ударения), ¡=>2x1 + 1=3

3) п=2 (строка с пропуском двух ударений подряд), ¡=>2x2+1=5

Видно, что объем междуударного интервала действительно изменяется по формуле арифметической прогрессии, записанной выше. Для трехсложных метров - дактиля, амфибрахия и анапеста, задача решается аналогично. Разница только в том, что метрический интервал в этом случае равен двум, а стопа состоит из трех слогов. Поэтому формула для грехсложников выглядит так: ¡=Зп+2. Покажем это на примере: Ан 3: Прижимаюсь щекою к воронке...

Ритмическая схема: 2.2.2. i Аи 3: За стаканчиками купороса... Ритмическая схема: 2.5.1 П одета un в значения в формулу, получим:

1) п=0 (полноударная строка) ¡=>3x0+2=2

2) п=1 (строка с пропуском ударения) ¡=>3x1+2=5

Видно, что междуударные интервалы в трсхсложнике изменяются по закону, заданному данной арифметической прогрессией. (В трехсложнпках к интервалам, задаваемым прогрессией, следует добавить еще нулевой интервал, т.к. в них часты сверхсхемныс ударения (в отличие от двусложников, для которых характерны пропуски схемных ударений), а при дополнительном ударении в трехсложной стопе интервал исчезает. Но сверхсхемныс ударения все равно существенно реже схемных, иначе стих перестает быть трехсложником, поэтому основной интервал задается прогрессией. Нулевой интервал допустим, но только как дополнительный.) Запишем формулу в общем виде: ¡=fn+c

где f - величина стопы (2 или 3 слога)

с - объем метрического интервала (1 или 2 слога) Отдельные метры отличаются друг от друга величиной анакрусы (от нуля до двух слогов).

Мы можем сделать сейчас важный вывод: силшбо-топика - это стих с одним типом междуударного интервала, причем интервал здесь не конкретное число, а закономерность, выраженной формулой типа fn+c. И реальной для русского стиха силлабо-тонике это формулы 2п + 1 и Зп+2, но в принципе коэффициенты здесь произвольны. Если бы существовали пеоны, формула для них была бы построена очень легко. Теперь, когда структура междуударного интервала в силлабо-тоиике известна, воспользуемся операциями редукции и наращения. Запишем междуударные интервалы для дольника. Начнем с самою распространенного дольника - (1,2) с преобладанием двусложных интервалов. Поскольку дольник - стих с двумя типами интервалов, ю естественно предложить 2 формулы - для вычисления интервалов каждою тина (на самом деле речь идет не столько об определении междуиктовых интервалов разных типов, сколько о правильном распознавании стихотворной формы в случае пропусков ударений при сочетании разных интервалов).

Одна формула у нас есть - формула трехсложника - Зп+2. Редуцируем трехсложный интервал (в соответствии с тем, что было написано выше) -получим формулу: Зп+1. Таким образом, междуиктовыс интервалы в дольнике описываются двумя формулами:

Зп+2 Зп+1

Приведем пример (Маяконский, "Гимн судье"): Попал павлин орапжево-сшшй под глаз его строгай, как пост, и вылинял моментально павлиний великолепный .хвост/ Ритмическая схема: 1.1.1.2.1 Дк

1.2.2. Амф 1.4.2.1 Дк 3.1. Я (или Дк) В первой строчке 2 первых интервала рассчитываются по формуле Зп+1, (п=0), 3-й по формуле Зп+2 (п=0). Вторая строчка силлабо-тоническая -это трехстопный амфибрахий (описывается формулой Зп+2), в третьей строчке первый интервал рассчитывается по формуле Зп+1:

4=3x1 + 1 п=|

Значение п говорит, что здесь пропущено одно схемное ударение. Следующий интервал обслуживается формулой Зп+2 (п=0), последняя четвертая строчка - трехстопный ямб с пропуском ударения на нерпой eioiie или дольник. Формула для ее расчета - Зп+1 (п=0). Здесь только один интервал - он и считается по вышеприведенной формуле или, если мы сочтем это формой дольника, - два интервала с односложной анакрусой. Все четверостишие укладывается в дольник. Последняя строчка может вызвать некоторые опасения - если пропуск ударения придется не на первую стопу, а на середину строки - интервал в 3 слога вроде бы не поддается определению по приведенным формулам. IIa самом деле это не гак. Данный случай подробно рассмотрен в диссертации, но здесь мы не имеем возможности сделать этого (не будем забывать при этом, что дольник с трехсложными интервалами - большая редкое! ь).

Существуют еще один тип дольника, не разобранный нами - (2,0). (Он также чрезвычайно редок.) Для него в приведенные выше формулы добавляется нулевой интервал. Обобщенный набор формул, обслуживающий псе виды дольника, выглядит так:

О

2п+1 Зп+2 Зп+1

Но обычно используются только 2 последние.

Представим теперь, что у нас есть некоторый стихотворный текст, например, приведенный выше отрывок из "Гимна судье" Маяковского, по мы не знаем, что такое дольник (а также тактовик и другие пееиллабо-тонические метрические формы). Можно ли как-то определить метр этого текста? Будем рассуждать следующим образом. Он не описывается полностью пи одной силлабо-тонической формулой, следовательно, это не силлабо-тоника, т.е. в данном стихе не один тип междуиктового

интервала. Предположим, что здесь интервалы двух типов. Редуцируем одно слабое место в формуле трехсложника, получим две формулы для двух интервалов и посмотрим, описывается ли ими ритмика нашею текста. Дальше задача сводится к описанной выше.

Таким образом, мы ответили на вопрос, заданный в начале предыдущего абзаца. Нам не нужны предварительные знания о метре. Строя формулы по предложенному алгоритму, можно "открывать метр в самом тексте" (но выражению С.И.Гиндина) - задача, популярная в 60-е - 70-е годы. (Если текст не описывается двумя формулами, легко построить третью, как это будет показано ниже, и т.д.) Такая модель метрики удобна тем, что позволяет открывать новые метрические формы, причем это может делат ь даже не человек, а компьютер по заданному алгоритму. Получим теперь аналогичный набор интервальных формул для тактовика. (Такой оборот не должен вводить в заблуждение. Формулы получаются непосредственно из текста, но поскольку они описывают уже существующие метрические формы, то набору формул приписывается имя соответствующей формы. Заодно метрические формы наконец получают формальное определение. Интервальная модель, таким образом, может работать и сверху, раскладывая тсксты по полочкам существующих форм, и снизу, открывая метр в тексте.)

Тактовику свойственны 3 типа интервала. Формулы для двух у пас уже есть - это дольниковыс формулы Зп+1 и Зп+2. Собственно тактовиковый. трехсложный интервал может быть получен наращением трехсложника или дольника. Выполним операцию наращения. Получим арифметическую прогрессию Зп+З.

Аналогично получаются формулы для строгого акцентного стиха. Выполнив логическую операцию наращения тактовика, будем иметь 4 формулы для четырех типов интервалов акцентного стиха:

Зп+1 Зп+2 Зп+З Зп+4

За четырехинтервальным акцентным стихом идет многоинтервальный. Эк> преимущественно пятиинтервальный стих (добавляется нулевой интервал) с небольшим вкраплением интервалов больше четырех слогов. По ритмическим характеристикам этот стих непосредственно граничит с прозой. Принцип построения интервальных формул для него понятен, число их увеличивается в соответствии с увеличением диапазона интервалов.

Далее в этой главе рассматривается статистическая процедура разграничения метрических форм. Предлагаемый метод позволяет с достаточной точностью провести границу между двумя метрическими формами. Думается, что важность решения этой задачи в стиховедении

очевидна. Почти в каждом тексте (исключая силлабо-томику) есть некоторое количество "лишних" строк, не укладывающихся . в предполагаемый набор интервалов. Необходимо определить, при каком количестве таких строк стихотворение еще относится к данному тину, а при каком уже описывается другим набором интервалов или, иными словами, каков допустимый уровень "шума". Этот уровень может довольно сильно отличаться у разных поэтов и при проведении границ между разными группами текстов.

Итак, задача заключается в том, чтобы, отобрав предварительно две группы текстов определить, действительно ли они относятся к разным метрическим формам. По-видимому, сделать это можно только на основе какого-нибудь критерия. Кажется, что в данном случае вполне уместны статистические критерии, поскольку нас интересует количество строк, а не их структура.

Предлагаемый метод заключается в следующем:

1) В каждой из предварительно отобранных групп текстов вычисляется отношение наиболее расшатанных строк к общему числу строк в стихотворении (разумеется, для каждого стихотворения)

2) Две полученных выборки сравнивают между собой.

Вначале сравниваются статистические распределения той и другой выборки. Если выборки относятся к распределениям разного типа (например, одна к нормальному, а другая к пуассоновскому), понятно, что метрические формы стихотворных групп различны. Если они относятся к одному распределению, с помощью статистических критериев сравниваются количественные параметры распределения одной и другой выборки. Если эти параметры совпадают, наши тексты относятся к одной метрической форме, если нет - к разным. С помощью данного метода были проведены границы между дольником и строгим акцентным стихом Маяковского и между строгим и многоинтервальным акцентным стихом того же автора. Так выглядит русская метрика от силлабо-тоники до чисто тонического стиха, если посмотреть на нее с "интервальной" точки зрения. Подытожим содержание главы:

1) Основные стихотворные формы полностью определяются количеством типов интервалов в тексте и самим набором интервалов (для силлабо-тонических метров необходимо также знать величину анакрусы, в других формах она важна, но не настолько). Существенно, что тип интервала -это некоторая закономерность, выражаемая формулой; как правило, принимает несколько числовых значений.

2) Все метрические формы вычислимы, т.е. любой форме можно сопоставить набор интервальных формул, которым она полностью описывается, иначе говоря, перевести с литературоведческого языка на более строгий язык алгоритмов;

3) Существуют алгоритмы автоматического анализа, определяющие размер любого стихотворного текста (о них пойдет речь в последней главе). Эго существенно как с точки зрения компьютерного анализа поэтического текста,

так и с точки зрения решения задачи "открытия метра в самом тексте", как было показано выше. Мы подошли к главному выводу данном главы. Интервальная модель представляет собой отличную от существующей модель метрики. Метр здесь не директивно формулируемое правило, а набор условии, которым удовлетворяет определенное множество текстов. В случае необходимости, если текст не описывается существующими формулами, по известным правилам можно записать удовлетворительный для него набор условии. Реально это имеет смысл делать в случае довольно большой группы текстов, отражающих какую-то тенденцию, поскольку всегда можно сочинить несколько экспериментальных стихотворений любой структуры. С помощью интервальной модели можно решать как традиционную задачу подведения текста под заранее установленный размер (правда, в сильно формализованном виде), так и обратную ей.

Третья глава - Акцентный стих Маяковского - посвящена рассмотрению акцентного стиха с точки зрения интервальной модели русской метрики. Стих Маяковского кажется вполне подходящим материалом для решения этой задачи - во-первых, по мнению большинства исследователей, это классический пример русского акцептного стиха, во-вторых, большое количество текстов дают возможность надежной проверки исследовательских гипотез.

Считается, что акцентный (или, в друг ой терминологии, чисю тонический) стих лишен метрической урегулированное™ и его единственная мера - количество ударений. Принятое н настоящее время определение В.М.Жирмунского гласит: "Чистый тонический стих основан на счете ударных слогов; число неударных между ударениями является величиной переменной. Общая формула такого стиха: х - х х - .... где х = 0,1.2,3.,.; мы различаем соответственно стих двухударпый, трехударный, четырехударный и т.п." По Жирмунскому, в область чисто тонического стиха попадают дольники , тактовики и собственно акцентный стих. После работ МЛ.Гаспарова (см. выше) ни у кого уже не вызывает сомнений метрическая урегулированность дольников и тактовиков. По акцентный стих по прежнему остается "областью ритма, а не метра".

Между тем, если кроме числа ударений анализировать также слоговой обьем междуударных интервалов, то окажется, что акцентный сгих отчетливо разбивается по этому параметру на две группы. Стих Маяковского удобен для такого эксперимента. Он преимущественно четырехударный (также часто встречается устойчивая комбинация ударений 4/3, другие случаи существенно более редки), поэтому обычно не надо тратить больших усилий на определение числа иктов.

Зависимость от двух параметров (подобно силлабо-тоническим размерам), замеченная ранее для дольника и тактовика, проявляется и в акцентом стихе. Назовем это свойство метрической урсгулированностыо акцентного стиха. Разделение акцентного стиха по количеству типов интервалов позволяет говорить о существовании двух групп акцентного стиха.

Для. работы были взяты все лирические стихотворения Маяковского, написанные акцентным стихом, и пятая глава поэмы "Хорошо". (Принципы отбора текстов подробно описаны в реферируемой диссертации.) Всего было проанализировано 6249 строк. Они распались на две группы - стихи с четырьмя типами интервалов и с пятью и более. Как уже было сказано, мы назвали их соответственно строгим и многоинтервальным акцентным стихом. Данные о числе строк в каждой группе приведены выше, а таблицы с полным перечнем стихотворений и результатами анализа - в тексте диссертации. Все основные соотношения видны на диаграммах, представленных ниже. Поясним принятые нами обозначения: С-Т - силлабо-тонические строки, Дк - строки, укладывающиеся в дольник, Тк - строки, укладывающиеся в тактовик, Лкп(С) - строки, укладывающиеся в строгий акцентный стих, Акн1(С) - строки, укладывающиеся в строгий акцентный стих типа (0,1,2,3),

Акн(Мн) - строки, укладывающиеся в многоинтервальный акцентный стих.

Строгий акцептным стих Маяковского.

Рнс.1

3500 3000 2500 2000 1500 1000 500 0

Общее С-Т Дк Тк Акц Акц число (С) (Мн)

строк

Общее число строк С-Т Дк Тк Акц (С) Акц (М)

3420 30 672 1079 1275 364

% 0.88 19.65 31.55 37.28 10.64

Многоинтервальным акцентный стих Майкопского Рие.2

Общее С-Т число строк

Акц (С)

Общее число строк С-Т Дк Тк Акц (С) Акц (Мн)

2829 8 368 672 650 1131

% 0.28 13.01 23.75 22.98 39.98

Под рисунками приведено общее число строк и число строк каждого типа для исследуемых групп стиха, а также эти же данные в процентах для удобства сопоставления. Из диаграмм и подсчетов под ними ясно виден интуитивный критерий, руководствуясь которым мы выделили два типа акцептного стиха. В первом случае число стихов, укладывающихся в строгий акцентный стих, превышает четверть строк стихотворения, а число стихов, укладывающихся в многоинтервальный стих, существенно меньше четверти. Во втором случае все с точностью до наоборот. (Такое деление подтверждено разработанной нами специальной статистической оценочной процедурой, кратко описанной выше).

Как видно из рисунков, в строгом акцентном стихе больше строк других типов (С-Т, Дк, Тк), а общее число акцентных строк (Акц(С) и Акп(М)) больше в многоинтервальном стихе. При этом динамика наполнения одинакова в том и другом акцентном стихе - очень немного силлабо-тоники, затем в порядке возрастания дольник, тактовик и акцентный стих. Приведем также средние данные по числу строк в стихотворении и числу строк рассматриваемых типов (результат деления общего числа строк на число стихотворений для каждого параметра; мы не приводим здесь

данные по силлабо-топике, поскольку число силлабо-тонических строк очень невелико).

Средние данные по числу строк и наполнению стиха Таблица 2

Среднее число строк 1) стихотворении Дк Тк Акц (С) 1!

Акп(С) 43.29 8.51 13.66 16.14 4.61

Акц(М) 47.95 6.24 11.39 11.02 19.17

В таблице также отчетливо видны отмеченные выше свойства акцептного ст иха.

Рассмотрим в рамках нашей выборки только акцептные строки для обеих групп.

1800 1600 1400 1200 1000 800 600 400 200 0

Акн Лкц (С) Лкц1(С) Лкц (М)

Акц (всего) Акц(С) Акц1(С) Акп(М)

1639 1 118 157 364

% 68.21 9.58 22.21

Рис.3

Группы акцентного стиха в строгом акцентном стихе

\\ * т» }

Па-. Л. „„и/}

Группы акцентного стиха в многоинтервальном стихе. Рис.4

1800 1600 1400 1200 1000 800 600 400 200 0

Акц Акц (С) Акц! (С) Акц (М)

Акц (всего) Акц (С) Акц1 (С) Акц (М)

1781 650 365 766

% 36.5 20.49 43.01

В акцентном стихе мы выделили отдельную небольшую группу, которую назвали Лкц1 (С) - это стих со стыком ударений, иначе говоря, с нулевыми интервалами. Набор интервалов в таком стихе (0,1,2,3). Группа очень немногочисленна, в строгом стихе она представляет самостоятельный подвид (об этом речь ниже), в многоинтервалыюм стихе (где количество таких строк превосходит строгий более чем в два раза - 157 к 365) просто особую группу акцентных строк. Из рисунков и подписей под ними видно, что

1) как уже отмечалось, в многоинтервалыюм стихе больше акиеишых строк;

2) в строгом и многоинтервалыюм стихе различные акцентные строки распределены по разному. В многоинтервалыюм стихе распределение относительно плавное: акцентные строки относятся друг к другу как 766 : 650 : 365 или в процентах 36.5 : 20.49 : 43.01 (соответственно Акц(М) : Акц(С) : Акц1(С)). В строгом акцептном стихе оно гораздо более резкое: 1118 : 364 : 157, в процентах 68.21 : 22.21 : 9.58 (Акц(С) : Акц(М) : Акц1(С)). Такое распределение естественно: оно показывает, что в строгом акцентном стихе основную часть акцентных строк составляют собственно строго акцептные, на долю остальных приходится меньше четверти сцюк

стихотворении, ;i и многоинтервалыюм стихе обычно представлен весь спектр тонических строк, в которых выделяется четверть или более м н о го и 11тс р на л ы i ы х.

Рассмотрим теперь соотношение двух основных типов акцентного стиха и прозы. Для сравнения возьмем очерк Маяковского "Мое открытие Америки" (Америка). Мы поделили eco на строчки, разбив на приблизительно четырехударные колоны. Предложение (текст от точки до точки) стало аналогом строфы. Некоторые, особо длинные, предложения становились двумя строфами. Длина сгрофы колеблется от двух до шести строк. При разбивке прозаического текста на колоны мы следовали двум основным правилам:

1) Синтаксическая связь между последним словом в строке н первым словом следующей строки должна быть слабой;

2) Внутри строки следует избеган, устойчивых ритмических повторов.

I? дальнейшем правила построения колона, видимо, должны быть расписаны детальнее. В скобках замечу, что кажется более разумным пользоваться термином колон, чем термином синтагма (соображения в пользу последнего также высказываются), поскольку, с одной стороны, не следует нагружать и без того безразмерное понятие синтагмы еще одним лишением, а с другой, колон, каким-бы способом его ни выделять, все равно не сможет стать чисто синтаксической единицей. Сопоставительные данные по двум группам стиха и прозе приведены в таблице (в

Таблица 3

Общее число строк С-Т Як Тк Акц (С) Акц (М)

Строгий акцентный стих 3420 0.88 19.65 31.55 37.28 10.64

Многоинтервальный акцентпый стих 2X29 0.28 13.01 23.75 22.98 27.08

Очерк "Мое открытие Америки" (Америка) 249 0 0.8 15.26 39.36 44.58

Видно, что прозаический текст ритмически соответствует мноюинтервальному акцентному стиху. Отличия прозы от акцентного стиха структурно повторяют отличия многоинтервального акцентного стиха от строгого, только в более резкой форме. В прозе меньше, чем в акцентном стихе дольников и тактовиков (силлабо-тоники вовсе нет), а акцептного стиха обоих типов существенно больше. Проценты строгого и многопнтервалыюго акцептного стиха превышают соответствующие показатели и стихе. Таким образом, проза по ритмической структуре не отличима от многопнтервалыюго акцентного стиха. Отныне будем

считать, что здссь проходит граница между стихом и прозой по длине междуударного интернала.

Исходя из сказанного нише, можно считать, что строгий акцентным ешх метрически урегулирован и имеет опорную метрическую схему. Запишем ее аналогично дольнику и тактовику.

(хи) -

и

ш ихи

и

ихи ихх^/-

- ... - (О)

/

здесь "-" сильное место (также " — " безусловно ударное

сильное место),

"и" слабое место, (также

место),

'7У - безусловно безударное слабое

"х" произвольное место (сильное, слабое или редуцированное), ( ) указывают на необязательность компонента. { } указывают на выбор из нескольких компонент. Отклонения от метрической схемы, т.е. ритмические формы, достаточно редки, что естественно, учитывая длину интервала.

Кроме господствующего стиха (1,2,3,4), мы выделили небольшую фунну типа (0,1,2,3). Ввиду крайней немногочисленности (320 строк), эта группа может скорее указывать на потенциальную возможность существования данного стиха, чем служить представительной выборкой.

Предметом рассмотрения в данной главе реферируемой диссертации было изменение одного метрического параметра. В акцентном стихе Маяковского при относительной стабильности числа ударений "работающим" стал тип интервала. Его динамика обусловила метрическое разнообразие стиха. Поскольку поэт стремился, как мпоюкрагпо отмечалось исследователями, сделать стих максимально разговорным, но в то же время хотел оставить его стихом, а не свести к прозе, ему нужно было одновременно два разных, противоположных по действию инструмента. Один жестко ограничивающий, а другой максимально расшатывающий стих. Первым стала тоническая сдержка на число ударений (и обязательная рифмовка), не позволяющие читаи'лю усомниться, что перед ним стих, вторым совершенно раскрепощенный междуударный интервал, размывающий границы стиха и прозы (или, вернее, в нашем случае, стиха и разговорной речи). С помощью этого приема Маяковский решил стоявшую перед ним задачу.Основываясь на изменении длины междуударного интервала, мы старались разграничить два типа акцентного стиха, возможно, возникших в результате описанного эксперимента.

/

13 последней, четвертой, главе - А/горшпмы компьютерного анализа поэтического текста - описаны алгоритмы формального распознавания силлабо-тонического и несиллабо-тонического стиха и методика построения компьютерного метрического справочника. (Сделаем одну оговорку. Поскольку рассмотренная выше модель не затрагивает силлабику, поступающий на вход алгоритма текст прежде всего проверяется на силлабичность - подсчитывается число слогов в каждой строке и при подозрении на равносложность пользователю выдастся запрос о принадлежности текста к силлабической системе. При положительном ответе дальнейший анализ прекращается.) I) Силлибо-топическии стих

Стихи построчно вводятся в машину в виде текстового файла. Предполагается, что текст предварительно размечен: вручную или автоматически расставлены ударения » полпозначпых словах (существительные, глаголы, прилагательные) и агонированы

неиолпозначные слова. Разметка на данном этапе минимальна (двойственные слова (по П.М.Жирмунскому) атонируются). Этого достаточно, чтобы определить, относится ли данный текст к силлабо-гопике. После этого вступают в силу некоторые различия в размегке силлабо-тонических и иссиллабо-топичсских текстов (впрочем, кажется, что разумно пренебречь нюансами в пользу более общих принципов разметки). В случае силлабо-тоники после распознавания метра разметка двойственных слов уточняется уже автоматически.

Строчка просматривается справа налево, и строится ее ритмическая схема, как показано на предыдущих примерах: точка (.) означает ударный слог, а цифры между точками - число безударных слогов между ударениями. Ритмические схемы строятся для всего текста. На следующем шаге нужно определить, относится ли данный текст к силлабо-тонической системе стихосложения. Выше мы выяснили, что это ¡начит с формальной точки зрения. Для силлабо-тонических текстов можно предложим, следующий алгоритм анализа:

1. Подсчитывается количество слогов перед первым ударением.

2. Подсчитывается количество слогов во всех междуударных интервалах.

3. Определяется, какой из двух формул арифметической прогрессии соошегствует строка. В зависимости от этого ей условно приписывается двусложный или трехсложный метр.

4. Таким образом, двусложный или трехсложный метр условно приписывается всем строкам стихотворения.

5. Теперь можно определить метр точно. В большинстве случаев достаточно вертикального просмотра текста с определением места первого ударения в строке. Если мсгр двусложный и ударение надает на первый слог, подсчитывается количество безударных слогов до первого ударения. Ударение на втором слоге означает ямбическую строку, на третьем или другом нечетном слоге - хореическую соответственно с безударной первой или большим числом стоп. Ударение на четном слоге (не на втором )

означает ямб с пропуском метрического ударения. Таким образом, весь текст просматривается по вертикали и чаще встречающийся метр и будет являться метром текста н целом (гак нивелируются отдельные строки, выпадающие из общего метрического ряда). Если метр трехсложный, он определяется аналогично по месту первого ударения в тексте. Рассмофим алгоритм нейтрализации свсрхсхемных ударений. Сперхсхемные ударения связаны с двумя разными текстовыми ситуациями: I) Дополнительное (лишнее) ударение в строке; 2) Так называемое смещение ударения -перенос его с сильного места на слабое. В первом случае (описанные ниже процедуры применяются последовательно ко всем "отклоняющимся" от нормальной интервальной структуры строкам), количество ударений в строке сравнивается с соседними. Если их больше, значит, это строка со еверхсхемным. ударением (обычно при этом возникает ситуация ..1 -нулевой интервал и затем односложный), и она отмечается соответствующим образом. Если число ударений в строке не отклоняемся от соседних, а интервальная структура тем не менее нарушена, используем вторую модель. Строка сравнивается с метрической схемой полпоударпой строки. При этом сдвиг ударения с сильною места на слабое обнаруживается, и ударение маркируется как свсрхсхемное. Если пи первая, ни вторая модель не работают - перед нами строка, не укладывающаяся в данный размер, и с ней поступают по правилам интервальной модели, описанным выше. э.Подсчитывается число повторяющихся стой. 6. По числу стон определяется размер строки.

В качестве теста для приведенного алгоритма на комиькиерс был проанализирован цикл Б.Пастернака "Начальная нора" (14 стихотворений, 217 строк). На этом материале, где присутствовали все виды силлабо-тонических метров и ритмических форм, машина не сделала ни одной ошибки. По результатам анализа был построен первый компьютерный метрический справочник для цикла "Начальная нора". Теперь можно дать определения силлабо-тонических метров с алгоритмической точки зрения. Сразу оговоримся, чтобы не быть неверно понятыми: определения, предлагаемые нами - не общие определения метров (они даются в терминах силы них и слабых мест), а определения их языков:,IX реализаций, пригодные для языков, где сильные места чаше бывают ударными, а слабые - безударными.

Ямб - это метр с междуударным интервалом, вычисляющимся но формуле 2п + 1 и анакрусой в один слог. (Случаи с пропуском метрическою ударения на первой стопе, как только что было показано, обслуживаю 1ся алгоритмом обычным образом и анакрусой не считаются.) Хорей - это метр с междуударным интервалом, вычисляющимся по формуле 2н+/, и нулевой анакрусой.

Дактиль - это метр с междуударпым интервалом, вычисляющимся по формуле Зп+2, и нулевой анакрусой.

Амфибрахии - это метр с междуударным интервалом, вычисляющимся по формуле Зп+2, и анакрусой в один слог.

Анапест - это метр с междуударным интервалом, вычисляющимся по формуле Зп+2, и анакрусой в два слога.

Эти определения не отменяют традиционных (пользоваться обычными, наверное, удобнее, хотя бы потому, что привычнее). Они просто разного уровня. Традиционные существуют для человека, а данные только что нами, видимо, в болыпей степени для вычислительной машины. Необходимость их введения связана с тем, что человек может пользоваться и тем и другим определением, а компьютер - только формульным. Они несколько более общие, поскольку включают не только полпоударпые формы, но н все формы с пропусками метрических ударений - то, что обычно называют ритмическими формами пли вариациями размера. Тем самым, скажем, нолноударная форма четырехстопного ямба и форма с пропуском на третьей стопе становятся равноправными и снимается оппозиция метра и его ритмических вариантов. II) Иссиллаво-топичсскии стих.

Не будем давать здесь полного алгоритма анализа песиллабо-тонического стиха, по укажем только его главные, ключевые части.

1. Разметка текста (частично вручную, частично автоматическая при помощи программ типа автоматической расстановки ударений в тексте), подсчет всех интервалов и построение ритмической схемы.

2. 2) блокировка строк в тексте.

Размеченный текст делится на блоки. При разметке текста Маяковского критерием выделения блока служила рифма, проще говоря, блоком считалось четверостишие или двустишие. При отсутствии рифмы строки блокируются по другим признакам. Та или иная стихотворная форма приписывается не отдельной строке, а блоку в целом, т.е. считается, что одно четверостишие написано гактовпком, друтое дольником и т.д. Здесь на первый план выходит контекст - подход, широко используемый в современной лингвистике (к нам он пришел из стиховедческой практики M.JITасиарова). Например: Растет улыбка, жирна и нагла, рот с)о ушеït разросся,

будто v пего на раже спектакль галсi затеяла труппа малороссов.

15.Маяковский "Мое к этому отношение" 3) Ниже мы рассмотрим интуитивный или, иначе говоря, экспертный способ определения метрической формы стихотворения. Этот способ (основанный па сложившейся в стиховедении практике) использовался для предварительного отбора текстов. При сравнении с разработанной нами формальной процедурой он дал хорошие результаты, что позволяет

и впредь пользоваться им в аналогичных целях. Кроме того, данный способ позволяет определить метрическую форму одною стихотворения, что бывает необходимо, когда мы не располагаем выборкой достаточною объема или анализ выборки не входит в паши задачи. (Конечно, I! гаком случае вероятность ошибки повышается, но не всегда есть выбор.) Идентификация текста включает два лапа:

1) определение метрической формы блока;

2) определение метрической формы стихотворения. Первый этап - определение метрической формы блока. Определяются метрические формы всех строк, как описано выше, при этом в спорных случаях существенными оказываются следующие критерии (в том порядке, в каком они приводятся): а) стремление к примерному равенству числа пктов в строках одною блока, если в соседних блоках нет отчетливо выдерживаемой ритмической структуры (т.е. если есть два варианта ритмической интерпретации строки, выбирается тот, при котором количество и кто в в соседних строках окажется равным, или различия будут меньше, чем при другом варианте); б) Если в рядом стоящих блоках выдерживается какая-либо ритмическая структура (например, чередование ударений в соседних строках по схеме 4/3), двойственные строки проверяются на соответствие такой ритмической структуре (но только в случае ее отчетливого соблюдения в соседних блоках). «) Стремление к минимальной расшатанной и при соблюдении двух первых условий (если блок укладывайся п в дольник и в строгий акцентный стих, выбирается дольник). Затем рассматривают приписанные метрические формы, начиная с самых расшатанных. Если максимально расшатанных строк (т.е. с наибольшим количеством интервальных типов) больше или равно 25% от общею числа строк в блоке, считается, что такой блок паписан данной метрической формой. Если строк такого типа меньше 25%, аналогичным образом рассматриваются строки следующею но уровню расшатанности типа (с количеством интервальных типов, на единицу меньшим) н т.д., пока не найдется нужная доля строк какой-либо метрической формы. Определение метрической формы спорных строк происходи! в зависимости от конкретной контекстной сшуацпи. Если неопределенность не удастся разрешить на данном уровне, она переходи! на следующий, т.е. спорной (или двойственной) становится метрическая форма блока в целом. При большом числе таких блоков в стихотворении атрибуция всего стихотворения становится затруднительной.

Возможна ситуация, когда среди расшатанных не набирается четверш однотипных строк, но суммарное количество строк разных типов превышает 25%. В этом случае используется другой алгориш: рассматривается 75% строк, начиная с наименее расшатанных, и выясняется, в какую метрическую форму они укладываются. Топш на форма и становится мефическон формой блока. Перейдем к следующему этапу - определению метрической формы стихотворения.

Форма, приписываемая тексту к целом, определяется но совокупности форм, приписанных каждому блоку. Алгоритм определения только что Оыл описан. Считается, что текст принадлежи г некоторой стихотворной группе, если не менее четверти его строк относятся к этой группе (при соблюдении описанных выше условий). Например, текст считается написанным тактовиком, если там не меньше 25% тактовиковых строк и меньше 25% акцентных (т.е. более расшатанных). (Поскольку мы имеем дело с эмпирической, иначе творя, экспертной методикой, па вопрос, почему, например, 25%, а не 37рп, отметить невозможно иначе, чем сославшись на огромный практический опыт многих стиховедов. Думается, что такой ответ достаточен, если принять во внимание, что построенные на этих соотношениях концепции дольника и тактовика вполне работают.) Последняя часть третьей главы - компьютерный мсфпческпй справочник. Такой опыт в отечественной, а но нашим сведениям, и в мировой практике, предпринимается впервые.

Компьютерный индекс стихотворений представляет собой две двумерных мблпиы - одна содержит описание метрики и ритмики стихотворений -индекс мегрпко-ритмнческих форм, а другая - описание строфики (строфическим индекс). По выделенной системе параметров строится полное метрическое описание любого стихотворного текста. Перейдем к структуре словарной статьи. I. Индекс метрпко-ритмичсских форм. 1) Номер ст ихо! ворения; 2) Постоянный или переменным метр - т.е. указание, написано стихотворение постоянным или переменным метром; 3) Постоянный пли переменный размер - то же относительно размера; 4) Метр, размер - обозначение того, каким метром и размером написано стихотворение, например, я4; 5) Строфическая или астрофичсская форма -укашнме, есть ли в стихотворении деление на строфы; (>) Число строк -число строк в тексте; 7) Число словоформ - число словоформ в тексте; 8) Число словоразделов - число фонетических слов в тексте; 9) Номер формы - для удобства рассмотрения все метрические формы пронумерованы, начиная от полноударной: I - полноударная форма. 2 - форма с морнчсскнм пропуском на первой стопе и т.д.; 10) Номера строк с данной формой - номера строк текста, построенных по соответствующей ритмической схеме; II) Число форм - число строк сданной ритимичсской формой; 12) Частота - частота встречаемости данной формы в тексте (частое от деления числа форм на число строк). II. Строфический индекс. 1) Номер стихотворения. 2) Номер строфы. 3) Число строк в строфе. 4) Число словоформ в строфе. 5) Число словоразделов - число словоразделом в строфе. 6) Метр - название метра (или метров), которыми написана строфа. 7) Постоянный или переменный метр -признак, указывающий, написана строфа постоянным или переменным метром (обозначения тс же, что и в мстрико-ритмическом индексе) 8) Размер; 9) Постоянный или переменный размер - то же о размере. 10) Номер ритмической формы - аналогично метрико-ритмическому

индексу. 11) Повторяющиеся строки с данной формой - номера строк строфы с вышеуказанной ритмической формой. Строки с совпадающими ритмическими формами могут отличаться последним безударным слогом. Если строки совпадают пол-ностыо, они помечаются значком "к", что означает - совпадающие клаузулы. 12) Клаузула - тип клаузулы; 13) Повторяющиеся строки с данной клаузулой - номера строк строфы с клаузулой указанного выше типа. Индекс построен на материале корпуса текстов цикла Б.Пастернака "Начальная пора". В следующей версии системы предполагается сделать индекс полностью автоматическим, дополнив программу машинного анализа ритмики набором модулей, вычисляющих ряд дополнительных параметров. Это позволит создать единый человеко-машинный комплекс программ стиховедческого анализа с получением па выходе компьютерного метрического справочника.

Существование автоматизированных метрических справочников позволит п дальнейшем проводить, экспериментальный и классификационный анализ текстов методами, существующими только па базе современной вычислительной техники, и поэтому недоступными прежде, притом в несравненно больших объемах.

Автоматический анализ метрики и ритмики поэтического текста подводит некоторый итог стиховедческим исследованиям в данном направлении. За исключением особо сложных случаев такой анализ в дальнейшем может производить машина, дан стиховеду возможность на основе проанализированной ритмики заниматься исследованиями других уровней текста.

Также очень существенной кажется возможность формального определения основных стиховедческих понятий через алгоритм анализа. Этот продуктивный и вполне принятый в современной лингвистике способ в сочетании с основаниями классификации метрических форм, заложенными в интервальной модели, дает основание говорить (пока трудно сказать, насколько серьезно) о появлении новой дисциплины на стыке традиционного стиховедения и компьютерной лингвистики. Можно с долей шутки назвать эту дисциплину компьютерной поэтикой. В заключении перечислены основные результаты работы и выводы из нее:

1) Главным результатом данной работы, как нам кажется, следует считать создание формальной модели метрики, позволяющей открывать новые формы стиха, исходя из числа интервальных типов в тексте, и распознавать, с помощью алгоритмов компьютерного анализа, различные метрические формы. Это способствует процессу перевода книжной культуры в электронный вид - одной из существенных тенденций времени.

2) Вследствие "интервального" подхода акцентный стих Маяковского распался на два класса - на строгий и многоинтервальный акцентный стих.

3) Строгий акцентный стих метрически урегулирован и имеет опорную метрическую схему, которая записывается аналогично дольнику и тактовику.

4) Эксперимент, проведенный с очерком Маяковского "Мое открытие Америки" показал, что проза по ритмической структуре не отличима от многоинтервального акцентного стиха. Будем считать, что здесь проходит общая видовая граница между стихом и прозой по длине междуударного интервала (это вовсе не исключает, например, существования отдельных видов прозы, менее расшатанных, чем многоинтервальный акцептный стих).

5) Интервальная модель позволяет несколько иначе взглянуть на проблему верлибра. С точки зрения интервальной структуры нельзя говорить о стихе, свободном от какой бы то ни было метрической зависимости. Верлибр может занимать в классификации любое место от дольника до мпогоинтервального акцентного стиха (он не является строгой метрической характеристикой, и в этом смысле свободен). Но определение метрической принадлежности само по себе почти ничего не даег для идентификации свободного стиха, его описание требует разработки системы более тонких параметров. Хотя установить метрическую структуру верлибра возможно, проблема не решается на этом уровне.

6) На основе интервальной модели разработаны алгоритмы компьютерною анализа метрики для любых метрических форм.

7) Система анализа ритмики позволяет создавать в автоматическом или полуавтоматическом режиме компьютерные метрические справочники поэтов, а также базы данных и знаний но стиховедению.

8) Основные понятия метрики можно определить через алгоритмы анализа, что подразумевает возможность более строгого, чем сейчас, подхода к терминологии.

9) Деление стихотворных текстов на классы по числу интервалов позволяет предположить, что так устроены не только поэтические, но любые тексты - т.е. тем же способом можно классифицировать и прозу. Конечно, предстоит разработать методику разметки, существующую на данный момент только для стиха, и провести серьезное обследование, прежде чем определенно что-нибудь утверждать, но уже сейчас кажется разумным поставить вопрос об учете ритмического уровня при анализе прозаического текста, так же как учитывается фонетический, морфологический, синтаксический и т.д.

Основные результаты диссертации изложены в следующих публикациях:

1. Е.М.Брейдо. Моделирование на ЭВМ отдельных элементов индивидуально-художественной структуры // Тезисы Всесоюзной научной конференции "Стилистика и поэтика", Выпуск I, М., 1989, с.14-15.

2. Е.М.Брейдо. Модель стихотворения // Тезисы Всесоюзной научной конференции "Актуальные проблемы компьютерной лингвистики", Тарту, 1990, с.27-28.

3. Е.М.Брсйдо. О структуре поэтического языка (О.Мандельштам и А.Впсденский) // Межвузовский научный сборник "Проблемы стиховедения и поэтики", Алма-Ата, 1990, с.74-77.

4. Е.М.Брсйдо. Об автоматическом анализе ритмики русского стиха // Тезисы Всесоюзной научной конференции "Семантические и коммуникативные категории текста", Ереван, 1990, с.26-28.

5. Е.М.Брсйдо. Компьютерный анализ поэтического текста (система Риметр-1) // Бюллетень Машинного фонда русского языка, вып. 2, М, 1992., с.15-30.

6. Е.М.Брсйдо. Алгоритмическое представление метрики // Русистика сегодня, #4. 1995, с.47-65.

7. Е.М.Брсйдо. Акцентный стих Маяковского // Сборник в честь академика М.Л.Гаспарова (к 60 -летию со дня рождения) (в печати), 1 а.л.

8. Е.М.Брсйдо. О двух типах акцентного стиха у Маяковского // Сборник в честь профессора В.П. Григорьева (к 70-летию со дня рождения), (в печати), I а.л.

9. Е.М.Брсйдо, Е.Л.Гинзбург. Структура словарной статьи метрического справочника поэтического текста // Проблем» створсння машинних фоншн мов (тези доповщей), Кшв, 1991, с. 11-13.

10. Е.М.Брсйдо, Н.И.Лауфер. К проекту словаря лингвопоэтической терминологии // Принципы изучения художественного текста (тезисы Всесоюзной научной конференции "2-е Саратовские стилистичсскис чтения"), Саратов, 1992, с.80-82.

11. Е.М.Брсйдо, Н.И.Лауфер. Проект словарной статьи учебного компьютерного словаря-справочника по стиховедению // Инженерная лингвистика и оптимизация преподавания языков (тезисы докладов), Самарканд, 1992, с.84-85.