автореферат диссертации по филологии, специальность ВАК РФ 10.02.19
диссертация на тему:
Количественные критерии авторизации текста как проблема теоретической лингвистики

  • Год: 2013
  • Автор научной работы: Верхозин, Степан Сергеевич
  • Ученая cтепень: кандидата филологических наук
  • Место защиты диссертации: Улан-Удэ
  • Код cпециальности ВАК: 10.02.19
450 руб.
Диссертация по филологии на тему 'Количественные критерии авторизации текста как проблема теоретической лингвистики'

Полный текст автореферата диссертации по теме "Количественные критерии авторизации текста как проблема теоретической лингвистики"

На правах рукописи

РМи

ВЕРХОЗИН Степан Сергеевич

КОЛИЧЕСТВЕННЫЕ КРИТЕРИИ АВТОРИЗАЦИИ ТЕКСТА КАК ПРОБЛЕМА ТЕОРЕТИЧЕСКОЙ ЛИНГВИСТИКИ

Специальность 10.02.19-теория языка

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата филологических наук

21 НОЯ 2013

Улан-Удэ-2013

005539130

Работа выполнена на кафедре прикладной лингвистики ФГБОУ ВПО «Иркутский государственный лингвистический университет».

Научный руководитель: Каплуненко Александр Михайлович

доктор филологических наук, профессор

Официальные оппоненты: Хилханова Эржен Владимировна

доктор филологических наук, доцент, профессор кафедры общего и исторического языкознания ФГБОУ ВПО «Бурятский государственный университет»

Антипьева Ирина Александровна

кандидат филологических наук, доцент кафедры иностранных языков ФГБОУ ВПО «Байкальский государственный университет экономики и права»

Ведущая организация: ФГБОУ ВПО «Хакасский государственный

университет им. Н.Ф. Катанова»

Защита диссертации состоится 16 декабря 2013 г. в 11 ч. 30 мин. на заседании диссертационного совета Д 212.022.05 по защите диссертаций на соискание ученой степени кандидата наук, на соискание ученой степени доктора наук в ФГБОУ ВПО «Бурятский государственный университет» по адресу: 670000, г. Улан-Удэ, ул. Смолина, 24а, конференц-зал.

С диссертацией можно ознакомиться в научной библиотеке ФГБОУ ВПО «Бурятский государственный университет» по адресу: 670000, г. Улан-Удэ, ул. Ранжурова, 5, ауд. 1110.

Автореферат разослан « Щ » ноября 2013 г.

Ученый секретарь Диссертационного совета

Судоплатова Галина Алексеевна

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Реферируемое диссертационное исследование посвящено изучению количественных методов анализа в рамках теоретической лингвистики и авторизации текста, в частности. Исследование сосредоточено на изучении функции и места идиолекта в теоретической лингвистике и возможностей его количественного описания в рамках авторизации текста.

Авторизация или атрибуция текста - явление для лингвистики не новое. Оно возникло тогда, когда учёных впервые заинтересовала проблема авторства того или иного произведения. Широко известны случаи оспаривания авторства некоторых пьес У. Шекспира, комедий, приписываемых Мольеру, критико-литературного творчества A.C. Пушкина и Ф.М. Достоевского, Н.Г. Чернышевского, М.А. Шолохова.

К решению этой проблемы языковеды подходили с разных сторон. На ранних этапах пользовались преимущественно собственно лингвистическими методами. Однако в конце 19 и начале 20 веков впервые в умах языковедов начала формироваться и возникать идея о возможном приложении к этой сфере подходов, характерных для других наук, прежде всего, математики. На математизацию языковедения в своё время указывали ещё Ф. де Соссюр и И.А. Бодуэн де Куртенэ [Соссюр, 1999; Бодуэн де Куртенэ, 1963]. Впоследствии об этом стали говорить и другие видные психологи и лингвисты, в частности, JI.C. Выготский, В. В. Виноградов, Ю. Д. Апресян и т.д. [Выготский 1935; Виноградов, 1938; Апресян, 1966].

Окончательно математические методы закрепились в лингвистике лишь в 50-х годах 20 века. Кроме того, они начали применяться и для решения проблемы авторства. Математический аппарат позволил фиксировать в текстах некоторые функционально-формальные показатели (например, подсчитывать долю служебных слов), которые, как предполагалось, в значительной мере характеризуют индивидуальный авторский стиль.

Уникальный индивидуальный стиль в зависимости от конкретного подхода или направления можно назвать идиостилем, но с точки зрения авторизации текста наиболее адекватным является понятие идиолекта.

Идиолект представляет собой различительный и идиосинкратический (специфический) выбор при порождении текста [Coulthard, 2004, р. 431]. Он выражается в умении пользоваться функционально-формальным аппаратом языка, что, в свою очередь, наводит на мысль о применимости к его описанию и изучению количественных методов, используемых разными учёными в русле исследований по авторизации.

Актуальность темы диссертации обусловлена недостатком исследований проблем авторизации текста в теоретико-лингвистическом ракурсе. Кроме того, необходимы научная оценка возможностей авторизации текста, равно как и определение границ их применения, с целью диагностики языковой личности и уточнение места количественной методологии по отношению к качественным методам

в теоретической лингвистике.

Объектом исследования является идиолект разных авторов, установленный выборкой некоторого количества их текстов.

Предметом исследования избраны, исходя из задач авторизации текста, идиолекты с точки зрения их количественных показателей на релевантных уровнях языка.

Целью диссертации является анализ феномена идиолекта, а также выделение тех его аспектов, которые могут лечь в основу подхода к определению авторства. Кроме того, ставится цель историко-теоретического исследования количественных методов лингвистики и возможностей их применения.

Для достижения поставленной цели в работе решаются следующие задачи:

1) анализируется понятие идиолекта, его история и подходы к изучению;

2) анализируется отношение понятия «идиолект» к смежным понятиям «идио-стиль» и «языковая личность»;

3) устанавливается идиолект и его составляющие в качестве главной цели описания при авторизации текста;

4) изучаются и анализируются количественные методы, их специфика, место в теоретической лингвистике, а также применение в рамках лингвистических исследований;

5) обосновываются возможности использования количественных методов с целью изучения и описания идиолекта;

6) определяются лингвистические основания авторизации текста;

7) проводится обзор и анализ релевантных количественных методов и подходов к проблеме установления авторства текста;

8) проводится количественное описание идиолектов трёх разных авторов с точки зрения авторизации принадлежащих им текстов.

Материалом диссертационного исследования послужили тексты трёх авторов-публицистов, ведущих колонки в «Российской Газете»: Валерия Выжутовича, Леонида Радзиховского, Андрея Чеснакова. Первоочередное внимание уделено идиосинкратическим особенностям, обнаруженным в их статьях, для описания которых подходят некоторые количественные методы.

Научная новизна работы состоит в том, что впервые обоснованы правомерность количественных подходов к авторизации текста с целью описания соответствующего идиолекта и характеристика эвристических возможностей количественных методов в исследовании феномена языковой личности.

Теоретическая значимость диссертационной работы заключается в том, что полученные результаты вносят вклад в разработку современных методов параметризации идиолекта на основе количественных показателей функционирования языка. Поскольку такие показатели устанавливаются на материале текста, они служат надёжным основанием для дальнейшей разработки критериев идентификации языковой личности.

Практическая значимость диссертации заключается в том, что её резуль-

s

таты могут быть использованы как для филологического или описательного исследования идиолекта, идиолектных аспектов языковой личности, так и для выполнения практических задач по установлению авторства различных текстов с помощью применения количественных методов. Материалы диссертации могут использоваться в курсах общей и прикладной лингвистики, а также при подготовке курсовых и дипломных работ.

Методологическую основу исследования составляют количественные методы, применяемые в лингвистических и автороведческих исследованиях, а именно: критерии средней длины слова и средней длины предложения (в разных вариациях использовались различными учёными: Г. Хьетсо, В.П. Фоменко и Т.Г. Фоменко, Д.В. Хмелёвым), критерии степени синтаксической сложности и коэффициента лексического разнообразия (А.П. Варфоломеев), критерий процента/доли служебных слов (H.A. Морозов, П. Фоменко и Т.Г. Фоменко), критерий определения процента квазисинонимичных лексем (А.Н. Баранов), а также критерий распределения в текстах различных репрезентаций и наклонений глаголов. Теоретическое обобщение сути количественных методов осуществляется путём их научного синтеза.

На защиту выносятся следующие положения:

1. Идиолект и идиостиль - разные, но смежные понятия. Если идиолект представляет собой совокупность структурно-языковых особенностей (стабильных характеристик), проявляющихся в речи отдельного носителя языка, то идиостиль - это совокупность речетекстовых характеристик отдельной языковой личности (индивидуальности писателя, учёного и т.д.).

2. Идиолект и идиостиль являются составными частями более общего целого, а именно языковой личности. Они действуют на разных её уровнях. Идиолект относится к первому - вербально-семантическому уровню структуры языковой личности (лексикон и грамматикон в терминах Ю.Н. Караулова), а идиостиль действует на двух оставшихся уровнях более «глубокого» порядка: когнитивном и прагматическом.

3. Авторизация текста может рассматриваться как одно из направлений исследования и описания идиолекта и, кроме того, основываться на его параметрах. Это обусловлено характерными особенностями идиолекта, в частности, непреднамеренностью выбора тех или иных языковых средств автором.

4. Количественные методы могут успешно применяться при авторизации текста, предоставляя весьма объективную информацию об авторстве. При этом они применимы главным образом к структурно-языковым характеристикам текста.

5. Выделенные в результате их апробации количественные критерии установления авторства позволяют описать и дифференцировать идиолекты разных авторов, выраженные в принадлежащих им текстах.

Апробация работы. Результаты исследования были представлены на заседаниях кафедры прикладной лингвистики Иркутского государственного лингви-

стического университета (2011-2013). По теме диссертации сделаны доклады на межвузовских конференциях молодых учёных «Современные проблемы гуманитарных и естественных наук», проводимых в рамках недели науки ИГЛУ (20112013), на Всероссийской научно-практической конференции «Аспирантские чтения ИГЛУ» (2011). Всего по теме диссертации опубликовано 6 научных работ.

Объём и структура работы. Общий объём диссертации составляет 241 страницу, из них 148 — основной текст. Диссертация состоит из введения, трёх глав, выводов по главам, заключения, списка литературы, включающего 135 наименований, списка использованных словарей (8 наименований) и принятых сокращений, списка источников примеров (14 наименований), приложений.

ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ

В главе I «История, сущность и сопоставимость понятий идиолекта, идиостиля и языковой личности» даётся история возникновения понятия идиолекта, его развитие и современные подходы к его изучению, а также соотношения с понятиями идиостиля и языковой личности.

Первые идеологические основания идиолекта предложил глава немецкой школы младограмматизма Г. Пауль. В книге "Prinzipien der Sprachgeschichte" он оспаривает метафору представления языка как живого организма [Hazen, 2006, р. 513]. Г. Пауль настаивает на том, что язык занимает центральное место в мышлении человека. Учёный вводит в обиход такие термины, как «индивидуальная языковая деятельность», «индивидуальная неоднородность», «индивидуальное отличие». Современные интерпретации идиолекта так или иначе связаны с содержанием этих терминов.

Впервые термин «идиолект» использовал американский лингвист Б. Блок в 1948 году в книге "A Set of Postulates for Phonemic Analysis", где он пересматривал постулаты Л. Блумфильда [Bloch, 1948, р.7]. У Б. Блока идиолект представляет собой речь одного лица, разговаривающего об одном и том же предмете с одним и тем же собеседником в течение короткого отрезка времени. По Б. Блоку идиолект предполагает три условия:

• идиолект специфичен для одного говорящего;

• конкретный говорящий может обладать различными идиолектами на отдельных этапах собственной эволюции;

• говорящий может обладать двумя или более идиолектами в одно и то же время.

Гораздо шире мыслится идиолект (от греч. iSioc; — свой, своеобразный, особый и (диа)лект), определяемый как характеристика индивидуального говорящего, которая обязательно включает в себя все аспекты индивидуальных речевых привычек, моделей и манер [Kühl, 2003, р. 4].

Немецкий учёный Н. Диттмар приводит дефиницию идиолекта, которая

опирается на критерий различительной способности: «идиолект - язык индивидуума, который, вследствие приобретённых привычек и стилистических особенностей личности, отличается от языка других личностей и языка различных стадий жизни» [Dittmar, 1996, р. 111].

В традиции отечественной науки под идиолектом принято подразумевать совокупность формальных и стилистических особенностей, свойственных речи отдельного носителя данного языка [Виноградов, 2008].

Для целей реферируемой диссертации весьма существен подход одного из родоначальников современной судебной лингвистики М. Култхарда. Он рассматривает явление идиолекта, полагаясь на критерий авторства. М. Култхард говорит о том, что подход к этой проблеме с позиции теоретической лингвистики опирается на обладание каждым носителем собственной версии языка, на котором он говорит и пишет, своим собственным идиолектом. Этот идиолект проявляется у носителя языка через различительный и идиосинкратический выбор при порождении текста. Каждый говорящий обладает очень большим активным словарём, создаваемым долгие годы, который отличается от словарей других носителей, построенных подобным образом, не только отдельными элементами, но также предпочтениями в выборе того или иного элемента взамен другого [Coulthard, 2004, р. 431].

Таким образом, термин идиолект понимается в узком и широком смыслах. Идиолект в узком смысле - только специфические речевые особенности конкретного носителя языка. В таком аспекте изучение идиолекта актуально, прежде всего, в поэтике, где основное внимание уделяется соотношению общих и индивидуальных характеристик речи (стиля). В широком смысле идиолект представляет собой использование языка индивидом, дающее совокупность текстов, исследуемых лингвистом с целью изучения системы языка [Виноградов, 2008]. Последнее определение служит отправным пунктом планирования настоящего диссертационного исследования.

С точки зрения тематики данного диссертационного исследования, а именно авторизации текста, за основу следует принять узкий подход к пониманию идиолекта или ориентацию на специфические языковые особенности отдельного носителя языка. Последние играют первостепенную роль в атрибутивном анализе, позволяя на различных уровнях и по различным критериям сравнивать идиолекты разных носителей языка.

С теоретической точки зрения существует два идеологически разных подхода к изучению идиолекта: когнитивный и стилистический. Иными словами, можно выделить когнитивные и стилистические теории идиолекта.

С когнитивной точки зрения, индивидуальный язык в основном определяется языковой компетентностью, которая понимается как когнитивная способность человека к языку. При таком подходе некоторые аспекты языка, например, его синтаксическая сложность, могут быть объяснены с помощью когнитивных моделей [Grant, 2010, р. 509-514].

Стилистический подход иногда рассматривается в качестве оппозиции когнитивному подходу к идиолекту. Сторонники стилистического подхода исходят из того, что теории стилистических вариаций играют важнейшую роль в понимании различий, появляющихся в идиолектах разных людей. Такие теории более ориентированы на объяснение того, как и почему язык варьируется или остаётся постоянным. Они направлены на идентификацию устойчивых и отличительных характеристик текстов одного автора [Grant, 2010, р. 512].

Однако существует и универсальный подход, в котором объединяется внимание когнитивных теорий к языку отдельного автора и ориентированные на различия идиолектов разных людей стилистические теории. В соответствии с универсальным подходом теории идиолекта не могут просто указывать на устойчивые и отличительные характеристики языка человека. Их задача в том, чтобы предоставить объяснение этого факта [Grant, 2010, р. 513]. Универсальный подход сформирован, например, работами М. Култхарда, который пытался продемонстрировать, насколько очевиден индивидуальный характер бытовых высказываний [Coulthard, 2004], а также М. Хоуи [Ноеу, 2005], С. Гринфилда [Greenfield, 2008] и другими.

Лингвисты часто расходятся в понимании идиолекта и связанного с ним явления идиостиля. Одни полагают, что идиолект и идиостиль отделимы друг от друга [Леденёва, 2001, с. 38; Тер-Минасова, 1980, с.182], другие же считают идиолект базой идиостиля, который, в свою очередь, понимается как индивидуальный стиль речи [Григорьев, 1983, с. 4; Кристалл, Дейви, 1980, с. 165; Риффатер, 1980; Хэллидей, 1980, с. 136].

В исследовательских целях идиолект и идиостиль писателя могут изучаться изолированно, но их нераздельность очевидна [Фоменко, 2013]. Идиолект присущ любой языковой личности [Langacker, 1999, р. 230], а собственный идиолект писателя определяется системой национального языка [Тураева, 1994, с. 106]. Идиостиль писателя, включая в себя идиолект, проявляется в языковой и коммуникативной компетенции, осознанном выборе средств общения, языковом чутье и вкусе [Карасик, 2004, с. 10, 13].

Идиостиль или индивидуальный стиль — это совокупность языковых и сти-листико-текстовых особенностей, свойственных речи писателя, учёного, публициста, а также отдельных носителей данного языка [СЭСРЯ, 2003, с. 95].

В целом современные исследователи исходят из противопоставления «язык — его индивидуальная модификация», и с этой точки зрения «идио-лект/идиостиль» рассматриваются в аспекте соотношений «язык/стиль». В этом плане идиостиль реконструируется по материалам идиолекта - совокупности языковых форм «индивидуального говорения» [Григорьев, 1990, с. 3-4].

Соотношение понятий «идиостиль», «идиолект» и «языковая личность» можно охарактеризовать как соотношение общего и частного: понятия «идиостиль» и «идиолект» входят в понятие «языковая личность» и являются его составными частями, однако, действуют на различных уровнях структуры языковой

ЛИЧНОСТИ.

Если соотнести такое понимание идиостиля со структурой языковой личности, которую предлагает Ю.Н. Караулов, можно определить, что идиостиль относится к более высоким и сложным уровням: когнитивному и прагматическому, поскольку они в той или иной степени отражают личность индивида: его «картину мира», ценности, мотивы или интенции.

В отличие от идиостиля, идиолект в структуре языковой личности занимает не «содержательную» или глубинную, а скорее, формально-выраженную позицию, то есть представляет собой понятие поверхностного уровня. Идиолект - это не что иное, как совокупность собственно структурно-языковых особенностей, то есть стабильных характеристик.

На основе этих рассуждений можно сделать вывод, что идиолект относится к первому - вербально-семантическому (лексикон и грамматикой) уровню структуры языковой личности, а идиостиль действует на двух уровнях более «глубокого» порядка: когнитивном и прагматическом.

Изучение идиолекта или идиостиля позволяет исследовать и описывать саму языковую личность. Выбор же в качестве объекта изучения того или иного предмета в первую очередь зависит от целей, стоящих перед исследователем. Таким образом, исследование авторской картины мира или того, как то или иное время, та или иная эпоха находят выражение в текстах, будет являться идиостили-стическим исследованием. А то, какими языковыми единицами пользуется при этом автор, их выбор, частотность и другие технические характеристики, должно лечь в основу анализа идиолекта.

Авторизация, в основе которой лежит исключительно описание идиостиля, выраженного через эксплицитные, специфические языковые средства, представляется весьма непростой задачей, поскольку при порождении текста, например, может иметь место преднамеренность выбора тех или иных стилистических конструкций (пародия или плагиат). Так как особенности идиостиля того или иного автора выражены в его языке, их выделение и использование (возможно, с корыстными целями) представляется вполне возможным. По этой причине мы полагаем, что надёжное установление авторства текста должно быть основано в первую очередь не на идиостиле, а на идиолекте, содержащем дорефлексивные языковые признаки.

В главе II «Лннгво-теоретический анализ количественных методов и их применение в русле изучения идиолекта» доказывается, что количественные методы лингвистики решают круг задач, позволяя получать определённые данные о функционировании языка, которые не способны предоставить качественные методы.

Всё более широкое применение количественных и неколичественных математических методов является одним из характерных свойств современной лингвистики. Такая ситуация обусловлена рядом причин:

1) более глубоким пониманием многих явлений языка и речи;

2) бурным развитием лингвистических дисциплин, которые испытывают повышенную потребность в такого рода методах (функциональная стилистика, социолингвистика, психолингвистика и т.д.);

3) появлением прикладных задач, связанных с автоматической переработкой текстов (автоматический перевод, автоматическое реферирование и т.д.);

4) усиленными поисками путей увеличения объективности и точности исследований [Шубин, 1980].

Количественные методы - это методы, опирающиеся на «количественные» методы математики (математическая статистика, теория множеств, теория информации, математический анализ) [Пиотровский, 1977, с. 8], но используемые в языкознании и адаптированные для этой науки. Некоторые из количественных методов основаны на применении математической статистики и, следовательно, могут быть названы статистическими или вероятностно-статистическими.

На основе анализа различных мнений и подходов к исследуемой проблематике можно говорить о том, что количественная методология лингвистики носит весьма дискуссионный характер. Очевидным является то, что поле применения математических методов ограничено: во многих случаях заменить собственно лингвистические подходы количественными невозможно. Прежде всего, выбор должен быть обусловлен тем кругом задач, которые стоят перед исследователем. По мнению Б.Н. Головина, «если статистическая методика в руках лингвиста (и шире - филолога) всего лишь любопытная игрушка, создающая иллюзию точности и строгости наблюдений и оценок некоторых явлений языка, не стоит, очевидно, и копья ломать, защищая её применение. Если же эта методика необходима, если её необходимость диктуется свойствами языка, его природой, если без статистики не может быть достигнуто полное и разностороннее знание языка, -борьба за внедрение этой методики становится принципиальной задачей науки, никак не зависящей от настроений и симпатий отдельных учёных» [Головин, 1971, с. 10].

Несмотря на то, что количественные, методы в лингвистике, как правило, соотносят с практической областью, они весьма широко применяются и для решения некоторых теоретических вопросов языкознания.

Способы применения количественных методов в языкознании мало чем отличаются от их применения в других науках. В лексикографии их используют для составления частотных словарей, помогающих отобрать самую употребительную лексику (так называемая статистическая лексикография). Количественные методы непосредственно связаны с составлением методик обучения иностранным языкам, оптимизацией обучения, определением параметров базового языка и осуществлением оптимизации преподавания языков [Нелюбин, 2003, с. 211]. Разумеется, они играют важную роль в прикладной лингвистике (автоматическая обработка естественного языка и речи, создание систем машинного перевода, электронных словарей и т.д.), психолингвистике, социолингвистике, сравнительно-историческом языкознании, прагмалингвистике и т.д. С помощью количественной лингвистики

решается весьма широкий круг других задач: устанавливается семантическая близость слов и структура семантических полей (работы А.Я. Шайкевича), определяется стиль писателя и авторство литературного произведения (работы А.Н. Колмогорова, М.А. Марусенко, Г. Хьетсо и др.), выделяется хронология языковых явлений (концепция М. Сводеша) и т.д. С точки зрения проблематики, поднятой в данном исследовании, требуется применение именно количественного подхода к анализу языковых явлений.

В частности, существенно то, что количественные методы используются в лингвистических исследованиях для подсчёта и измерения языковых реализаций. Это позволяет значительно расширить и модифицировать картину всей языковой системы и возможностей её функционирования [Баранов, 2001]. Таким образом, количественная лингвистика оказывает существенное влияние на лингвистическую теорию. С теоретической точки зрения использование количественных методов в языкознании позволяет дополнить структурную модель языка вероятностным компонентом, то есть создать структурно-вероятностную модель функционирования языка, обладающую значительным объяснительным потенциалом. Строительство этой модели является задачей именно теоретической лингвистики, оно входит в компетенцию теории языка [Баранов, 2001].

Безусловно, количественные методы не могут в полной мере заменить методы качественные. Очевидным выходом из этой ситуации видится комбинированный подход, при котором качественный анализ будет объективизироваться результатами анализа количественного и наоборот: результаты количественного анализа будут интерпретироваться качественно. Количественная лингвистика должна выступать в качестве важного лингвистического инструмента в руках учёного, с помощью которого он сможет решать всеобъемлющие языковые проблемы. В поддержку такого мнения, правда, с некоторыми оговорками, выступает В.А. Звегинцев: «В известной своей части квантитативные данные, видимо, могут быть использованы лингвистикой, но лишь в качестве вспомогательных ...» [Звегинцев, 1960, с. 140].

Идиолект как объект лингвистического изучения рассматривается, как правило, на основе качественного подхода. Однако количественные методы также могут дать релевантные результаты, имеющие определённую ценность для теоретической лингвистики, на основе которых можно делать различные выводы, например, о характеристиках идиолектов разных людей. Они играют весьма важную роль, если не в качестве основного способа исследования, то в качестве вспомогательного инструмента, позволяющего упростить собственно лингвистический анализ (например, дескриптивный). По мнению М. Култхарда, «на стилистический анализ влияют как качественный, так и количественный анализ, но лингвистическая оценка стиля должна предшествовать её числовому выражению, поскольку числовая оценка зачастую более реалистично репрезентирует факты» [Цит. по: МсМепагшп, 2010, р.491].

Примером применения количественных и статистических методов при ис-

следовании идиолекта может служить работа по изучению устной речи пяти пресс-секретарей Белого Дома США: М. МакКарри, Ари Флейшера, Скотта Мак-Кпиллана, Тони Сноу и Даны Перино. В этом исследовании автор рассматривает частоты применениям ими тех или иных лексических и синтаксических моделей и показывает, что:

1) индивидуальные модели являются достаточно стабильными на протяжении, по крайней мере, 1 -2 лет;

2) индивидуальные модели вариации сохраняются, несмотря на их отличие от общего употребления языка в сообществе;

3) вариации одного говорящего обычно больше, чем вариации между говорящими, основанные на примерах, относящихся к разному времени;

4) идиолектная вариация основывается на ядерных аспектах языка [Barlow, 2010].

Количественные методы находят своё применение во многих областях языкознания, однако особую важность они принимают при решении проблемы авторизации текста.

Такую связь между установлением автора того или иного текста и количественным подходом можно объяснить на основе природы той области лингвистики, к которой в большей степени и относится авторизация, - это судебная лингвистика. В судебной лингвистике научные знания о языке, накопленные теоретической лингвистикой, используются для целей судопроизводства [Плотникова, 2006]. Судопроизводство предполагает под собой проведение чётких, доказательных, объективных и независимых экспертиз.

Таким образом, результаты, получаемые при установлении авторства, должны характеризоваться максимальной объективностью, независимостью от мнения и предположений эксперта. С определённой степенью надёжности этого можно достичь с помощью применения количественных методов. Одновременно справедливо утверждение, что совокупность количественных показателей идиолекта несёт важную лингвотеоретическую информацию, формулируя основу научного описания языковой личности.

В главе III «Лингво-теоретические особенности количественной авторизации текста» анализируется проблематика авторизации текста, её методология, а также проводится количественный эксперимент по изучению идиолекта автора с точки зрения определения авторства.

Проблема атрибуции (авторизации) текстов имеет довольно глубокие исторические корни и относится к числу классических проблем филологического исследования [Баранов, 2001, с. 41]. В широком смысле авторизация текста - соотнесение тексту соответствующих ему атрибутов, к которым причисляется не только имя создателя, но также жанр, время и место создания текста [Хмелёв, 1999].

Для определения авторизации текста в узком смысле целесообразно привести дефиницию одного из ведущих учёных в этой сфере П. Юла: «атрибуция ав-

торства - это наука об определении характеристик автора на основе характеристик документов, написанных этим автором» [1ио1а, 2007, р. 120]. Поскольку текст - продукт речи, характеристики автора выделяются на лингвистических основах, а их комплекс представляет собой то, что мы можем назвать его идиолектом, а в конечном счёте — его языковой личностью. Таким образом, несколько перефразировав определение П. Юла, можно вывести следующее определение: авторизация текста — это лингвистическая наука об определении языковой личности/идиолекта автора на основе языковых характеристик документов, написанных этим автором.

Типовые случаи авторизации текста описываются следующими ситуациями:

1) множественная неопределённость;

2) сравнение по образцу;

3) конкуренция образцов [Баранов 2001].

Практические задачи автороведческого исследования можно выделить в три группы:

• судебная практика (например, плагиат);

• исследование литературы и истории (например, установление авторства анонимных произведений);

• образование и психология (например, контроль за выполнением дипломных работ и рефератов) [Васюков, 2005].

Проблема авторизации текста относится к числу классических проблем филологического исследования. Часто она рассматривается в рамках «статистической (количественной) стилистики» — стилеметрии. Стилеметрия — прикладная филологическая дисциплина, занимающаяся измерением стилевых характеристик текстов с целью их упорядочивания и систематизации (типологии, диагностики, атрибуции, классификации, датировки и тому подобное). Задачей этой дисциплины является поиск таких формальных количественных параметров текста, которые позволяли бы проводить строгие различия между двумя-тремя авторами [Мартыненко, 1988].

Индивидуальность идиолекта автора проявляется в присущих ему маркёрах, проявляющихся на разных уровнях языковой системы. К таким маркёрам могут относиться:

• форматирование или оформление самого документа (пробелы, поля и т.д.);

• пунктуация всех типов;

• написание (все различные варианты написания слов и ошибки);

• словообразование;

• синтаксис (структура предложения, связи между ними и т.д.);

• лексическая вариативность (выбор фраз и слов);

• семантическая вариативность (семантические особенности слов, фраз и предложений);

• функциональная вариативность использования языка (сочетание структуры

и функции);

• признаки языковой интерференции [McMenamin, 2002, р. 121].

Маркёры, выделенные Дж. Макменамином, указывают на очень важную роль понятия лингвистической вариативности. У. Лабов - один из первых учёных, преуспевших в определении тех сил, которые обуславливают лингвистическое разнообразие и его связи с системой языка. Вариативность может проявляться на разных уровнях, например, групповом и индивидуальном (социолект/диалект, идиолект). В отношении к групповому разнообразию индивид создаёт свою собственную систему вербального поведения, похожую на систему той группы, с которой он себя идентифицирует [McMenamin, 2010], привнося, однако, в неё частицу своего собственного, индивидуального творчества.

Среди факторов лингвистической вариативности чаще всего называют следующие:

1) вариации в языке отдельного человека;

2) вариации среди всех носителей языка в рамках определённого языкового сообщества [McMenamin, 2002].

Тщательное исследование и анализ языка показывают, что лингвистическая вариативность может быть описана и измерена в той степени, в которой она обусловлена собственно лингвистическими и экстралингвистическими факторами [McMenamin, 2002, р. 47].

Все методы атрибуции, используемые исследователями для решения вопросов, лежащих в рамках различных направлений (например, судебной лингвистики или источниковедения), служат единственной цели, а именно: выделению и описанию языковой личности в целом и идиолекта конкретного автора в частности.

Будучи одним из средств описания языковой личности и её идиолекта, авторизация текста должна ориентироваться исключительно на некие особенности, благодаря которым автора можно дифференцировать не только от всех носителей его родного языка, но и от представителей одного с ним социума. С этой точки зрения ключевое значение приобретает вопрос, в чём же собственно могут заключаться уникальные характеристики языковой личности. По этой причине авторизация текста должна, в первую очередь, основываться на исследовании идиолекта, поскольку именно на этом уровне проявляются закреплённые до автоматизма (до-рефлексивные) умения автора пользоваться родным языком.

Современные формальные методики установления авторства текста (именно они используются в экспертизах) опираются на стохастическую модель порождения речи. В основе этой модели лежит представление о том, что с возрастанием объёма текста авторские особенности языкового оформления содержания становятся устойчивыми с вероятностной точки зрения, что позволяет устанавливать авторство по стабильно повторяющимся формальным характеристикам текста [Рахимова, 2005].

Важно отметить, что использование методов установления авторства, осно-

ванных на анализе формальных характеристик, или, наоборот, на собственно стилистическом и литературном анализе текста, не представляется возможным. С другой стороны, грамматические особенности авторского стиля - частота употребления неполнозначных, синсемантических слов и дискурсивных маркёров (частиц, союзов, предлогов, некоторых модальных слов, вводных выражений) — для текстов порядка 1000-2000 словоупотреблений сохраняются. Это и даёт возможность подтверждать или опровергать имеющиеся гипотезы относительно авторства текста. Необходимо подчеркнуть, что гипотеза об авторстве в любом случае должна присутствовать и формулироваться на экстралингвистических основаниях [Рахимова, 2005].

В контексте всей истории развития и нынешних подходах к феномену индивидуальности в языке, её выделению и анализу можно сделать два важных вывода:

1. Индивидуальное в языке, безусловно, присутствует и выражается с помощью некоего идиосинкратичного выбора средств выражения языковой личности, её идиолекта или идиостиля — того, что можно назвать авторским инвариантом. По В.П. Фоменко и Т.Г. Фоменко авторский инвариант — это количественная характеристика литературных текстов (некий параметр), который: а) однозначно характеризует своим поведением произведения одного автора или небольшого числа «близких авторов», б) принимает существенно разные значения для произведений разных групп авторов [Фоменко, Фоменко, 1996].

2. Индивидуальное в языке может успешно подвергаться различного вида анализу, в том числе и количественному.

Количественная оценка идиолекта автора — весьма нетривиальная задача. Авторский инвариант должен обладать рядом свойств. Искомая числовая характеристика должна удовлетворять следующим естественным требованиям:

1) она должна быть достаточно «массовой», интегральной, чтобы слабо контролироваться автором на сознательном уровне. Другими словами, она должна быть его «бессознательным параметром», коренящимся настолько глубоко, что автор даже не задумывается о нём;

2) искомый параметр должен сохранять «постоянное значение» для произведений данного автора, то есть иметь небольшое отклонение от среднего значения (слабо колебаться) на протяжении всех его книг. Именно это свойство и позволяет говорить, что данный параметр является инвариантом;

3) параметр должен различать между собой разные группы писателей, то есть должно существовать достаточное число авторских групп, заметно отличающихся друг от друга значениями инварианта [Фоменко, Фоменко, 1996]. Среди основных задач количественного опыта авторизации текста можно

выделить: поиск и отбор материала исследования, подготовка текстов к количественному анализу, выработка методологии исследования, количественное изучение отобранных текстов, анализ полученных результатов и построение на их ос-

нове выводов об идиолектах рассматриваемых авторов.

С этой целью были выбраны три публициста (авторы колонок в «Российской Газете»): В. Выжутович, Л. Радзиховский и А. Чеснаков. Отбор авторов происходил по нескольким параметрам:

1) по наличию единой стилистической среды, в данном случае - публицистической;

2) по одному временному отрезку написания текстов — 2012-2013 годы;

3) по соотносимое™ размеров текстов. В данном случае свои ограничения на объём текста накладывает его формат - формат газетной колонки;

4) по формату текстов, а именно электронному, который больше подходит для их обработки специализированным лингвистическим и общим программным обеспечением.

Таким образом, было выбрано по 10 текстов каждого из авторов. Методика исследования опирается не на единичный критерий, а на комбинацию многих из них, что должно послужить получению более надёжных и объективных результатов, а также минимизировать возможность появления неоднозначностей в итоговой трактовке авторства.

Для проведения опыта количественной авторизации были выбраны критерии, предложенные известными лингвистами и представителями других наук, в частности Г. Хьетсо, А.Н. Барановым, В.П. Фоменко и Т.Г. Фоменко, А.П. Варфо-ломеевым:

1) средняя длина слова в буквах, вычисляемая на основании выборок размером 100, 200 и 400 текстовых слов, а также полных текстов;

2) индекс разнообразия лексики;

3) средняя длина предложения в словах, вычисляемая на основании выборок размером в 10 и 20 предложений, а также полных текстов;

4) коэффициент синтаксического разнообразия;

5) процент служебных слов;

6) сравнение частоты встречаемости квазисинонимических лексем;

7) распределение глагольных форм.

В рамках проведённого опыта количественной авторизации были получены определённые результаты, проанализировав которые, можно прийти к выводу, что применяемые критерии в данном случае дают вполне объективные основания детерминировать выраженные в текстах идиолекты авторов по их выделенным индивидуально-стилевым характеристикам. Таким образом, можно говорить о том, что количественная методика вполне жизнеспособна при описании теоретически значимых идиолектных предпочтений в сфере авторизации текстовых материалов.

Для того чтобы подвести окончательный итог опыта авторизации, определения и разграничения идиолектов трёх исследованных авторов, все основные данные были занесены в таблицу 1.

Таблица 1. Сравнительные данные опыта количественной авторизации по набору критериев

Автор

Критерий Выжутович Радзиховский Чеснаков

Средняя длина слова 6,15 5,56 6,19

Индекс лексического разнообразия 0,3117 0,2662 0,3221

Средняя длина предложения 13,27 12,27 15,06

Степень синтаксической сложности 0,925 0,918 0,934

Доля служебных слов 0,215 0,238 0,244

Процент квазисинонимических лексем

Наречия степени

Едва 0,01% 0.02% 0,00%

Немного 0,00% 0,00% 0,00%

Наречия степени

Вдруг 0,01% 0,01% 0,04%

Внезапно 0,015% 0,000% 0,000%

Неожиданно 0,015% 0,000% 0,000%

Наречия степени

Очень 0,07% 0,11% 0,00%

Слишком 0,000% 0,022% 0,064%

Частицы

Тоже 0,09% 0,11% 0,04%

Так 0,175% 0,46 Г/о 0,851%

Вводные слова и выражения

Конечно 0,04% 0,21% 0,19%

Разумеется 0,073% 0,110% 0,000%

Естественно 0,015% 0,044% 0,000%

Союзы, союзные слова

Поскольку 0,015% 0,022% 0,043%

Почему 0,058% 0,000% 0,106%

Если 0,277% 0,351% 0,319%

Доля репрезентаций и наклонений глаголов

Повелительное наклонение 0,016304348 0,015544041 0,010416667

Изъявительное наклонение 0,588768116 0,649395509 0,462797619

Причастие 0,141304348 0,097582038 0,18452381

Инфинитив 0,216485507 0,215025907 0,308035714

Деепричастие 0,037137681 0,022452504 0,03422619

Таким образом, была продемонстрирована возможность использования количественных методов для описания идиолекта путём авторизации текста.

Выявленные числовые показатели, однако, в некоторых случаях близки. Это свидетельствует о том, что поднятая в данном диссертационном исследовании проблематика нуждается в дальнейшем изучении и совершенствовании как со стороны теоретических аспектов идиолекта, его выделения, описания и фиксации, так и со стороны применимости и дальнейшей интеграции в лингвистику матема-тико-статистических методов, которые могут позволить решить проблему авторизации.

Тем не менее полученные результаты позволяют уточнить ряд положений современной теории языка. Во-первых, опора на структурные особенности текста открывает возможность применения количественных методов к его анализу, что приводит к выведению надёжных критериев разграничения идиолекта и идиости-ля. При этом именно дорефлексивная природа признаков, формирующих идиолект, даёт основания полагать, что их количественные характеристики могут служить основой адекватного описания конкретной языковой личности. Во-вторых, применение количественных методов в авторизации текста даёт надёжные основания для установления связи между «языковой механикой», с одной стороны, с другой - особенностями текстобразования в исполнении конкретной языковой личности. И, в-третьих, устанавливаются относительно ясные границы применения количественных и качественных методов к исследованию языковой личности. Область первых: грамматикон и лексикон, в то время как последние незаменимы на прагматическом и когнитивном уровнях. В конечном счёте эти результаты способствуют решению актуальных проблем теории языка.

Лингво-теоретический анализ смежных понятий идиолекта и идиостиля показал, что данные явления представляют собой соотносимые, но детерминируемые аспекты языка отдельного носителя. Идиолект — это дорефлексивный (автоматический) выбор говорящим или пишущим определенных языковых средств, а идиостиль - это, напротив, проявление автором рефлексии над своим текстом, выражающейся в когнитивных и прагматических особенностях его языка. Кроме того, идиолект и идиостиль - это предметы рассмотрения разных направлений исследований. Если первое - это понятие собственно лингвистическое, то второе относится в большей степени к теории литературы.

И идиолект, и идиолстиль - это элементы понятия более общего порядка. Они являются составными частями языковой личности человека, однако проявляются на разных уровнях её структуры. Идиолект относится к вербально-семантическому уровню, который в большей мере характеризуется непреднамеренностью выбора средств языкового выражения, а идиостиль - к когнитивному и прагматическому уровням, особенностями которых являются те или иные установки, интенции, смыслы, вкладываемые автором при порождении текста.

На вербально-семантическом уровне идиолект проявляется через лексикон и грамматикон - те категории, которые в большей мере поддаются количественному исчислению. Напротив, средства выражения идиостиля, а именно семанти-кон и прагматикон, не формализуемы. Следовательно, с точки зрения авторизации

текста как области, требующей объективности и однозначности, при установлении авторства того или иного текста следует рассматривать преимущественно идиолект.

Так как количественные методы авторизации позволяют анализировать лишь формализуемые характеристики текста, то есть лексикон и грамматикон, можно сказать, что они опираются на структурно-языковые особенности текста. Поскольку такие особенности очень сложно подделать, сымитировать или скопировать, во многих случаях количественная методология авторизации может давать объективные и точные результаты, свидетельствующие о принадлежности текста тому или иному автору.

Выделенные в рамках количественного анализа критерии авторизации на каждом из этапов исследования позволили получить дифференцируемые результаты, которые дают нам основания говорить об успешно проведённой атрибуции выбранных текстов и установленном количественном различии идиолектов их авторов.

Основные положения исследования отражены в публикациях:

1. Верхозин, С.С. К проблеме лингвистических оснований авторизации текста [Текст] / С.С. Верхозин // Вестник Иркутского государственного лингвистического университета. Сер. Филология. — Иркутск, 2013. -№1 (22). - С. 24-28 (0,4 п.л.).

2. Верхозин, С.С. К вопросу о лингвотеоретических основах методик авторизации текста [Текст] / С.С. Верхозин II Ученые записки Забайкальского государственного гуманитарно-педагогического университета. Сер. Филология, история, востоковедение. - Чита, 2013. - №2 (49). - С. 22-27 (0,5 п.л.).

3. Верхозин, С.С. О статусе количественных методов в лингвистике [Текст] / С.С. Верхозин // Вестник Иркутского государственного лингвистического университета. Сер. Филология. - Иркутск, 2013. - №3 (24). - С. 145-150 (0,5 п.л.).

4. Верхозин, С.С. К проблеме лингвистических оснований авторизации текста [Текст] / С.С. Верхозин // Современные проблемы гуманитарных и естественных наук: материалы конференции молодых ученых. - Иркутск: ИГЛУ, 2011.-С. 38-39 (0,1 п.л.).

5. Верхозин, С.С. К вопросу о лингво-теоретических основах методик авторизации текста [Текст] / С.С. Верхозин // Современные проблемы гуманитарных и естественных наук: материалы конференции молодых ученых. - Иркутск: ИГЛУ, 2012. - С. 34-36 (0,1 п.л.).

6. Верхозин, С.С. Количественный подход к изучению идиолекта [Текст] / С.С. Верхозин // Современные проблемы гуманитарных и естественных наук: материалы конференции молодых ученых. - Иркутск: ИГЛУ, 2013. -С. 25-27 (0,1 п.л.).

Отпечатано: ООО «Издательство «Аспринт» 664003 г. Иркутск, ул. Сухэ-Батора, 18, оф. 67 Формат 60*90 1/16 усл. печ. л. 1,5 Заказ № 731 тираж 100 экз.

 

Текст диссертации на тему "Количественные критерии авторизации текста как проблема теоретической лингвистики"

ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ «ИРКУТСКИЙ ГОСУДАРСТВЕННЫЙ ЛИНГВИСТИЧЕСКИЙ

УНИВЕРСИТЕТ»

На правах рукописи

04201450621

ВЕРХОЗИН СТЕПАН СЕРГЕЕВИЧ

КОЛИЧЕСТВЕННЫЕ КРИТЕРИИ АВТОРИЗАЦИИ ТЕКСТА КАК ПРОБЛЕМА ТЕОРЕТИЧЕСКОЙ ЛИНГВИСТИКИ

Специальность 10.02.19 — теория языка

ДИССЕРТАЦИЯ на соискание ученой степени кандидата филологических наук

Научный руководитель: доктор филологических наук, профессор А.М. Каплуненко

Иркутск — 2013

ОГЛАВЛЕНИЕ

ВВЕДЕНИЕ......................................................................................................................5

ГЛАВА I. ИСТОРИЯ, СУЩНОСТЬ И СОПОСТАВИМОСТЬ ПОНЯТИЙ ИДИОЛЕКТА, ИДИОСТИЛЯ И ЯЗЫКОВОЙ ЛИЧНОСТИ

1Л. История появления понятия идиолекта и его развитие...........................11

1.2. Современные подходы к изучению идиолекта.........................................14

1.2.1. О двойственности подходов к пониманию термина «идиолект».................................................................................................21

1.2.2. Идиолект уз социолект...................................................................24

1.2.3. Об основаниях современных теорий идиолекта..........................26

1.3. Проблема соотношения понятий идиолект и идиостиль.........................30

1.4. Идиолект и языковая личность

1.4.1. Понятие языковой личности..........................................................37

1.4.2. Соотношение понятия «языковая личность» с понятиями «идиостиль» и «идиолект»......................................................................45

1.5. Определение идиолекта как основной цели авторизации текста...........47

1.6. Лингвистические единицы как маркёры идиолекта.................................52

ВЫВОДЫ ПО ПЕРВОЙ ГЛАВЕ.................................................................................56

ГЛАВА II. ЛИНГВО-ТЕОРЕТИЧЕСКИЙ АНАЛИЗ КОЛИЧЕСТВЕННЫХ МЕТОДОВ И ИХ ПРИМЕНЕНИЕ В РУСЛЕ ИЗУЧЕНИЯ ИДИОЛЕКТА 2.1. Теоретическая специфика количественных методов и количественной лингвистики

2.1.1. Место математической и количественной лингвистики

в кругу лингвистических дисциплин......................................................58

2.1.2. Об идеологии количественных методов в лингвистике.............62

2.1.3. Релевантные лингвистические методы исследования идиолекта...................................................................................................66

2.1.4. Количественные методы в кругу лингвистических исследований.............................................................................................69

2.1.5. Качественные и количественные методы:

основные различия....................................................................................71

2.1.6. Количественные методы исследования языка:

pro et contra................................................................................................74

2.2. Место количественных методов в теоретической лингвистике 2.2.1. Применение количественных методов в теоретической

лингвистике...............................................................................................81

2.2.1.1. Применение количественных методов

в исследованиях идиолекта автора...............................................84

ВЫВОДЫ ПО ВТОРОЙ ГЛАВЕ.................................................................................89

ГЛАВА III. ЛИНГВО-ТЕОРЕТИЧЕСКИЕ ОСОБЕННОСТИ КОЛИЧЕСТВЕННОЙ АВТОРИЗАЦИИ ТЕКСТА

3.1. Авторизация текста как средство описания идиолекта и языковой личности

3.1.1. Понятие авторизации текста и недостатки качественных

методов установления авторства.............................................................91

3.1.2. Стилеметрия как количественный метод

авторизации...............................................................................................95

3.1.3. Количественные подходы к авторизации текста

с точки зрения лингвистической вариативности...................................99

3.2. Краткая история количественной авторизации текстов........................103

3.3. Характеристика современных количественных методов авторизации........................................................................................................107

3.4. Опыт количественной авторизации текстов российских публицистов

3.4.1. Задачи и цели исследования, отбор текстового

материала.................................................................................................113

3.4.2. Предварительная обработка текстов, определение

критериев авторизации и ее инструментарий......................................116

3.4.3. Описание методики исследования идиолектов российских публицистов.............................................................................................120

3.4.4. Анализ и интерпретация полученных результатов

3.4.4.1. Лексические критерии: распределение средней длины слова и индекс лексического разнообразия...............................125

3.4.4.2. Синтаксические критерии: распределение средней длины предложения и степени синтаксической сложности .... 130

3.4.4.3. Процент служебных слов................................................133

3.4.4.4. Доля квазисинонимических лексем...............................135

3.4.4.5. Доля встречаемости репрезентаций и наклонений глаголов..........................................................................................138

ВЫВОДЫ ПО ТРЕТЬЕЙ ГЛАВЕ..............................................................................143

ЗАКЛЮЧЕНИЕ...........................................................................................................145

БИБЛИОГРАФИЧЕСКИЙ СПИСОК.......................................................................149

СПИСОК ИСПОЛЬЗОВАННЫХ СЛОВАРЕЙ И ПРИНЯТЫХ

СОКРАЩЕНИЙ..........................................................................................................162

СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ..................................................163

ПРИЛОЖЕНИЕ 1........................................................................................................165

ПРИЛОЖЕНИЕ 2........................................................................................................192

ПРИЛОЖЕНИЕ 3........................................................................................................222

ВВЕДЕНИЕ

Авторизация текста - явление для лингвистики не новое. Оно возникло тогда, когда учёных впервые заинтересовала проблема авторства того или иного произведения. Широко известны случаи оспаривания авторства некоторых пьес У. Шекспира, комедий, приписываемых Мольеру, критико-литературного творчества A.C. Пушкина, Ф.М. Достоевского, Н.Г. Чернышевского, М.А. Шолохова.

К решению этой проблемы языковеды подходили с разных сторон. На ранних этапах пользовались преимущественно собственно лингвистическими методами. Однако в конце 19 - начале 20 веков впервые была сформулирована идея о возможном приложении к этой сфере подходов, характерных для других наук, прежде всего, математики. На математизацию языковедения в своё время указывали Ф. де Соссюр и И.А. Бодуэн де Куртенэ [Соссюр, 1999; Бодуэн де Куртенэ, 1963]. Впоследствии об этом стали говорить другие известные лингвисты и психологи, в частности, JI.C. Выготский, В.В. Виноградов, Ю.Д. Апресян и т.д. [Гладкий, 2007; Виноградов, 1938; Апресян, 1966].

Окончательно математические методы закрепились в лингвистике лишь в 50-х годах 20 века. Они начали применяться и для решения проблемы авторства. Математический аппарат позволил фиксировать в текстах некоторые функционально-формальные показатели (например, долю служебных слов), которые, как предполагалось, в значительной мере характеризуют индивидуальный авторский стиль.

Уникальный индивидуальный стиль в зависимости от конкретного подхода или направления можно назвать идиостилем, но с точки зрения авторизации текста наиболее адекватным эквивалентом является понятие идиолекта.

Идиолект представляет собой различительный и идиосинкратический (специфический) выбор при порождении текста. Он выражается в умении носителя языка пользоваться его функционально-формальным аппаратом, что, в свою очередь, наводит на мысль о применимости к его описанию и изучению количественных методов, используемых в русле исследований по авторизации текстов.

В качестве теоретической основы диссертации используются идеи лингвистов, занимавшихся изучением языковой личности, идиостиля и идиолекта (В.В. Виноградов, Ю.Н. Караулов, Б. Блок, Н. Хомский, О.Г. Ревзина, Н. Диттмар, М. Култхард, В.П. Григорьев, В.П. Конецкая и другие), идеи и труды по изучению и применению количественных методов в лингвистике (Р.Г. Пиотровский, А.Н. Баранов, Б.Н. Головин, Г.Я. Мартыненко, A.B. Гладкий и другие), а также авторизации текста (H.A. Морозов, Г. Хердан, А.Н. Баранов, Д.В. Хмелёв, П. Юла, М.А. Марусенко, Е.С. Родионова, Дж. Макменамин, Д. Култхард, И. Тулдава и другие).

Актуальность темы диссертации обусловлена недостатком исследований проблем авторизации текста в теоретико-лингвистическом ракурсе. Кроме того, необходимы научная оценка возможностей авторизации текста, равно как и определение границ их применения, с целью диагностики языковой личности и уточнение места количественной методологии по отношению к качественным методам в теоретической лингвистике.

Объектом исследования является идиолект разных авторов, установленный выборкой некоторого количества их текстов.

Предметом исследования избраны, исходя из задач авторизации текста, идиолекты с точки зрения их количественных показателей на релевантных уровнях языка.

Целью диссертации является анализ феномена идиолекта, а также выделение тех его аспектов, которые могут лечь в основу подхода к определению авторства. Кроме того, ставится цель историко-теоретического исследования количественных методов лингвистики и возможностей их применения. Для достижения поставленной цели в работе решаются следующие задачи:

1) анализируется понятие идиолекта, его история и подходы к изучению;

2) анализируется отношение понятия «идиолект» к смежным понятиям «идио-стиль» и «языковая личность»;

3) устанавливается идиолект и его составляющие в качестве главной цели описания при авторизации текста;

4) изучаются и анализируются количественные методы, их специфика, место в

теоретической лингвистике, а также применение в рамках лингвистических исследований;

5) обосновываются возможности использования количественных методов с целью изучения и описания идиолекта;

6) определяются лингвистические основания авторизации текста;

7) проводится обзор и анализ релевантных количественных методов и подходов к проблеме установления авторства текста;

8) проводится количественное описание идиолектов трёх разных авторов с точки зрения авторизации принадлежащих им текстов.

Материалом диссертационного исследования послужили тексты трёх авторов-публицистов, ведущих колонки в «Российской Газете»: Валерия Выжутовича, Леонида Радзиховского, Андрея Чеснакова. Первоочередное внимание уделено идиосинкратическим особенностям, обнаруженным в их статьях, для описания которых подходят некоторые количественные методы.

Научная новизна работы состоит в том, что впервые обоснованы правомерность количественных подходов к авторизации текста с целью описания соответствующего идиолекта и характеристика эвристических возможностей количественных методов в исследовании феномена языковой личности.

Теоретическая значимость диссертационной работы заключается в том, что полученные результаты вносят вклад в разработку современных методов параметризации идиолекта на основе количественных показателей функционирования языка. Поскольку такие показатели устанавливаются на материале текста, они служат надёжным основанием для дальнейшей разработки критериев идентификации языковой личности.

Практическая значимость диссертации заключается в том, что её результаты могут быть использованы как для филологического или описательного исследования идиолекта, идиолектных аспектов языковой личности, так и для выполнения практических задач по установлению авторства различных текстов с помощью применения количественных методов. Материалы диссертации могут использоваться в курсах общей и прикладной лингвистики, а также при подготовке

курсовых и дипломных работ.

Методологическую основу исследования составляют количественные методы, применяемые в лингвистических и автороведческих исследованиях, а именно: критерии средней длины слова и средней длины предложения (в разных вариациях использовались различными учёными: Г. Хьетсо, В.П. Фоменко и Т.Г. Фоменко, Д.В. Хмелёвым), критерии степени синтаксической сложности и коэффициента лексического разнообразия (А.П. Варфоломеев), критерий процента/доли служебных слов (Н.А. Морозов, П. Фоменко и Т.Г. Фоменко), критерий определения процента квазисинонимичных лексем (А.Н. Баранов), а также критерий распределения в текстах различных репрезентаций и наклонений глаголов. Теоретическое обобщение сути количественных методов осуществляется путём их научного синтеза.

На защиту выносятся следующие положения:

1. Идиолект и идиостиль - разные, но смежные понятия. Если идиолект представляет собой совокупность структурно-языковых особенностей (стабильных характеристик), проявляющихся в речи отдельного носителя языка, то идиостиль - это совокупность речетекстовых характеристик отдельной языковой личности (индивидуальности писателя, учёного и т.д.).

2. Идиолект и идиостиль являются составными частями более общего целого, а именно языковой личности. Они действуют на разных её уровнях. Идиолект относится к первому - вербально-семантическому уровню структуры языковой личности (лексикон и грамматикон в терминах Ю.Н. Караулова), а идиостиль действует на двух оставшихся уровнях более «глубокого» порядка: когнитивном и прагматическом.

3. Авторизация текста может рассматриваться как одно из направлений исследования и описания идиолекта и, кроме того, основываться на его параметрах. Это обусловлено характерными особенностями идиолекта, в частности, непреднамеренностью выбора тех или иных языковых средств автором.

4. Количественные методы могут успешно применяться при авторизации текста, предоставляя весьма объективную информацию об авторстве. При этом они применимы главным образом к структурно-языковым характеристикам

текста.

5. Выделенные в результате их апробации количественные критерии установления авторства позволяют описать и дифференцировать идиолекты разных

авторов, выраженные в принадлежащих им текстах.

Апробация работы. Результаты исследования были представлены на заседаниях кафедры прикладной лингвистики Иркутского государственного лингвистического университета (2011-2013). По теме диссертации сделаны доклады на межвузовских конференциях молодых учёных «Современные проблемы гуманитарных и естественных наук», проводимых в рамках недели науки ИГЛУ (20112013), на Всероссийской научно-практической конференции «Аспирантские чтения ИГЛУ» (2011). Основные результаты исследования нашли своё отражение в 6 публикациях, в том числе в трёх публикациях в ведущих рецензируемых научных изданиях («Вестник ИГЛУ», «Учёные записки» ЗабГГПУ им. Н.Г. Чернышевского). Общий объём публикаций составляет 1,7 печатный лист.

Структура работы. Диссертация состоит из введения, трёх глав, выводов по главам, заключения, списка использованной литературы, списка использованных словарей и принятых сокращений, списка источников примеров, приложений.

Во введении обосновываются цели и задачи работы, её актуальность и новизна, теоретическая и практическая значимость, перечисляются основные методы анализа.

В первой главе «История, сущность и сопоставимость понятий идиолекта, идиостиля и языковой личности» рассматриваются теоретические и исторические аспекты изучения идиолекта, определяется его отношение к смежным понятиям идиостиля и языковой личности, устанавливается основополагающая роль идиолекта при авторизации текста.

Во второй главе «Лингво-теоретический анализ количественных методов и их применение в русле изучения идиолекта» описывается теоретическая специфика количественной методологии, место количественной лингвистики и количественных методов в изучении языка, а также применимость количественных методов в исследованиях идиолекта.

В третьей главе «Лингво-теоретические особенности количественной авторизации текста» проводится описание и анализ лингво-теоретических оснований авторизации текста: её сущности, проблематики, истории, методологии. Кроме того, проводится количественное исследование идиолектов трёх разных авторов с точки зрения авторизации.

В заключении обобщаются результаты проведённого исследования, формулируются основные выводы и намечаются перспективы дальнейшей разработки данной темы.

Список использованной литературы включает 135 источников, в том числе 35 на иностранных языках.

Приложения содержат материал, необходимый для иллюстрации ряда теоретических и практических положений диссертации.

ГЛАВА I. ИСТОРИЯ, СУЩНОСТЬ И СОПОСТАВИМОСТЬ понятий ИДИОЛЕКТА, идиостиля И ЯЗЫКОВОЙ личности

1Л. История появления понятия идиолекта и его развитие

Несмотря на то, что термин «идиолект» как таковой не существовал до 1948 года, само явление начало изучаться лингвистами с конца 19 века.

Первые теоретические основания идиолекта предложил глава немецкой школы младограмматизма Г. Пауль. В книге "Prinzipien der Sprachgeschichte" он оспаривает метафору представления языка как живого организма [Hazen, 2006, р. 513]. Г. Пауль настаивает на том, что язык занимает центральное место в мышлении человека. Ученый вводит такие термины, как «индивидуальная языковая деятельность» (Sprechtätigkeit), «индивидуальная неоднородность» (individuelle Verschiedenheiten), «индивидуальное отличие» (individuelle Unterschiede). Современные интерпретации идиолекта, так или ин�