автореферат диссертации по филологии, специальность ВАК РФ 10.02.04
диссертация на тему:
Лингвистические принципы построения и использование корпуса текстов для исследования официально-делового стиля современного немецкого языка

  • Год: 2005
  • Автор научной работы: Вадяев, Сергей Евгеньевич
  • Ученая cтепень: кандидата филологических наук
  • Место защиты диссертации: Самара
  • Код cпециальности ВАК: 10.02.04
Диссертация по филологии на тему 'Лингвистические принципы построения и использование корпуса текстов для исследования официально-делового стиля современного немецкого языка'

Полный текст автореферата диссертации по теме "Лингвистические принципы построения и использование корпуса текстов для исследования официально-делового стиля современного немецкого языка"

На правах рукописи

ВАДЯЕВ Сергей Евгеньевич

ЛИНГВИСТИЧЕСКИЕ ПРИНЦИПЫ ПОСТРОЕНИЯ И ИСПОЛЬЗОВАНИЕ КОРПУСА ТЕКСТОВ ДЛЯ ИССЛЕДОВАНИЯ ОФИЦИАЛЬНО-ДЕЛОВОГО СТИЛЯ СОВРЕМЕННОГО НЕМЕЦКОГО ЯЗЫКА

(на материале электронного корпуса «DER»)

Специальность 10 02.04 - Германские языки

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата филологических наук

Нижний Новгород - 2005

Работа выполнена на кафедре немецкой филологии Самарского государственного университета.

Научный руководи!ель- доктор филологических наук,

профессор Сергей Иванович Дубинин Официальные оппоненты: доктор филологических наук,

профессор Ефим Григорьевич Вышкин

кандидат филологических наук, доцент Николай Евдокимович Бажайкин

Ведущая организация: Волгоградский государственный

университет

Защита состоится « 18 » мая 2005 г. в 14 часов на заседании диссертационного сове 1а К 212 163.01 по защите диссертаций на соискание ученой сюпени кандидата филологических наук при Нижегородском государственном лиш вистическом университете им Н.А Добролюбова по адресу 6031 15, г Нижний Новгород, ул. Минина, д. 31а, научный читальный зал.

С диссертацией можно ознакомиться в библиотеке Нижегородского государственного лингвистического университета им. Н.А.Добролюбова.

Автореферат разослан « 2005 г.

Ученый секретарь

диссертационного сове 1а

В.В. Денисова

бич

мтъ

Реферируемая диссертация является комплексным исследованием, которое включает в себя: разработку электронного корпуса текстов, служащего текстовой и инструментальной базой для квантитативных лингвистических исследований, а также использование этого корпуса для выявления особенностей функционирования модальных глаголов в текстах официально-делового стиля современного немецкого литературного языка

В последние годы особое внимание лингвистов уделяется исследованию характеристик устойчивых текстовых форм. Это обусловлено, с одной стороны, необходимостью решения проблем, связанных с раз1раничением стилей, а с другой стороны - задачами практической стилистики, ришрики и языковой культуры. Немецкие лингвисты применяют для определения устойчивых текстовых форм и их конкретных реализаций в речи 1ермины тип текста (Тех1-эоЛе) и экземпляр текста (Тех1ехешр1аг). Под типом текста (далее ТТ) понимается форма текста, в которой реализуется коммуникативное намерение говорящего/пишущего и которая с1роиюя по определенным правилам и нормам. Каждый конкретный гекст {экземпляр текста) обладает определенным набором лингвистических и экстралингвистических признаков, по которым его можно отнести к определенному типу текста (Б Зандш, К. Адамчик, X. Штегер , X. Дойфих).

В немецкой стилистике при классификации ТТ принято выделять группу политических текстов (К. Бринкер, Е. Рольф, И. Кляйн, Г. Штраус), большинство из которых являются текстами официально-делового стиля. В последнее время наблюдается особый интерес германистов к изучению именно политических ТТ. Это обусловлено динамичными изменениями характеристик данной группы ТТ, вызванными значительными преобразованиями структуры политических учреждений и политической системы ФРГ в конце XX века. Однако большинство подобных исследований построено на материале внутриполитических ТТ (конештуция, парламентские документы, законы и т.п.) и практически не затрагивают ТТ, относящиеся к внешнеполитической деятельности (международные договоры, докумешы Европейского союза и

До настоящею времени не проводилось развернутых исследований, рассматривающих стилистические особенности внешнеполитических текстов, 1де бы на основе репрезентативного корпуса проводился не только квалша-Iивный анализ отдельных, тип влений, но и кпантита-

ООН).

тивная оценка их частотное ш. Только такой подход может обеспечить достоверное выявление функционально-коммуникативных особенностей данного ТТ и его актуальных характеристик в немецком литературном языке последних десятилетий.

Для сравнения квантифицируемых признаков текстов (например, для выявления их принадлежности к функциональному стилю или к типу текстов), а также для определения и сравнения лексическою многообразия текстов в современной стилистике активно используются квантитативные методы. Их применение для стилистического анализа текстов имеет долгую традицию (У Пипер, У. Шмитц, А А Пиотровская, А.Я Шайкевич). Как правило, в качестве основы для таких исследований служит корпус, репрезентативная выборка текстов, составленная с учетом таких факторов, как функционально-стилистические особенности 1екстов, письменная или устная форма их существования Общая коммуникативная направленность конкретных ТТ в значительной мере влияет на употребление языковых средств и их частотность Таким образом, частотные характеристики молут служить в качестве одного из дифференциальных признаков для отнесения группы текстов к определенному функциональному стилю, их выделения в отдельный ТТ.

Использование квантитативных методов для стилистического анализа предполагает исследование обширных массивов текстов, поэтому для их применения большое значение приобретает подюювка репрезентативных выборок текстовых данных и разработка средств доступа к ним, для чего всё чаще используются электронные {машинные) корпусы текстов. Они позволяют более эффективно, надежно и широко использовать квантитативные методы, в частности для выявления стилистических особенностей входящих в их состав 1екстов. При этом особое внимание уделяется выявлению тенденций частотности и дистрибуции отдельных языковых единиц и их групп, сю-хастических зависимостей между ними, а также соотношений между внутренними характеристиками текста и внешними по отношению к нему факторами (У. Шмиц, X. Бергенхольц, Л. Хоффман, У Пипер).

В рамках данной диссертации был разработан оригинальный электронный корпус текстов «ВЕЯ» (1)еи1яс11-Кшз15с1те? Рага11е1когрич), послуживший текстовой и инструментальной базой для выявления особенностей функционирования немецких модальных глаголов в текстах официально-делового стиля Он представляет собой парапечьный корпус текстов (далее ПКТ), включающий немецко- и русскоязычные варианты документов ООН общим объё-

мом в 300 ООО словоупотреблений Использование ПКТ «DER», помимо преимуществ одноязычного корпуса при изучении отдельною языка, даст реальные возможности для проведения контрастивных изысканий, исследования проблем передачи различных языковых явлений в разных языках, поиска использующихся в переводческой практике эквивалентов, а также для составления и пополнения переводных словарей и обучения иностранному языку.

Теоретической основой исследования послужили работы отечественных и зарубежных лингвистов по функциональной стилистике (В Фляйшер, Г. Ми-хель, М.П. Брандес, Э.Г. Ризель, Е.И. Шендельс, В.И. Проворотов, М Н. Кожина), грамматике (Г. Хельбиг, И. Буша, Г. Цифонун, JI. Хоффман, О.И. Москальская), а также корпусной лингвистике (Д.О Добровольский, А Н. Баранов, В М. Апдрющенко, M.II Михайлов, С. Йоханссон, Т. МакЭнри, Э. Уилсон).

Методологической основой построения ПКТ «DER» стали концепции разработанные лингвистами при создании параллельного немецко-финского корпуса «Finde» университета г. Вюрцбур1, ФРГ (www.finde.de), англонорвежского параллельного корпуса «ENPC» университета г. Осло, Норвегия (http://www.hf.uio.no/iba/prosjekt/ENPCmanual.html).

Итогом данной работы являются два теоретически и практически значимых результата, первый из которых состоит в обосновании необходимости и разработке принципов создания ПКТ «DER», а второй - в выявлении модальной специфики немецких текстов официально-делового стиля и особенностей функционирования в них модальных глаюлов.

Актуальность данного диссертационного исследования определяется, с одной стороны, необходимостью выявления специфики функционирования модальных 1лаголов п текстах различных функциональных стилей немецкого яилка, а, с другой стороны, ограниченным количеством параллельных корпусов текстов вообще и для пары языков немецкий и русский в частности, а также недостаточной разработкой концепции и технологии их составления

Научная новизна предлагаемой диссертации состоит в том, чго в ней детально описана лингвистическая концепция и разработана технология построения немецко-русского параллельно1 о корпуса текстов, а также наглядно представлены возможности исполыования одного из субкорпусов ПКТ для с1илистическо1 о анализа В рамках рабогы детально представлены принципы построения ПКТ, а также осуществлено пракшческое его приложение для

выявления особенностей употребления модальных глаголов в одном из типов тексюв официально-делового стиля современного немецкого языка (официальные доклады Гснсекретаря ООН)

Теоретическая значимость исследования состоит в обосновании зависимости между частотностью средств реализации категории модальности (на примере модальных глаголов немецкого языка) и основной коммуникативной функции текстов официально-делового стиля (на примере документов ООН) Данная работа рассматривает также широкий круг проблем, касающихся особенностей официально-делового стиля в современном немецком языке, места документов ООН как самостоятельного типа текстов в динамичной системе функциональных стилей современного немецкого литературного языка Несмотря на то, что официально-деловой стиль является многоплановым феноменом и в спектре политических типов текстов проявляет в последние десятилетия значительную динамику, связанную с расширением международной функции немецкого языка (А И Домашнев), за последнее время появилось не так много работ, посвященных данной тематике'. Кроме того, в диссертации подробно разрабатывается теоретическая база для моделирования ПКТ, а также обосновываются возможносш применения ПКТ «DFR» для анализа стилистических характеристик TT

Материалом исследования послужила подборка элекфонных документов ООН (www un.org) на немецком и русском языках, входящих в состав ПКТ «DER» Первоначальную основу корпуса составляют ежегодные доклады Генерального Секретаря о работе ООН за 1997-2001 гг Общий объем текстов насчитывав! около 900 сфаниц (примерно 300 тыс словоупотреблений) ПКТ «DRR» может служить не только в качес1ве источника сташстических данных или для поиска эквивалентов, но и в качестве базиса для исследований явлений одного из языков корпуса Так, например, немецкие тексты ПКТ «DER» могут служить в качестве самостоятельною объекта специализированною исследования, что наглядно продемонстрировано п рамках данной работы.

1 См , в частности, диссерыциоппые исстедования Коччева С В Лингвистические особенности выражс-ния поб\дите п.ности в текстах официально-еловой прсы (на материале современною немецкого ячыка) АКД - СПб РГИУ им Герцена 2003, Исакова Л Д Соотношение типологических 1енденции и особенностей проявления функциональною стиля в современных 1ерчапских я плках, ЛДД М М1 ЛУ 2001

Цель данного исследования заключается в выявлении модальной специфики немецких текстов официально-делового стиля и особенностей функционирования в них модальных глаголов на базе репрезентативного корпуса текстов Для решения поставленной задачи была разработана оригинальная технология составления немецко-русского ГЖТ «DER» и продемонстрированы возможности его оптимального применения для выявления стилистических особенностей текстов официально-делового стиля (определение параметров поиска и обработка его результатов).

На первом этапе работы ставилась общая задача разработать технологию автоматической обработки текстов для ГЖТ, а также средств их представления и последующего языкового анализа. IIa втором этапе планировалось выявить на основе данных квантитативного и квалитативного стилистического анализа немецкого субкорпуса ГЖТ «DER» закономерности частотно-распределительных характеристик немецких модальных глаголов и их зависимости от общей коммуникативно-функциональной направпенности представленного в ПКТ «DER» типа текстов (ежегодные доклады Генерального Секретаря).

Практическая ценнос1Ь исследования: ПКТ «DER» уже в своём первоначальном виде может служить в качестве основы и инструментария для дальнейших стилистических, лексикологических, грамматических и контра-стивных исследований, в частности, позволяя:

• осуществлять стилометрический анализ различных стилистически релевантных явлений на основе субкорпусов ГЖТ;

• проводить сравнительный анализ особенностей немецкого и русского языков, относящихся к лексическому составу, морфологии и синтаксису (статистический и сравнительный анализ лексических структур, синтаксических конструкций в параллельных текстах и др.);

• осуществлять поиск переводных соответствий для слов и коллокаций, а также примеров употребления лексических единиц и их перевода на другой язык в зависимости от контекста употребления;

• проводить исследования в области стилистики (рассмотрение способов передачи стилистических особенностей в текстах на разных языках, приемов и стилистических средств, при помощи которых в языке перевода передается содержание оригинального текста)

В качестве инструментария были избраны следующие методы исследования: квантитативный метод для определения частотносш квантифицируемых единиц в корпусе и выявления соотношений между внутренними характеристиками текста и внешними по отношению к нему факторами, квалитативный метод для интерпретации полученных статистических данных, для семантического и грамматического анализа употреблений исследуемых языковых единиц в текстах корпуса, а также методы и новейшие технологии корпусной лингвистики для реализации и обработки ПКТ «DER».

Объекюм данного исследования является стилистическая система современно! о немецкого литературного языка, а в качестве предмета исследования выступают частотно-распределительные характеристики немецких модальных глаголов в текстах официально-делового стиля (документы ООН).

Положения, выносимые на защиту:

1 Важнейшим лингвистическим принципом построения корпуса текстов является обеспечение ею репрезентативности. Значительное увеличение объема исследуемого корпуса не означает пропорционального роста количества уникальных лексем в нём (т.е. «автоматического» повышения репрезентативности). Динамика роста количества словоформ падает вместе с ростом количества словоупотреблений в корпусе, поэтому его репрезентативность должна обеспечиваться не столько за счет увеличения объёма, сколько за счет тщательной выборки текстов.

2 Сташстические данные о структурных элементах текста могут служить в качестве надежной основы для выявления параллельных сегментов в ¡екстах на немецком и русском языках и использоваться при разработке параллельных корпусов текстов

3. Документы ООП занимают особое месю среди политических типов тексюв в составе официально-делового стиля современною немецкого языка, что обусловлено их внешнепочитическим характером, особым статусом их эмитента, усиливающейся интернационализацией немецкого языка.

4 Между общей коммуникативно-функциональной направленностью тек-cia и основными средствами выражения модальности существует непосредственная зависимость, выражающаяся для модальных глаголов немецкого языка в изменении их частотно-распределительных характе-

ристик в зависимости от функционально-стилевой принадлежности текста.

5. Речевой фон употребления отдельных модальных глаголов немецкого языка и выбор синтаксических конструкций, в которых они употребляются, тесно связаны с общей коммуникативно-функциональной направленностью текстов определенного типа.

Апробация результатов исследования: основные положения работы были представлены в виде докладов на Международных научных конференциях «Korpuslinguistik deutsch: synchron - diachron - kontrastiv» (2003 г.) и «Europatag» (2004 г.) в университете г. Вюрцбург (ФРГ), «Компаративистика: современная теория и практика» (2004 г.) в Самарском государственном педагогическом университете, на конференции «Русско-немецкие культурно-исторические контакты» в Тольяттинском государственном университете (2004 г.), обсуждались на заседаниях кафедры немецкой филологии СамГУ.

Структура и объем диссертации: диссертация (объём 160 стр.) состоит из введения, трех глав, заключения, списка использованной научной литературы (180 единиц), списка входящих в ПКТ «DER» текстов, глоссария и приложения, которое включает CD-ROM с электронной версией ПКТ «DER» для Windows

Основное содержание работы

Во введении обосновывается актуальность исследования, определяется цель работы, её теоретическая значимость и практическая ценность, определяются методы исследования, характеризуется его материал, а также формулируются положения, выносимые на защиту.

В первой главе «Корпус текстов - новый тип источника лингвистического исследования» дастся определение понятия «корпус текстов», теоретически обосновывается использование электронных корпусов текстов в современной лингвистике (германистике), проводится критический анализ существующего опыта в области составления корпусов текстов, рассматриваются основные их типы и их назначение.

Использование машинных корпусов текстов открыло новые возможности для проведения лингвистических исследований, а разнообразные современные ¡ехнолотии позволяют существенно увеличить объём и повысить эффек-(ивность обрабо[ки языковых данных. Сам по себе корпус текстов не несет

новой информации о языке, являясь «копилкой», куда складываются тексты, репрезентирующие язык в своем естественном употреблении При помощи компьютера можно эффективно управлять содержащейся в корпусе информацией и её представлением для исследователя. Полученные на основании анализа корпуса данные являются релевантными в первую очередь для используемого корпуса, но, тем не менее, они могут бьпь обобщены для оценки явлений в языке в целом.

Термин «корпус» является неоднозначным и служит для обозначения самых разпообрашых объектов, нередко утрачивая строгость в употреблении (ср , «корпус высказываний/примеров употребления» и др ) Общим является то, что во всех случаях речь идет о некой подборке языкового ыатериааа Как правило, имеется в виду подборка полных текстов или их достаточно крупных фрагментов2. Корпус текстов следует отличать от подборки примеров, поскольку в данном случае из используемых текстов более или менее произвольно извлекаются отдельные «цитаты» и условие содержательной когерентности не выполняется (К. Бауш, Т. МакЭнери, Э. Уилсон).

Нет единства мнений и по поводу того, должен ли корпус содержать только тексты, которые являются результатом спонтанных, естественных ситуаций коммуникации, или данный термин применим и к текстам, искусственно возникшим вне акта языковой коммуникации. Поскольку в дискуссии об эмпирических данных, собираемых для анализа языка, центральную роль играет противопоставление корпуса и интуиции, неуместно обозначать термином «корпус» набор придуманных (возникших вне акта коммуникации) примеров Высказывания, возникшие в результате коммуникативного намерения, по многим причинам нельзя приравнивать к примерам, которые искусственно создает в рамках лингвистической дискуссии считающий себя «компетентным» носитель языка. Неоднозначными являются также данные, полученные в результате неспонтанного акта коммуникации (М.Н. Михайлов, X. Бергенхольц, И. Мугдан).

Мы придерживаемся следующего определения' корпусом является ограниченное количество языкового материала, состоящего исключительно из (письменных или устных) текстов или их частей Под текстом в данном слу-

2 Андрющенко В М Автоматическая обработка текста // Лшивистический энциклопедический словарь / Ред В Н Ярцева -М Советская лщиклопедия 1990 С 14-15

чае понимается относительно самостоятельная, содержательно связанная последовательность естественных языковых высказываний, а под частью текста - его связанный, сплошной фрагмент.

Принципы посгроения любого корпуса текстов напрямую зависят от его практического назначения, что определяет принципы сбора и представления данных в корпусе. Выделяются следующие основные типы корпусов: общие, специализированные, сопоставительные, учебные, педагогические, исторические (диахронические), моииторные и параллельные корпусы (С. Ханстон). Тип корпуса задаёт параметры исследования и определяет эвристическую значимость полученных при этом данных.

Во второй главе «Разработка и построение электронного корпуса текстов „DER"» формулируются основные принципы составления параллельных корпусов. В качестве основных рассматриваются проблемы автоматического определения границ структурных единиц текста (абзацев и предложений) и различные подходы к автоматической стыковке параллельных текстов. Кроме того, в данной главе характеризуется программная оболочка для представления текстов ПКТ «DER» и возможные способы поиска в них

При составлении ПКТ, в отличие от одноязычных и сравнительных корпусов текстов, следует учитывать фактор устойчивых межкультурных связей. Множество текстов исходного языка, пригодных для включения в ПКТ, составляют лишь тексты, которые были переведены на второй язык Подбор текстов для сбалансированного русско-немецкого ПКТ является сложной задачей, что связано с проблемой обнаружения текстов, аналогичных по тематике, жанру и относящихся к одному периоду времени. Хотя для пары языков немецкий /русский существует большое количес1во переводов, различия в культурных фадициях приводят к дисбалансу в структуре субкорпусов, а получить «зеркальные» субкорпуса оригинальных и переводных текстов для ПКТ часю проблематично.

Важнейшей проблемой при составлении ПКТ является стыковка параллельных текстов (alignment) Решение данной задачи для ПКТ «DER» было разделено на два этапа: выявление границ структурных элементов текста и определение параллельных сегментов. Основой для выявления параллельных сегментов в текстах на немецком и русском языках служили статистические данные, отражающие структурное сходство между оршиналом и переводом, проявляющееся на разных уровнях текста в различной степени Для стыковки

текстов ПКТ «DER» была создана специализированная программа, использующая для определения параллельных сегментов статистико-стохастический подход, чю обеспечило высокую надежность результатов стыковки при минимальных временных затратах. Как показали результаты работы, статистические данные о структурных элементах текста могут служить в качестве надежной основы для выявления параллельных сегментов в текстах на немецком и русском языках. При стыковке параллельных текстов сначала стыковались более крупные сегменты текста, а затем происходила проверка правильности и начиналась обработка малых сегментов на следующем уровне Такой подход позволил сократить количес1Во ошибок в процессе автоматической стыковки (см. рис. 1).

Рисунок 1

Схема процесса стыковки текстов в Г1КТ «DER»

Немецким язык

1 j**8,

\Гм in

Предложение

Предложение Предложение Предложение

Русский язык Глава

•"^ТИВЙ

Предложение Предложение Предложение

" 4 оа^с?» — •ю'Л'аезтяг) мъ

Предложение

Для наглядного представления ickctob ПКТ «DFR» и осуществления зф-фек[ивного поиска в них была создана специальная программная оболочка (см рис 2) Программа предназначаем для работы с таггированными параллельными 1екыами с лингвистической разметкой в форма1е XMI , соответствующей международному стандарту TFI (TEI I ite, версия для XML, см www tei-c org). Стандарт разметки ТЫ представляет собой набор предложений по кодировке электронных текстов различных типов именно для лингвистических целей. Особое значение при разработке программной оболочки придавалось следующим функциям, эффективный поиск в текстах корпуса, возможность различного представления ею результатов (параллельный кон-

корданс или KWIC-индекс3), автоматическое составление полного списка словоформ, обеспечение доступа и поиска в текстах корпуса через Интернет

В ПКТ «DER» (см. рис 2) предусмотрены два вида поиска: с использованием списка словоформ (в данном случае искомая словоформа или словоформы выбираются из списка) или посредством ввода строки поиска (напр , слова, которое должно быть найдено в корпусе). Поисковая строка может содержать «регулярные выражения» и символы подстановки. Регулярные выражения, используемые в поисковой системе ПКТ «DER», базируются на регулярных выражениях, используемых в языке программирования Perl, чго даёт возможность производить гибкий поиск в текстах.

Рисунок 2

Интерфейс ПКТ «DER»

а-третьиу пл йали^ацин лпирчет'-я но. /дивительпуг по своску характер/ настоящую революции с области иафиртциаиных те/пологи и den км отупел в частности в совмещении все более мощнкх компьютеров с телекоммуникациоиными

висококачественную пгредччу огромных объемов звуковой информация и различных данных в реальной масштабе времени, и подкрепляется этой революцией

Рейпростракекносрь этой формы насилия не зависит от обычны» различии между стрвнаки, провгдимых не основе таии/ факторов, гак национальным доход

Эти доклады помогают определять ранги

и исгользуются г raiTTPs- базы для гонтроля за ходом их осуществления

Aut вес GnauUage der von ihre geführten Erörterungen lud ich die Au6«»nro mistet

Tndr rsiers und fotijjaiJ ¿u 'mens Trtlien nach New York ein

Auf der btur<U.a(je eines / r rler Völkerrechtskommission erstellten Enrvutis /erabBchiedete die йеп^гчIversumlung Im Hai 1 J У"? dü.4 П->-г и kuitmcr Лег dos Г r-hr

Irt*,- *,r.ht-.r-hiff*hrr.lichen tym; типа__

МШШШШШгщ

OK i

c. ^m )r ^ hR|T yt

U hp

F' ur i» Vur-er

Г iCt - 1,1 bp*

3 и W ><>/

Au«/litem ><Iu£

<«■ ¿* ь j ч

liT *

Ii ^мг «№Uittt suetes

Befundene Sepaente 43 4u( liieiclicnkelte Grundlage

Grundlage (43)

DC 11

mrflu

der

<<lrkjoi iixer ji j die dies» aach ir Gang half eine f-ic sich selbst bemerkenswerte R^-/)lacion au£ dero Geblüt der Inlornw iourerlu^ logle, irebe? nti«-r<» h i der Integration /on zun»hm»nd leistungsfähiger R^chr»rn «it

Telel'onmiinika lGrissysC-nvri, die ein hohes Volumen an qualitativ hj(.hwertigee Sprachfccmrouniltation und tatenUbettragungen in Er-htzf-ir etiooijii^f-^n

Sie manifestiert sich vrllig unabhängig von den Unterscheidungen zwischen der» Landern, wie si»- herkonwlicbTweise etwa auf d>»r irruiulLatje von Faktoren wie dem VoJ V-jpj rtk.cjmm.ij getroffen werden

Diese Berichte erlelc-hcern Planung

f r» jr •Y^'f 3 r i j jrif; und di^nr-n als GrundJflcjf fui die ütietwa hung der dabei erzielten

с учетом проведенных ооеужаеяии < предложил министрам иноетранкых ; Индонезии и (Т^ р туг а лги пргрегти встречу в Нью-Йорке

Коииссиеи международного права, Генеральная Ассамблея ( приняла Неяд/народную г

. Segments: VJU ■ '/Л:

Sitte: SSeS/KS-'RUIii Töketi«: : ¡Г-аиС

3 KWIC индекс (key word in context) является набором контекстов употребления яллковой единицы Скак правило слова или словосочетания) на одном языке и дает исследователю возможность получать информацию о ее типичном окружении (контексте)

4 Регулярные выражения представляют собой специальную систему формирования сложных поисковых запросов в языках программирования Подробную информацию о ре!улярных выражениях в языке Perl можно паи/и в документации к нему (см www perl org), а также в Fried! J Mastering regular expressions powerful techniques for Perl and other tools - Cambridge O'Reilly, 1997

Кроме богатых поисковых возможностей, ГГКТ «DER» позволяет получать различные статистические данные. Они могут использоваться как для проведения контрастивных исследований, так и для изучения отдельных языков корпуса, а также служить для выявления особенностей текстов, входящих в него. Так, программная оболочка ПКТ «DER» позволяет определить соотношение длины текста в словоупотреблениях к количеству словоформ (type/token ratio, TTR), которое нередко используется в качестве одного из критериев богатства лексического состава представленных в корпусе текстов. Соотношение TTR может значительно изменяться в зависимости от типов текстов, входящих в корпус. Однако это не единственный фактор, который следует учитывать при создании корпуса. На примере ГЖТ «DER» было установлено, что значительное увеличение объема корпуса не ведет к прямо пропорциональному росту количества уникальных лексем в корпусе. Как видно их данных, представленных на диаграмме 1, динамика увеличения количества словоформ падает вместе с ростом количества словоупотреблений в корпусе. При увеличении объема (т.е. количества словоупотреблений) немецкой части ПКТ «DER» более чем в 8 раз количество словоформ увеличивается примерно в 3,5 раза. Это позволило ограничить первоначальный состав ПКТ «DER» шестью крупными текстами на немецком языке на основе принципа оптимальной достаточтюсти выборки

Диаграмма 1

Динамика увеличения соотношения количества словоупотреблений к количеству словоформ (types-tokens ratio) при увеличении объема ПКТ «DER»

180000 160000 140000 120000

100000 80000 60000 40000 20000 о

1 2 3 4 5 6

Количество текстов в корпусе (немецкий язык)

Даже при значительном увеличении объема корпуса (т е количества словоупотреблений) количество словоформ во всем корпусе повышается лишь не-

тачителыю Э ю позволяет сделать вывод о том, что даже значительное повышение обьема корпуса не означае! пропорционального роста количества уникальных лексем, встречающихся в текстах корпуса, что было важно для определения оптимального объёма исследуемо! о ПКТ «DER». Тщательная выборка текстов позволяет на основе достаточно компактного корпуса получать достоверные данные для всех текстов данного типа, отвечающих заданным параметрам отбора.

В третьей ¡лаве «Использование ПКТ «DER» для исследования особенностей официально-деловых текстов (на материале документов ООН)» даётся обзор использования квантитативных методов в стилистике, определяются актуальные проблемы исследования текстов официально-делового стиля, описываются основные характеристики входящих в ПКТ «DER» текстов. IIa основе представленных в корпусе текстов рассматриваются особенности функционирования модальных глаголов в текстах официально-делового стиля.

Документы ООН, входящие в состав ПКТ «DER», представляют интерес для изучения особенностей официально-делового функционального стиля в современном немецком языке и для опытного подтверждения предположений, касающихся особенностей таких текстов Использование корпуса даёт возможность быстро и надежно получить результаты обработки большого массива текстов, что обеспечивает получение более точных данных На основе немецких текстов ПКТ «DER» были рассмотрены особенности частотно-распределительных характеристик модальных глаголов и определены наиболее употребительные значения модальных глаголов в текстах ООН.

Значения возможности, необходимости, разрешения, запрета и желания выражаются в немецком языке в основном при помощи модальных глаголов. Они являются одним из средств выражения модальности в немецком языке, которое вносит весомый вклад в формироваггие общей интенции всего текста, и играют важную роль в выражении его функционально-коммуникативных параметров. Согласно нашей гипотезе, они также имеют особое значение для реализации в тексгах официально-делового стиля на немецком языке прагматической функции допжепствованш и выражения их предписывающе-оценочного характера. Опираясь на описанные в грамматиках немецкого языка значения модальных ?паголов (Г Хельбиг, И Буша, Е.И Шендельс) и

теорию речевых фонов5 (Г. Цифонун, Л. Хоффман), были определены наиболее частотные значения модальных глаголов в немецких текстах ПКТ «DER», а полученные данные были соотнесены с общей коммуникативной интенцией официально-делового функционального стиля. ПКТ «DER» оптимально подходит для решения данной задачи, поскольку значения модальных глаголов в немецком тексте точно передаются в параллельных текстах на русском языке.

Решения поставленной задачи осуществлялось в три этапа. Сначала был произведен поиск всех модальных глаголов в немецком субкорпусе ПКТ «DER» и определена их частотность (для всего субкорпуса и каждого текста отдельно). На втором этапе был проведен анализ значений модальных глаголов в соответствии с теорией речевых фонов. На завершающем этапе было проведено сравнение полученной информации об употреблении каждого модального глагола с общей коммуникативно-функциональной направленностью текстов ПКТ «DER». Исходя из того, что тексты ООН являются типичными для официально-делового функционального стиля, мы предположили, что прагматическая функция долэ/сенствовапия и директивный характер данных текстов должны соответствующим образом отражаться в речевом фоне употребления модальных глаголов.

Для того, чтобы провести анализ употреблений модальных глаголов, необходимо было выявить в корпусе абсолютно все их употребления в контексте. ПКТ «DER» позволил быстро и эффективно выполнить эти сложные поисковые запросы. Для поиска всех употреблений модальных глаголов в субкорпусе были составлены специальные поисковые запросы с использованием «регулярных выражений» Например, поисковый запрос для глагола dürfen выглядит так:

\Wdurf(en|L)\W|\Wdarf(st)*\W|\Wdurft(е|рчГ|enI et)\WI\WgedurftW

Программная оболочка ПКТ «DER» позволяет не только найти все употребления для модальных глаголов, но и выявить их частотность во всем корпусе и в каждом отдельном его тексте. В немецких текстах ПКТ «DER», содержащих 153 931 словоупотребление, было найдено 838 употреблений модальных глаголов dürfen, können, wollen, mögen, sollen и müssen (см. табл. 1)

5 Семантика мода-м пых I ииоюв огшсываекя не как сумма отдельных значений, а в зависимости от «речевого фона» П^еИтГе^гипс!) - условий с учетом которых удается оценит!, положение вещей как возможное или необходимое Речевой фон привносится говорящим/пишущим, воспринимается и изменяется слу-шающим'читаюшим Это своеобразный ориенгир аюа коммуникации, который определяет его ишенцию

Таблица /

Распределение модальных глаголов по частотности в немецких текстах

ПКТ «DER»

Модальные глат олы können sollen müssen wollen mögen dürfen

Доля от всех употреблений 44% 29% 20% 3% 2% 2%

Как показывает частотность употребления dürfen, mögen и wollen встречаются в текстах значительно реже, чем können, müssen и sollen. Однако показатели частотности для всего корпуса не дают исчерпывающих сведений о частотности каждого из модальных глаголов в отдельно взятом тексте. Можно предположить, что частотность отдельно взятого глагола не зависит от типа текста и, следовательно, может значительно колебаться в зависимости от конкретного экземпляра текста

IIa основании предположения о том, что значения частотно-распределительных характеристик модальных 1лаголов являются особенностью, свойственной определенному типу текстов (документам ООН, относящимся к официально-деловому функциональному стилю), была определена частотность модальных глаголов в каждом отдельно взятом тексте ПК Г «DER». Как видно из данных (см. табл. 2), глаголы können, müssen и sollen сохраняют высокую частотность в каждом из текстов корпуса. Это означает, что их стабильные частотно-распределительные характерисшки являются отличительной чертой представленного в корпусе типа текстов, так как они практически не изменяются в отдельных текстах Количество употреблений менее частотных глаголов (dürfen, mögen и wollen) нестабильно и колеблется в каждом отдельном тексте. На эти 3 глагола приходится всею 7% всех упофеблений модальных глаголов в текстах корпуса Столь низкая частотность данной группы глаголов и неустойчивость их часютно-распределительных характеристик в отдельных экземплярах текста свидетельствует о том, что они играют второстепенную роль в представленном TT, а их частотность не определяется особенностями представленных в ПКТ «DER» текстов.

Таблица 2

Частотно-распределительные характеристики в текстах ПКТ «DER»

Модальный глагол Тексты корпуса «DER» на немецком языке Количество упофебле-ний (все тексты)

А-52-1 А-53-1 А-55-1 А-56-1 А-57-1 А-58-1

können 43 67 64 73 62 72 381

sollen 29 46 50 35 30 50 240

müssen 25 26 37 31 19 28 166

wollen 0 8 6 6 0 3 23

mögen 4 0 3 1 2 6 16

dürfen 1 2 3 3 1 3 13

Всего 102 149 163 149 114 162 839

Для того, чтобы подтвердить, что приведенные частотно-распределительные характеристики модальных глаюлов отражают особенность представленного в ГПСТ «DER» типа текстов, был проведен анализ частотно-распределительных характеристик модальных глаголов в корпусе «Der deutsche Wortschatz» (далее «DDW», www.wortschatz.uni-leipzig.de, проект университета г. Лейпцига). Данный корпус представляет собой базу данных, включающую тексты различных типов (в основном газетные и специализированные тексты). Корпус «DDW» содержит 35 млн предложений ( около 500 млн. словоупотреблений), что позволяет говорить о том, что он характеризует основной массив современной немецкой литературной письменной речи. В текстах корпуса «DDW» был произведен поиск всех употреблений модальных глаголов. Поскольку корпус «DDW» охватывает различные типы текстов широкой тематики и имеет значительный объем, данные о частотно-распределительных характеристиках модальных глаголов, полученные на его основе, могут считаться «масштабом» их употребления в современном немецком языке. В табл. 3 представлены результаты этого анализа

Таблица 3

Распределение модальных глаголов по частотности в корпусе «DDW»

Модальные глаголы können sollen müssen wollen mögen dürfen

Доля от всех употреблений 32% 20% 21% 19% 5% 3%

Самым употребительным в корпусе «DDW» является können, что совпадает с данными, полученными на основе ГТКТ «DER» Тем не менее, очевидно, что доля его употреблений в корпусе «DDW» заметно меньше (32%), чем в ПКТ «DER» (44%). Более показательными являются изменения частотно-распределительных характеристик wollen, müssen и sollen. Количество употреблений данных глаголов в корпусе «DDW» практически равно Особенно значительным по сравнению с ПКТ «DER» (3%) является прирост употреблений -wollen в корпусе «DDW» (19%). Количество употреблений sollen в «DDW» заметно ниже (20%), чем в немецких текстах ПКТ «DER» (29%) (см. диаграмму 2, отображающую различия частотно-распределительных характеристик модальных глаголов в немецких текстах ПКТ «DER» и в корпусе «DDW»),

Диаграмма 2

Распределение модальных глаголов по частотности в корпусе «DDW» и в ПКТ «DER»

50% ----------,—-.......,.....,.,,... ,. „...-„, .......,VJ„.....

können sollen müssen wollen mögen dürfen

При сравнении двух корпусов очевидно, что частотно-распределительные характеристики некоторых модальных глаголов в них значительно варьируются, что можно объяснить тем, что они содержат разные ТТ с различной коммуникативно-функциональной направленностью, а изменения в частотности употребления модальных глаголов являются отражением этих различий. Корпус можно рассматривать как общий, поскольку он включает тек-

сты ра;личных шпов. Перед таким корпусом ставится задача охватить не какую-то определенную проблемную область, а дать широкий срез наибольше-

го количества текстов самого различного типа. «DDW» имеет большой объем и может использоваться как базис для сравнения со специализированными корпусами Таким специализированным одноязычным корпусом можно считать немецкую часть ГГКТ «DER», т.к. он представляет собой подборку текстов определенного типа (тексты ООН, относящиеся к официально-деловому функциональному стилю).

Следующим шагом была интерпретация статистических данных, полученных на основе двух корпусов. Наиболее очевидным и объяснимым с учетом функциональных особенностей текстов корпуса «DER» различием является низкая частотность wollen («DER» - 3%, «DDW» - 19%). Это связано с тем, что основным значением данного глагола является выражение желание или намерения Выражения субъективных желаний и использование интрасубъек-тивно-волитивного речевого фона мало соответствует коммуникативно-функциональной направленности текстов официально-делового стиля. Это также служит объяснением более низкой частотности mögen в немецкой части ГТКТ «DER». Половину употреблений глагола wollen составляют случаи его использования в условных придаточных предложениях с союзом wenn. При этом практически все эти употребления относятся к телеологическому речевому фону, где wollen используется не столько для выражения субъективного желания, сколько для определения целей и выражения стремления эти цели достигнуть. Значение желания, намерения, выражаемое обычно глаголом wollen, отступает в таких случаях на второй план. Ср.:

Gezieltes Zugehen auf junge Menschen ist ausschlaggebend, wenn die Vereinten Nationen auch in Zukunft ihre Relevanz bewahren wollen [Bericht des Generalsekretärs über die Tätigkeit der Vereinten Nationen 1998]

Модальный глагол mögen используется в текстах субкорпуса «DER» в основном (-80% употреблений) в форме сослагательного наклонения (Konjunktiv Präteritum) Эта форма служит для выражения значения желания и является синонимичной глаголу wollen. При этом желание, выраженное таким образом, носит смягченный, менее категоричный характер и относится к событиям в настоящем времени. В текстах ООН, представленных в ПКТ «DER», такое употребление глагола mögen используется в интрасубъективно-волитивном речевом фоне, например, для выражения пожеланий докладчика при его обращении к аудитории по конкретному поводу. Ср.:

Ich mochte diese Gelegenheit wahrnehmen, um die Mitgliedstaaten abermals aufzurufen, zu dem Treuhandfonds für den Sondergerichtshof beizutra-

gen [Bericht des Generalsekretärs über die Tätigkeit der Vereinten Nationen 2003]

Основной характеристикой müssen и sollen является выражение различных форм долженствования. В корпусе «DDW» эти глаголы проявляют примерно одинаковую частотность (sollen - 20% , müssen - 21%). В немецкой части ПКТ «DER» наблюдается значительное преобладание количества употреблений sollen (29%) над müssen (20%). По нашему мнению, это связано с тем, что выражение прагматической функции долженствования носит в документах ООН менее категоричный, рекомендательный характер. Статус ООН и язык её дипломатических документов обусловливают общую тенденцию снижения категоричности выраженного модальными глаголами долженствовании, при одновременном сохранении коммуникативной функции долженствования и предписывающего, нормативного характера данных текстов (доклады Ген-секретаря).

Основным значением sollen, используемым в текстах ПКТ «DER», является значение менее категоричного долженствования, выражающее чужую по отношению к субъекту действия волю- на данное значение приходится порядка 70%) от всех его употреблений Особенность использования глагола sollen в докладах Генсекретаря ООН заключается в том, что субъект долженствования в высказываниях не называется конкретно или представляется лишь как средство выполнения чужой воли Так, в следующем примере указывается на назначение гуманитарных программ, разработанных ООН, а глагол sollen не только подчеркивает необходимоеib выполнения какого-то действия, но и определяет субъект предложения как средство, необходимое для достижения поставленных целей.

Verschiedene Programme der Vereinten Nationen für "gute Staatsführung" sollen den einzelnen Regierungen dabei behilflich sein, jenes Gleichgewicht zu finden, das ihren Bedürfnissen am ehesten entspricht [Bericht des Generalsekretärs über die fatigkeit der Vereinten Nationen 1997]

В отличие oi ишюла sollen, спектр значений, выражаемых müssen, значительно уже. Необходимость, выражаемая данным модальным глаголом, обусловлена самим субъектом действия, т с осознается им как долг, внутреннее побуждение и является следствием неизбежности действия или состояния Достаточно часто (-30%)) в корпусе «DER» встречается употребление глагола müssen в форме первого лица множес1венно! о числа Долженствование, выраженное таким образом, объединяет субъекта высказывания (Генсекретаря)

с аудиторией, представляя тем самым долженствование как общую необходимость, а не как чужую волю:

Diesen Herausforderungen müssen wir uns stellen, wenn wir das unentbehrliche Instrument der Friedenssicherung durch die Vereinten Nationen den Krisen anzupassen suchen, denen wir uns heute und in Zukunft gegenübersehen, und wenn wir an einem System der kollektiven Sicherheit für das einundzwanzigste Jahrhundert arbeiten [Bericht des Generalsekretärs über die Tätigkeit der Vereinten Nationen 1997]

Заметное различие в употреблении модальных глаголов в корпусе «DDW» и в ПКТ «DER» заключается в значительной разнице в частотности глагола können. Исходя из особенностей представленных в корпусе «DDW» и ПКТ «DER» текстов, мы предположили, что при их сравнении нормативный характер текстов ООН должен проявиться в некотором снижении частотности können и более высокой частотности dürfen. Dürfen в основном служит для выражения «категоричного разрешения», которое более соответствует пре-скриптивной интенции официально-делового функционального стиля Тем не менее, первоначальное предположение не подтвердилось и при сравнении частотно-распределительных характеристик können и dürfen в корпусах «DDW» и «DER» было обнаружено противоположное явление. По сравнению с корпусом «DDW» (32%) количество употреблений können в немецких текстах ПКТ «DER» (44%) заметно выше, в то время как количество употреблений dürfen снижается («DER» - 2%, «DDW» - 3%). Как показал анализ употреблений модального глагола können в ПКТ «DER», большинство из них относится к телеологическому речевому фону и служит для ориентации высказывания на определенную цель, а также для выражения возможности её достижения, что вполне соотносится с общей интенцией представленных в ПКТ «DER» текстов. Так, например, модальный глагол können в придаточных предложениях с союзом dass/daß (15% всех употреблений können) служит для выражения возможности достижения целей, определенных в придаточном предложении. Ср.:

Es müssen angemessene Mittel aufgebracht werden, um zu gewährleisten, daß die erforderlichen Sicherheilsvorkehrungen für das Personal der Vereinten Nationen getroffen werden können. [Bericht des Generalsekretärs über die Tätigkeit der Vereinten Nationen 1997]

Анализ употреблений dürfen даёт основание утверждать, что этот модальный глагол практически не используется в текстах ПКТ «DER» в своём основном значении для выражения «категоричного разрешения». Большинство употреблений dürfen (11 из 13) представляет собой сочетание модального гла-

гола с отрицанием, что по своей сути является конструкцией, синонимичной основному значению i лагола sollen. Этот факт объясняет то, что практически все употребления данного модального глагола относятся к нормативному речевому фону. Преобладание в немецких текстах ООН данного значения может быть объяснено характером текстов: все высказывания с использованием dürfen либо относятся к регламентированию деятельности самой организации, либо выражают рекомендации для мирового сообщества:

Solche Anstrengungen dürfen jedoch nicht davon ablenken, dass die Hauptverantwortung für die Verhütung von Konflikten hei den Mitgliedstaaten liegt. [Bericht des Generalsekretärs über die Tätigkeit der Vereinten Nationen 2000]

Несмотря на io, что прагматическая функция долженствования играет важную роль в документах ООН, её выражение носит некатегоричный, рекомендательный характер. Статус ООН и язык её дипломатических документов отражают общую тенденцию снижения категоричности выраженного модальными глаголами долженствования, при одновременном сохранении коммуникативной функции долженствования и предписывающего, нормативного характера данных текстов. Большинство употреблений глагола können относится к телеологическому речевому фону и служит для ориентации высказывания на определенную цель, а также для выражения возможности её достижения, что соотносится с общей интенцией представленных в Г1КТ «DER» тексюв ООП. Волитивный речевой фон играет в докладах Генсекретаря ООН скорее второстепенную роль, т.к. он не соответствует общей функционально-коммуникативной направленности официально-делового стиля. Этим фактором обусловлена низкая частотность глаголов wollen и mögen

Результаты анализа употреблений модальных глаголов в немецком субкорпусе ПК1 «DER» показали, что некоторые из них (sollen и können) используются в ряде типичных синтаксических конструкций. Примерно половина всех упофеблений sollen приходится на определительные придаточные предложения (-28% всех употреблений глагола sollen), условные придаточные предложения с союзом wenn (-14%), придаточные предложения с местоименным наречием wodurch или с предлотом durch + существительное/местоимение (-7%). Примерно треть всех его употреблений können приходится на придаточные предложения с союзами dass/daß (15%), damit (5%) и wie (10%).

Каждый из модальных глаюлов реализует спектр модальных значений, а в каждом конкретном употреблении актуализируется одно из них. При этом

значение модального глагола обуславливаю ния Анализ употреблений модальных ПКТ «DER» также показал, что различные з четливо передаются в параллельных текста служить в качестве дополнительного дифф жающего речевой фон данного употребление висимость от общей интенции текстов, преде

В заключении обобщаются основные pe3yj*üitAiL»i __, г

ляются выводы относительно апробации критериев составления немецко-русского параллельного корпуса текстов и возможностей применения ПКТ в лингвостилистических исследованиях, а также намечаются возможные перспективы дальнейшего развишя и более широкого использования ПКТ «DER»

Основные положения диссертации отражены в следующих публикациях автора

1 Вадяев СЕ Электронная лексикография и корпусная лингвистика // Аспекты становления и функционирования западногерманских языков - Самара Изд-во «Самарский университет», 2003 - С 83-92

2 Вадяев С Е Использование машинных текстов в лингвистических исследованиях контрастивного характера // Русско-немецкие культурно-исторические контакты. Материалы международной научной конференции (22-23 09.2004 г ) - Тольятти ТГУ, 2004 - С 86-89

3 Вадяев С Е Использование корпусов параллельных текстов в прикладной германистике // Слово, высказывание, дискурс Международный межвузовский сборник научных статей - Самара Изд-во «Самарский университет», 2004 - С 104-121

4 Вадяев С Е Машинная обработка текстов и квантитативные методы в современной германистике Методические указания по курсу «Техническое обеспечение филологического исследования» - Самара Изд-во «Самарский университет», 2005 - 40 с

РНБ Русский фонд

2006-4 5174

Подписано в печать 02-О^х 2.005" Формат 60x84 1/16 Бумага офсетная Печать оперативная Объем 1 печ л Тираж 100 экз Заказ № ' / о 4 Издательство «Самарский университет», 443011, г Самара, ул Акад Павлова, 1 Отпечатано на УОП СамГУ

 

Оглавление научной работы автор диссертации — кандидата филологических наук Вадяев, Сергей Евгеньевич

Введение.

Глава 1. Корпус текстов - новый тип источника лингвистического исследования.

1.1. Электронный текст как основа корпуса.

1.1.1. Свойства электронного текста и его создание.

1.1.2. Информационный поиск и количественный анализ.

1.2. Корпусы текстов: принципы построения и репрезентативность.

1.2.1. Определение понятия «корпус».

1.2.2. Типы корпусов и их назначение.

Выводы к главе 1.

Глава 2. Разработка и построение электронного корпуса текстов «DER».

2.1. Проблемы составления и использования параллельных корпусов текстов и их субкорпусов.

2.2. Репрезентативность параллельных корпусов текстов.

2.3. Подбор текстов для ПКТ «DER».

2.4. Членение текстов ПКТ «DER» и определение границ их структурных элементов.

2.4.1. Единицы текста и их определение. 2.4.2. Автоматическое распознавание границ предложения при стыковке текстов.

2.5. Подготовка текстов ПКТ «DER».

2.5.1. Общие требования к формату текстов.

2.5.2. Применение языка разметки XML и рекомендаций TEI для разметки текстов.

2.6. Стыковка параллельных текстов ПКТ «DER».

2.6.1. Автоматическая стыковка параллельных текстов.

2.6.2. Лингвистический подход к стыковке параллельных текстов.

2.6.3. Статистическо-вероятностный подход к стыковке параллельных текстов.

2.6.4. Стыковка параллельных текстов ПКТ «DER».

2.7. Программная оболочка ПКТ «DER» и её возможности.

Выводы к главе 2.

Глава 3. Использование ПКТ «DER» для исследования особенностей официально-деловых текстов (на материале документов ООН).

3.1. Использование квантитативных методов в современной стилистике.

3.2. Актуальные проблемы исследования текстов официально-делового стиля.

3.3. Документы ООН как особый тип текстов официально-делового стиля

3.4. Модальность и основные способы её выражения в текстах официально-делового стиля.

3.5. Особенности частотно-распределительных характеристик модальных глаголов.

3.5.1. Особенности употребления глаголов sollen и mussen.

3.5.2. Особенности употребления глаголов konnen и durfen.

3.5.3. Особенности употребление глаголов wollen и mogen.

Выводы к главе 3.

 

Введение диссертации2005 год, автореферат по филологии, Вадяев, Сергей Евгеньевич

В последние годы особое внимание лингвистов, и германистов в частности, уделяется исследованию характеристик устойчивых текстовых форм. Это обусловлено, с одной стороны, развитием стилистических изысканий, направленных на решение проблем разграничения стилей, на выделение стилеобразую-щих признаков, с другой стороны, задачами практической стилистики, совре-0 менной риторики и культуру речи [Домашнев 1989: 148-149].

Немецкие лингвисты для характеристики устойчивых текстовых форм и их конкретной реализации применяют термины тип текста (Textsorte) и экземпляр текста (Textexemplar). Под типом текста (далее ТТ) при этом понимается форма текста, в которой реализуется коммуникативное намерение говорящего/пишущего и которая строится по определенным правилам и нормам. Каждый конкретный текст (Textexemplar) обладает определенным набором лингвистических и экстралингвистических признаков, по которым его можно отнести к ф определенному типу текста (Textsorte) [Eisenberg, Gelhaus и др. 1998: 842-845;

Steger, Deutrich и др. 1974: 95].

В немецкой стилистике при классификации ТТ принято выделять группу политических текстов [Brinker 1983; Rolf 1993], большинство из которых является текстами официально-делового стиля. В последнее время наблюдается особый интерес германистов именно к изучению политических ТТ. Это обусловлено политизацией и ростом влияния СМИ, а также значительными изменениями характеристик данной группы ТТ, вызванными существенными преобразова-щ ниями структуры политических учреждений и политической системы в ФРГ в конце XX века [Klein 2000; Straufi 1986]. Но большинство подобных исследований построено на материале внутриполитических типов текстов (конституция, парламентские документы, законы и т.п.) и мало затрагивают ТТ, относящиеся к внешнеполитической деятельности (международные договоры, документы Европейского союза или ООН).

До настоящего времени не проводилось развернутых исследований, рассматривающих стилистические особенности подобных текстов, где на основе их репрезентативной подборки осуществлялся бы не только квалитативный анализ отдельных, типичных для данного ТТ явлений, но и комплексная квантитативная оценка их частотности. Только такой подход может обеспечить достоверное выявление функционально-коммуникативных особенностей данного ТТ и его актуальных характеристик в немецком литературном языке последних десятилетий.

Для сравнения квантифицируемых признаков текстов (например, для выявления их принадлежности к функциональному стилю или к типу текстов), а также для определения и сравнения лексического многообразия текстов в современной стилистике активно используются квантитативные методы. Их применение для стилистического анализа текстов имеет уже долгую традицию [Schmitz 2000: 196-198]. Как правило, в качестве основы для таких исследований служит корпус, репрезентативная выборка текстов, составленная с учетом таких факторов, как функционально-стилистические особенности, письменная или устная форма существования, содержание. Объем выборки должен быть достаточно большим для того, чтобы достоверно определить стилистические закономерности, отделив их от случайных или нетипичных случаев употребления. Количественные данные, полученные на основе такой выборки, служат в качестве «симптомов» квалитативных характеристик и представляют собой основу для последующей интерпретации [Ризель, Шендельс 1975: 49]. Использование квантитативных методов предполагает исследование обширных массивов текстов, поэтому для их применения большое значение приобретает подготовка репрезентативных выборок текстовых данных и разработка средств доступа к ним на основе новых электронных технологий.

Для лингвистических исследований всё чаще используются именно электронные {машинные) корпусы текстов. Они позволяют более эффективно и широко применять квантитативные методы, в частности для выявления стилистических особенностей входящих в их состав текстов. Особое внимание уделяется выявлению тенденций частотности и дистрибуции отдельных языковых единиц и их групп, стохастических зависимостей между ними, а также соотношений между внутренними характеристиками текста и внешними по отношению к нему факторами [Bergenholtz, Schaeder 1979; Pieper 1979; Schmitz 2000].

В рамках данной работы был разработан оригинальный двуязычный электронный корпус текстов «DER» (Deutsch-Russisches Parallelkorpus), послуживший текстовой и инструментальной базой для выявления особенностей функционирования модальных глаголов в текстах официально-делового стиля. Корпус «DER» представляет собой параллельный корпус текстов (далее ПКТ), включающий в себя немецко- и русскоязычные варианты документов ООН общим объёмом в 300 000 словоупотреблений. Использование ПКТ, помимо преимуществ одноязычного корпуса при изучении отдельного языка (на основе одного из субкорпусов), дает реальные возможности для проведения контра-стивных исследований, исследования проблем передачи различных языковых явлений в разных языках, поиска использующихся в переводческой практике

Ф эквивалентов, для составления и пополнения переводных словарей и обучения иностранному языку.

Итогом данной работы являются два практически и теоретически значимых результата, первый из которых состоит в обосновании необходимости использования ПКТ «DER» и разработке принципов его создания, а второй — в выявлении модальной специфики немецких официально-деловых текстов и особенностей функционирования в них модальных глаголов.

Актуальность данного диссертационного исследования определяется, с одной стороны, необходимостью дальнейшего изучения и выявления закономерностей функционирования модальных глаголов в текстах различных функциональных стилей, а, с другой стороны, ограниченным количеством параллельных корпусов текстов вообще и для пары языков немецкий и русский в частности, а также недостаточной разработкой концепции их составления и технологии обработки.

Научная новизна предлагаемой диссертации состоит в том, что в ней впервые детально описана лингвистическая концепция и на её основе разработана технология построения немецко-русского параллельного корпуса текстов, а также наглядно представлены возможности использования немецкоязычного субкорпуса ПКТ для исследований в области стилистики. В рамках работы детально представлена методика автоматической стыковки параллельных текстов на немецком и русском языках, что не служило ранее предметом рассмотрения 0 в лингвистических исследованиях, а также осуществлено практическое приложение немецкого субкорпуса ПКТ «DER» для выявления специфики употребления модальных глаголов в текстах официально-делового стиля современного немецкого языка, относящихся к внешнеполитической сфере (деятельность ООН).

Теоретическая значимость исследования состоит в обосновании зависимости между частотностью средств реализации категории модальности (на примере модальных глаголов немецкого языка) и основной коммуникативной ф функции текстов официально-делового стиля (на примере документов ООН).

Кроме того, в диссертации подробно разрабатывается теоретическая база для моделирования ПКТ, а также обосновываются возможности применения ПКТ «DER» для комплексного анализа стилистических характеристик конкретных типов текстов. В данной работе рассматривается также широкий круг проблем, касающихся определения особенностей официально-делового стиля в современном немецком языке, места документов ООН как самостоятельного типа текстов в динамичной системе функциональных стилей современного немецкого литературного языка. Несмотря на то, что официально-деловой стиль является многоплановым феноменом, а в спектре политических ТТ проявляет в последние десятилетия значительную динамику, связанную в частности с расши рением международной функции немецкого языка [Домашнев 1989: 129-130], 'Л за последнее время появилось не так много работ, посвященных этой тематике1.

Материалом исследования послужила выборка электронных документов ООН (www.un.org) на немецком и русском языках. Основу корпуса составляют шесть докладов о работе ООН за 1997-2001 гг., с которыми ежегодно выступает её Генеральный Секретарь перед Генеральной Ассамблеей. Общий объём текстов корпуса составил около 900 страниц и включает примерно 300 тыс. слово* употреблений (на каждый из языков корпуса приходится примерно 150 тыс. словоупотреблений).

Цель данного исследования заключается в выявлении модальной специфики немецких текстов официально-делового стиля и особенностей функционирования в них модальных глаголов на примере репрезентативного корпуса текстов. Для решения поставленной задачи на основании лингвистических принципов была разработана технология составления немецко-русского ПКТ и определены возможности и параметры его применения для выявления базисных стилистических особенностей текстов официально-делового стиля.

На первом этапе работы ставилась задача разработать технологию автоматической обработки текстов для ПКТ, а также средств их представления и анализа. На втором этапе планировалось выявить на основе данных квантитативного и квалитативного стилистического анализа немецкого субкорпуса ПКТ «DER» закономерности частотно-распределительных характеристик немецких модальных глаголов и их зависимость от общей коммуникативно-функциональной направленности представленного в ПКТ «DER» типа текстов

• (ежегодные доклады Генсекретаря о работе ООН).

1 См., в частности, диссертационные исследования: Комлева Е.В. Лингвистические особенности выражения побудительности в текстах официально-деловой прозы (на материале современного немецкого языка), АКД. -СПб.: РГПУ им. Герцена, 2003; Исакова Л.Д. Соотношение типологических тенденций и особенностей проявления функционального стиля в современных германских языках, АДЦ,- М.: МГЛУ, 2001.

Для реализации поставленных целей необходимо было решить следующие общие задачи:

• изучить существующие подходы к составлению параллельных корпусов текстов и сформулировать оптимальные принципы составления ПКТ «DER»;

• оценить объем существующих параллельных текстов для немецкого и русского языков, возможности их использования и выработать стратегию дальнейшего отбора текстов для ПКТ «DER»;

• на основе существующих определений «абзаца» и «предложения» разработать концепцию автоматического определения границ данных структурных элементов для последующей стыковки;

• на основе существующих теоретических концепций и методов разработать методику автоматического выявления параллельных сегментов для текстов ПКТ;

• разработать программную оболочку для наглядного представления текстов ПКТ и осуществления эффективного поиска в них изучаемых языковых явлений.

После выполнения перечисленных общих технологических задач была сделана попытка найти пути решения следующих лингвистических проблем:

• раскрытие основных возможностей использования квантитативных методов для стилистического анализа репрезентативного корпуса официально-деловых текстов',

• обоснование зависимости между общей коммуникативно-функциональной направленностью типа текста и основными средствами выражения модальности (на примере модальных глаголов в текстах официально-делового стиля на немецком языке);

• выявление особенностей частотно-распределительных характеристик немецких модальных глаголов в текстах официально-делового стиля (на примере текстов ООН, входящих в ПКТ «DER»);

• определение значений модальных глаголов, наиболее частотных в текстах официально-делового стиля (на примере текстов ООН, входящих в ПКТ «DER») и выявления преобладающего речевого фона их употребления;

• сравнение полученных на основе немецкого субкорпуса ПКТ «DER» (специализированный корпус, где представлен один тип текстов) данных о частотности употребления модальных глаголов с данными одноязычного корпуса «Der deutsche Wortschatz» (общий корпус, где представлены разнообразные типы текстов) для выявления закономерностей употребления модальных глаголов в текстах с различной функционально-стилевой принадлежностью.

Практическая ценность исследования: ПКТ «DER» может служить в качестве основы и инструментария для дальнейших стилистических, лексикологических, грамматических и контрастивных исследований, в частности, он позволяет:

• проводить сравнительный анализ особенностей немецкого и русского языков, относящихся к лексическому составу, морфологии и синтаксису (статистический анализ и сравнительный анализ лексических структур и синтаксических конструкций в параллельных текстах);

• осуществлять поиск эквивалентов для слов и коллокаций, а также примеров употребления лексических единиц и их перевода на другой язык в зависимости от контекста употребления;

• проводить исследования в области стилистики (рассмотрение способов передачи стилистических особенностей в текстах на разных языках, а также определение приемов и стилистических средств, при помощи которых переводчик передает в языке перевода содержание оригинального текста);

• разрабатывать и совершенствовать программные средства для проведения стыковки текстов, автоматического поиска и извлечения эквивалентов для отдельных лексем и коллокаций.

Кроме того, ПКТ «DER» может служить не только в качестве источника статистических данных или для поиска эквивалентов, но и в качестве базиса для дальнейших исследований разнообразных явлений одного из языков корпуса. Например, немецкие тексты ПКТ «DER» по разнообразным параметрам могут служить в качестве самостоятельного объекта исследования, что наглядно продемонстрировано в рамках данной работы.

На основе ПКТ «DER» нами было проведено исследование функционирования модальных глаголов в текстах официально-делового стиля в современном немецком языке, при этом квантитативные методы исследования сочетались с квалитативным анализом полученных на их основе данных. Такой подход обеспечивает достоверное выявление зависимостей между основной коммуникативной функцией представленного в корпусе типа текстов и частотно-распределительными характеристиками модальных глаголов, являющихся в немецком языке одним из основных средств выражения модальности.

В качестве инструментария исследовательской работы были избраны следующие методы исследования: квантитативный метод для выявления на основе ПКТ «DER» тенденций частотности и дистрибуции квантифицируемых языковых единиц и соотношений между внутренними характеристиками текста и внешними по отношению к нему факторами; квалитативный метод для интерпретации полученных статистических данных, для семантического и грамматического анализа употреблений исследуемых языковых единиц в текстах ГОСТ; методы и технологии корпусной лингвистики для реализации и обработки ПКТ «DER».

Положения, выносимые на защиту:

1. Важнейшим лингвистическим принципом построения корпуса текстов, является обеспечение его репрезентативности. Значительное увеличение объема исследуемого корпуса не означает пропорционального роста количества уникальных лексем в нём (т.е. автоматического повышения репрезентативности). Динамика роста количества словоформ уменьшается вместе с ростом количества словоупотреблений в корпусе, поэтому ре* презентативность корпуса должна обеспечиваться не столько за счет увеличения его объёма, сколько за счет более тщательной выборки текстов.

2. Статистические данные о структурных элементах текста могут служить надежной основой для выявления параллельных сегментов в текстах на немецком и русском языках и использоваться при разработке параллельных корпусов текстов.

3. Документы ООН занимают особое место среди политических типов текстов в составе официально-делового стиля современного немецкого литературного языка, что обусловлено их внешнеполитическим характером, особым статусом их эмитента, усиливающейся интернационализацией немецкого языка.

4. Между общей коммуникативно-функциональной направленностью текста и основными средствами выражения модальности существует непосредственная зависимость, выражающаяся для модальных глаголов немецкого языка в изменении их частотно-распределительных характеристик в зависимости от функционально-стилевой принадлежности текста.

5. Речевой фон употребления отдельных модальных глаголов немецкого языка, частотность и выбор синтаксических конструкций для их употребления тесно связаны с общей коммуникативно-функциональной направленностью текстов.

Апробация результатов исследования: основные положения работы были представлены в виде докладов на Международных научных конференциях Л

Korpuslinguistik deutsch: synchron — diachron - kontrastiv» (2003 г.) и «Europa-tag» (2004 г.) в университете г. Вюрцбург (ФРГ), «Компаративистика: современная теория и практика» (2004 г.) в Самарском государственном педагогическом университете и на конференции «Русско-немецкие культурно-исторические контакты» в Тольяттинском государственном университете (2004 г.), а также обсуждались на заседаниях кафедры немецкой филологии СамГУ.

Структура и объем диссертации: диссертация состоит из введения, трех глав, заключения, списка использованной научной литературы и словарей, списка входящих в ПКТ «DER» текстов, глоссария терминов и приложения (CD-ROM с электронной версией ПКТ «DER» для Windows).

 

Заключение научной работыдиссертация на тему "Лингвистические принципы построения и использование корпуса текстов для исследования официально-делового стиля современного немецкого языка"

Выводы к главе 3

В последние десятилетия особое внимание лингвистов уделяется изучению • политических ТТ, и отмечается тенденция изменения данной группы ТТ в рамках ОДС, обусловленная значительными преобразованиями во конце XX века структуры политических учреждений и политической системы в целом, в частности в ФРГ. Большинство таких исследований построено на материале внутриполитических ТТ (конституция, парламентские документы, законы и т.п.) и практически не затрагивают ТТ, относящиеся к внешнеполитической деятельности (международные договоры, документы Европейского союза и ООН). В современных условиях постоянно расширяющихся международных политиче-ф ских контактов и усиливающейся глобализации изучение текстов официальноделового стиля (ОДС), регулирующих правовые и политические отношения субъектов международного права, приобретает особую актуальность. До настоящего времени исследования, рассматривающие стилистические особенности подобных текстов, где на основе их репрезентативной подборки проводился W бы квантитативная оценка частотности и квалитативный анализ типичных для данного ТТ явлений, являются малочисленными.

Документы ООН занимают особое место среди политических ТТ, что обусловлено особой ролью эмитента этих текстов и их внешнеполитическим характером. Статус международной организации и задачи, заложенные в уставе ООН, во многом, определяют прагматическую перспективу ТТ, представленного в ПКТ «DER». В отличие от резолюций ООН, для которых основной является директивно-регулятивная функция, доклады Генсекретаря имеют менее категоричный характер, поскольку его положения в правовом смысле не являются обязательными для выполнения. Для данного ТТ основными коммуникативными функциями являются аппелятивная и ориентирующая, а директивно-регулятивная выполняет скорее вспомогательное значение. Это составляет специфику данного ТТ и во многом определяет его композиционные и стилистические особенности.

Используя тексты ООН, входящие в ПКТ «DER», и его инструментарий можно выявить языковые средства, типичные для данного ТТ, и дать подробную картину их употребления в текстах указанного типа (Доклады Генсекретаря ООН). ПКТ «DER» даёт возможность быстро и надёжно получить разнообразные результаты обработки большого массива текстов, что, в свою очередь, обеспечивает получение точных статистических данных.

На основе сопоставительного анализа частотно-распределительных характеристик модальных глаголов в немецкой части ПКТ «DER» и в одноязычном корпусе «DDW» было выявлено, что частотно-распределительные характеристики некоторых модальных глаголов в них значительно отличаются. На наш взгляд это связано с тем, что они содержат ТТ с различной коммуникативно-функциональной направленностью. Изменения в частотности употребления модальных глаголов являются отражением этих различий.

Несмотря на то, что прагматическая функция долженствования играет важную роль в документах ООН, её выражение в них носит не категоричный, а рекомендательный характер. Это косвенно подтверждается преобладанием количества употреблений глагола sollen над количеством употреблений глагола mtissen. Статус ООН и язык дипломатических документов обусловливают общую тенденцию снижения категоричности выраженного модальными глаголами долженствования при одновременном сохранении коммуникативной функции долженствования и предписывающего, нормативного характера данных текстов. Большинство употреблений глагола кдппеп относится к телеологическому речевому фону и служит для ориентации высказывания на определенную цель, а также для выражения возможности её достижения, что вполне соотносится с общей интенцией представленных в ПКТ «DER» текстов ООН. Воли-тивный речевой фон играет в текстах ООН скорее второстепенную роль, так как он не соответствует общей функционально-коммуникативной направленности официально-делового стиля. Этим фактором обусловлена довольно низкая частотность глаголов wollen и mogen.

Каждый из модальных глаголов реализует целый спектр модальных значений. В каждом конкретном употреблении актуализируется одно из этих значений. При этом значение модального глагола обусловливается речевым фоном высказывания. Анализ употреблений модальных глаголов в немецких текстах ПКТ «DER» показывает, что различные значения модальных глаголов отчетливо проявляются в текстах на русском языке, что может служить в качестве дополнительного дифференцирующего признака, отражающего речевой фон данного употребления и позволяющего оценить его зависимость от общей интенции текстов, представленных в ПКТ «DER».

Заключение

В рамках данного исследования был разработан электронный корпус текстов «DER», послуживший текстовой и инструментальной основой для выявления особенностей функционирования модальных глаголов в немецких текстах официально-делового стиля как отражения их стилистического своеобразия.

Решение поставленной задачи осуществлялось в два этапа. На первом этапе были сформулированы лингвистические принципы построения ПКТ «DER», разработана технология автоматической обработки текстов корпуса, а также средства их представления и анализа.

Для составления ПКТ «DER» была произведена оценка объема существующих электронных параллельных текстов для немецкого и русского языков и возможностей их использования в корпусе. Учитывая фактор межкультурных связей, можно констатировать существование значительного количества параллельных текстов на русском и немецком языках, однако для составления сбалансированного русско-немецко-немецко-русского ПКТ не всегда возможно найти тексты, аналогичные по тематикам и жанрам и относящиеся к одному периоду времени. Хотя «в обе стороны» переводится довольно большое количество текстов, различия в культурных традициях приводят к сильному дисбалансу в структуре переводных текстов на немецком и русском языках. Таким образом, получить «зеркальные» субкорпуса оригинальных и переводных текстов любого типа представляется проблематичным.

Для подготовки текстов ПКТ «DER» была разработана оптимальная для целей исследования методика автоматического определения структурных элементов текста (абзацев и предложений) на основании их формальных признаков (знаков пунктуации, элементов графического оформления и т.п.), а также технология выявления параллельных сегментов в текстах ПКТ с использованием статистических данных об их объеме (статистико-вероятностный метод).

На основе существующих в лингвистике определений структуры текстов и имеющихся в них уровнях членения, а также с учетом особенностей автоматической обработки текста была разработана концепция автоматического определения границ структурных элементов в тексте, предназначенных для последующей стыковки. Данная концепция базируется, во-первых, на признании важной роли знаков пунктуации при членении письменного текста и, во-вторых, на постулате о невозможности автоматического определения границ элементов текста без учета их формальных признаков. Поскольку при автоматической обработке электронный текст воспринимается как последовательность байтов, а не как смысловое единство, то автоматическое определение границ предложений и абзацев в тексте может осуществляться только с учетом «физических» признаков этих структурных элементов. Такими признаками могут являться знаки пунктуации, элементы графического оформления текста, строчные/прописные буквы.

С учетом существующих теоретических концепций [В. Гейл, К. Черч] была разработана оригинальная методика автоматического выявления параллельных сегментов в текстах на немецком и русском языках. Результаты данной работы подтверждают возможность автоматического выявления параллельных сегментов в электронных текстах на немецком и русском языках. Наиболее эффективным методом выявления параллельных сегментов в текстах на немецком и русском языках оказался статистическо-вероятностный подход, основанный на определении и сравнении количественных характеристик (числа знаков) структурных элементов текста (предложений и абзацев). Результаты исследования показали, что решающее значение при автоматической стыковке параллельных текстов играет величина предельного отклонения сравниваемых сегментов, складывающаяся из величины относительного и абсолютного отклонения.

В рамках данной работы была также успешно разработана и опробована программная оболочка для наглядного представления текстов ПКТ «DER» и осуществления эффективного поиска в них. Она позволила получать различные статистические данные, эффективно управлять содержащейся в корпусе информацией, а также её представлением для исследователя. С её помощью было установлено, что значительное увеличение объема корпуса не ведет к прямо пропорциональному росту количества уникальных лексем в корпусе. При увеличении объема (т.е. количества словоупотреблений) немецкой части ПКТ «DER» более чем в 8 раз количество словоформ увеличивается примерно в 3,5 раза. Даже при существенном увеличении объема корпуса количество словоформ во всем корпусе повышается лишь незначительно. Это позволяет сделать вывод о том, что даже значительное повышение объема корпуса не ведет к пропорциональному росту количества уникальных лексем в текстах корпуса. Таким образом, тщательная выборка первоначальных текстов позволила на основе достаточно компактного корпуса получить достоверные данные для всех текстов данного типа, отвечающих заданным параметрам отбора.

На втором этапе исследования на основе данных квантитативного и квалитативного стилистического анализа немецкого субкорпуса ПКТ «DER» были выявлены закономерности частотно-распределительных характеристик немецких модальных глаголов и их зависимость от общей коммуникативно-функциональной направленности представленного в ПКТ «DER» типа текстов (ежегодные доклады Генсекретаря о работе ООН).

На основе ПКТ «DER» было проведено исследование функционирования модальных глаголов в текстах официально-делового стиля в современном немецком языке (на примере текстов ООН), в котором квантитативные методы исследования сочетались с квалитативным анализом полученных на их основе данных. Такой подход позволил выявить зависимости между основной коммуникативной функцией представленного в корпусе типа текстов и частотно-распределительными характеристиками модальных глаголов, являющихся в немецком языке одним из основных средств выражения модальности. На основе немецких текстов ПКТ «DER» были рассмотрены особенности частотно-распределительных характеристик модальных глаголов и определены наиболее употребительные значения модальных глаголов в текстах ООН.

Значения возможности, необходимости, разрешения, запрета и желания выражаются в немецком языке в основном при помощи модальных глаголов. Они являются одной из существенных частей системы модальности в немецком языке, а именно той частью, которая вносит весомый вклад в формирование общей интенции всего текста, и играют важную роль в выражении его функционально-коммуникативных параметров. Они также имеют особое значение для реализации в текстах официально-делового стиля на немецком языке прагматической функции долженствования и выражения их предписывающе-оценочного характера. Как показали результаты исследования, частотно-распределительные характеристики модальных глаголов можно отнести к числу характеристик, свойственных определенному типу текстов (доклады Генсек-ретаря ООН, относящиеся к официально-деловому функциональному стилю).

Как показывает частотность употребления модальных глаголов в немецких текстах ПКТ «DER», глаголы dtirfen, mogen и wollen встречаются в представленных текстах значительно реже, чем кбппеп, mtissen и sollen. Такая частотность употребления модальных глаголов в целом сохраняется в каждом отдельном тексте. Это означает, что данный признак является отличительной чертой представленного в корпусе типа текстов и практически не изменяется в зависимости от экземпляра текста.

Несмотря на то, что прагматическая функция долженствования играет важную роль в документах ООН, её выражение носит менее категоричный, рекомендательный характер. Это косвенно подтверждается преобладанием количества употреблений глагола sollen (29% всех употреблений модальных глаголов) над количеством употреблений mtissen (20% всех употреблений модальных глаголов). Статус ООН и язык её дипломатических документов обусловливают общую для них тенденцию снижения категоричности выраженного модальными глаголами долженствовании, при одновременном сохранении коммуникативной функции долженствования и предписывающего, нормативного характера данных текстов (доклад Генсекретаря).

Как показал анализ употреблений глагола кдппеп, большинство из них отно

• сится к телеологическому речевому фону и служит для ориентации высказывания на определенную цель, а также для выражения возможности её достижения, что вполне соотносится с общей интенцией представленных в ПКТ «DER» текстов. Анализ употреблений глагола durfen даёт основание утверждать, что этот модальный глагол практически не используется в текстах ПКТ «DER» в своём основном значении для выражения «категоричного разрешения». Большинство

• употреблений представляет собой сочетание модального глагола с отрицанием, что по своей сути является конструкцией, синонимичной основному значению глагола sollen. Преобладание в немецких текстах ООН данного значения может быть объяснено характером текстов: все высказывания с использованием глагола durfen либо относятся к регламентированию деятельности самой организации, либо выражают рекомендации для мирового сообщества. Этот факт объясняет то, что практически все употребления данного модального глагола относятся к нормативному речевому фону. щ Как показывает статистика употреблений глаголов wollen и mogen в немецкой части ПКТ «DER», их частотность (наряду с dtirfen) является одной из самых низких среди всех модальных глаголов. На wollen приходится 3% от всех употреблений модальных глаголов, а на mogen — 2%. Данные глаголы употребляются в основном в волитивном речевом фоне, который не является в целом типичным для текстов официально-делового стиля вообще и документов ООН в частности.

Сравнение частотно-распределительных характеристик модальных глаголов ф в немецких текстах ПКТ «DER» и в текстах корпуса общего типа «Der deutsche

Wortschatz» («DDW», www.wortschatz.uni-leipzig.de), включающих в себя спектр текстов различных типов, отчетливо показывает, что частотно-распределительные характеристики некоторых модальных глаголов в корпусах текстов значительно отличаются. Это можно объяснить тем, что они содержат разные типы текстов с отличающейся коммуникативно-функциональной направленностью, а изменения в структуре употребления модальных глаголов являются отражением этих различий. Учитывая эти предположения, были интерпретированы статистические данные, полученные на основе этих двух корпусов. Различия частотно-распределительных характеристик модальных глаголов во многом подтверждают предположения о том, что их колебания во многом обусловлены особенностями функционально-стилевой принадлежности текстов, представленных в ПКТ «DER» и в корпусе «DDW».

Результаты анализа употреблений модальных глаголов в немецком субкорпусе ПКТ «DER» показали, что некоторые из них (sollen и konnen) используются в ряде типичных синтаксических конструкций (придаточных предложений). Примерно половина всех употреблений sollen приходится на определительные придаточные предложения (-28% всех употреблений sollen), условные придаточные предложения с союзом wenn (-14%), придаточные предложения с местоименным наречием wodurch или с предлогом durch + существительное/местоимение (-7%). Примерно треть всех его употреблений konnen приходится на придаточные предложения с союзами dass/dafi (15%), damit (5%) и wie (10%).

Анализ употреблений модальных глаголов в немецких текстах ПКТ «DER» также показал, что различные значения модальных глаголов отчетливо передаются при переводе в текстах на русском языке, что может служить в качестве дополнительного дифференцирующего признака, отражающего речевой фон данного употребления и позволяющего оценить его зависимость от общей интенции текстов, представленных в ПКТ «DER».

В качестве продолжения данной работы планируется постепенное пополнение корпуса новыми текстами, относящимися к различным функциональным стилям и более полно отражающими соотношение лексических единиц в письменных текстах. Постепенное увеличение объема используемых в корпусе текстов будет обеспечивать более высокую степень репрезентативности и содержать большее количество лексических единиц. ПКТ «DER» состоит из двух подкорпусов для немецкого/русского языков. Каждый из данных массивов текстов может использоваться как самостоятельная единица и служить для проведения различных исследований, касающихся данного конкретного языка.

Способы использования ПКТ «DER» ограничены лишь его техническими возможностями и набором входящих в него текстов, поэтому в дальнейшем предполагается не только увеличивать число текстов в корпусе, но и расширять его функциональные возможности. При наличии необходимого инструментария можно вносить в тексты корпуса дополнительную лингвистическую мета-информацию - например, о грамматической форме слова, синтаксической структуре предложения и т.п. Поступательное наполнение текстов корпуса дополнительной метаинформацией позволит значительно расширить возможные области применения ПКТ «DER» в германистике.

 

Список научной литературыВадяев, Сергей Евгеньевич, диссертация по теме "Германские языки"

1. Абрамов Б.А. Теоретическая грамматика немецкого языка. - М.: Гуманитарный издательский центр ВЛАДОС, 1999. - 286 с.

2. Абрамов Б.А., Семенюк Н.Н. Немецкий язык // Языки мира: Герм.яз. Кельт.яз. М.: Academia, 2000. - С. 216-271.

3. Аверина С.А., Азарова И.В., Алексеева Е.Л. Прикладное языкознание. -СПб.: Изд-во Санкт-Петербург, ун-та, 1996. 525 с.

4. Адмони В.Г. Введение в синтаксис современного немецкого языка. М.: Издательство литературы на иностранных языках, 1955. - 392 с.

5. Адмони В.Г. Система форм речевого высказывания. СПб.: Наука, 1994. -151 с.

6. Андрющенко В.М. Автоматическая обработка текста // Лингвистический энциклопедический словарь / Гл.ред. В.Н. Ярцева. М.: Советская энциклопедия, 1990. - С. 14-15.

7. Андрющенко В.М. Концепция и архитектура машинного фонда русского языка. М.: Наука, 1989. - 200с.

8. Аношкина Ж.Г. Лингвистический программно-источниковый пакет UNILEX+. Тексто-ориентированная компонента UNILEX-T. // Бюллетень Машинного фонда русского языка. 1992. - Вып. 2. - С. 3-7.

9. Апресян Ю.Д. Идеи и методы современной структурной лингвистики. -М.: Просвещение, 1966. 300 с.

10. Балли Ш. Общая лингвистика и вопросы французского языка. -2.изд.,стер. М.: Эдиториал УРСС, 2001. - 416 с.

11. Баранов А.Н. Введение в прикладную лингвистику. М.: Эдиториал УРСС, 2001.-358 с.

12. Баранов А.Н. Проблема репрезентативности корпуса текстов // Труды Международного семинара Диалог-2001 по компьютерной лингвистике и её приложениям. М.: РГГУ, 2001. - С. 35-42.

13. Беляева Л.Н., Герд А.С., Убин И.И. Автоматизация в лексикографии // Прикладное языкознание. СПб.: Изд-во СПб-ского ун-та, 1996. - С. 318333.

14. Беляева Л.Н., Откупщикова М.И. Автоматический (машинный) перевод // Прикладная лингвистика. СПб.: Изд-во СПб-ского ун-та, 1996. - С. 4352.

15. Бернард Л., Шперберг Мак-Куин С.М. Введение в TEI Lite - Русская редакция, 1995. http://www.tei-c.org.uk/Lite/teiu5 ru.rtf

16. Богуславский И.М. и др. Аннотированный корпус русских текстов: концепция, инструменты разметки, типы информации // Труды Международного семинара «Диалог 2000 по компьютерной лингвистике и ее приложениям». М.: РГГУ, 2000. - Т. 2. - С. 41-47.17