автореферат диссертации по филологии, специальность ВАК РФ 10.02.04
диссертация на тему: Корпусная фразеография
Полный текст автореферата диссертации по теме "Корпусная фразеография"
На правах рукописи
КРОТОВА Елена Борисовна
КОРПУСНАЯ ФРАЗЕОГРАФИЯ (на материале немецкого языка)
Специальность 10.02.04 - германские языки
АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата филологических наук
005059117
16 МАЙ 2013
Москва-2013
005059117
Работа выполнена на кафедре германских языков и культур факультета иностранных языков и регионоведения Московского государственного университета имени МВ. Ломоносова.
Научный руководитель:
кандидат филологических наук, доцент Филипенко Татьяна Владимировна
Официальные оппоненты:
Нефёдова Любовь Аркадьевна доктор филологических наук, профессор, и.о. заведующего кафедрой лексики и фонетики немецкого языка Московского педагогического государственного университета, Костева Виктория Михайловна кандидат филологических наук, доцент Московского городского педагогического университета
Ведущая организация:
Федеральное государственное бюджетное учреждение науки Институт русского языка им. В.В. Виноградова Российской академии наук
Защита состоится «21» мая 2013 года в « (2.» часов на заседании диссертационного совета Д 002.006.02 по защите диссертаций на соискание ученой степени кандидата филологических наук при Институте языкознания РАН по адресу: 125009, г. Москва, Б. Кисловский пер., д. 1, стр. 1. '
С диссертацией можно ознакомиться в библиотеке Института языкознания РАН. Автореферат разослан « » апреля 2013 г.
Ученый секретарь диссертационного совета доктор филологических наук
Е К
Молчанова
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Реферируемое диссертационное исследование посвящено вопросу о том, какую новую информацию об идиоматике языка можно получить с помощью электронных текстовых корпусов и каким образом применение корпусных методов отражается на фразеографической практике. Корпусная фразеография понимается нами в первом приближении как фразеографическая практика, эмпирической базой которой являются электронные текстовые корпусы.
В центре нашего внимания находятся идиомы как центральная часть фразеологической системы языка. Учёными давались самые разные определения понятию «идиома», но неизменно в той или иной формулировке отмечается фиксированность состава идиом и их устойчивость (например, у В.В. Виноградова, Н.М. Шанского, И.И. Чернышевой, В.Г. Гака, Г. Бургера, В. Фляйшера). В данной работе под идиомами понимаются «сверхсловные образования, которым свойственна высокая степень идиоматичности и устойчивости»1. Фиксированность компонентного состава, тем не менее, не исключает возможности определенных модификаций идиом. Речь идет не только о модификациях с целью создания языковой игры, но и о стандартных модификациях, которым могут подвергаться идиомы. Так, работа с электронными текстовыми корпусами представляет многочисленные доказательства возможности модификаций идиом, включающих в себя лексическое, синтаксическое и иные виды варьирования.
В связи с развитием компьютерных технологий и повышением доступности электронных корпусов растёт их использование при составлении новых словарей и при создании обновлённых версий уже существующих. Однако возникают вопросы, в какой мере используются корпусы, являются ли они (1) просто базой для поиска иллюстративных примеров или (2) получаемые из них эмпирические данные корректируют имеющиеся сведения и добавляют новую информацию об изучаемом языковом явлении. Если словарная работа ведётся в рамках корпусной лингвистики, то ответом может быть только второй из вышеуказанных вариантов. Растущим значением электронных текстовых корпусов для лексикографической и, в частности, фразеографической практики объясняется актуальность данной работы.
Объектом диссертационного исследования являются контексты, содержащие идиомы. Контексты взяты из электронных текстовых корпусов, находящихся в открытом доступе.
1 Баранов А.Н., Добровольский Д.О. Аспекты теории фразеологии. М.: Знак, 2008. - 656 с. С. 57.
3
В основном нами использовались архивы корпусов Института немецкого языка в г. Мангейме.
Предметом настоящего исследования является реализация корпусного подхода во фразеографии с учетом новой информации, которую корпусы предоставляют относительно идиоматической системы немецкого языка.
Цель диссертационного исследования состоит в получении новой информации об идиоматике немецкого языка с помощью электронных текстовых корпусов, в том числе о варьировании идиом и их семантике.
Достижение поставленной цели предполагает решение следующих задач:
- определить на материале немецкого языка наиболее подходящие для фразеографических исследований электронные текстовые корпусы;
- рассмотреть, что должно пониматься под корпусным подходом в лингвистике и, в частности, фразеографии, и, следовательно, как должна протекать работа с корпусными данными;
- выделить список употребительных идиом немецкого языка, которые будут подвергаться корпусному анализу;
- проанализировать контексты с употреблениями идиом в выбранных электронных корпусах;
- выявить случаи варьирования данных идиом;
- проанализировать, какие новые сведения о семантике, валентностях и переводе рассматриваемых идиом можно получить из корпусов;
- предоставить обзор и анализ новой информации, полученной об идиоматике немецкого языка благодаря электронным корпусам.
Материалом исследования явились более 500 употребительных идиом немецкого языка, содержащихся в словаре Д.О. Добровольского2 и в списке идиом из монографии того же автора3, которые были дополнительно проверены по корпусам на частотность. Для всей совокупности идиом анализировались контексты из электронных корпусов, в основном из архивов корпусов Института немецкого языка в г. Мангейме, в среднем около 100 контекстов на идиому.
Основным методом исследования является метод корпусного анализа, под которым понимается анализ материалов корпусов, содержащих исследуемый языковой феномен, с целью получения соответствующей новой информации и обязательным учетом
2 Добровольский Д.О. Немецко-русский словарь живых идиом. М.: Метатекст, 1997. - 201 с.
3 Dobrovol'skij D. Idiome im mentalen Lexikon: Ziele und Methoden der kognitivbasierten Phraseologieforschung. Trier; Wissenschaftlicher Verlag, 1997. - 288 S.
максимального количества примеров, в том числе противоречащих имеющимся в словарях сведениям. Для описания значения исследуемых идиом применялись методы толкования и перевода.
Информационной базой исследования послужили материалы монографий, учебных пособий, диссертаций, статей и словарей (в общей сложности 129 источников, из них 63 на русском языке и 66 на немецком и английском языках).
Новизна исследования заключается в том, что впервые на обширном идиоматическом материале показано значение электронных текстовых корпусов для фразеографии; анализируется, в чём заключается корпусный подход в применении к фразеографии; подробно описываются обнаруженные у идиом виды и способы варьирования, а также обобщаются новые сведения, полученные о семантике идиом и их переводе.
Теоретическая значимость исследования заключается в рассмотрении корпусного подхода во фразеографии с описанием его ценности для исследования идиоматической системы немецкого языка. Полученные сведения об идиомах могут быть использованы при верификации гипотез, касающихся свойств идиом, а также при разработке и корректировке фразеологических теорий.
Практическая ценность исследования заключается в том, что в результате корпусного анализа рассматриваемых идиом были созданы словарные статьи, вошедшие в состав немецко-русского фразеологического словаря, готовящегося к изданию. Сведения, полученные о варьировании идиом, их семантике и переводе, а также контексты и словарные статьи с соответствующими употреблениями идиом могут быть использованы на лекционных и семинарских занятиях по лексикологии, лексикографии, фразеологии и переводу.
Апробация работы. Результаты данного исследования были обобщены в докладах, сделанных на Международных конференциях студентов, аспирантов и молодых ученых «Ломоносов» (М., 2010; 2011; 2012; 2013) и на конференции «Актуальные проблемы немецкого языкознания и методика преподавания современного немецкого языка» (М., 2012).
На защиту выносятся следующие положения:
1. Использование электронных текстовых корпусов может повысить объективность проводимого лингвистического исследования за счет расширения его эмпирической базы, что позволяет прийти к более точным выводам.
2. Исследование является корпусным, если существующая у лингвиста перед началом работы гипотеза подвергается проверке эмпирическими фактами, полученными методом корпусного анализа.
3. К корпусной лингвистике относятся базирующийся на корпусах (corpus-based) и направляемый корпусами (corpus-driven) подходы; при этом оба они являются эмпирическими. Сам корпусный подход в сфере идиоматики подразумевает не только получение данных об употребительности идиом и их партнёрах по сочетаемости, но и исследование семантических, синтаксических и прагматических особенностей идиом на материале корпусов.
4. Корпусы представляют неопровержимые доказательства вариативности компонентного состава идиом. Пока не совсем понятны причины, по которым некоторые идиомы в большей степени склонны к модификациям, другие -практически им не подвергаются. Дальнейшее изучение вариативности идиом на материале электронных корпусов могло бы помочь в систематизации и научном обобщении знаний о модификациях.
Структура работы. Диссертация состоит из введения, трёх глав, заключения, списка использованной литературы и четырёх приложений. В Главе 1 содержится обзор литературы, посвященной корпусной лингвистике и корпусному подходу во фразеографии. В Главах 2 и 3 рассматриваются результаты корпусного анализа употребительных немецких идиом. Глава 2 посвящена видам варьирования идиом, в том числе морфологическому, лексическому и синтаксическому варьированию. В Главе 3 рассматривается семантика идиом и их валентности. В Приложении 1 представлен список употребительных идиом немецкого языка, полученный при сравнении словников двух немецко-русских фразеологических словарей и при последующей проверке на частотность данных идиом в корпусах. В Приложении 2 приводится описание формата словаря, в соответствии с которым оформлены словарные статьи, приводящиеся в диссертации. В Приложении 3 даются словарные статьи, частично приведённые в основном тексте диссертационного исследования. В Приложении 4 приводится таблица, в которой отражено, каким видам варьирования могут подвергаться проанализированные идиомы.
ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ Во Введении обосновывается выбор темы диссертации, раскрывается актуальность и новизна разрабатываемой проблемы, её теоретическая значимость и практическая ценность, выделяются объект и предмет исследования, формулируются цель и задачи
6
исследования, определяются источники материала и методы его анализа, формулируются положения, выносимые на защиту.
В Главе 1 «Корпусный подход к изучению идиоматики» рассматривается содержание понятий корпуса и корпусной лингвистики, суть различий между эмпирическим и рационалистическим подходами в лингвистике, отношение к языковым данным в разных направлениях лингвистики и определяется содержание термина «корпусная фразеография».
Обзор литературы показал, что понятия «корпус» и «корпусная лингвистика» по-разному трактуются лингвистами. В реферируемой работе под термином «корпус» понимаются только электронные текстовые корпусы, по определению В.А. Плунгяна, рассматривающего корпус как собрание текстов на данном языке, представленное в электронном виде и снабженное научным аппаратом (разметкой). Одной из ключевых характеристик корпуса является наличие в нём «реального» языкового материала, а не сконструированного непосредственно исследователем. Также следует подчеркнуть, что в нашем представлении корпус является собранием текстов, а не «естественным языковым материалом», включающим в себя примеры из текста и несвязанные предложения, так как при проведении лексического исследования для чистоты делаемых выводов желательно, чтобы был виден весь абзац, в котором употреблена идиома.
Термин «корпусная лингвистика» может трактоваться, как в узком, так и в широком смысле. Узкое понимание корпусной лингвистики предполагает, что она является разделом компьютерной лингвистики, занимающимся разработкой общих принципов построения и использования лингвистических корпусов (корпусов текстов) с использованием компьютерных технологий. Ряд исследователей определяет понятие «корпусной лингвистики» гораздо шире и рассматривает её как новый подход к изучению языка. К причинам её бурного развития в последнее время относят как растущую тенденцию в лингвистике к изучению языка в процессе коммуникации, а не абстрактной системы языка, так и те возможности, которые предоставляют лингвисту электронные текстовые корпусы.
Далее в диссертационном исследовании рассматривается, в чём состоит суть корпусной лингвистики как определённого подхода к изучению языка, для чего дается обзор эмпирического и рационалистического подходов к лингвистике. Эмпирический подход в лингвистике и изучение «использования языка» (в терминологии Д. Байбера, С. Конрада и Р. Реппена) связывается с корпусной лингвистикой, в то время как рационалистический подход и изучение структуры языка связывается со структурализмом и генеративной грамматикой Н. Хомского.
В рамках теории Н. Хомского машиночитаемый лингвистический корпус особой ценности не представляет. Корпус мог бы быть использован как база для поиска примеров, но при построении описаний учитывалась бы только часть примеров, не противоречащая интуиции исследователя и теории, которой он придерживается. Принципиальным для понимания разницы между эмпирическим и рационалистическим подходом в лингвистике является именно отношение к наблюдаемым данным. Если у Н. Хомского значимость наблюдаемых данных может определяться тем, насколько хорошо они укладываются в теорию, то у Дж. Лича как представителя эмпирического подхода в лингвистике значимость описания и теории находятся в зависимости от наблюдаемых данных. Можно сказать, что различный подход к эмпирическим данным в генеративизме и корпусной лингвистике логически следует из разного понимания объекта исследования. Если в генеративизме объектом можно считать абстрактный и ненаблюдаемый «язык» (или «компетенцию»), то в корпусной лингвистике исследуется «речь» (или «употребление»).
В связи с рассмотрением эмпирического и рационалистического подхода в лингвистике затрагивается вопрос о роли языковой интуиции. Так, К. Аймер и Б. Альтснберг говорят о двух значениях интуиции применительно к лингвистическим исследованиям. В первом значении интуиция (т.е. языковая интуиция) идентична знанию языка носителем этого языка. Во втором значении интуиция предстает как неотъемлемый элемент работы лингвиста. Если в первом значении интуиция склонна к ошибкам и ненадежна, то во втором значении она незаменима при исследовании структуры наблюдаемых явлений и трансформации наблюдений в теоретические положения. С пониманием роли интуиции в разных лингвистических направлениях связано отношение к примерам, иллюстрирующим определенный языковой феномен. Так, в генеративизме считалось приемлемым и необходимым придумывать предложения, которые бы соответствовали языковой интуиции исследователя либо опрашиваемых им участников лингвистического эксперимента. Иное отношение к примерам обнаруживается в корпусной лингвистике. Очень ёмко выразил его Дж. Синклэр, говоривший о том, что «нельзя изучить ботанику по искусственным цветам»4. Под искусственными цветами здесь понимаются придуманные самим исследователем предложения.
Роль интуиции не отрицается ни в одном из вышеупомянутых лингвистических направлений. Признается, что невозможно работать без использования интуиции, исследователь постоянно направляется ей и не может освободиться от неё, даже если захочет. Но необходимо более осторожное обращение с данными, предоставляемыми
4 Sinclair J. Corpus, Concordance, Collocation. Oxford University Press. 1991. P. 6
8
интуицией. Интуитивные ответы требуют тщательной интерпретации, и исследователи должны учитывать её вероятностный характер. Корпусы могут направлять работу языковой интуиции и, таким образом, способствовать более глубокому пониманию исследуемого явления.
Далее в диссертационном исследовании рассматривается содержание термина «корпусная фразеография». Под фразеографией понимается раздел лексикографии, предметом которого является разработка методологии и конкретных приемов составления фразеологических словарей, выработка научно обоснованных принципов отбора фразеологизмов для разных типов фразеологических словарей, установление единых принципов лексикографической разработки. Говоря о корпусной фразеографии, мы подразумеваем, что работа ведётся с позиции эмпирического подхода и на базе электронных текстовых корпусов. Так, анализируется реальный языковой материал, предоставляемый корпусами, где исследуемые единицы рассматриваются в контексте, и на основе проведённого корпусного анализа уточняется и дополняется имеющаяся информация об идиомах.
Исследователи выделяют два подхода к использованию корпусов в лексикографических исследованиях: базирующийся на корпусах (corpus-based) и направляемый корпусом (corpus-driven) (например, у А. Бруннер и К. Штайер, у Л. Лемнитцера и X. Цинсмайстера, Дж. Синклера). В рамках первого подхода корпусные данные используются для подтверждения уже существующей гипотезы, в рамках второго подхода данные о языковых структурах предоставляет проводимый машиной анализ, результаты которого затем интерпретируются лингвистом. Следует отметить, что выделение двух подходов к использованию корпусов в лексикографических исследованиях, то есть базирующегося на корпусах и направляемого корпусом, несколько условно. Как сказано выше, характерным для первого подхода является использование корпусных данных для подтверждения уже существующей гипотезы. Здесь возникает вопрос, говорим ли мы о лингвистических исследованиях в принципе или только о корпусных исследованиях. Если корпусы используются только в качестве базы примеров, корпусным исследованием такое исследование не является. Получается, что первый подход, базирующийся на корпусах, корпусным подходом не является, так как не соответствует критерию эмпиричности, а второй, направляемый корпусом, является единственно возможным корпусным подходом. Поэтому кажется разумным рассматривать первый подход несколько шире и в рамках корпусной лингвистики. Так, не отрицается наличие перед началом работы с корпусами некой гипотезы, теории или информации, которая затем корректируется и дополняется в ходе корпусного анализа. В
9
этом смысле и наш словарный проект «Современная немецкая фразеология: Немецко-русский корпусный словарь», о котором речь пойдёт во второй главе, отражает подход, базирующийся на корпусах.
В диссертационном исследовании дается также обзор типологии корпусов и указывается, что при проведении фразеографического исследования важнейшим параметром, определяющим выбор корпуса, является его размер, так как при относительно малом размере (около 100 млн. словоупотреблений) можно не получить ни одного контекста с использованием анализируемой идиомы, даже в случае, если редкой данная идиома не является. По этой причине основным материалом проведенного исследования послужил архив корпусов Института немецкого языка в г. Мангейме, являющийся самым большим корпусом для немецкого языка.
Корпусы являются большой эмпирической базой, с помощью которой можно уточнять значение, способ функционирования и сферу использования языковой единицы. Подобные исследования ранее проводились с гораздо более значительной опорой на собственное языковое чутьё, на так называемую языковую интуицию, что могло приводить к искажению значения идиом, к неадекватному отражению их реального употребления в языке, к слишком упрощенному пониманию поведения идиом в тексте. Появление электронных текстовых корпусов намного упростило техническую работу по сбору материала и сделало возможным постановку таких задач, которые раньше были технически невыполнимы. Учёт корпусных данных ведет к корректировке, а часто и к необходимости более глубокого изменения тех гипотез и теорий, с которыми лингвист приступает к работе.
В то время как в Главе 1 показано, что подразумевается под корпусным подходом в лингвистике и, в частности, в идиоматике, в Главах 2 и 3 рассматривается, как корпусный подход реализуется на практике и какие новые сведения об идиоматике немецкого языка он помогает получить.
Глава 2 «Виды варьирования идиом» посвящена таким видам варьирования идиом, как морфологическому, лексическому, синтаксическому и лекеико-синтаксическому. Как известно, устойчивость является одной из характерных черт идиоматических выражений, но она свойственна им в различной степени. Наличие вариативности идиом признаётся, в той или иной степени, большинством исследователей. Так, проблема вариативности идиом обсуждалась, в частности, в трудах И.И. Чернышевой, A.M. Бабкина, Т.А. Бертагаева и В.И. Зимина, В.М. Мокиенко, В.Н. Телия, А.Н. Баранова, Д.О Добровольского.
При обработке новой информации об идиомах немецкого языка, полученной в результате работы с корпусами, мы взяли за основу классификацию модификаций идиом, предложенную Д.О. Добровольским. Говоря о типах модификаций идиом, автор выделяет морфологические, лексические и синтаксические модификации. К морфологическим относятся, например, вариации в числе именного компонента. К лексическим относятся изменения компонентного состава идиомы. Возможны морфолексические модификации, например, когда именной компонент употребляется в уменьшительной форме. К синтаксическим модификациям относятся в т.ч. топикализация, пассивизация, номинализация или адьективизация глагольной фразы, субстантивация глагольного компонента, употребление идиомы как члена главного предложения, вводящего придаточное предложение. В отличие от лексических модификаций, синтаксические не меняют значения идиомы как лексической единицы. Ещё одним смешанным типом модификаций являются лексико-синтаксические модификации (такие как ввод в структуру выражения придаточного относительного или прилагательного).
Новая информация, полученная о модификациях идиом, проиллюстрирована нами словарными статьями из проекта «Современная немецкая фразеология: Немецко-русский корпусный словарь» (далее - Словарь). Словарные статьи даются не полностью, а в тех частях, которые релевантны для рассматриваемого феномена. Полные словарные статьи даны в Приложении 3. Информация об оформлении статей представлена в Приложении 2.
Изучение корпусных данных показало, что идиомы при наличии в их составе артиклей часто подвергаются морфологическим модификациям. Однако по имеющейся в словарях информации нельзя точно сказать, какой из этих вариантов является более частотным, т.к. отсутствуют соответствующие исследования. Именно к решению проблемы определения частотности вариантов можно приблизиться с помощью электронных корпусов.
У большинства идиом, подвергающихся морфологическим модификациям, употребление артикля ориентируется на узус. Так, компоненты идиомы могут предпочтительно употребляться с определённым артиклем, с неопределённым, либо без артикля, и корпусы помогают выявить, в какой именно форме идиома употребляется чаще. Например, для идиомы auf dem absteigenden Ast sein: (jmd., etw.) ist auf dem absteigenden Ast = (чьи-л.) дела плохи; (кто-л., что-л.) сдаёт позиции было обнаружено, что вариант с неопределённым артиклем употребляется гораздо реже вариантов с определённым артиклем:
Rj5 sich auf dem absteigenden Ast befinden, редко auf einem absteigenden Ast sein [sich befinden]
ff Während die Gesamtverkäufe in den USA übers Jahr merklich anzogen, wurde Toyota weniger Wagen los und das trotz großer Rabatte. Auch in Deutschland sind die Japaner auf dem absteigenden Ast: Im Jahr 2009 waren noch 3,6 Prozent aller hierzulande neu zugelassenen Wagen Toyotas, 2010 schrumpfte der Marktanteil dramatisch auf 2,7 Prozent. (Nach: Mannheimer Morgen, 27.01.2011) В то время как общие объёмы продаж в США за год заметно увеличились, компания Тойота, несмотря на большие скидки, продала меньше машин. В Германии японцы также сдают позиции: за 2009 год среди новых машин, прошедших техосмотр, только 3,6 процента были Тойоты, а за 2010 год доля рынка резко сократилась и составила 2,7 процента.
Был обнаружен также ряд идиом, где употребление артикля определяется скорее стандартными правилами коммуникативного выделения, чем узусом. Например:
Fass ohne Boden
нейтр.
бездонная бочка
Ш7 Употребление артикля следует правилам коммуникативного выделения: по большей части с неопределённым артиклем, но в зависимости от контекста возможно употребление определённого артикля или указательного местоимения, fj „Eine Handball-Bundesligamannschaft ist schon immer ein reines Zuschussgeschäft gewesen", sagt Strohmann, „25 Jahre habe ich in dieses Fass ohne Boden investiert." (Nach: Frankfurter Rundschau, 10.09.1998)
«Любая сборная Бундеслиги по гандболу полностью зависит от субсидий, -говорит Штрёман. - 25 лет инвестировал я в эту бездонную бочку».
В данном случае варьирование артикля имеет определённое влияние на семантику идиомы в отличие от идиом, где варьирование артикля определяется только узусом.
Варьировать может таюке морфемный состав компонентов идиом. Как известно, дативное окончание -е практически вышло из употребления в немецком языке и сохраняется только в некоторых устойчивых словосочетаниях (например, zu Hause = дома). В идиомах оно также сохраняется, но всё более выходит из употребления, как в случае с нижеприведённой идиомой: vom Hals halten
1. sich (О) vom Hals halten (jmdn., etw. А)
отделаться (от кого-л., чего-л.)', избавиться (от кого-л., чего-л.)
2. vom Hals halten (jmdm.jmdn., etw. А)
ограждать (кого-л. от кого-л., чего-л.)', избавлять (кого-л. от кого-л., чего-л.) Ш С дативным окончанием -е употребляется редко.
Тем не менее есть примеры, где идиома по-прежнему в основном употребляется с
5 Данный знак вводит зону вариантов. Подробнее оформление статей описывается в Приложении 2 реферируемой диссертации.
6 Данный знак вводит зону примеров.
7 Данный знак вводит зону комментариев.
дативным окончанием:
die Haare stehen zu Berge {jmdm.) волосы дыбом встали (у кого-л.)
Ш Без дативного окончания -е существительного Berg в форме die Haare stehen (jmdm.) zu Berg идиома используется редко.
Подобные исключения лишний раз доказывают, что даже при наличии неких общих тенденций и в языке в целом, и в идиоматике в частности, особенности варьирования формы необходимо прописывать в каждой словарной статье отдельно.
Большое количество новой информации корпусные данные предоставляют и о лексических модификациях идиом. Изучение материала корпусов, прежде всего, помогает выявить более частотные варианты идиом и менее частотные, обнаружить ранее не зафиксированные варианты, уточнить форму леммы на основании данных об употреблении идиомы.
В основном информация о лексических вариантах идиом бралась нами из различных одноязычных и двуязычных словарей. Часть вариантов была обнаружена во время анализа корпусных данных. Важным результатом работы стало построение градации вариантов по их употребительности, что было практически невозможным ранее при отсутствии достаточно большого количества примеров на одну идиому, иллюстрирующих с2 употребление. Разумеется, полученные результаты о частотности нельзя считать абсолютно точными, но они могут стать первым шагом к более полному изучению лексического варьирования данных идиом, в том числе на базе других корпусов, не использовавшихся в данном исследовании.
В случаях широкого варьирования мы указывали употребительные варианты в зоне
вариантов, а редко встречающиеся варианты - в зоне комментариев, чтобы не перегружать
зону вариантов. Так, для идиомы sich schwarz ärgern (über etw. А) = прийти в ярость
[бешенство] (из-за чего-л.), для которой Общий словарь Дуден (2000 г.) даёт три варианта
sich schwarz / sich grün und blau / sich gelb und grün ärgern, наряду с зоной вариантов мы
составили следующий комментарий:
fb sich grün (und blau) ärgern (über etw. A), sich grün (und schwarz) ärgern {über etw. A)
Ш Реже идиома встречается в следующих вариантах: sich grün und gelb ärgern, sich blau und grün ärgern, sich blau (und blass) ärgern, sich schwarz und grün [blau] ärgern.
Важно то, что удаётся найти более частотный вариант, который и помещается в лемму. Зачастую эти данные противоречат сведениями, имеющимся в существующих словарях, что придает им особую ценность. Например, в Общем словаре Дуден для идиомы aufs
(rechte) Gleis bringen (jmdn., eftv. А) = нейтр. привести в порядок (что-л.); наладить (что-
л.); наставить на верный путь [на путь истинный] (кого-л.) в качестве основной формы
указывается вариант wieder ins (rechte) Gleis bringen. По результатам корпусного анализа
обнаружилось, что он является менее частотным, чем aufs (rechte) Gleis bringen (jmdn., etw.
А), поэтому мы перенесли его в зону вариантов:
Fb aufs [auf das] (rechte) Gleis führen {jmdn., etw. A), ins [in das) (rechte) Gleis
bringen [führen] (jmdn., etw. A)
ffi Прилагательное recht может заменяться на richtig.
Корпусные данные также помогают обнаружить новые, еще не зафиксированные в словарях варианты идиом. К примеру, идиома das Heft in der Hand haben = нейтр. держать бразды правления (в своих руках) приводится в Общем словаре Дуден в двух вариантах: das Heft in der Hand haben / behalten. Однако помимо этих вариантов возможны и другие:
Fb das Heft in der Hand behalten, реже das Heft in der Hand halten
ffl Также в форме das Heft des Handels in der Hand haben [behalten, halten].
Варьирование может быть настолько широким, что указываются только самые частотные варианты. В Общем словаре Дуден даётся идиома eine gute, schlechte, klägliche o.ä. Figur machen / abgeben. Мы разделили ей на две статьи со следующими комментариями:
(1) eine gute Figur machen (irgendwo)
показать себя с хорошей стороны (в чём-л., где-л.), производить хорошее впечатление
Rj eine gute Figur abgeben (irgendwo)
Ш Прилагательное в составе идиомы допускает широкое варьирование: ср. eine hervorragende [glänzende, perfekte, starke, passable, einträgliche, stattliche, souveräne ...] Figur machen [abgeben]. Варьирование прилагательного приводит к соответствующим модификациям значения и перевода.
(2) eine schlechte Figur machen (irgendwo)
показать себя с плохой стороны (в чём-л., где-л.), производить плохое впечатление Rj eine schlechte Figur abgeben (irgendwo)
ffl Прилагательное в составе идиомы допускает широкое варьирование: ср. eine unglückliche [traurige, klägliche, schwache ...] Figur machen [abgeben]. Варьирование прилагательного приводит к соответствующим модификациям значения и перевода.
Корпусы предоставляют богатую информацию о лексическом варьировании идиомы, в том числе помогают выявить возможные лексические варианты идиомы, определить их частотность и, исходя из этих сведений, уточнить форму леммы, а также на основании корпусных данных решить вопрос об объединении в одной статье лексических и синтаксических вариантов одной идиомы, в случае если подобное совмещение лучше
отражает языковую реальность и/или соответствует потребностям пользователя словаря.
Синтаксические модификации идиом (напр., каузативы, инцептивы, конверсивы и т.д.) в словарном проекте было решено рассматривать следующим образом: если данные модификации являлись широко употребительными, они рассматривались в отдельных словарных статьях (ср. in [im] Schwung sein = активизироваться; переживать подъём, in Schwung kommen = активизироваться; приобретать размах; переживать подъём) с ссылками на статьи с другими модификациями. При малой употребительности модификаций они отмечались в комментариях. В качестве примера можно привести идиому aus den Fugen geraten, в статье к которой к ее первому значению 1. выйти аз колеи, сойти [слететь, сорваться] с катушек; разрупииться; прийти в хаос дается следующий комментарий:
Ш Ср. каузативную форму (etiv. А) aus den Fugen bringen.
Особый случай представляли собой идиомы, состоящие из номинативной группы и
часто сочетающиеся с определёнными глаголами. Было решено дать отдельные статьи на
номинативную группу и на наиболее частотные сочетания идиомы с глаголами. Так, для
идиомы ein dickes Fell даются переводные эквиваленты непробиваемость,
толстокожесть, ср.:
fj Gesundheitsministerin Ulla Schmidt ist eine Politikerin mit dickem Fell, doch derzeit dürfte selbst sie vor Zorn im Gesicht rot anlaufen: Eine Krankenkasse nach der anderen verkündet für das nächste Jahr höhere Beiträge. (Mannheimer Morgen, 22.12.2006) Министр здравоохранения Улла Шмидт - толстокожий политик, но даже она должна была бы сегодня рассвирепеть: больничные кассы одна за другой объявляют о повышении взносов в следующем году.
Помимо этого, отдельные статьи даются для широко употребительных модификаций, таких как ein dickes Fell haben: (jmd.) hat ein dickes Fell = (кто-л.) толстокожий; ничем не проймёшь (кого-л.)', ein dickes Fell brauchen: (jmd,) braucht ein dickes Fell = нужно быть толстокожим [непробиваемым] (кому-л.); sich (D) ein dickes Fell zulegen = стать толстокожим [непробиваемым]. В статьях модификаций также приводятся их лексические варианты, например, для ein dickes Fell haben - редко ein dickes Fell besitzen', для sich (D) ein dickes Fell zulegen - редко sich (D) ein dickes Fell anlegen [legen], редко ein dickes Fell entwickeln, редко ein dickes Fell bekommen.
В рассматриваемом случае было бы неверно указывать исходной формой ein dickes Fell haben, как это делают многие словари, а остальные формы считать её модификациями, так как номинативная группа ein dickes Fell является семантически самостоятельной.
К синтаксическим особенностям идиом относится также их взаимодействие с отрицанием. Классифицировать идиомы по отношению к отрицанию можно на основании двух параметров: наличию в словарной формы идиомы отрицания и способности идиомы пропускать отрицание. В случае если идиома в изъявительном наклонении употребляется с отрицанием и употребление без отрицания затруднено, идиома является эксплицитно-негативной. В словаре такие идиомы также по большей части указываются с отрицанием в лемме. В противоположном случае, если идиома употребляется в изъявительном наклонении без отрицания, а ее употребление с отрицанием возможно только в определенных контекстах, о которых речь пойдёт ниже, такая идиома обозначается как эксплицитно-позитивная. Также есть ряд идиом, которые одинаково легко могут употребляться и с отрицанием, и без. Такие идиомы являются негативно-нейтральными. Если эксплицитно-негативная идиома не может использоваться без отрицания, её обозначают как сильную эксплицитно-негативную идиому. Если в определённых контекстах идиома употребляется без отрицания, то - как слабую эксплицитно-негативную. То же самое с эксплицитно-позитивными идиомами. Идиомы, не пропускающие отрицания ни в каких контекстах, обозначаются как сильные эксплицитно-позитивные идиомы. Идиомы, пропускающие отрицание, - как слабые эксплицитно-позитивные идиомы.
По терминологии Е.В. Падучевой, контексты, в которых эксплицитно-позитивные идиомы употребляются с отрицанием, а эксплицитно-негативные - без, являются контекстами снятой утвердительности.
В Словаре мы комментировали возможность употребления эксплицитно-негативных и эксплицитно-позитивных идиом в контекстах снятой утвердительности и употребление с отрицанием для эксплицитно-позитивных и негативно-нейтральных идиом с указанием их формы при отрицании. Классификация по контекстам нами не давалась; так, мы не указывали, присутствует ли в данном контексте императив, цитация, будущее время и т.д. Подобное решение объясняется концепцией Словаря. Он задумывался не как база по идиомам, доступная в онлайн-режиме, а как «бумажный» словарь. Тем не менее, задача проследить, в какого рода контекстах снятой утвердительности употребляется та или иная идиома, представляется нам достойной для дальнейшего, более подробного изучения.
Идиомы обладают дефектной парадигмой, что, в частности, сказывается на употреблении в страдательном залоге. В Словаре комментарии по употреблению в страдательном залоге давались в том случае, если наблюдалось несоответствие между возможностью пассивизации немецкой идиомы и русского перевода. Например, для идиомы kein Haar krümmen (jmdm.) = и пальцем не тронуть (кого-л.), не причинить вреда
16
(кому-л.) дается следующий комментарий:
Ш Также употребляется в страдательном залоге.
U Doch im Ergebnis hat sich das modernste Verkehrssystem der Welt entwickelt, welches seit seiner Einführung im Jahre 1962 rund vier Milliarden Menschen befördert hat, ohne dass auch nur einem ein Haar gekrümmt worden wäre. (Rhein-Zeitung, 07.04.2010)
В результате появилась самая современная транспортная система в мире, которой воспользовались, начиная с eä ввода в эксплуатацию в 1962 г., около 4 миллиардов человек, причём ни один из них не пострадал.
Ряд идиом употребляется предпочтительно в определённых конструкциях, либо в
сочетании с определёнными словами. Подобные случаи отдельно комментировались в
Словаре, так как они важны для понимания семантических и синтаксических
особенностей идиом, и без их знания затруднено верное употребление идиомы при
продуцировании текста. Так, для идиомы mit leeren Händen = с пустыми руками, ни с чем
даётся комментарий:
Ш Употребляется в сочетании с глаголом kommen = прийти с пустыми руками, прийти без подарка. Часто с отрицанием nicht.
Ц Sie waren nicht mit leeren Händen gekommen. Genau 1000 Euro Ubergaben sie im Namen ihres Arbeitgebers an Joachim Sum, den Leiter der Lampertheimer Musikschule. (Mannheimer Morgen, 25.01.2010)
Они пришли не с пустыми руками. От имени своего работодателя они передали ровно тысячу евро Йохиму Зуму, руководителю музыкальной школы в Лампертхейме.
Ш Также употребляется в сочетании с глаголом dastehen = остаться с пустыми руками, остаться ни с чем, ничего не добиться.
IJ Vergangene Woche hat er Führerscheinprüfung gehabt - und nicht bestanden. Er gibt zu: Es war ein doofes Gefühl, durchzufallen. „Zumal ein guter Freund von mir unmittelbar davor den Führerschein bekommen hat. Und ich stehe mit leeren Händen da." (Nach: Hamburger Morgenpost, 16.02.2010)
На прошлой неделе у него был экзамен на водительские права, и он его завалил. Он признает: это отвратительное чувство провалиться на экзамене. «Тем более что прямо незадолго до меня один мой хороший друг получил водительские права. А я остался с пустыми руками».
Так как синтаксическое поведение идиом сильно разнится, их синтаксические особенности, в том числе данные о сочетаемости с другими словами и употреблением в определённых конструкциях, необходимо прописывать для каждой идиомы отдельно.
Корпусный анализ помог выявить случаи синтаксического варьирования и многие синтаксические особенности рассматриваемых идиом, создающие их индивидуальный «профиль». Перспективным видится построение классификации синтаксического варьирования идиом с помощью корпусных данных. Сведения, приводимые в Словаре, затруднительно использовать при построении подробной классификации идиом по синтаксическому варьированию, так как в основе нашей работы лежала несколько иная
цель: предоставить пользователю такое количество информации, какое будет ему необходимо для верного употребления идиомы в речи. Так, возможность употребления немецкой идиомы в страдательном залоге часто комментировалась нами только в случае, если эквивалент на русском языке в страдательном залоге не употребляется.
Важными видятся сведения, даваемые в Словаре о контекстах снятой утвердительности. Данная тема в применении к идиоматике еще довольно слабо разработана, по этой причине информация, полученная из корпусов, могла бы оказаться особенно полезной.
Последним рассматриваемым в диссертационном исследовании видом варьирования является лексико-еинтаксическое. В своей работе мы пользовались классификацией модификаций, имеющейся в работах Д.О. Добровольского. Автор выдвигает гипотезу, согласно которой модификация идиомы является стандартной, если соблюдаются определённые условия, нарушение которых приводит к появлению нестандартных модификаций. Автор останавливается на лексико-синтаксических модификациях и определяет условия, при которых ввод в структуру идиомы прилагательного воспринимается как стандартная модификация:
1) идиома должна быть семантически членима: номинативная группа, подвергающаяся адъективной модификации, должна обладать определенной семантической самостоятельностью;
2) прилагательные не должны семантически противоречить ни актуальному, ни буквальному значению идиомы.
У П.С. Дронова модификации идиом, в которых атрибут противоречит образной составляющей идиомы, но совместим с ее актуальным значением, обозначаются как контекстно-зависимые (напр., за семь вёрст выставочного киселя хлебать). Модификации, при которых вводимое определение противоречит актуальному значению идиомы, но совместимо с её образной основой, именуются модификациями двойной актуализации (напр., родиться в смирительной рубашке), так как в них выражение осмысляется одновременно в двух пластах плана содержания, актуальном и буквальном. Таким образом, контекстно-зависимые модификации и модификации двойной актуализации относятся к нестандартным модификациям.
В Словаре комментировались все случаи лексико-синтаксических модификаций: как атрибутивные модификации идиом, так и адвербиальные модификации. На стандартность модификации по большей части мы эксплицитно не указывали, что связано с форматом словаря, рассчитанным на пользователей без лингвистического образования. В случае нестандартных модификаций, по большей части контекстно-зависимых, давался
18
соответствующий комментарий. В ходе работы выявилось большое количество идиом, подвергающихся в разной степени лексико-синтаксическим модификациям. Ранее получить данные сведения было затруднительно, так как не было достаточного языкового материала. Корпусный анализ помог выявить, помимо способности/неспособности идиом к подобного рода модификациям, также ряды адвербиалов/атрибутов, которые могут выступать в качестве модификаторов для рассматриваемых идиом.
В ходе словарной работы идиомы анализировались нами на наличие морфологического, лексического, синтаксического и лексико-синтаксического варьирования. По результатам этой работы была составлена таблица для 500 идиом, в которой указано, какой из типов варьирования возможен для данной идиомы. Из синтаксического варьирования в таблице (см. Приложение 4) отмечена возможность употребления в контекстах снятой утвердительности, наличие синтаксических модификаций по типу каузативов, инцептивов и т.д., а также такие синтаксические модификации, как трансформация глагольной части в придаточное определительное, эллипсис глагола-связки, преобразование в номинативную группу, употребление в определённой конструкции и т.п.
Целью данного диссертационного исследования не являлось изучение варьирования идиом как такового. Нам важно было показать, какой потенциал кроется в электронных текстовых корпусах для изучения идиоматики языка. По этой причине, таблица с информацией по варьированию идиом нами дополнительно не анализировалась. Она может быть использована в дальнейших исследованиях, нацеленных на изучение варьирования идиом.
В задачи Главы 3 «Семантика идиом и их валентности» входит показать, что варьирование не единственный феномен, в изучении которого корпусы могут помочь фразеологу. Работа с корпусами вскрыла некоторые недостатки в представлении семантики идиом, их валентностей и перевода, имеющиеся в существующих словарях. При этом речь идёт не только об единичных явлениях, но и о некоторых тенденциях в развитии и функционировании идиоматики, которые пока не нашли отражения в словарях.
Наиболее предсказуемым результатом работы с крупными текстовыми корпусами является обнаружение у идиом новых узуальных значений как значений, являющихся абстракцией «от в принципе бесконечного ряда актуальных значений слова в речи»8. Действительно, у ряда идиом были обнаружены значения, отсутствовавшие либо во всех, либо в большинстве консультируемых нами словарей.
8 Кобозева И.М. Лингвистическая семантика. URSS, M., 2009. - 352 с. С. 158.
19
Так, идиома die Gegend unsicher machen объясняется во фразеологическом словаре Дуден9 следующим образом: ugs. scherz, sich zeitweilig an einem Ort aufhalten (разг. шути, пребывать где-л.). В нашем словаре ей даётся объяснение снижен, шутл. шататься, слоняться, соотносимое с вышеприведённым объяснением; также было выявлено дополнительное значение орудовать в округе (о ворах, хулиганах и т.п.), наводить страх на всю округу.
Для некоторых из рассматриваемых нами идиом были обнаружены случаи
употребления в неидиоматическом значении, не являющиеся языковой игрой. Если
возможность буквального прочтения для рассматриваемого словосочетания была очевидна
и употребления в буквальном значении относительно редки, например, для идиомы vom
wilden Affen gebissen sein (букв, «быть укушенным дикой обезьяной»), подобные случаи не
комментировались. В противном случае давался комментарий с указыванием на форму, в
которой идиома употребляется в буквальном прочтении и соответствующий перевод. Так,
для идиомы auf der [einer] falschen Spur sein = нейтр. быть на ложном пути; идти по
ложному следу даётся следующий комментарий:
Ш Эта идиома употребляется гораздо реже антонимичной идиомы auf der richtigen Spur sein. Словосочетание auf der falschen Spur sein в большинстве случаев используется в неидиоматическом значении 'ехать не по той полосе', 'ехать по встречной полосе'.
Также в диссертационном исследовании затрагиваются вопросы, касающиеся перевода идиом. Как отмечает Ф. Кинг, в корпусных исследованиях часто встречается утверждение о том, что одна из функций многоязычного корпуса и конкордансов состоит в том, чтобы подобрать более подходящие переводные эквиваленты для рассматриваемой языковой единицы. Однако возникает вопрос, какие из эквивалентов, полученных таким образом, необходимо отразить в словаре, так как многие из них в высокой степени зависят от контекста. Решение данного вопроса во многом интуитивно. Лексикографу необходимо ориентироваться скорее на систему языка и определять, возможен ли некоторый вариант перевода для идиомы вне контекста (например, в зоне перевода словарной статьи) либо же рассматриваемый вариант перевода возможен лишь в строго определённом контексте.
Перевод контекстов употребления идиомы во многих случаях помог найти хороший переводной эквивалент, отсутствовавший в существующих немецко-русских словарях. Так, для идиомы das Gras wachsen hören: (jmd.) hört das Gras wachsen в словаре Д.Г. Мальцевой10 даются эквиваленты на два аршина в землю видеть, видеть всё наперёд. В
9 Duden. Redewendungen. Wörterbuch der deutschen Idiomatik. Wörterbuch der deutschen Idiomatik. Mannheim, 2008.
10 Мальцева Д.Г. Немецко-русский словарь современных фразеологизмов. «Русский язык-Медиа», 2004.
20
Словаре приводятся следующие эквиваленты: das Oras wachsen hören: (jmd.) hört das Gras wachsen = ирон. (кто-л.) видит на три аршина в землю (кто-л. воображает себя сверхпроницательным, тж. кто-л. сверхосторожен, букв, кто-л. слышит, как растёт трава); (кто-л.) мнит себя сверхпроницательным.
Помимо непосредственной корректировки перевода, для некоторых идиом показалось необходимым добавить комментарий к переводу. Часто комментарий добавлялся в случае употребления идиомы с факультативной валентностью, влияющей на выбор переводного эквивалента. Так, для идиомы auf der richtigen Fährte sein: (jmd.) ist auf der richtigen Fährte = (кто-л.) идёт по верному следу [пути]; (кто-л.) идёт верным курсом; (кто-л.) на верном пути был дан следующий комментарий:
Ю При наличии валентности mit etw. D идиома может переводиться как не ошибиться (с чем-л. ), не прогадать (с чём-л.).
Может возникнуть вопрос, в какой мере подобные комментарии связаны с корпусным анализом. Сложности, возникающие при переводе фразеологических единиц, в частности идиом, рассматриваются в обширной литературе (напр. у В.Н. Комиссарова, C.B. Тюленева, И.С. Алексеевой), не связанной напрямую с корпусной лингвистикой. Тем не менее составление вышеприведённых комментариев по переводу для Словаря стало возможным именно благодаря анализу большого количества контекстов, предоставленных корпусами, поэтому они также рассматриваются как результат корпусной работы над идиоматикой. «
Корпусный анализ оказывается полезным не только при изучении варьирования
идиом, но и при рассмотрении их семантики. В ходе работы удалось обнаружить значения,
которые были не зафиксированы в существующих словарях. Среди них есть значения,
воспринимаемые носителями скорее как стандартные употребления идиомы, например,
новые значения с субъектной валентностью etw as. Так для идиомы vor sich hin dämmern:
(jmd., etw.) dämmert vor sich hin было обнаружено значение (что-л.) пребывает в
запустении; (что-л.) заброшено:
Д Von den 17 ООО Ausstellungsstücken können aus Platzgründen nur 4000 öffentlich gezeigt werden. „Die übrigen Objekte dämmern in Magazinen vor sich hin" (Nach: Hannoversche Allgemeine, 02.07.2008)
Из 17000 экспонатов демонстрируются только 4000 из-за недостатка площадей. Остальные экспонаты пылятся в хранилищах».
Также были зафиксированы значения, которые идиома приобретает в спортивном дискурсе, и вне его воспринимаемые скорее как окказиональные либо неправильные. К примеру, для идиомы den Faden verlieren: (jmd.) verliert den Faden было обнаружено
значение (в спортивных контекстах) игра расклеилась (у кого-л.); (кто-л.) упустил инициативу.
Щ In den ersten 15 bis 20 Minuten hatten wir das Spiel unter Kontrolle. Dann aber
haben wir den Faden verloren. (Hamburger Morgenpost, 30.06.2008)
Первые 15-20 минут мы контролировали ситуацию на поле. А потом мы упустили
инициативу.
Изучение корпусных данных также помогло в подборе более точных переводных эквивалентов идиом и обнаружению возможных переводческих трудностей при определённых контекстных условиях.
В Словаре присутствует также ряд уточнений, касающихся валентностей идиом. В ряде случаев это не столько результат новой информации, полученной из корпусов, сколько результат недоработки в существующих словарях. В первую очередь, это касается указания на валентности идиомы, которое отсутствует во многих словарях, хотя может быть выведено из приведённых там примеров. Помимо эксплицитного указания на валентности идиом, в Словаре также даются комментарии по возможному заполнению валентностей. Для ряда идиом, употребляющихся с субъектной валентностью jemand, была выявлена возможность метонимических сдвигов. Также давались комментарии по лексическому заполнению валентностей. Если по корпусным данным обнаруживалось, что валентность предпочтительно заполняется определёнными словами, в зоне комментария статьи приводился их список. Определенная тенденция обнаружилась с игнорированием валентности etwas, выступающей в качестве субъектной либо объектной. Для ряда идиом данная валентность и соответствующее значение идиомы не были указаны в существующих словарях. Возможно, это связано с тем, что употребление с данной валентностью является относительно новым и ещё не воспринимается носителями языка как типичное для этой идиомы.
В Заключении подводятся итоги диссертационного исследования, а также намечаются перспективы дальнейшего изучения вопроса. Подчеркивается, что появление текстовых электронных корпусов открывает новые возможности перед лексикографией, и в частности фразеографией. С помощью корпусного анализа может быть дан ответ на многие вопросы, возникающие при составлении статей для фразеологических словарей, например: есть ли у идиомы варианты, какой из вариантов наиболее частотен и должен быть вынесен в лемму, какие валентности и морфо-синтаксические ограничения есть у фразеологизма. Проводимый компьютером статистический анализ лексической комбинаторики помогает также раскрыть особенности сочетаемости идиом либо выявить фразеологические единицы, ещё не зафиксированные в словарях.
В ходе исследования была получена информация о широком варьировании компонентного состава некоторых идиом. Пока не представляется возможным объяснить, почему некоторые идиомы в большей степени склонны к модификациям, другие -практически им не подвергаются. Тем не менее корпусы помогают приблизиться к этому пониманию.
Помимо информации о варьировании идиом, в ходе работы были получены новые сведения о семантике, переводе и валентностях идиом. Частично отсутствие этих сведений в имеющихся словарях говорит о недоработках, и восполнение этой информации было бы возможно и без консультации с корпусами. Тем не менее именно наличие большого количества контекстов в электронных корпусах помогло выявить новые узуальные значения, не зафиксированные в словарях, обнаружить возможное варьирование валентностей, определить, как валентности могут заполняться, а также подобрать более подходящий переводной эквивалент.
Дальнейшее изучение вариативности идиом с созданием крупной базы данных на основе электронных корпусов и при наличии продуманной классификации модификаций могло бы помочь в систематизации и научном обобщении знаний о соотношении между фиксированностью идиом и степенью их варьирования.
Результаты и выводы, полученные в ходе исследования, нашли отражение в следующих публикациях:
1. Кратова Е.Б. Корпусный подход к фразеографии // Вестник МГУ. Сер. 19. Лингвистика и межкультурмая коммуникация, 2011. № 4. С. 153-160.
2. Кротова Е.Б. Фразеографические проекты в корпусной лингвистике // Сборник трудов молодых ученых. Вып. VI / Моск. гос. ун-т им. М.В. Ломоносова, фак-т иностр. яз. и регионоведения; [отв. ред. П.И. Сергиенко] -М.: КДУ, 2010. - 136 с. С. 24-30.
3. Машиночитаемые корпуса текстов во фразеографическом исследовании на материале немецкого языка // Материалы докладов XVII Международной конференции студентов, аспирантов и молодых ученых «Ломоносов» / Отв. ред. И.А. Алешковский, П.Н. Костылев, А.И. Андреев, A.B. Андриянов. [Электронный ресурс] - М.: МАКС Пресс, 2010.
4. Фразеографические проекты в корпусной лингвистике // Материалы докладов XVIII Международной конференции студентов, аспирантов и молодых ученых «Ломоносов» / Отв. ред. А.И. Андреев, A.B. Андриянов, Е.А. Антипов, М.В. Чистякова. [Электронный ресурс] - М.: МАКС Пресс, 2011.
5. Кротова Е.Б. Электронные языковые корпусы как источник новой информации о фразеологических единицах» // Материалы докладов XIX Международной
23
конференции студентов, аспирантов и молодых ученых «Ломоносов» / Отв. ред. А.И. Андреев, A.B. Андриянов, Е.А. Антипов, К.К. Андреев, М.В. Чистякова. [Электронный ресурс] - М.: МАКС Пресс, 2012. 6. Кротова Е.Б. Семантика идиом немецкого языка на основе корпусного анализа // Материалы докладов XX Международной конференции студентов, аспирантов и молодых ученых «Ломоносов» / Отв. ред. А.И. Андреев, A.B. Андриянов, Е.А. Антипов, К.К. Андреев, М.В. Чистякова. [Электронный ресурс] - М.: МАКС Пресс, 2013.
Подписано в печать: 11.04.2013 Объем 1,0 п.л Тираж 50 экз. Заказ № 63 Отпечатано в типографии «Реглет» 119606, г. Москва, пр-т Вернадского, д. 39 (495) 363-78-90; www.reglet.ru
Текст диссертации на тему "Корпусная фразеография"
МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ИМЕНИ М.В. ЛОМОНОСОВА
На правах рукописи
04201356219
Кротова Елена Борисовна
КОРПУСНАЯ ФРАЗЕОГРАФИЯ (НА МАТЕРИАЛЕ НЕМЕЦКОГО ЯЗЫКА)
Специальность 10.02.04 - германские языки
Диссертация на соискание ученой степени кандидата филологических наук
Научный руководитель кандидат филологических наук, доцент Т.В. Филипенко
МОСКВА-2013
ОГЛАВЛЕНИЕ
ВВЕДЕНИЕ..............................................................................................................5
Глава 1. Корпусный подход к изучению идиоматики.......................................11
1.1. Понятие корпуса..........................................................................................11
1.2. Понятие корпусной лингвистики...............................................................15
1.3. Эмпирический подход в лингвистике.......................................................19
1.3.1. Отношение к языковым данным в разных направлениях лингвистики ..............................................................................................................................20
1.3.2. Роль языковых данных в практических и теоретических исследованиях.....................................................................................................29
1.3.3. Оценка роли языковой интуиции............................................................32
1.4. Корпусная фразеография............................................................................38
1.5. Корпус для фразеографических исследований........................................50
1.6. Проблемы при работе с корпусом.............................................................55
Выводы по Главе 1.............................................................................................58
Глава 2. Виды варьирования идиом.....................................................................60
2.1. Морфологическое варьирование...............................................................63
2.1.1. Варьирование артикля..........................................................................63
2.1.2. Употребление без дативного -е...........................................................68
2.2. Лексическое варьирование и лексические особенности.........................70
2.2.1. Градация вариантов по употребительности.......................................71
2.2.2. Уточнение формы леммы.....................................................................75
2.2.3. Новые варианты идиом, не зафиксированные в словарях................76
2.2.4. Совмещение в одной статье вариантов идиом, рассматривающихся некоторыми словарями как две разные идиомы..........................................78
2.3. Синтаксическое варьирование и синтаксические особенности идиом. 81
2.3.1. Употребление идиом с отрицанием....................................................85
2.3.2. Употребление в страдательном залоге................................................97
2.3.3. Особенности сочетаемости................................................................101
2.3.4. Прочие синтаксические модификации и особенности...................107
2.4. Лексико-синтаксическое варьирование..................................................110
2.4.1. Адвербиальные модификации...........................................................114
2.4.1.1. Стандартные адвербиальные модификации.................................114
2.4.1.2. Нестандартные адвербиальные модификации.............................120
2.4.2. Атрибутивные модификации.............................................................122
2.4.2.1. Стандартные атрибутивные модификации...................................122
2.4.2.2. Нестандартные атрибутивные модификации...............................123
2.4.3. Металингвистические модификации................................................126
Выводы по Главе 2........................................................................................127
Глава 3. Семантика идиом и их валентности....................................................129
3.1. Новые узуальные значения.......................................................................129
3.2. Комментарии по неидиоматическому и слабоидиоматическому употреблению...................................................................................................133
3.3. Корректировка перевода...........................................................................134
3.4. Комментарии по переводу........................................................................140
3.5. Эксплицитное указание на валентности.................................................143
3.6. Комментарии по заполнению валентности............................................145
3.7. Добавление новой валентности как равнозначного или более редкого варианта.............................................................................................................150
3.8. Указания на орфографические особенности..........................................153
Выводы по Главе 3...........................................................................................154
ЗАКЛЮЧЕНИЕ....................................................................................................156
3
Список источников литературы.........................................................................159
Приложение 1. Список идиом после проверки частотности по корпусам.... 171
Приложение 2. Описание формата словаря......................................................177
Приложение 3. Словарные статьи......................................................................180
Приложение 4. Варьирование идиом.................................................................279
ВВЕДЕНИЕ
В одной из речей, произнесённых знаменитым британским писателем Джорджом Бернардом Шоу, прозвучала замечательная фраза: „ Science сап never solve опе problem without raising ten more problems" [Shaw 1963: 83], -наука не в силах ответить ни на один вопрос, не поставив при этом десятка новых. Данное утверждение отражает ситуацию, часто возникающую при развитии науки, когда ответ на один вопрос порождает такие вопросы, о которых раньше учёные даже не задумывались. Действие этого принципа хорошо прослеживается и на примере корпусной лингвистики: появление электронных корпусов текстов и развитие программ по работе с ними сделало возможным постановки таких задач, которые раньше виделись лингвистам технически невыполнимыми и/или не представляющими интереса.
В настоящей диссертационной работе будет рассмотрен вопрос о том, какую новую информацию об идиоматике языка можно получить с помощью электронных текстовых корпусов и каким образом применение корпусных методов отражается на фразеографической практике. Корпусная фразеография понимается нами, в первом приближении, как фразеографическая практика, чьей эмпирической базой являются электронные текстовые корпусы.
В центре нашего внимания находятся идиомы как центральная часть фразеологической системы языка. Определения понятию ИДИОМА давались учёными самые разные, но неизменно в той или иной формулировке отмечается фиксированность состава идиом и их устойчивость ([Виноградов 1946, 1972; Шанский 1985; Чернышева 1970; Гак 1977, 2010; Burger 1998; Fleischer 1997, Иорданская, Мельчук 2007])В данной работе под идиомами
' Многие из выше указанных авторов не употребляют термин «идиома». Так, по терминологии В.В. Виноградова большая часть идиом соотносится с фразеологическими сращениями и фразеологическими единствами. У И.И. Чернышевой идиомы обозначаются как собственно фразеологизмы. У В.Г. Гака - как идиоматические словосочетания.
понимаются «сверхсловные образования, которым свойственна высокая степень идиоматичности и устойчивости» [Баранов, Добровольский 2008: 57]. Фиксированность компонентного состава, тем не менее, не исключает возможности определённых модификаций идиом. Речь идёт не только о модификациях с целью создания языковой игры (ср. напр. [Тер-Минасова 2007: 67]), но и о стандартных модификациях, которым могут подвергаться идиомы. Так, работа с электронными текстовыми корпусами представляет многочисленные доказательства возможности модификаций идиом, включающих в себя лексическое, синтаксическое и иные виды варьирования.
В связи с развитием компьютерных технологий и повышением доступности электронных корпусов, растёт их использование при составлении новых словарей и при создании обновлённых версий уже существующих. Однако возникают вопросы, в какой мере корпусы используются, являются ли они (1) просто базой для поиска иллюстративных примеров или (2) получаемые из них эмпирические данные корректируют имеющиеся сведения и добавляют новую информацию об изучаемом языковом явлении. Если словарная работа ведётся в рамках корпусной лингвистики, то ответом может быть только второй из вышеуказанных вариантов. Растущим значением электронных текстовых корпусов для лексикографической, и в частности фразеографической, практики объясняется актуальность данной работы.
Объектом данного диссертационного исследования являются контексты, содержащие идиомы. Контексты взяты из электронных текстовых корпусов, находящихся в открытом доступе. В основном нами использовались архивы корпусов Института немецкого языка в г. Мангейме.
Предметом настоящего исследования является реализация корпусного подхода во фразеографии с учётом новой информации, которую корпусы предоставляют об идиоматической системе немецкого языка.
Цель диссертационного исследования состоит в получении новой информации об идиоматике немецкого языка с помощью электронных текстовых корпусов, в том числе о варьировании идиом и их семантике.
Достижение поставленной цели предполагает решение следующих задач:
- определить наиболее подходящие для фразеографических исследований на материале немецкого языка электронные текстовые корпусы;
- рассмотреть, что должно пониматься под корпусным подходом в лингвистике и, в частности, фразеографии, и, следовательно, как должна протекать работа с корпусными данными;
- выделить список употребительных идиом немецкого языка, которые будут подвергаться корпусному анализу;
- проанализировать контексты с употреблениями рассматриваемых идиом в выбранных электронных корпусах;
- выявить случаи варьирования данных идиом;
- проанализировать, какие новые сведения о семантике, валентностях и переводе рассматриваемых идиом можно получить из корпусов;
- предоставить обзор и анализ новой информации, полученной об идиоматике немецкого языка благодаря электронным корпусам.
Материалом исследования явились более 500 употребительных идиом немецкого языка, содержащихся в словаре [Добровольский 1997] и списке идиом из монографии [ОоЬгоуоГзку 1997], которые были дополнительно проверены по корпусам на частотность. Для данных идиом анализировались контексты из электронных корпусов, в основном из архивов корпусов Института немецкого языка в г. Мангейме, в среднем около 100 контекстов на идиому.
Основным методом исследования является метод корпусного анализа, под которым понимается анализ материалов корпусов, содержащих исследуемый языковой феномен, с целью получения соответствующей новой информации и обязательным учётом всех примеров, в том числе противоречащих имеющимся сведениям. Для описания значения исследуемых идиом применялись методы толкования и перевода.
Информационной базой исследования послужили материалы монографий, учебных пособий, диссертаций, статей и словарей (в общей сложности, 130 источников, из них 64 на русском языке и 66 на немецком и английском языках).
Новизна исследования заключается в том, что впервые на обширном идиоматическом материале показано значение электронных текстовых корпусов для фразеографии; анализируется, в чём заключается корпусный подход в применении к фразеографии; подробно описываются обнаруженные у идиом виды и способы варьирования, а также обобщаются новые сведения, полученные о семантике идиом и их переводе.
Теоретическая значимость исследования заключается в рассмотрении корпусного подхода во фразеографии с описанием его значения для исследования идиоматической системы немецкого языка. Полученные сведения об идиомах могут быть использованы при верификации гипотез, касающихся свойств идиом, а также при разработке и корректировке фразеологических теорий.
Практическая ценность исследования заключается в том, что в результате корпусного анализа рассматриваемых идиом были созданы словарные статьи, вошедшие в состав находящегося в публикации немецко-русского фразеологического словаря. Сведения, полученные о варьировании идиом, их семантике и переводе, а также контексты и словарные статьи с соответствующими употреблениями идиом могут быть использованы на лекционных и семинарских занятиях по лексикологии, лексикографии, фразеологии и переводу.
Структура работы. Диссертация состоит из введения, трёх глав, заключения, списка использованной литературы и четырёх приложений. В Главе 1 содержится обзор литературы, посвященной корпусной лингвистике и корпусному подходу во фразеографии. В Главах 2 и 3 рассматриваются результаты корпусного анализа употребительных немецких идиом. Глава 2 посвящена видам варьирования идиом, в том числе морфологическому, лексическому и синтаксическому варьированию. В Главе 3 рассматривается семантика идиом и их валентности. В Приложении 1 представлен список употребительных идиом немецкого языка, полученный при сравнении словников двух немецко-русских фразеологических словарей и последующей проверке на частотность данных идиом в корпусах. В Приложении 2 приводится описание формата словаря, в соответствии с которым оформлены словарные статьи, приводящиеся в диссертации. В Приложении 3 даются словарные статьи, частично приведённые в основном тексте диссертационного исследования. В Приложении 4 приводится таблица, в которой отражено, каким видам варьирования могут подвергаться проанализированные идиомы.
На защиту выносятся следующие положения:
1. Использование электронных текстовых корпусов может повысить объективность проводимого лингвистического исследования за счёт расширения его эмпирической базы, позволяющего прийти к более точным выводам.
2. Исследование является корпусным, если существующая у лингвиста перед началом работы гипотеза подвергается проверке эмпирическими фактами, полученными методом корпусного анализа.
3. К корпусной лингвистике относятся базирующийся на корпусах (согрш-Ьазес!) и направляемый корпусами (согрш-ёпуеп) подходы; при этом оба они являются эмпирическими. Сам корпусный подход в сфере идиоматики подразумевает не только получение данных об
употребительности идиом и их партнёрах по сочетаемости, но и
9
исследование семантических, синтаксических и прагматических особенностей идиом на материале корпусов.
4. Корпусы представляют неопровержимые доказательства вариативности компонентного состава идиом. Пока не совсем понятны причины, по которым некоторые идиомы в большей степени склонны к модификациям, другие - практически им не подвергаются. Дальнейшее изучение вариативности идиом на материале электронных корпусов могло бы помочь в систематизации и научном обобщении знаний о модификациях.
Апробация работы. Результаты данного исследования были обобщены в докладах, сделанных на Международных конференциях студентов, аспирантов и молодых ученых «Ломоносов» (М., 2010; 2011; 2012; 2013) и на конференции «Актуальные проблемы немецкого языкознания и методика преподавания современного немецкого языка» (М., 2012). По теме диссертации опубликовано 6 работ в научных сборниках.
Глава 1. Корпусный подход к изучению идиоматики
1.1. Понятие корпуса
Как часто бывает, лингвисты вкладывают разное значение в термин «корпус». Рассмотрим, какие определения предлагаются исследователями, особое внимание при этом уделяя электронным корпусам.
Под термином «корпус» может пониматься набор однородных текстов, т.е. текстов, относящихся к одной области, написанных и употребляемых одним типом людей при схожих обстоятельствах ("The term 'corpus' denotes a set of homogeneous texts, i.e. texts covering the same field, written and used by the same type of people and under similar conditions" [Cardey et al. 2003: 247]).
Похожее определение даётся у Дж. Синклера: корпус как собрание текстов, имевших место в коммуникации и не сконструированных специально для целей исследования, которое характеризует тот или иной вариант языка ("a corpus is a collection of naturally-occurring language text, chosen to characterize a state of variety of a language" [Sinclair 1991: 171]). Термин вариант языка содержательно близок здесь понятию «набор однородных текстов» из определения С. Кардей. В определении Дж. Синклера подчеркивается важная черта эмпирического подхода в лингвистике: изучается «реальный» языковой материал, а не сконструированный непосредственно исследователем (подробнее см. главу 1.3).
Корпусы текстов в данном понимании как лингвистический ресурс использовались давно. К. Фельбаум отмечает, что, понимая под корпусом некое собрание текстов, одним из первых корпусных лексикографов можно было бы назвать Самюэля Джонсона, а первым словарем, базирующемся на корпусе текстов, его "Dictionary of the English Language", вышедший в 1755 г. В данном словаре в качестве иллюстративного материала использовано около 114000 примеров из литературных источников. Однако, как отмечает Ф. Кермод (Kermode 2006, цитируется по [Fellbaum 2007: 7]), словарь имеет в
целом прескриптивный характер, что отличает его от дескриптивного подхода, принятого в современных корпусных исследованиях.
В данной работе речь пойдёт не о корпусах текстов в целом, а об их определённом типе - электронных текстовых корпусах как корпусах, имеющих огромный потенциал для лексикографии.
Посмотрим, какие определения корпусов, в т.ч. электронных, можно найти у отечественных исследователей.
Корпус некоторого языка - собрание текстов на данном языке, представленное в электронном виде и снабжённое научным аппаратом (разметкой) [Плунгян 2005: 6]. Обе названные характеристики - электронная форма и наличие разметки - основное, что отличает электронные текстовые корпуса, с одной стороны, от текстовых (традиционных)