автореферат диссертации по филологии, специальность ВАК РФ 10.02.21
диссертация на тему:
Формализованное описание структуры лексико-семантического поля глаголов деятельности для компьютерного идеографического словаря типа WordNet

  • Год: 2007
  • Автор научной работы: Ушакова, Анастасия Александровна
  • Ученая cтепень: кандидата филологических наук
  • Место защиты диссертации: Санкт-Петербург
  • Код cпециальности ВАК: 10.02.21
450 руб.
Диссертация по филологии на тему 'Формализованное описание структуры лексико-семантического поля глаголов деятельности для компьютерного идеографического словаря типа WordNet'

Полный текст автореферата диссертации по теме "Формализованное описание структуры лексико-семантического поля глаголов деятельности для компьютерного идеографического словаря типа WordNet"

САНКТ-ПЕТЕРБУ РГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ На правах рукописи

Ушакова

Анастасия Александровна

ФОРМАЛИЗОВАННОЕ ОПИСАНИЕ СТРУКТУРЫ ЛЕКСИКО-СЕМАНТИЧЕСКОГО ПОЛЯ ГЛАГОЛОВ ДЕЯТЕЛЬНОСТИ ДЛЯ КОМПЬЮТЕРНОГО ИДЕОГРАФИЧЕСКОГО СЛОВАРЯ ТИПА

\VORDNET

(на материале русского языка)

Специальность 10.02.21 - ((Прикладная и математическая лингвистика»

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата филологических наук

Санкт- Петербург 2007

003070219

Работа выполнена на филологическом факультете Санкт-Петербургского государствен лого университета.

Научный руководитель кандидат филологических наук( доцент Ирина Владимировна Азарова

Официальные оппоненты доктор филологических наук, профессор Галина Николаевна Ку стога

Ведущая организация ГосудЕ<рственное образовательное учреждение высшего

профессионального образования Российский государственный педагогический университет им. А.И.Герцена

диссертационного совета Д 212.232.23 по защите диссертаций на соискание ученой степени доктора филологических наук при Санкт-Петербургском государственном университете (199034, Санкт-Петербург, Университетская набережная, д. 7/9), ауд. ___

С диссертацией можно ознакомиться в научной библиотеке им. М. Горького Санкт-Петербургского государственного университета (Санкт-Петербург, Университетская набережная, д. 7/9).

кандидат филологических наук, старший научный сотрудник Екатерина Юрьевна Ваулина

Защита состоится «¿4» '--Ц А я ____200 _рт. в

часов на заседании

Автореферат разослан « У»

200 / г.

Ученый секретарь диссертационного cobi

доктор филологических наук профессор П.А. Скрелин

Общая характеристика работы

В современном языкознании утвердилось представление о системной организации лексического уровня языка Исследованию и описанию лексики - этой многоуровневой, сложно организованной системы - посвящены работы таких выдающихся ученых, как Ю Д Апресян, Л М Васильев, В Г Гак, Ю Н Караулов, Э В Кузнецова, М В Никитин, ЕВ Падучева, А А Уфимцева, ДН Шмелев, сформировавших отечественную школу семантических исследований Одним из базовых методологических подходов к представлению лексики как внутренне организованной совокупности, элементы которой существуют в тесной взаимосвязи и взаимоопределяют друг друга, является метод анализа лексико-семаятических полей Их формализованное описание может являться основой построения словарных систем, представляющих семантический уровень языка Реферируемая работа посвящена описанию структурных взаимосвязей, существующих в лексико-семантическом поле глаголов деятельности в контексте построения компьютерного тезауруса ЯчввКе! (Азарова, Митрофанова, Синопальникова 2003)

Актуальность исследования определяется необходимостью развития представлений, связанных с полевым методом, для его использования в качестве основы для построения компьютерного идеографического словаря ЯцвзЫе^ включающего информацию о парадигматических связях Выбор глаголов деятельности в качестве предмета исследования обусловлен тем, что этот пласт глаголов пока остается в стороне от систематизирующих описаний, что, в свою очередь, объясняется диффузным характером категориального значения деятельности, лишенного четко очерченных границ и прозрачной внутренней структуры В то же время тот факт, что это значение присутствует у высокочастотных глаголов, указывает на очевидную необходимость включения этой совокупности в состав интегрального описания

Целью исследования является создание структурного описания ядра лексико-семантического поля глаголов деятельности русского языка и выявление основных закономерностей в их взаимодействии с лексическим окружением, существенных для дальнейшего описания поля

Указанная цель предполагает решение следующих задач исследования

1) рассмотрение теории лексико-семантического поля с выделением базовых принципов методологии его построения в контексте обработки подмножества глаголов для представления в тезаурусе Ил^Ке^

2) анализ специфических особенностей категориального значения деятельности,

3) отбор и контекстный анализ глаголов, реализующих значение деятельности, с вьивлением парадигматических связей.

Научная новизна исследования состоит

• в использовании комплексного подхода к анализу и последующему описанию лексико-семантического поля как базового компонента компьютерного тезауруса КиввКе^

• в выполнении анализа категории деятельности применительно к ее использованию в качестве полеобразующего значения,

• в оформлении модели семантического поля глаголов деятельности путем представления системы параметров категориального значения

Теоретическая значимость исследования

Теоретическая значимость диссертационной работы заключается

• в адаптации метода лексико-семантического поля к задачам формирования тезауруса ЛиввЫе!

• в выявлении параметров и структуры категории деятельности, существенных для создания формализованного словарного представления

Научная достоверность результатов исследования

Научная достоверность результатов работы обеспечивается использованием случайных выборок из объемного и репрезентативного корпуса текстов в качестве материала для контекстного анализа, количеством контекстов, проанализированных для каждого значения, всесторонним обоснованием категории деятельности Практическая значимость работы

Практическая значимость работы состоит в том, что одним из ее результатов является создание описания структуры лексико-семантического поля глаголов деятельности в формате, адаптированном для включения глагольных значений и их связей в компьютерный тезаурус Кл^зИе! Апробация работы

Основные положения и результаты исследования обсуждались на XXX научно-методической конференции преподавателей и аспирантов филологического факультета СПбГУ (1-17 марта

2001 года), XXXI научно-методической конференции преподавателей и аспирантов филологического факультета СПбГУ (11-16 марта 2002 года), изложены в трех публикациях Структура работы

Диссертация состоит из введения, трех глав, заключения, списка использованной литературы

Содержание и основные результаты исследования

Во введении обосновывается актуальность и необходимость структурирования семантической информации, содержащейся в языке, и систематизации представлений, существующих на этот предмет Это положение иллюстрируется последовательной реализацией проекта по созданию компьютерного тезауруса \VordNet (РеИЪаит 1998) (по существу прототипа тезауруса ЯизвЫе!, подлежащего развитию применительно к русскому языку) Приводятся краткие сведения по структуре КивзЫе! (а) и состоянию ее разработки (б) На основании оценки (а) и (б) формулируется заключение о том, что одной из актуальных «точек роста» системы является формализация и структурирование лексико-семантического поля глаголов деятельности, поскольку деятельность по существу служит стержнем активной формы существования (бытия) человека Представляется естественным, что эта группа глаголов выступает в качества одной из ключевых в интегральном поле языка, при этом она конкретизирует взаимодействие субъекта (человека) с окружающей действительностью (обществом, природой, материальными и интеллектуальными артефактами) В этой связи формализованное описание структуры лексико-семантического поля глаголов деятельности может рассматриваться как один из структурообразующих факторов языка как целого

Отдавая себе отчет в масштабности задачи (скорее, проблемы «человек-окружающая действительность») автор счел целесообразным выполнить ограниченный внутриязыковой анализ группы глаголов деятельности лингвистическими средствами, полагая, что таким образом может быть структурирована по крайней мере одна грань (проекция в сознании) взаимодействия «субъект-окружение» Таким образом, целью работы являлось создание структурного описания ядра лексико-семантического поля глаголов деятельности русского языка и выявление на материале анализа 74 значений глаголов деятельности, реализующихся в 2959 контекстах, основных закономерностей и коррелятивных зависимостей, значимых для дальнейшего описания поля

Таким образом, в качестве основы методологического подхода автором использовалось построение и анализ лексико-семантических полей - их структуры, принципов организации и особенностей применительно к полю глаголов деятельности В ходе работы над проблемой обнаружилось, что для полноценного (всестороннего) ее освещения необходимо привлечение дополнительных представлений, в частности из области психологии, в плане взаимодействия семантического и экстралингвистического отражения категории деятельности, а также сравнительная оценка и конкретизация (применительно к контексту данной работы) некоторых теоретических положений Это определило перечень тактических задач, подлежащих освещению в работе

В соответствии с вышеизложенным в главе 1 рассматривается краткая история и логика развития представлений о семантических полях и их роль в осмыслении системной организации лексического уровня языка При этом отдельное внимание уделяется взаимосвязи и противопоставлению концептуальной и языковой картины мира В основе противопоставления лежит субъективное восприятие действительности носителем языка При этом отмечается, что системность является качеством, органически присущим языковой картине мира как отраженной в языке совокупности представлений о мире данного языкового коллектива Методом, позволяющим выявить эту системность, не нарушая ее специфики, является метод поля

В качестве узловых моментов развития теории семантического поля рассмотрены и проанализированы представления Й Трира, Л Вайсгербера и В Порцига, а также таких современных авторов, как ЮД Апресян, Л Г Бабенко, ЛМ Васильев, Р.М Гайсина, В Г Гак, Э В Кузнецова, А А Уфимцева, Д Н Шмелев Подход, основы которого были заложены Й Триром, получил название логического или концептуального, так как в своем анализе он опирался на абстрактное членение языка на понятийные сферы В соответствии с этим подходом, объектом анализа выступает понятийная сфера, которой соответствует некое словесное поле, само слово и его значение не анализируются В противовес этому, при лингвистическом подходе, к которому тяготел В Порциг, внимание исследователя сосредоточено на сочетании слов в контексте, исследуются связи слов и их значения

Далее картина дополняется современными представлениями В частности, рассмотрены и сопоставлены разнообразные семантические классы слов (лексико-семантическая парадигма, синонимический ряд, лексико-семантическая группа), которые представлены как содержательное расширение и детализация идеи семантического поля в смысле Трира, при этом это поле скрепляется парадигматическими отношениями В качестве

базового принципа внутренней организации поля предложено использовать радиально-цепочечный принцип, сформулированный ЮД Апресяном (Апресян 1995) При этом цепочкам внутри поля соответствуют синонимические ряды или синсеты (в терминологии WordNet), на которых задаются радиальные взаимосвязи, соответствующие родовидовым отношениям

В методическом плане особое внимание уделено подходам к описанию поля Рассматриваются ономасиологический (от содержания - к выражению, от понятия - к слову) и семасиологический (от звучания - к содержанию, от слова - к понятию) подходы и наиболее плодотворным признается комплексный подход, учитывающий как внутреннюю, так и внешнюю организацию поля и предполагающий следующие этапы его разработки

1 На основе экстралингвистического анализа выделяется некое понятие, и в соответствие ему подбираются все единицы языка, способные его выразить и передать.

2 Проводится содержательный анализ выбранных языковых единиц, выделение структурно-семантических особенностей слова (выявление структуры значений), описание отношений между группами, оформляющимися внутри лексико-семантического поля

В качестве единицы анализа и конструктивных элементов поля предлагается использовать лексико-семантические варианты (значения) слов, что представляется естественным следствием многозначности рассматриваемых глаголов

Подход Порцига, примененный на уровне лексемы, позволяет дополнительно обосновать ее фрагментацию, заключающуюся в выделении отдельных значений слова (ЛСВ) с привлечением, в том числе, анализа его синтаксической сочетаемости Кроме того, анализ направленных (векторных) отношений соподчинения, являющихся скрепляющей основой поля Порцига, помогает осуществить детальный анализ совокупности, составляющей парадигматическое поле Трира В итоге получается некий объект, представляющий собой один из видов парадигматических полей, а именно, лексико-семантическое поле

В результате констатируется, что ни одна из схем по отдельности не позволяет дать полное и всестороннее описание совокупности глаголов деятельности В этой связи автором осуществлен синтез, результатом которого явилось понятие лексико-семантического поля, единицами которого являются лексико-семантические варианты, а структурной основой -радиально-цепочечный принцип его организации При этом определяются отдельные этапы разработки поля и делается выбор в пользу комплексного анализа значения слова,

подразумевающего как обращение к словарным дефинициям, так и учет данных контекстного анализа Последний в рамках полевого метода повышает степень проработанности значений элементов поля и подкрепляет аргументацию, использующуюся при задании связей на элементах поля

Таким образом, был сформирован базовый инструментарий, необходимый и достаточный для формирования, анализа и описания специфических связей в рамках лексико-семантического поля глаголов деятельности

В главе 2 подробным образом интерпретируются и анализируются характеристики предмета исследования (совокупности глаголов деятельности) и задающей его категории Важнейшим этапом анализа на исходной стадии является выделение категории деятельности, предполагающее ее разграничение с категорией действия

Необходимость такого разграничения обусловливается тем, что категорию деятельности следует признать присутствующей в объективной действительности как категорию, обобщающую понятие действия во всех вариантах его проявления Это утверждение подкрепляется обращением к психологии, а именно, к деятельностному подходу, сформулированному С Л Рубинштейном и А Н Леонтьевым Подход к категории деятельности, принятый в нашей работе, стал результатом анализа и развития тезиса о том, что действие по существу является элементом деятельности, ее квантом

Это соотношение, с которым следует согласиться, определяет не только иерархию понятий, но и существенное различие между ними Отметим, что с точки зрения деятельностного подхода, разработанного в рамках психологии, целенаправленной может являться только деятельность, а действие лишь результативным (или нет) Однако ситуативный анализ, использующийся психологами, имеет гораздо больше координат и предполагает более широкий и полный охват отрезка действительности, чем анализ словарного значения глагола и его употребления в этом значении Кроме того, значение слова само по себе уже является фильтром, особым образом преобразующим внеязыковую действительность и фиксирующим в себе ограниченный ряд ее значимых признаков Иными словами, при переходе от ситуации к значению глагола мы имеем дело, во-первых, с сужением фокуса восприятия ситуации (отбором ее существенных признаков), во-вторых, с переходом на качественно более высокий уровень абстракции (анализ ситуации опирается только на отобранные признаки) При этом целенаправленность и мотивированность

деятельности переходит в разряд подразумеваемых характеристик, и на поверхности остается только ее квантованный характер

Таким образом, основным индикатором принадлежности глагола к лексико-семантическому полю деятельности, по нашему мнению, является, во-первых, содержательная квантованность процесса в целом (возможность выделить более мелкие элементы деятельности, исходя из экстралингвистического опыта), во-вторых, значительный объем подразумеваемого содержания (вкладываемого носителем языка в утверждение с глаголом деятельности) и, соответственно, отсылочный характер значения (дающего указание на некую группу действий, которую каждый субъект наполняет, исходя из своих представлений) Поясним это утверждение на примере Так, глагол учиться в первом значении («посещать какое-либо специализированное учебное заведение с целью получения образования или профессиональной квалификации»), очевидно, подразумевает и посещение занятий, и выполнение заданий, и подготовку к экзаменам - это мы можем предполагать, исходя из своих экстралингвистических знаний

Сформулированные содержательные особенности глаголов деятельности находят свое отражение также в характере их временной локализованности Эти особенности раскрываются с использованием семантической классификации предикатных выражений 3 Венддера В этой связи подробно рассматриваются особые виды «состояний» по Вендлеру (states), а именно частные (specific) и обобщенные (generic) состояния, которые удовлетворяют сформулированному в работе критерию включения глагола в состав поля глаголов деятельности Далее подход Вендлера адаптируется к русскому языку Особые виды «состояний» по Вендлеру соответствуют предикатам класса (термин ОН Селиверстовой (Семантические типы предикатов 1982)), которые подразделяются на предикаты со значением гетерогенного класса (обобщенные «состояния», обобщение разнородных действий царствовать, править, воспитывать) и предикаты со значением гомогенного класса (частные «состояния», в структуре которых можно выделить центральное действие воровать, питаться) Класс понимается как обобщение, соотносимое с отдельными случаями, но абстрагированное от них класс не может быть равен ни какому-либо из своих членов, ни множеству своих членов, а его денотат не локализуется на временной оси

Далее проводится анализ семантических особенностей обобщенных и частных состояний и вводится понятие глаголов-занятий (термин ЕВ Падучевой) Они обладают внутренней динамикой (можно выделить качественно разные фазы), предполагают наличие

субъекта, контролирующего ситуацию, и обладают свойством нетерминативности, при этом они не обладают конкретной локализованностъю во времени Как отмечает Е В Падучева, «главное аспектуальное свойство занятий состоит в том, что они занимают сверхдолгий интервал, не целиком заполненный деятельностью или действиями субъекта, но при этом характеризуют субъект на всем протяжении этого интервала» (Падучева 1996, С 149)

На основании вышеизложенных подходов делается вывод о том, что указанное аспектуальное свойство, в целом, характеризует глаголы деятельности в нашем понимании, вместе с тем, для включения глагола в поле необходимо и достаточно, чтобы хотя бы одно из его значений достигало уровня обобщения, свойственного предикату класса и вызывающего к жизни данное аспектуальное свойство Так, у уже упомянутого глагола учиться есть и другие значения, объединяющие в себе разрозненные действия, но не обладающие свойствами класса В своем втором значении глагол учиться («приобретать навык или умение, (неоднократно) выполняя соответствующие действия, стремясь получить нужный результат») уже может мыслиться в приложении к тому (необязательно сверхдолгому) конкретному промежутку времени, когда субъект выполняет некую совокупность действий, приобретая навык

В заключительной части главы дополнительно рассматриваются частные варианты проявления особой временной локализации, такие как невозможность моментализации и внутренняя беспредельность значения глагола деятельности, а также трудности, которые могут возникать при образовании глаголом в этом значении начинательного и ограничительного способа действий

Обосновывается подход к отнесению глагола к лексико-семантическому полю глаголов деятельности При этом в качестве приоритета выделяется содержательный анализ значения с точки зрения его квантованной структуры В ряде случаев этот анализ может дополнительно подкрепляться соображениями о локализации данного значения в сверхдолгом временном интервале В этом случае деятельность характеризует субъект на всем протяжении этого временного интервала, несмотря на то, что последний не целиком заполнен деятельностью или действиями субъекта

В главе 3 излагается и обосновываются процедура описания лексико-семантического поля глаголов русского языка, реализующих значение деятельности, для словаря КиввИе! С помощью метода последовательных приближений уточняются и конкретизируются параметры поля глаголов деятельности

На первом этапе (первое приближение в процессе описания поля) выявляются признаки, ставшие основой для выделения совокупности глаголов деятельности, которые в дальнейшем будут подвергнуты контекстному анализу Важно отметить, что деятельность не может рассматриваться как простая сумма действий, поскольку дополнительно характеризуется организующим началом действия упорядочены во времени и подчинены цели деятельности Это перекликается с пониманием предикатов деятельности как предикатов класса Подчеркивается взаимосвязь наличия в значении глагола деятельности элемента обобщения и отсутствия у него конкретной временной локализованности, характерной для глаголов действия В качестве обобщаемых элементов могут выступать действия, конкретность которых невозможно оспорить

В то же время обращается внимание на другие важные характеристики, присущие глаголам, по своему содержанию являющимися претендентами на включение в лексико-семантическое поле глаголов деятельности внутренняя организующая целенаправленность, многостадийность, наличие контролирующего субъекта, способность служить характеристикой субъекта на некоем временном промежутке В этой связи становится очевидной необходимость подробного контекстного анализа объективно разнородной совокупности глаголов деятельности, отобранной на первом этапе, с целью уточнения признаков категориального значения Вполне понятно, что такие признаки могут быть выражены в разной степени, что само по себе является одним из указаний на структуру поля Напомним, что основанием для выделения глаголов из исходного перечня явилась возможность их употребления в контекстах, отражающих значение деятельности На основании анализа категории деятельности, представленного в главе 2 данной работы, мы можем сформулировать это значение следующим образом иметь что-либо предметом своих занятий, деятельности = в течение определенного периода времени выполнять ряд разнородных действий, подчиненных некой стратегической задаче (цель деятельности) или отобранных и упорядоченных согласно структуре деятельности, содержательно объединяющей указанные действия в одно целое

В связи с тем, что методика построения тезауруса WordNet и, вслед за ним, тезауруса ЯиБэКе! базируется на том, что ядра лексико-семантических групп оформляются вокруг частотных лексем, занимающих верхние уровни родовидовой иерархии, на первом шаге для контекстного анализа был отобран массив глаголов, реализующих сформулированное значение и находящихся в верхней части словника частотного словаря С А Шарова В их число вошли следующие глаголы работать, заниматься, служить, учиться, воевать,

бороться, защищать, возиться, охранять, торговать, беречь, заботиться, трудиться, воспитывать, ухаживать, растить, сражаться (глаголы расположены в порядке уменьшения частоты встречаемости согласно частотному словарю С. А Шарова1)

В разделе 2 (второе приближение в процессе описания поля) указанные глаголы были подвергнуты подробному контекстному анализу по следующей процедуре2 Контексты, содержащие прежде всего личные формы указанных глаголов, а также причастия и деепричастия, отбирались из исследовательского корпуса текстов «Бокренок»3 объемом около 21 миллионов словоупотреблений, включающего в себя тексты разных функциональных стилей Случайная выборка, извлеченная с помощью программы-менеджера корпуса текстов Бонито, размечалась на предмет отнесения данного употребления глагола в контексте к тому или иному словарному значению Объем случайной выборки зависел от частоты встречаемости глагола в корпусе и для частотных глаголов колебался в пределах от 54 до 300 контекстов на глагол Словарные определения формулировались на базе MAC - второго издания четырехтомного словаря русского языка (М, 1981-1984) При этом имеющие место корректировки словарных определений связаны с тем, что тезаурус RussNet не предполагает выделения оттенков значения В связи с этим последние либо объединялись с основным значением, либо выделялись в самостоятельное значение, если анализ валентностей давал на то основание Так, например, первым значением глагола трудиться по MAC является «заниматься каким-л трудом, делом, работать», оттенок этого значения - «работать над созданием, изготовлением чего-л, производить обработку чего-л » Этот оттенок был выделен в самостоятельное значение благодаря наличию контекстного маркера - обязательной валентности объекта трудиться над чем-л

По результатам анализа выборочной совокупности контекстов выделялись частотные значения глаголов, выражающие категорию деятельности, и проводился дополнительный сплошной отбор контекстов, пока на каждое из частотных значений не приходилось по 100 контекстов (или менее, если общее число контекстов в корпусе для данного глагола было недостаточно велико) Кроме этого, изменялась словарная нумерация значений самому

1 Шаров С А Список частот для слов русского языка (2000), URL www.artint ru/proiects/frqlist asp

2 О стандартной процедуре подготовки wordnet-словарей см в (Азарова И В, Иванов В JI, Овчинникова Е А Использование схемы наследования рамок валентностей в тезаурусе RussNet для автоматического анализа текста // Компьютерная лингвистика и интеллектуальные технологии Труды международной конференции Диалог'2006 (Бекасово, 31 мая - 4 июня 2006 г ) М.2006 с 18-25)

Корпус был создан на кафедре математической лингвистике СПбГУ см (Азарова И В, Синопальникова А А Использование статистико-комбинаторных свойств корпуса современных текстов для формирования структуры компьютерного тезауруса RussNet // Труды международной конференции «Корпусная лингвистика 2004» СПб, 2004 С 5-15)

частотному значению присваивался первый номер, далее значения упорядочивались по убыванию частоты Согласно результатам проведенных исследований 100 случайных контекстов, извлеченных из корпуса, дают такую же схему валентностей, что и 1000 контекстов, минимальное необходимое количество контекстов составляет 25 единиц (Азарова, Иванов, Овчинникова 2006) В связи с этим, если количество контекстов, отнесенных к данному значению, составляло более 25, проводился количественный анализ -вычислялась частота встречаемости той или иной валентности В комментарии к значению глагола выявлялось семантическое наполнение, характерное, прежде всего, для валентностей субъекта и объекта Для каждого из выделенных значений приводились примеры из корпуса текстов

Как и следовало ожидать, большинство рассмотренных глаголов многозначны для 17 глаголов было выявлено более 50 значений, из которых 26 непосредственно реализуют значение деятельности в сформулированном смысле

Таким образом, рассмотренная во второй главе категория деятельности была проанализирована методом контекстного анализа Итогом этого рассмотрения явилось, во-первых, уточненное и расширенное описание категории деятельности через дополнительные параметры, извлеченные из контекстного рассмотрения, во-вторых, вариант структуры поля глаголов деятельности, обсуждению которых посвящен третий раздел главы 3

Наличие сформулированного значения деятельности позволяет выделить архилексему поля, которая, во-первых, должна быть высокочастотной и, во-вторых, в одном из своих значений в наиболее общем виде реализовывать значение деятельности. Этим условиям отвечает глагол заниматься в первом значении («иметь что-либо предметом своих занятий, деятельности») Поскольку заниматься не конкретизирует вид деятельности, этот глагол находится на более высоком уровне родовидовой иерархии, чем другие частотные глаголы, такие как работать, воевать, служить, торговать и так далее

Кроме этого, с целью выявить дополнительные аспекты возможной детализации значений своих гиперонимов, в контекст рассмотрения нами были введены следующие 16 низкочастотных глаголов батрачить, бездельничать, вкалывать, корпеть, обучать, огородничать, пестовать, плотничать, подвизаться, приторговывать, разбойничать, репетиторствовать, рыбачить, халтурить, хозяйствовать

В результате анализа глагольных значений и их сочетаемости с лексическим окружением были выделены следующие параметры категории деятельности, в разной степени реализующиеся в значениях рассмотренных глаголов

1) Абстрактная временная локализованность

Этот параметр подробно рассматривается в главе 2 и подразумевает, что по крайней мере в одном из значений глагол может обозначать занятие субъекта, не соотносимое с конкретным промежутком времени, но характеризующее субъект на всем протяжении этого промежутка

2) Квантованность

Под квантованностью мы понимаем дискретное наполнение деятельности отдельными составляющими При этом структура может быть двухуровневой, что подразумевает наличие обобщающего компонента (выраженного, собственно, в виде значения глагола деятельности) и обобщаемых компонентов (подразумеваемый набор действий, содержательно объединенных в одно целое) Например, деятельность, обозначаемая глаголом воспитывать (в значении «растить (давая образование, прививая какие-л навыки, правила поведения и т п)») подразумевает, что субъект обеспечивает жизненные потребности воспитуемого, его обучение, формирует в его сознании базовые установки и тд

3) Наличие контрагента

Субъект деятельности регулярно взаимодействует с разньми типами контрагентов Контрагентом может быть начальник или социально вышестоящий агенс (для субъектов глаголов работать, служить, учиться, трудиться, батрачить, вкалывать и др), подчиненный (для субъектов группы глаголов руководящей деятельности руководить, управлять, править, царствовать, командовать, контролировать), ребенок (для субъектов глаголов воспитывать, растить), бенефициант (для субъектов глаголов заботиться, ухаживать, защищать, охранять, беречь), противник или враждебная сила (для субъектов глаголов сражаться, воевать, бороться)

4) Наличие плана или алгоритма, в соответствии с которым реализуется деятельность, определяющего ее конкретное содержание

Наличие плана или алгоритма деятельности является прямым следствием ее квантованности Отдельные этапы деятельности должны реализовываться в определенной последовательности и согласовываться друг с другом во времени и пространстве Например, строительство (строить дом) подразумевает последовательное движение от фундамента к крыше План является воплощением стратегического смысла деятельности, ее целей и задач

5) Наличие продукта (результата) деятельности

В качестве продукта (результата) деятельности обычно рассматривается достигнутая (воплощенная) цель дом (деятельность строить дом), кинофильм (деятельность снимать кино), образование (деятельность учиться)

6) Целесообразность

Структура и содержание деятельности соответствуют ее целевой установке - результату или задаче Например, задачей обучения (глаголы учиться, обучать) является получение представлений, навыков, квалификации, и, в соответствии с этим, определяется содержание и процедура обучения

7) Возможность заполнения валентности субъекта группой лиц или названием организации (множественность субъекта)

Субъектом глагола деятельности может являться не индивидуум, а группа людей (или организация, частью которой эти люди являются), так как в осуществлении деятельности могут участвовать на разных стадиях или единовременно более одного человека Например, военные действия (деятельность воевать) часто реализуются полком или дивизией, в торговле (деятельность торговать) могут участвовать магазины или лавки, а обеспечивать безопасность (деятельность охранять) может несколько вооруженных людей

8) Возможность выделения отдельных стадий в осуществляемой деятельности

Ряд деятельностей допускают выделение отдельных стадий в ходе достижения поставленной субъектом цели Стадии имеют технологический (как, например, в строительстве - фундамент, пол, стены, кровля), квалификационный (как, например, в учебе - курсы, классы) или психологический смысл Каждая стадия завершается качественным скачком

Результатом анализа этой системы параметров стала таблица показателей, в которой степень реализации того или иного параметра в значении проанализированных глаголов оценивается по четырехбалльной шкале (1 - нет, не реализован, 2 - скорее нет, чем да, 3 - скорее да, чем нет, 4 - да, реализован) Для каждого глагола была получена сумма баллов, которая определяет, в какой мере глагол выражает весь комплекс базовых характеристик деятельности Суммируя баллы для каждого из глаголов, прошедших контекстный анализ, мы получаем шкалу, отражающую то, в какой степени в значении частотного глагола присутствуют вышеописанные признаки, те насколько многогранно он представляет категорию деятельности во всей ее сложности При этом давалась интегральная оценка глаголы рассматривались не в отдельных своих значениях, а как структура из нескольких

значений, как они далее фигурируют и в подгруппах Результаты суммирования выглядят следующим образом

Глагол Сумма Глагол Сумма

баллов баллов

Учиться 31 Сражаться 22

Работать 31 Заниматься 21

Воспитывать 30 Защищать 21

Руководить 27 Охранять 20

Служить 26 Беречь 20

Трудиться 24 Заботиться 20

Воевать 24 Ухаживать 19

Бороться 22 Возиться 17

Интересно отметить, что архилексема поля глаголов деятельности заниматься попала в середину списка и уступает таким глаголам, как работать, учиться и т д по признаку наличия контрагента (который реализуется лишь в небольшой части контекстов заниматься кем-либо) и наличия плана или алгоритма, в соответствии с которым реализуется деятельность Мы полагаем, что в данном случае это следствие высокой степени общности значения, в котором часть признаков оказывается «не востребованной» Глаголы, находящиеся в нижней части списка (суммарный балл менее 20) составляют периферию поля, так как для них в меньшей степени реализованы признаки мвогостадийности деятельности, наличия плана или алгоритма, в соответствии с которым деятельность осуществляется В то же время, признак квантованности и признак абстрактной временной локализации (хотя бы в одном из значений) у всех глаголов выражен в достаточно высокой степени

Опираясь на семантическую близость значений, в лексико-семантическом поле глаголов деятельности можно выделить следующие основные подгруппы, задающие базовую структуру поля глаголов деятельности

1) подгруппа трудовой и профессиональной деятельности (центральный глагол работать, глаголы трудиться, служить, батрачить, вкалывать, пахать и другие),

2) подгруппа глаголов деятельности, направленной на создание сложного объекта (создавать, творить, строить (дом), писать (роман), ставить (спектакль), снимать (фильм), репетировать (сцену) и другие),

3) подгруппа глаголов руководящей и контролирующей деятельности (руководить, управлять, заведовать, командовать, царствовать, править, контролировать, проверять и другие),

4) подгруппа глаголов обучения, воспитания и познания (учить, учиться, обучать, обучаться, репетиторствовать, преподавать, исследовать, изучать, воспитывать, растить, пестовать и другие),

5) подгруппа глаголов занятия (центральный глагол - архилексема поля заниматься, а также конкретные виды деятельности работать, воевать, торговать, воровать, разбойничать, охотиться, рыбачить, хозяйствовать),

6) подгруппа глаголов противостояния (воевать, сражаться, бороться и другие),

7) подгруппа глаголов защиты объекта (защищать, охранять, беречь, оберегать и другие),

8) подгруппа глаголов помощи объекту (заботиться, ухаживать и другие)

Групповое структурирование лексико-семантического поля позволяет оптимизировать дальнейшую процедуру описания глагольного массива, предполагающую на следующем шаге подробный анализ совокупности на предмет поиска парадигматических связей, которые можно было бы включить в

На примере глаголов, которые были подробно проанализированы методом контекстного анализа, предлагается представление о связях, существующих между их отдельными значениями Это представление впоследствии может быть расширено посредством увеличения количества проанализированных лексем, которые будут заполнять указанные подгруппы

Центральная лексема поля - глагол заниматься в первом значении - не указывает на конкретный вид деятельности Глаголы, конкретизирующие вид деятельности (в нашем материале встретились глаголы работать, воевать, торговать, воровать, разбойничать, рыбачить, хозяйствовать), являются тропонимами (от греч тролоа - способ) центральной лексемы Тропонимия - это разновидность родовидовых отношений, которая в Т/огсО-И является основной формой иерархического структурирования синонимических рядов глаголов Будучи одним из основных вариантов радиальной организации лексико-семантического поля, тропонимия составляет основу древовидных структур, элементами которых могут выступать отдельные глагольные значения В данном случае тропоним (например, торговать) конкретизирует способ которым осуществляется деятельность заниматься', а временное соотношение между тропонимом и гиперонимом - совпадение во времени (иными словами, субъект торгует все то время, когда он занимается торговлей)

Способ (хролос) понимается широко и в данном случае представляет собой указание на конкретный вид деятельности

Необходимо отметить, что у большей части рассмотренных глаголов деятельности присутствует значение, в котором они допускают актуализацию Приведем пример глагола торговать В своем первом значении (пример 1) он указывает на постоянное занятие «вести торговлю, иметь торговые отношения с кем-л », в то время как второе значение («заниматься продажей, отпуском товаров покупателям») допускает актуализацию - соотнесение деятельности с текущим моментом (пример 2)

1) Если ему предложили торговать, он должен знать все о товаре, которым торгует, и обязательно взять лицензию на право торговли

2) Я попросила Игоря остановиться в стороне, чтобы девочки, которые торговали овощами, не увидели, что я подъехала на джипе

В то же время, главной особенностью структуры значений глаголов деятельности является не наличие у многих из них актуализированного значения, а их способность подниматься на более высокий уровень обобщения, которой лишены глаголы, не входящие в лексико-семантическое поле глаголов деятельности Индикатором такой способности к обобщению является именно абстрактная временная локализация в одном из значений глагола

Глагол работать обладает наиболее разветвленной собственной подгруппой В подгруппу глагола работать входят в одном из своих значений такие частотные глаголы как служить, трудиться, а также такие низкочастотные глаголы как халтурить, вкалывать, корпеть, бездельничать, огородничать, плотничать При этом при образовании родовидовых связей задействуются разные значения глагола Так, глагол работать1 («имея постоянное занятие, (должность), выполнять фиксированный круг обязанностей, (определенный в соответствии с занимаемой должностью)») является гиперонимом глагола служить2 («исполнять воинские обязанности, быть на военной службе») и одновременно входит в один синонимический ряд с глаголом служить5 («работать по найму, исполнять обязанности, предусмотренные работой») В то же время, глагол работать3 («заниматься каким-либо делом, применяя свой труд в какой-либо области, трудиться») входит в один синонимический ряд с глаголом трудиться1 («заниматься каким-л трудом, делом, работать») и подвизаться (стилистический синоним), является гиперонимом глаголов плотничать и огородничать и антонимом глагола бездельничать

Ряд глаголов-занятий также образуют подгруппы Например, в подгруппу глаголов обучения и приобретения знаний объединяются частотные глаголы учиться, обучать и

низкочастотный глагол репетиторствовать (тропоним обучать), в подгруппу глагола воспитывать входят его синонимы растить (в значении «ухаживая, обеспечивать рост и развитие кого-л, воспитывать») и пестовать, подгруппа глагола торговать включает в себя низкочастотный глагол приторговывать

В связи с многозначностью глаголы входят в синонимические ряды в разных значениях Приведем в качестве иллюстрации пример трех синонимических рядов, выделенных в подгруппе, состоящей из трех глаголов воевать, сражаться и бороться

1 сражаться'-воевать2

Значение сражаться' «вести бой, принимать участие в сражении, биться, драться с оружием в руках»

Значение воевать2 «сражаться с кем-чем-л »

2 сражаться2-бороться'- воевать3

Значение сражаться2 «бороться, решительно противодействовать, сопротивляться кому-чему-л »

Значение бороться' «сопротивляться чему-л , стараться преодолеть или уничтожить что-л » Значение воевать3 «то же, что бороться (с кем-чем-л и против кого-чего-л )»

3 сражаться3-бороться2

Значение сражаться3 «вступить в борьбу, спор с кем-л за что-л »

Значение бороться2 «отстаивать что-л , добиваться, стремиться достичь чего-л »

По каждой подгруппе в тексте диссертации представлены выделенные синонимические ряды и приводится схема подгруппы

Таким образом, исходными позициями раздела работы, представленного главой 3, являются методика описания лексико-семантического поля (изложенная в главе 1) и базовые характеристики категории деятельности, прокомментированные в главе 2 Было сформулировано определение значения деятельности, использовавшееся для решения прикладной задачи - выделения стартовой совокупности частотных глаголов, которые далее должны были стать объектом контекстного анализа В определении были учтены такие характеристики деятельностного значения, как квантованность, целесообразность, внутренняя структурированность На основании определения из стартовой совокупности глаголов выделена архилексема поля (глагол заниматься), выражающая полеобразующее значение в наиболее общем виде

Далее, поскольку совокупность частотных глаголов, являющаяся результатом проекции категории деятельности с указанными характеристиками на глагольный массив,

оказалась объективно разнородной, возникла задача по уточнению параметров собственно категориального значения в процессе контекстного анализа Употребление рассмотренных глаголов в текстах корпуса позволило существенно уточнить и расширить перечень параметров категории деятельности и констатировать неравную степень реализации категориального значения у глаголов анализируемой совокупности Был проведена условная количественная оценка степени, в которой каждый из параметров проявляется в значении глагола Полученная картина согласуется с представлением о полевой структуре, подробно проанализированной в главе 1, являясь дополнительной иллюстрацией наличия в поле глаголов деятельности адра (работать, учиться, воспитывать) и периферии (возиться, заботиться, ухаживать, беречь, охранять)

Анализ параметров категории деятельности позволил определить базовую структуру и основной состав поля глаголов деятельности, в частности, его подгрупповую субструктуру Значения и валентностные характеристики глаголов отдельных подгрупп, для которых проводился контекстный анализ, проанализированы на предмет выявления синонимических рядов и родовидовых отношений, составляющих основу структуры тезауруса КиБЭ^ В результате контекстного анализа указанных глаголов была получена новая структура их значений, адаптированная для представления в тезаурусе И^Ые! (значения ранжированы по признаку частотности)

Таким образом, лексико-семантическое поле глаголов деятельности, будучи описываемо в формате, необходимом для представления составляющих его глаголов в КиввКе^ обнаруживает свойство неравномерной и фрагментарной структурированности, задаваемой основными параметрами поля, такими как вид деятельности, ее результат, количество действующих субъектов и отношения между ними, а также характеристики локализации, интенсивности и продолжительности деятельности

В заключении подводятся основные итоги работы, кратко формулируется ее сущность и значение, в том числе для формирования и развития тезауруса НшвЫе! Отправной точкой работы явилось рассмотрение существующих теоретических подходов и приемов, используемых в аналитических исследованиях структуры лексики в целом и глаголов в частности В результате углубленного анализа полевого метода сформулировано заключение о рациональном в методологическом плане подходе к проблеме описания семантического поля глаголов При этом подчеркивается необходимость тщательного и подробного анализа реализации полеобразующего значения в отдельных элементах поля, подкрепляемого обнаруженными парадигматическими отношениями, которые, в свою

очередь, должны выявляться с учетом контекстных связей Сформулированные принципы могут бьггь положены в основу анализа лексико-семантических полей, в том числе в тех случаях, когда предполагается их использование в качестве компонента тезауруса типа \Уог(Ше1

Выполненное разграничение категорий «деятельность» и «действие» позволило сформулировать подход к решению вопроса о включении того или иного глагола в поле глаголов деятельности, учитывающий внутреннюю неоднородность, составной характер, а также специфику временной соотнесенности значений исследуемых глаголов

Представлен опыт применения полевого подхода к описанию структуры совокупности глаголов, задаваемой полеобразующим значением деятельности Описание процедуры и результатов проецирования этого значения на совокупность частотных глаголов является одним из методологически значимых итогов работы в контексте задачи наполнения тезауруса ЯиззМсП Выявлены параметры, позволяющие получить адекватное представление о месте лексико-семантического поля глаголов деятельности в общем континууме глагольных значений Параметрическое задание категориального значения, получаемое в результате контекстного анализа стартовой совокупности элементов поля, представляется целесообразным средством уточнения структуры поля Исследованная и структурированная совокупность может быть использована в качестве фрагмента структуры

Рекомендации по использованию основных результатов исследования

Результаты исследования могут бьггь использованы прежде всего с целью дальнейшего развитая компьютерного идеографического словаря Ячвв^! Помимо проанализированных глагольных значений, которые могут непосредственно пополнить собой словарь, ценность представляет подробная проработка методологических основ наполнения словаря и анализа составляющих его лексико-семантических полей

Уже созданные компьютерные ХУогсй^-лексиконы могут применяться в области информационного поиска для уточнения запросов пользователей с привлечением данных о связях слова в данном конкретном значении и для измерения смысловой близости текстов Постепенно пополняемый тезаурус Я^Ке! используется в процедурах автоматического анализа текстов, где его ресурсы позволяют уточнить семантическую интерпретацию текста и разрешить семантическую и грамматическую неоднозначность

Публикации

Основные положения диссертации изложены в следующих публикациях

1 Азарова И В, Ушакова А А Анализ лексико-семантического поля глаголов деятельности для тезауруса RussNet // Вестник Санкт-Петербургского университета Сер 9 2007, Вып 1,4 2

2 Ушакова А А Конструктивность описания структуры лексико-семантического поля // Материалы XXX межвузовской научно-методической конференции преподавателей и аспирантов филологического факультета СПбГУ (1-17 марта 2001 года), С-Пегербург, 2001 С 52-57

3 Ушакова А А Логические и психологические принципы разграничения действия и деятельности // Материалы XXXI межвузовской научно-методической конференции преподавателей и аспирантов филологического факультета СПбГУ (11-16 марта 2002 года) С-Петербург, 2002 С 46-51

4 Азарова И В , Митрофанова О А, Синопальникова А А, Ушакова А А , Яворская М В Разработка компьютерного тезауруса русского языка типа WordNet // Материалы конференции «Корпусная лингвистика и лингвистические базы данных» 5-7 марта 2002 г, Санкт-Петербург С 6-19

5 Ушакова АА. Выявление лексико-семантических полей для основных значений 200 частотных глаголов на базе толкований MAC // Материалы к компьютерному тезаурусу лексики русского языка / Сост. ИВ Азарова, OA Митрофанова С-Петербург, 2002 С 28-36

 

Оглавление научной работы автор диссертации — кандидата филологических наук Ушакова, Анастасия Александровна

ВВЕДЕНИЕ.

ГЛАВА 1 ЛЕКСИКО-СЕМАНТИЧЕСКОЕ ПОЛЕ КАК СПОСОБ ОРГАНИЗАЦИИ ЛЕКСИКО-СЕМАНТИЧЕСКОЙ СИСТЕМЫ ЯЗЫКА.

1.1 Исторический аспект: поле Й. Трира, Л. Вайсгербера и В. Порцига.

1.2 Семантические классы слов.

1.3 Поля в лексике: варианты трактовки понятия.

1.4 Ономасиологический и семасиологический подходы к выделению лексико-семантического поля.

1.5 Принципы организации лексики в лексико-семантическом поле.

1.6 Роль компонентного анализа при описании структуры лексического значения.

ГЛАВА 2 ОСОБЕННОСТИ ОРГАНИЗАЦИИ ЛЕКСИКО-СЕМАНТИЧЕСКОГО ПОЛЯ ДЕЯТЕЛЬНОСТИ.

2.1 Действие и деятельность: проблема разграничения.

2.2 Характер временной локализованности как семантическая особенность, являющаяся основанием для выделения поля глаголов деятельности.

2.3 Принципы семантической классификации предикатных выражений 3. Вендлера.

2.4 t-категория е.в. падучевой для семантической классификации аспектуальных соотношений глаголов русского языка.

2.5 Особые виды «состояний» 3. Вендлера.

2.6 Анализ семантических особенностей обобщенных и частных «состояний».

2.7 Предикаты класса и способы глагольного действия.

ГЛАВА 3 ФОРМАЛИЗОВАННОЕ ОПИСАНИЕ СТРУКТУРЫ ЛЕКСИКО-СЕМАНТИЧЕСКОГО ПОЛЯ ГЛАГОЛОВ ДЕЯТЕЛЬНОСТИ ДЛЯ КОМПЬЮТЕРНОГО ИДЕОГРАФИЧЕСКОГО СЛОВАРЯ ТИПА WORDNET.

3.1 Определение состава и выявление базовой структуры лексико-семантического поля глаголов деятельности.

3.2 Контекстный анализ как метод выявления структуры ЛСП глаголов деятельности.

3.3 Состав лексико-семантического поля деятельности и его основные параметры.

Архшексема ЛСП деятельности и ее связи.

Подгруппа глаголов приобретения знаний и обучения.

Подгруппа глагола РАБОТАТЬ.

Подгруппа глагола ВОСПИТЫВА ТЬ.

Подгруппа глагола ВОЕВА ТЬ.

Подгруппа глагола ТОРГОВАТЬ.

Подгруппа глагола ЗАЩИЩАТЬ.

Подгруппа глагола ЗАБОТИТЬСЯ.

 

Введение диссертации2007 год, автореферат по филологии, Ушакова, Анастасия Александровна

Представление семантической информации, содержащейся в языке, в виде удобной для пользователя и многофункциональной структуры остается по-прежнему нетривиальной задачей, побуждающей исследователей искать новые подходы к решению проблем, связанных с созданием такого описания. Обращение лингвистов к компьютерным ресурсам открыло ряд новых возможностей, что послужило толчком к появлению такого проекта как WordNet, опирающегося на обширную словарную базу, единицы которой существуют не изолированно друг от друга, но связаны между собой разнообразными парадигматическими отношениями. Компьютерная версия идеографического словаря WordNet появилась в 1995 году. Компьютерные технологии являются одним из средств, дающим возможность формализовать содержательную сторону языка, представив ее в виде структуры (сети) значений.

Методология построения лексико-семантической базы данных WordNet была заложена группой ученых Принстонского университета (США), возглавляемой Дж. Миллером (Miller 1990, Fellbaum 1998). Задача, которую они поставили перед собой, предполагала структурное описание лексики английского языка как составляющей языкового знания его носителей. В связи с этим исследователи делали упор на психолингвистические методики и большое внимание уделяли данным ассоциативных экспериментов. Получившийся в результате компьютерный идеографический словарь WordNet представляет собой сеть, базовыми элементами которой являются слова и синонимические ряды (синсеты). Синсеты могут быть связаны друг с другом парадигматическими отношениями. База данных состоит из четырех разделов, соответствующих четырем частям речи - существительному, прилагательному, наречию и глаголу.

Установка на приоритетность принципов организации лексических единиц в сознании носителей языка вывела на первое место отношения, которые связывают вместе разрозненные элементы словаря, формируя некую структуру. Слова, связанные лексико-семантическими отношениями, обычно принадлежат к одной семантической области или семантическому полю. Единица такой области (слово или синсет) представляет собой лексикализованное понятие. Информация о такой единице, содержащаяся в словаре, включает в себя словарное определение значения слова с примерами употребления в данном значении, указание на часть речи, к которой принадлежит данная единица, и ее парадигматические связи (антонимы, гипонимы, гиперонимы, тропонимы и т. д.). Кроме этого, запрос в виде слова предполагает в качестве ответа перечисление всех синонимических рядов, в состав которых данное слово входит (что эквивалентно перечислению всех его значений).

Идеи, которыми руководствовались создатели WordNet, получили широкое развитие — в ходе реализации проекта Euro WordNet к 1999 году были разработаны лексико-семантические базы данных для целого ряда европейских языков (французского, испанского, итальянского, немецкого, голландского, эстонского и чешского). Участники Euro WordNet следовали основным принципам, лежащим в основе WordNet, и поставили перед собой аналогичную задачу — описание всего комплекса языковых единиц, а не какой-либо отдельно взятой тематической или семантической области. При этом необходимо отметить, что тематическая организация лексики не принималась во внимание создателями WordNet, в основе которого лежат прежде всего внутриязыковые системные связи единиц. Тезаурус каждого из языков отражает особенности лексической системы соответствующего языка. Между собой национальные тезаурусы связаны посредством общей понятийной схемы (Top Ontology), которая включает в себя более 1300 понятий. Система межъязыковых указателей (Inter-Lingual-Index) позволяет установить корреляцию между элементами понятийной схемы и переходить от одной языковой структуры \VordNet к другой. В отличие от американских ученых создатели Еиго\¥огс1Ые1 опирались прежде всего на традиционные лексикографические источники (толковые, синонимические и переводные словари), а также корпусы текстов (Азарова и др. 2002).

В 1999 году на кафедре математической лингвистики СПбГУ была начата работа над созданием аналогичного лексикона для русского языка. Проект получил название (Азарова и др. 2002, 2003 и 2004). Целью проекта является построение компьютерного тезауруса, который, подобно \¥ЪгсГ№1, должен охватывать базовую общеупотребительную лексику и не ограничиваться описанием отдельной терминологической области. Наполнение словаря ведется методом отбора и анализа лексико-семантических полей, в состав которых входят высокочастотные лексемы, которые предположительно формируют ядерную часть лексико-семантических полей. При этом используются данные контекстного анализа, различных толковых словарей и ассоциативного словаря. ИшБЫе! содержит четыре взаимосвязанных базы данных, отображающих лексику основных частей речи — существительных, прилагательных, глаголов и наречий.

Для русского языка не существует описания подобного типа. Важность его создания подкрепляется широкими возможностями, которые описание типа WordNet предоставляет пользователям: будучи уникальным информационным ресурсом, он способен дать полномасштабное представление о значениях слова, его связях в рамках лексико-семантической системы языка и возможностях его употребления. В частности, уже созданные компьютерные \¥огс1Не1-лексиконы могут применяться в области информационного поиска для уточнения запросов пользователей с привлечением данных о связях слова в данном конкретном значении и для измерения смысловой близости текстов. Постепенно пополняемый тезаурус используется в процедурах автоматического анализа текстов, где его ресурсы позволяют уточнить семантическую интерпретацию текста и разрешить семантическую и грамматическую неоднозначность (Азарова и др. 2006). Актуальность исследования определяется необходимостью развития представлений, связанных с полевым методом, для его использования в качестве основы компьютерного идеографического словаря Ишб^, включающего информацию о парадигматических связях. Выбор глаголов деятельности в качестве предмета исследования обусловлен тем, что этот пласт глаголов пока остается в стороне от систематизирующих описаний, что, в свою очередь, объясняется диффузным характером категориального значения деятельности, лишенного четко очерченных границ и прозрачной внутренней структуры. В то же время тот факт, что это значение присутствует у высокочастотных глаголов, указывает на очевидную необходимость включения этой совокупности в состав интегрального описания.

Целью исследования является создание структурного описания ядра лек-сико-семантического поля глаголов деятельности русского языка и выявление основных закономерностей и коррелятивных зависимостей, существенных для дальнейшего описания поля, в их взаимодействии с лексическим окружением.

Указанная цель предполагает решение следующих задач исследования:

1) рассмотрение теории лексико-семантического поля с выделением базовых принципов методологии его построения в контексте обработки подмножества глаголов для представления в тезаурусе Я^Ме! (глава 1);

2) анализ специфических особенностей категориального значения деятельности (глава 2);

3) отбор и контекстный анализ глаголов, реализующих значение деятельности, с выявлением парадигматических связей между глагольными значениями (глава 3).

Научная новизна исследования состоит

• в использовании комплексного подхода к анализу и последующему описанию лексико-семантического поля как базового компонента компьютерного тезауруса Кл^Ке^

• в выполнении анализа категории деятельности применительно к ее использованию в качестве полеобразующего значения;

• в оформлении модели семантического поля глаголов деятельности путем представления системы параметров категориального значения.

Исследование проводилось на материале 74 значений глаголов деятельности, реализующихся в 2959 контекстах исследовательского корпуса текстов «Бокренок» (Азарова, Синопальникова 2004).

Таким образом, в число теоретических задач, поставленных перед автором, входило следующее:

1. анализ теории лексико-семантического поля (виды парадигматических группировок, варианты трактовки понятия поля, основные подходы к наполнению лексико-семантического поля, особенности его внутренней организации);

2. решение проблемы разграничения понятий «действие» и «деятельность» и раскрытие содержательных особенностей последнего;

3. сопоставление и анализ семантических классификаций, опирающихся на особенности временной соотнесенности глаголов;

4. выявление особенностей временной соотнесенности глаголов деятельности и параметров полеобразующего значения;

5. формулировка принципов анализа видовых пар глаголов для их представления в тезаурусе Ил^Ме^

Практическими задачами работы являлись:

1. определение принципов отнесения глаголов к лексико-семантическому полю глаголов деятельности;

2. отбор наиболее употребительных (частотных) глаголов, реализующих деятельностное значение (согласно перечню, приведенному в частотном словаре С.А Шарова);

3. анализ структуры значений выделенных глаголов с учетом результатов контекстного анализа и лексикографической информации;

4. выявление и описание парадигматических связей глаголов деятельности.

Работа состоит из трех глав. В первой главе рассматривается лексико-семантическое поле как способ организации лексико-семантической системы языка. Отдельные разделы посвящены описанию истории вопроса, перечислению видов различных парадигматических группировок слов и их особенностей, изложению вариантов трактовки понятия «поле», анализу существующих подходов к выделению лексико-семантического поля и принципов его внутренней организации. Во второй главе проводится разграничение понятий «действие» и «деятельность» на основе различий во временной локализованное™ глаголов, анализируется ряд классификаций, отражающих содержательные особенности аспектуальных соотношений глаголов, выделяются области этих классификаций, соотносимые с понятием «деятельность». Третья глава посвящена структурному описанию ядерной части лексико-семантического поля глаголов деятельности русского языка для тезауруса Кл^Ие!;, анализу значений и парадигматических связей ряда глаголов периферии рассматриваемого поля, а также раскрытию параметров, актуальных для расширения его количественного состава и выявления входящих в него подгрупп.

 

Заключение научной работыдиссертация на тему "Формализованное описание структуры лексико-семантического поля глаголов деятельности для компьютерного идеографического словаря типа WordNet"

Заключение

В соответствии с оценкой существующего положения в области системного описания лексики, выполненной во введении, актуальной задачей является создание компьютерных лексиконов тезаурусного типа. Именно в этой связи в качестве основной цели работы было сформулировано создание структурного описания ядра лексико-семантического поля глаголов деятельности русского языка для компьютерного тезауруса типа \YordNet. Для достижения этой цели были рассмотрены существующие теоретические подходы и приемы, используемые в аналитических исследованиях структуры лексики в целом и глаголов в частности. Прослежено в историческом и логическом плане развитие теории лексико-семантических полей и дополняющих их категорий лексико-семантического арсенала. Проанализированы разнообразные формулировки сути понятия лексико-семантического поля, а также отмечена необходимость и рациональность сочетания нескольких подходов применительно к описанию лексико-семантического поля глаголов деятельности в силу специфических особенностей этой категории. Это углубленное рассмотрение аргументировалось априорной сложностью понятийной категории, выбранной в качестве предмета исследования. Сформулировано заключение по рациональному в методологическом плане подходу к решению проблемы, состоящему в контролируемом по парадигматическим связям наполнении лексико-семантического поля лексико-семантическими вариантами (значениями) глаголов. При этом подчеркнута необходимость тщательного и подробного анализа реализации полеобразующего значения в отдельных элементах поля, подкрепляемого обнаруженными парадигматическими отношениями, которые, в свою очередь, выявляются с учетом контекстных связей. Изложение и обсуждение представлений о лексико-семантическом поле и его формировании составляет содержание первой главы.

Во второй главе детально проанализированы характеристики полеобра-зующего значения деятельности, а также глаголов, реализующих это значение и представляющих собой предмет исследования. Существенным этапом рассмотрения является обоснование необходимости разграничения категорий «деятельность» и «действие» и анализ психологических и лингвистических средств, которые могут внести свой вклад в решение этой проблемы. Наряду с содержательным анализом квантовой природы деятельности затронут вопрос специфики временной локализованное™ денотата глагола деятельности, проанализированы существующие классификации. В результате сформулирован подход к решению вопроса о включении того или иного глагола в поле глаголов деятельности, учитывающий внутреннюю неоднородность и составной характер обозначаемой деятельности, а также абстрагированность от временного промежутка хотя бы в одном значении глагола.

В третьей главе представлен опыт и результат применения полевого подхода к описанию структуры совокупности глаголов, задаваемой полеобра-зующим значением, исследованным во второй главе. Объективно разнородный характер глагольного множества, выражающего значение деятельности, обусловил необходимость уточнения параметров предмета исследования. Описание процедуры и результатов проецирования значения деятельности на совокупность частотных глаголов является одним из методологически значимых итогов работы в контексте задачи наполнения тезауруса ЯизвКе!. Удачным способом, использованным для выявления дополнительных параметров предмета исследования и являющимся одновременно одним из базовых инструментов подготовки лексического материала для помещения его в Ил^Ке!, оказывается контекстный анализ. Сформулированная модель значения деятельности включила в себя представление о таких специфических свойствах выражающих ее элементов как квантованность, абстрактная временная локализованное^, целесообразность, стадийный характер, наличие алгоритма реализации. Только с учетом этих параметров можно получить адекватное представление о месте лексико-семантического поля глаголов деятельности в общем континууме глагольных значений. Оценка степени и формы реализации указанных параметров в значениях исследованных глаголов, во-первых, иллюстрирует полевую природу совокупности, характеризующейся наличием ядра и периферии, во-вторых, позволяет выделить систему подгрупп. Состав подгрупп, существующих в лексико-семантическом поле глаголов деятельности, задается на совокупности проанализированных значений. При этом учитываются дополнительные группы, явившиеся результатом логического и контекстного анализа категории деятельности.

Таким образом, для достижения стратегической цели работы была реализована следующая цепь последовательных этапов исследования:

1. Проведен анализ теории семантического поля, представлены варианты трактовки основных понятий этой теории, дан обзор различных видов парадигматических группировок слов (к числу которых относится также и поле) и сформулирован собственный подход к формированию тезауруса ЯизБЫе! на основе построения лексико-семантических полей.

2. Проведен анализ категории «деятельность», сформулированы ее содержательные особенности, отграничивающие «деятельности» от «действий».

3. В результате сопоставления и анализа классификаций, основанных на особенностях временной соотнесенности глаголов, сформулированы свойства и характеристики глаголов деятельности, выражающиеся в особенностях их поведения во временном контексте.

4. Предложены принципы описания видовых пар глаголов в КиззЫе!:.

5. На основании сформулированных критериев выделена базовая совокупность глаголов, реализующих значение деятельности.

6. Проведен контекстный анализ глаголов, входящих в лексико-семантическое поле глаголов деятельности. Уточнены и дополнены параметры категории деятельности, существенные для дальнейшего расширения и детализации поля.

7. Введено представление о подгруппах как существенной характеристике лексико-семантического поля деятельности.

8. Дано описание структуры и связей, существующих внутри проанализированной совокупности.

Выполненное структурирование совокупности в виде выделения подгрупп и описания парадигматических связей обусловливает практическое значение данной работы в рамках задач построения тезауруса НшБЫе!. Наработанные методики анализа могут быть использованы при дальнейшем расширении тезауруса.

 

Список научной литературыУшакова, Анастасия Александровна, диссертация по теме "Прикладная и математическая лингвистика"

1. Апресян Ю.Д. Избранные труды. Том I. Лексическая семантика. М., 1995.

2. Апресян Ю.Д. Лексическая семантика. М.,1974.

3. Апресян Ю.Д. Экспериментальное исследование семантики русского глагола. М,, 1967.

4. Апресян Ю.Д., Богуславская О.Ю., Левонтина И.В., Уринсон Е.В. Новый объяснительный словарь синонимов. М., 1995.

5. Ю.Архипова Л.В. Управление глагола как проявление его лексикосемантических свойств (на примере глаголов созидания). Автореф. дис. канд. филол. наук. Тамбов, 2000.

6. ЬАрхипова Ю.Ю. Состав, семантика и функционирование ЛСГ глаголов зрительного восприятия (на материале художественной литературы). Автореф. дис. канд. филол. наук. С.-Петербург, 2000.

7. Бабенко Л.Г. Функциональный анализ глаголов говорения, интеллектуальной и эмоциональной деятельности. Автореф. дис. канд. филол. наук. Ростов, 1980.

8. Бабенко Л.Г., Боровикова H.A., Вепрева И.Г., Жданова С.П., Михайлова O.A. Научные идеи профессора Э.В. Кузнецовой и их развитие // Глагол в системе языка и речевой деятельности. Материалы научной лингвистической конференции. Свердловск, 1990. Сс. 4-5.

9. Бондарко A.B. Основы функциональной грамматики. Языковая интерпретация идеи времени. С.-Петербург, 1999.

10. Брушлинский A.B. С.Л. Рубинштейн — основоположник деятельностного подхода в современной науке //СЛ. Рубинштейн. Очерки. Воспоминания. Материалы. М., 1989. Сс. 64-102.

11. Булыгина Т.В. Грамматические и семантические категории и их связи // Аспекты семантических исследований. М., 1980. Сс. 320-355.

12. П.Булыгина Т.В. Классы предикатов и аспектуальная характеристика высказывания // Аспектуальные и темпоральные значения в славянских языках. М., 1983. Сс. 29-30.

13. Булыгина Т.В. К построению типологии предикатов в русском языке // Семантические типы предикатов. М., 1982. Сс. 7-85.

14. Васильев Л.М. Принципы семантической идентификации глагольной лексики // Семантические классы русских глаголов. Свердловск, 1982. Сс. 1114.

15. Васильев Л.М. Семантика русского глагола. М., 1981.

16. Васильев J1.M. Современная лингвистическая семантика. М., 1990.

17. Васильев JI.M. Теория семантических полей // Вопросы языкознания, 1971, №5.

18. Габай Т.В. Педагогическая психология. М., 1995.

19. Гайсина P.M. Значение и синтагматика глаголов (на материале глаголов отношения). Уфа, 1980.

20. Гайсина P.M. К семантической типологии глаголов русского языка // Семантические классы русских глаголов. Свердловск, 1982. Сс. 15-21.

21. Гайсина P.M. Лексико-семантическое поле глаголов отношения в современном русском языке. Саратов, 1981.

22. Гайсина P.M. Соотношение семантики и синтаксиса глагола // Исследования по семантике: Семантические единицы и их парадигмы. Уфа, 1992. Вып. 17.

23. Гак В.Г. Сопоставительная лексикология. М., 1977.

24. Гак В.Г. Языковые преобразования. М., 1998.

25. Гловинская М.Я. Семантические типы видовых противопоставлений русского глагола. М., 1982.

26. Зализняк Анна А., Шмелев А.Д. Введение в русскую аспектологию. М., 2000.32.3асорина JI.H. Введение в структурную лингвистику. М., 1974.

27. ЗЗ.Золотова Г.А. Коммуникативные аспекты русского синтаксиса. М., 1982.

28. Иванников В.А. Подходы к анализу деятельности. // Традиции и перспективы деятельностного подхода в психологии. Школа А.Н. Леонтьева. М., 1999. Сс. 38-47.

29. Казакова Н.В. Экстралингвистическая информация в семантическом поле // Теория поля в современном языкознании. Тезисы докладов научн.-теор. семинара. Уфа, 1994. Сс. 60-62.

30. Казарин Ю.В. Специфика словарных дефиниций в аспекте категорий абстрактности и конкретности глагольной семантики // Глагол и имя в русскойлексикографии: вопросы теории и практики. Екатеринбург, 1996. Сс. 108116.

31. Казыдуб H.H. К проблеме семантической классификации глаголов // Актуальные проблемы семасиологии. Межвуз. сборник научн. трудов. JI., 1991. Сс. 36-43.

32. Караулов Ю.Н. Общая и русская идеография. М., 1974.

33. Кильдибекова Т.А. Глаголы действия в современном русском языке: Опыт функционально-семантического анализа. Саратов, 1985.

34. Кильдибекова Т.А., Гафарова Г.В., Юлдашева Д.А. О некоторых принципах составления словарей семантических полей // Теория поля в современном языкознании. Тезисы докладов научн.-теор. семинара. Уфа, 1994. Сс. 11-13.

35. Киферова З.Г. Лексико-семантическое поле как основная системообразующая единица языка // Теория поля в современном языкознании. Тезисы докладов научн.-теор. семинара. Уфа, 1994. Сс. 90-93.

36. Клеопатрова Л.Ф. Лексико-семантическая группа глаголов разъединения в современном русском языке. Автореф. дис. канд. филол. наук. Воронеж, 1981.

37. Когнитивная лингвистика конца XX века. (Материалы межд. научн. кофе-ренции 7-9 октября 1997 г. в трех частях. Часть I). Мн., 1997.

38. Козинцева H.A. Временная локализованность действия и ее семантические связи (на материале армянского и русского языка) // Типология и грамматика. М., 1990. Сс. 152-161.

39. Компьютерный словарь WordNet II Материалы к компьютерному тезаурусу лексики русского языка / Сост. Азарова И.В., Митрофанова O.A. С.Петербург, 2002. Сс. 3-9.

40. Кузнецов A.M. Поле // Лингвистический энциклопедический словарь. М., 1990. Сс. 380-381.

41. Кузнецова Э.В. Итоги и перспективы семантической классификации русских глаголов. // Семантические классы русских глаголов. Свердловск, 1982. Сс. 3-10.

42. Кузнецова Э.В. Части речи и лексико-семантические группы слов. Вопросы языкознания, 1975, № 5.

43. Кузнецова Э.В. Язык в свете системного подхода. Свердловск, 1983.

44. Кустова Г.И. Типы производных значений и механизмы языкового расширения. М.: Языки славянской культуры. 2004.

45. Маслов Ю.С. Очерки по аспектологии. Л., 1984.

46. Мелиг Х.Р. Семантика предложения и семантика вида в русском языке (к классификации глаголов Зино Вендлера) // Новое в зарубежной лингвистике, вып. XV. М., 1985. Сс. 227-249.

47. Менон Р.Н. Системность лексики — семантические поля, лексико-семантические и тематические группы слов (краткий обзор) // Russian Philology, №8. Hyderabad, April 1989.

48. Ожегов. С.И. Словарь русского языка / Под ред. члена-корреспондента АН СССР H.IO. Шведовой. М., 1989.

49. Падучева Е.В. Семантические исследования: Семантика времени и вида в русском языке. Семантика нарратива. М., 1996.

50. Падучева Е.В., Розина Р.И. Семантический класс глаголов полного охвата: толкование и лексико-синтаксические свойства // Вопросы языкознания, 1993, №6.

51. Плотникова C.B. Высокочастотные глаголы в современном русском языке: лексико-семантическая классификация глаголов и регулярная многозначность: Автореф. дис. канд. филол. наук Екатеринбург, 1996.

52. Попова Т.В. Способы глагольного действия в толково-идеографическом словаре русских глаголов // Глагол и имя в русской лексикографии: вопросы теории и практики. Екатеринбург, 1996. Сс. 63-67.

53. Русская глагольная лексика: пересекаемость парадигм / Под ред. Л.Г. Ба-бенко. Екатеринбург, 1997.

54. Русская грамматика / Под ред. Н.Ю. Шведовой. М. 1980.

55. Селиверстова О.Н. Второй вариант классификационной сетки и описание некоторых предикатных типов русского языка // Семантические типы предикатов. М., 1982. Сс. 86-157.

56. Сентенберг И.В. Лексическая семантика английского глагола М., 1984.

57. Скребцова Т.Г. Семантический анализ основных значений глаголов действия. // Лексикология, лексикография, грамматика. Санкт-Петербург, 1996. Сс. 124-130.

58. Словарь русского языка в четырех томах / Под ред. А.П. Евгеньевой. М., 1981.

59. Словарь современного русского литературного языка в семнадцати томах. М., 1948-1965.

60. Слово и грамматические законы языка: Глагол / Под ред. Н.Ю. Шведовой, В.В.Лопатина. М., 1989.

61. Тихонов А.Н. Границы и структура лексико-семантического поля // Теория поля в современном языкознании. Тезисы докладов научн.-теор. семинара. Уфа, 1994. Сс. 3-7.

62. Толковый словарь русских глаголов. Идеографическое описание. (Английские эквиваленты. Синонимы. Антонимы.) / Под ред. проф. Л.Г. Бабенко. М., 1999.

63. Уфимцева А.А. Семантика слова // Аспекты семантических исследований. М., 1980. Сс. 5-80.

64. Уфимцева А.А. Слово в лексико-семантической системе языка. М., 1986.

65. Филин Ф.П. Очерки по теории языкознания. М., 1982.

66. Шаров С.А. Список частот для слов русского языка (2000), URL: www.artint.ru/proiects/frqlist.asp.

67. Шведова Н.Ю. Глагол как доминанта в системе русской лексики. // Филологический сборник. М., 1995.

68. Шмелев Д.Н. Проблемы семантического анализа лексики. М., 1973.

69. Щур Г.С. Теории поля в лингвистике. М., 1974

70. Dowty D.R. Word Meaning and Montague Grammar. Dordrecht, Holland, 1979.

71. Fellbaum Ch. A Semantic Network of English Verbs // WordNet: an electronic lexical database / Ch. Fellbaum (ed.) MIT Press Books, 1998.

72. Kearns K. Semantics. New York: St. Martin's Press, 2000.

73. Kenny A. Action, Emotion and Will. London, 1963.

74. Leacock С., Chodorow M. Combining Local Context and WordNet Similarity for Word Sense Identification // WordNet: an electronic lexical database / Ch. Fellbaum (ed.) MIT Press Books, 1998. P. 285-303.

75. Miller G., Johnson-Laird P. Language and perception. Cambridge, Mass., 1976.

76. Miller G., Berkwith R., Fellbaum С., Gross D., Miller K. Five Papers on WordNet // CSL-Report, vol. 43. Princeton University, 1990.

77. Parsons T. Events in the Semantics of English. MIT Press, 1990.

78. VendIer, Zeno. Linguistics in philosophy. Ithaca, NY, Cornell, 1967.