автореферат диссертации по филологии, специальность ВАК РФ 10.02.21
диссертация на тему: Роль и функции контекстологического словаря в алгоритмической обработке контрактов и международных соглашений
Полный текст автореферата диссертации по теме "Роль и функции контекстологического словаря в алгоритмической обработке контрактов и международных соглашений"
На правах рукописи
СУШИ ЛИН Алексей Анатольевич
РОЛЬ И ФУНКЦИИ КОНТЕКСТОЛОГИЧЕСКОГО СЛОВАРЯ В АЛГОРИТМИЧЕСКОЙ ОБРАБОТКЕ КОНТРАКТОВ И МЕЖДУНАРОДНЫХ СОГЛАШЕНИЙ (НА МАТЕРИАЛЕ АНГЛИЙСКОГО ЯЗЫКА)
Специальность 10.02.21 - прикладная и математическая лингвистика
Автореферат диссертации на соискание ученой степени кандидата филологических наук
ООЗ1БЭ511
Москва - 2007
003159511
Работа выполнена на кафедре теоретической и прикладной лингвистики Института лингвистики и межкультуряой коммуникации Московского государственного областного университета
Научный руководитель
доктор филологических наук, профессор Юрий Николаевич Марчук
Официальные опионенты -
доктор филологических наук, доцент Валентина Григорьевна Кульпина
кандидат филологических наук Алексей Владимирович Ахренов
Ведущая организация
Институт языкознания Российской академии наук
_ 3£>
Защита состоится Л £ стЪжл. я^кЯ 2007 г. в У/ часов на заседании
диссертационного совета Д 212.155.04 при Московском государственном
областном университете по адресу: 105082, г. Москва, Переведеновский пер.,
д. 5/7,
С диссертацией можно ознакомиться в библиотеке Московского государственного областного университета по адресу: 105005, г. Москва, ул. Радио, д. 10 а.
Автореферат разослан сЛ^г^Л^гА. 2007 г.
Ученый секретарь диссертационного совета, доктор филологических наук, профессор
Г.Т.Хухуни
Диссертация посвящена исследованию возможностей контекстологического словаря в разрешении многозначности общеупотребительной лексики в текстах на английском языке, относящихся к новым для российской экономики смежным предметным областям
Актуальность темы исследования определяется потребностью совершенствования процедур разрешения многозначности в алгоритмической обработке информации на иностранном языке, необходимостью настройки соответствующих систем на конкретную предметную область и важностью изучения особенностей использования общеупотребительной лексики в новых предметных областях в прикладных целях
Распознавание значений многозначной лексики в контексте ее реального употребления представляет собой одну из наиболее серьезных проблем в системах алгоритмической обработки текстов. Одним из наиболее эффективных средств ее решения выступает контекстологический словарь (КС). Идея использования контекстологического словаря в алгоритмическом переводе текстов была выдвинута, разработана и опробована на практике Ю Н. Марчуком [1976].
Несмотря на конструктивность и эффективность использования КС в алгоритмической обработке текстов, он не получил широкого распространения в первую очередь потому, что его составление сопряжено с обработкой значительных объемов лингвистической информации, ее глубокой систематизацией и обязательной формализацией Однако развитие методов корпусной лингвистики открывает в этом отношении новые перспективы в использовании КС в алгоритмизации разрешения лексической многозначности
Исходными гипотезами исследования выступают предположения о том, что, во-первых, многозначная общеупотребительная лексика может приобретать в новых предметных областях терминологизированйый характер, во-вторых, что в функционировании многозначной общеупотребительной лексики в смежных предметных областях экономики есть как сходные, так и отличительные черты, и, в-третьих, что КС может стать эффективным инструментом раз-
работки методики интегрального исследования особенностей функционирования многозначной общеупотребительной лексики в текстах смежной (экономической) тематики
Соответственно, целью исследования является использование методов корпусной лингвистики в разработке методики интегрального исследования закономерностей и особенностей функционирования многозначной общеупотребительной лексики в текстах смежной (экономической) тематики, центральным компонентом которой выступает контекстологический словарь В соответствии с целью исследования были поставлены следующие конкретные задачи.
1) Проанализировать роль корпусной лингвистики в современных лингвистических исследованиях, в составлении контекстологических словарей и изучении синхронного состояния многозначной лексики, а также определить роль КС в алгоритмической обработке текста
2) Сформировать материал исследования - представительный корпус экономических текстов новых предметных областей - контрактов и соглашений на английском языке, и разбить его на темы с тем, чтобы они образовали смежные предметные области «Credit», «Business» и «Trade»
3) Отобрать в качестве объекта исследования набор ключевых понятий -многозначных общеупотребительных слов, существительных и глаголов, которые способны воплощать характерные для данной предметной области понятия
4) Разработать на основе принципов составления КС методику формального разрешения многозначности общеупотребительной лексики в специальных текстах и описания особенностей ее функционирования в новых смежных областях экономики.
5) На основе полученных результатов охарактеризовать роль и функции КС в алгоритмической обработке специальных текстов
Объектом исследования является многозначная общеупотребительная лексика (12 единиц) и контексты ее использования в корпусе текстов, свыше 900 единиц Предметом исследования являются принципы использования КС
в разрешении многозначности общеупотребительной лексики и выявлении закономерностей и особенностей ее функционирования в текстах на английском языке, относящихся к новым для российской экономики смежным предметным областям Материалом исследования послужил корпус современных американских экономических текстов контрактов и соглашений, относящихся к наиболее важным для становления современной российской экономики новым областям знания, общим объемом 995 тыс словоупотреблений
В диссертации использовались следующие методы исследования, корпусный, алгоритмический, дистрибутивный, статистический, контекстологический, комбинаторный, компонентный, сопоставительный, трансформационный, семантический и лексикографический
Основные результаты исследования:
1 Разработанная в диссертации методика интегрального исследования особенностей функционирования многозначной общеупотребительной лексики в текстах смежной (экономической) тематики на основе контекстологического словаря позволяет- 1) уточнять и систематизировать контекстологические принципы разрешения многозначности общеупотребительной лексики в (специальном) тексте, 2) выявлять и систематизировать закономерности и особенности ее употребления в трех новых для российской экономики смежных предметных областях, 3) охарактеризовать общие и отличительные черты языка самих исследованных смежных предметных областей экономики, 4) описать и обосновать роль и функции КС в алгоритмической обработке специального текста, 5) сделать выводы относительно перспектив применения КС в алгоритмических и других прикладных разработках- дидактических, методических, лексикографических и др
2 Наиболее показательными формальными способами разрешения многозначности общеупотребительной лексики в контексте выступают (1) исходная
сентенциальная формула, отражающая семантико-синтаксические особенности употребления многозначного слова в данном значении, (2) лексико-граммати-ческая модель, отражающая типичные синтагматические контексты его употребления; (3) семантические/ тематические классы слов, с которыми типично сочетается данное многозначное слово в данном значении
3 Многозначная общеупотребительная лексика в специальном тексте служит для выражения важных общедисциплинарных и междисциплинарных понятий, для организации и развертывания текста, а также для упорядочения терминологической лексики. При этом она чаще всего используется не во всех своих словарных значениях, в основном сохраняет свои основные значения, отражает происходящие изменения в организации ее словарных значений и/ или ее «тонкую настройку» на конкретную предметную область
В специальном тексте происходит терминологизация значений многозначной общеупотребительной лексики Причем в экономическом тексте значения общеупотребительной лексики могут приобретать не только экономический, но и ярко выраженный юридический характер, а самой важной ее чертой оказывается ее сочетаемость с целыми классами тематически маркированных понятий и терминов, которые в содержательном отношении обозначают центральные для данной предметной области категории явлений и объектов
4 Из трех исследованных массивов текстов, относящихся к смежным областям экономики, предметная область «Credit» более всего ориентирована на юридические отношения, «Business» - на финансовые отношения, a «Trade» -на экономические При этом во всех трех смежных предметных областях наблюдается тенденция использования многозначной общеупотребительной лексики в юридически маркированных значениях, что свидетельствует об общей четкой ориентации экономических текстов на английском языке на следование букве закона и договора
5. КС, как инструмент, разработанный для использования в прикладных целях, отличается наглядностью, эксплицитностью и формализованностью, и
потому может получить широкое применение при решении большого круга новых прикладных задач. К ним относится не только совершенствование алгоритмической обработки текста и ее интеграция в новые компьютерные технологии, но и целый комплекс дидактических и программных приложений Это разработка дидактических и компьютерных программ «активного типа» по обучению иностранному языку и переводу, составление комбинаторных и толково-комбинаторных словарей, тезаурусов-онтологий, учебных пособий и справочников «активного типа» словарей сочетаемости, терминологизирован-ных понятий, словосочетаний и т д
6. КС открывает новые перспективы в изучении специальных текстов и особенностей функционирования в них многозначной лексики не только в прикладных, но и теоретических целях Они предопределяются, в первую очередь, развитием корпусной лингвистики Она предоставляет принципиально новые возможности в составлении КС, позволяет повысить его качество и эффективность в описании активной и специальной лексики, и тем самым способствовать его интеграции в разнообразные программные продукты и исследовательские технологии
Научная новизна исследования заключается в изучении новых для российской экономики предметных областей, терминология которых на русском языке еще не устоялась, и которые испытывают поэтому потребность в лексикографических и алгоритмических описаниях словарях различных типов, в формальных процедурах перевода на русский язык и др Разработанная в диссертации методика интегрального " исследования особенностей функционирования многозначной общеупотребительной лексики в текстах смежной (экономической) тематики на основе КС, в этом отношении позволяет 1) выделять новые значения у многозначной лексики, 2) распознавать и уточнять значения многозначной лексики в специальном тексте, 3) фиксировать несвободную/ устойчивую сочетаемость многозначной лексики, причем в каждом из значений, 4) выявлять взаимосвязь между толкованием многозначной лексики, ее сочетаемостью и лексико-грам-
матическими моделями ее употребления, 5) изучать синхронное состояние многозначной общеупотребительной лексики в новых для российской экономики смежных предметных областях
Теоретическая, значимость диссертации состоит в разработке принципов исследования синхронного состояния многозначной общеупотребительной лексики. Они заключаются в интегральном представлении семантической, лексикографической, контекстологической и статистической информации о многозначной общеупотребительной лексике и ее использовании в специальном тексте и позволяют уточнять формальные процедуры разрешения ее многозначности в контексте, описывать особенности в ее функционировании в конкретной предметной области, выявлять лингвистические особенности языка самой предметной области и изучать синхронное состояние многозначной общеупотребительной лексики в новых предметных областях
Практическая значимость работы определяется возможностью использования результатов проведенного исследования в таких прикладных направлениях, как. 1) разработка лингвистического обеспечения систем компьютерной обработки документов и систем класса «искусственный интеллект», особенно машинного перевода, 2) алгоритмическая обработка специальной информации на естественном языке тематическая обработка специальных текстов и построение тематических словников, реляционных баз данных, процессоров по извлечению предметных знаний и т п; 3) методика преподавания специального перевода и перевода контрактов и соглашений с английского языка на русский, 4) лексикографическая практика составление словарей нового, активного типа частотных словарей словосочетаний и словарей терминологических словосочетаний конкретной предметной области, комбинаторных и толково-комбинаторных словарей, тезаурусов-онтологий, учебных пособий и справочников «активного типа»; 5) чтение лекций по корпусной лингвистике и автоматической обработке текстов
Апробация работы. Основные положения диссертации обсуждались на различных Международных и региональных научных конференциях на X Международной Юбилейной научной конференции студентов, аспирантов и молодых ученых "Ломоносов-2003", посвященной 250-летию МГУ (Москва, 15-18 апреля 2003 г), на научных конференциях в МГОУ (Москва 17 апреля 2003 г, 16 апреля 2004 г; 18 апреля 2005 г) Основные положения работы изложены в 6 публикациях
Структура диссертации. Работа состоит из введения, двух глав, заключения, библиографии и двух приложений Во введении обосновывается актуальность темы диссертации, ее научная новизна, теоретическая и практическая значимость, определяются цели и задачи исследования, формулируется объект, предмет, материал, методы и результаты исследования В главе 1 - «Корпусная лингвистика, контекстологический словарь и современные проблемы обработки информации на естественном языке» анализируется роль корпусной лингвистики в современных лингвистических исследованиях и выявляются ее возможности в составлении КС и изучении синхронного состояния многозначной лексики, определяется роль КС в алгоритмической обработке текста и излагаются принципы построения методики интегрального исследования особенностей функционирования многозначной общеупотребительной лексики в текстах смежной (экономической) тематики на основе КС В главе 2 - «Контекстологический словарь и разрешение лексической многозначности на примере англоязычных контрактов (договоров) и соглашений» приводятся полученные на основе разработанной методики сводные таблицы, содержащие комплексные данные о функционировании многозначной общеупотребительной лексики в исследованных массивах, и производится их анализ и обобщение Текст диссертации иллюстрируется рисунками (12) и таблицами (54) В заключении сформулированы основные результаты исследования. В приложении 1 даются образцы контрактов (договоров) и соглашений, на материале которых проводилось исследование, с выделенными ключевыми словами, в приложении
2 приводится корреляционный анализ синхронных векторов многозначной лексики.
Основное содержание диссертации
В ГЛАВЕ 1 «Корпусная лингвистика, контекстологический словарь и современные проблемы обработки информации на естественном языке» показано, что современные проблемы алгоритмической обработки информации, представленной на естественном языке (ЕЯ), невозможно решить без лингвистических данных, полученных методами корпусной лингвистики В результате корпусная лингвистика становится неотъемлемым инструментом не только самых разнообразных теоретических исследований, но и подавляющего большинства прикладных разработок [Баранов 1998, Нелюбин 1997, Шаров 2003, Рахилина 2003, Леонтьева 2006 и др ]
Преимущества корпусной лингвистики заключаются прежде всего в том, что она 1) оперирует большими объемами текстовой информации, что обеспечивает убедительность получаемых результатов, 2) использует реальные тексты, функционирующие в обществе и потому отражающие закономерности современного словоупотребления, 3) позволяет сравнивать синхронное и диахронное употребление языка, устанавливать межъязыковые параллели и т п, т е дает объективные данные об изменениях в использовании языка, об особенностях семантики единиц разных языков и мн др, 4) позволяет формировать словари принципиально нового типа, основанные на наблюдениях по использованию языковых единиц в реальных текстах Это, прежде всего, словари-конкордансы, контекстологические словари, толково-комбинаторные словари и тезаурусы-онтологии предметной области [Боровикова, Загорулько 2002, Нариньяни 2001]
Одной из наиболее актуальных проблем современной теоретической и прикладной лингвистики является описание и разрешение/снятие неоднозначности. Центральная проблема разрешения неоднозначности в системах автоматической обработки информации - лексическая
8
многозначность Проблема лексической многозначности существует не только в теории и практике автоматизированных систем обработки текста, но и в лингвистике в целом, причем КС является действенным инструментом ее описания, особенно в отдельной предметной области и смежных областях [Марчук 1976, Иомдин 2002, Рябцева 2005;Семенова, Леонтьева 2002 и мн
др]
Использование корпуса текстов для изучения особенностей функционирования общеупотребительной лексики в специальном тексте позволяет дать характеристику ее «синхронного» состояния и дополнить имеющиеся в литературе и словарях сведения о тенденциях ее использования Тем самым можно получить данные о синхронном использовании многозначной лексики в специальном тексте, которые традиционные словари отражать не могут, так как они фиксируют, в основном, «ретроспективный» опыт ее использования
КС строится для заданного списка многозначной лексики на основе конкорданса - специальным образом организованных и упорядоченных контекстов употребления каждого из элементов списка Словарь-конкорданс как средство упорядочения контекстно-значимой информации об особенностях употребления многозначной или новой лексики, и контектологический словарь как средство упорядочения лингвистической информации о значениях многозначной или новой лексики получили применение в разнообразных прикладных исследованиях и разработках Причем новые информационные технологии обеспечивают возможность их быстрого составления и обновления, теоретически безграничного увеличения их объема и потому информативности, а также их включения/интеграцию в различные программные продукты терминологические многоязычные базы данных, онтологии предметных областей и т п [Нариньяни 2001, Каневский, Тузов 2002].
Изучение синхронных и диахронных особенностей функционирования многозначной лексики имеет не только большое теоретическое значение, но и
практическое, особенно при составлении словников, словарей, справочников и пособий, при обучении иностранному языку, в процессе формирования лингвистического обеспечения систем автоматической обработки информации на ЕЯ и систем автоматизированного/ компьютерного обучения иностранному языку и т п [Магомедова 2004; Бахарлуи 2006, Варинская 2005 и мн др ]
Динамика использования многозначной общеупотребительной лексики -это особенности ее современного использования/ употребления в различных или смежных предметных областях, и приобретаемые ею при этом специфические или новые значения, а также «реорганизация» ее значений в зависимости от конкретной предметной области Одним из способов описания динамики использования многозначной общеупотребительной лексики в текстах смежной тематики выступает синхронный вектор слова Понятие СВС может найти применение в целом комплексе прикладных задач [Марчук 1988, Магомедова 2004, Марчук 2000]
Для того, чтобы установить возможности КС в разрешении многозначности общеупотребительной лексики в экономических текстах и в определении особенностей ее функционирования в них, в диссертации была разработана процедура составления КС на материале англоязычных контрактов (договоров) и соглашений Процедура состояла из следующих этапов
1 Сбор материала исследования поиск, отбор и упорядочение корпуса текстов англоязычных контрактов и соглашений, Систематизация материала исследования разбиение на темы, Отбор объекта исследования - ключевых понятий
2 Выбор контекстов употребления ключевых понятий предложений, содержащих искомый элемент, и их приведение к пропозициональной форме-сокращенной и упрощенной сентенциальной формуле, необходимой и достаточной для распознавания значения ключевого понятия
3 Выделение детерминант
4 Выбор инструмента исследования - словаря
5 Организация материала в виде таблицы разработка формата, содержания и способа интегрального представления данных
Из интернет-сайтов, посвященных финансово-экономическим отношениям, был отобран корпус текстов на английском языке на тему «контракты и соглашения» Всего было отобрано 100 контрактов и соглашений, которые составили исходный материал исследования Наиболее яркой лингвистической чертой отобранных документов выступает преобладание в них усложненных, распространенных самыми разнообразными синтаксическими оборотами и конструкциями, предложений Это значительно затрудняет анализ данных текстов и их понимание, но, главное, значительно затрудняет процедуру разрешения многозначности общеупотребительной лексики в контексте Вместе с тем, в таких реальных условиях проблема разрешения многозначности встает во всей своей сложности Корпус отобранных текстов был систематизирован и разделен на 3 массива Crédit, Business, Trade. Всего из корпуса текстов было отобрано 5 многозначных существительных (payment, support, application, conclusion, détermination) и 7 глаголов (to apply, to develop, to provide, to use, to realize, to issue, to reduce). Это общеупотребительные слова, т е лексемы с широкой понятийной основой, способные входить в терминологические словосочетания и конструкции Они были названы ключевыми понятиями (КП) Распознавание значения многозначной лексики в контексте сопряжено с явными трудностями, главным образом потому, что она употребляются не в своей словарной, «исходной» форме, а в самых разнообразных контекстных окружениях В процессе обработки текстового массива выбирались предложения, содержащие ключевое понятие Общее количество полученных таким образом контекстов употребления КП в проанализированном массиве -свыше 900 контекстов словоупотребления В целом соответствующий массив контекстов представляет собой конкорданс В процессе составления конкорданса выяснилось, что исходный контекст употребления ключевого
слова нуждается в преобразовании- упрощении, сокращении и обнажении его структуры. Поэтому громоздкие предложения сокращались до минимума
Как известно, теоретической основой принципов составления контекстологического словаря является теория детерминант [Марчук 1976] Согласно этой теории, каждое значение (перевод) многозначного слова, отличающееся от наиболее общего значения (общего выхода алгоритма перевода), детерминируется в контексте другими словами, с которыми данное слово сочетается, или определенными грамматическими признаками Эти слова, а также классы и группы слов, и грамматические признаки называются детерминантами Соответственно, в данной работе на этапе выделения из ближайшего контекста КП детерминант, отбирались наиболее показательные элементы, связанные с данным словом по смыслу По возможности в контексте учитывалась полнозначная лексика, так как многие из КП сочетаются с определенными классами полнозначной лексики, которые, в свою очередь, раскрывают значение соответствующего ключевого многозначного слова.
В ходе проведенной систематизации полученного языкового материала первоначально была опробована методика разрешения многозначности, которая была использована в ряде аналогичных прикладных исследований в кандидатской диссертации МВ. Марчук «К развитию лексических значений многозначных слов» [1988], в ее же докторской диссертации «Динамика лексических значений многозначных слов» [1996] и в кандидатской диссертации А. Н Магомедовой «Корпусная лингвистика и контекстное разрешение лексической многозначности слов» [2004], в которых значение многозначного слова определялось по двуязычному англо-русскому словарю Поэтому на первом этапе автором был выбран Большой англо-русский финансово-экономический словарь [Пивовар 2003], который является наиболее полным и современным изданием по финансово-экономической тематике Использование данного словаря для упорядочения материала показало, что установление значения многозначного слова в контексте по его русскому эквиваленту требует перевода всей фразы целиком, а перевод всей фразы
целиком, в свою очередь, требует установления значения данного многозначного слова в данном контексте Получается замкнутый круг, и вся процедура приобретает чрезмерно усложненный характер
В результате было принято решение использовать толковый одноязычный словарь Самыми популярными толковыми одноязычными словарями являются словари Longman и Webster Однако и их использование не дало желаемого эффекта, так как в них отсутствуют формальные принципы различения значений многозначного слова в контексте его словоупотребления
Учитывая вышеизложенное, было решено обратиться к одноязычному словарю Hornby Advanced [1988] Данный словарь, как показал его анализ, имеет не только ярко выраженную практическую направленность, но и содержит формальные показатели разграничения значений слова В нем каждому значению соответствует минимальный набор чаще всего формальных грамматических средств его идентификации При этом в нем указывается канонический вариант использования многозначного слова в данном контексте
Выбор данного словаря позволил не только выделить детерминанты и сравнить словарное значение слова с контекстным значением, но стал удобным инструментом для четкой и наглядной организации всего материала в виде таблиц Причем он позволил объединить в единую систему данные из собственно словаря Hornby, нашего материала для контекстологического словаря и словарь-конкорданс - контексты употребления многозначного слова
Пример сводной таблицы для многозначного существительного determination приводится на стр 14 (в работе эта таблица имеет номер 5 1) Всего было составлено и проанализировано 36 таблиц В результате были определены контекстологические принципы разрешения многозначности общеупотребительной лексики в специальном теките Этим вопросам посвящена глава 2.
Таблица 1 Существительное determination
№ Конкорданс Пропозициональный контекст Значение в словаре Кол -BO Показатель значения (детерминанта) H/3 П/3
the court making such determination shall have the power to limit the term or provision such determination
1 any determination that could reasonably be expected to materially adversely affect which determination shall be made by the Company's Board of Directors a final determination by the independent legal counsel in the determination of the Company and its underwriter or underwriters such date of determination at any date of determination (3) such determination is made in accordance with the definitions Determination Date (2) in the same manner as the determination with respect to domestic (U S A) all determinations of the Repurchase Obligation with respect to make all determinations with respect to any Tax Returns (3) -of determining or being determined, deciding значение в контексте «официальное (юрд.)пвстано вление» 18 any determination which determination shall be made by a final determination by m the determination of (the Company) such date of determination any date of determination such determination is made in accordance with Determination Date the determination with respect all determinations of (the Repurchase Obligation) with respect all determinations with respect to (any Tax Returns) 1 +
2 in the determination of such person's "parachute payment" under Section 280GoftheCode < (in)-of calculation or finding out (of an amount) 1 the determination of such person's payment 2
3 with - (to do sth) firmness of purpose, resolution 0 -
ВСЕГО 3 19 63 2
В ГЛАВЕ 2 - «Контекстологический словарь и разрешение лексической многозначности: на примере англоязычных контрактов (договоров) и соглашений» приводятся полученные на основе разработанной методики сводные таблицы, содержащие комплексные данные о значениях и функционировании многозначной общеупотребительной лексики в исследованных массивах, и производится их анализ и обобщение
Данные сводных таблиц содержат дистрибутивно - статистические характеристики КП и, в частности, показывают, что использование отобранных для анализа ключевых слов (многозначной общеупотребительной лексики) характеризуется в исследованных массивах экономических текстов следующими показателями сохранение / отсутствие многозначности, совпадение / несовпадение порядка значений в словаре и тексте, сходство / различие частотности, использование многозначной общеупотребительной лексики преимущественно в одной и той же грамматической форме и/ или значении
Так, из 12-ти проанализированных слов сохраняют многозначность 8 to provide, payment, to develop, détermination, application, to apply, conclusion, to reahze Из них только 2 слова употребляются во всех значениях (в скобках показано количество значений в словаре и в тексте) to provide (3/3), payment (3/3), а употребляются не во всех значениях 6 слов to develop (4/2), détermination (3/2), application (4/3), to apply (5/3), conclusion (4/3), to realize (4/2) При этом существительное payment почти не используется в своем третьем значении (4 словоупотребления из 226), а глагол to apply, самое многозначное слово из исследованных (5 значений в словаре), употребляется в проанализированных экономических текстах в трех значениях Соответственно, большинство из проанализированных, многозначных слов сохраняет свою многозначность в специальном (экономическом) тексте, однако при этом они используются чаще всего не во всех своих словарных значениях
Теряют многозначность и употребляются только в одном значении 4 слова to use (3/1), support (2/1), to reduce (3/1), to issue (3/1) При этом to use, support, to reduce употребляются в своем первом словарном значении, a to issue только в третьем, самом специальном значении Но во всех случаях те значения, в которых употребляются данные слова, стремятся к терминологизации
Так, у глагола to reduce первое общеупотребительное значение приобретает терминологизированный «количественный» характер (ср to reduce an amount / portion / price / fee / payment), у глагола to issue -терминологизированный «юридический» характер (cp to issue shares / subsidiaries, to issue a credit card / a debt / a warrant / a letter of credit / a report / a press release / a certificate), у существительного support терминологизированный «технологический» характер (ср support line/ staff/ period/ hours/ functions/ charges, etc) Соответственно, многозначная общеупотребительная лексика, теряющая свою многозначность в специальном (экономическом) тексте, чаще всего используется в своем основном, исходном значении Однако в любом случае значение такой лексики приобретает специальный, терминологизированный характер Об этом свидетельствует, прежде всего, ее употребление в большом количестве устойчивых терминологизированных словосочетаний
Что касается частотности, то сходна в значительной степени частотность употребления 6-ти слов (с учетом порядка значений) по всем массивам (в скобках указана частотность по массивам) to use (20/ 20/ 20), determination (19/ 13/ 23), to apply (29/ 26/ 14), to issue (51/51/ 32), to realize (7/ 7/ 8), to reduce (13/ 25/ 21) Из них сохраняют свою многозначность determination, to apply и to realize При этом determination употребляется чаще в первом значении, чем во втором (50 vs, 5), to realize - чаще в третьем, чем четвертом (17 vs 5), а у глагола to apply во всех массивах порядок значений «обратный» третье значение самое частотное, а первое - наименее частотное (31 vs 11) Соответственно, лексику, одинаково характерную (по частотности и порядку
значений) для смежных областей знания, можно охарактеризовать как обозначающую важные для данной предметной области в целом междисциплинарные понятия
Различается в значительной степени частотность употребления у 6-ми слов (с учетом порядка значений) в разных массивах to provide (27/ 15/ 12), to develop (16/ 6/ 10), support (34/ 0/ 5), payment (46/ 98/ 82), application {All 15/ 25), conclusion (7/ 0/1) При этом у глагола to provide третье («юридическое») значение наиболее частотно в массиве 1 (13/ 0/ 3), у to develop наименьшая частотность в массиве 2, существительное support используется преимущественно в массиве 1, payment наиболее характерно (частотно) для массива 2, в котором используется преимущественно в первом из трех значений (69/ 26/ 3), application наиболее характерно для массива 1, где сохраняет порядок значений, и весьма показательно для массива 3, в котором употребляется в третьем значении чаще, чем в первом и втором (6/ 8/ 11), conclusion более характерно для массива 1 имеет в нем наибольшее количество употреблений и наибольшее количество значений.
Соответственно, лексику, более характерную для данной смежной предметной области, можно определить как обозначающую в ней ключевые специальные понятия Так^ в предметной области «Credit» (массив 1) такими понятиями являются to provide (в третьем «юридическом» значении), to develop, support, application (в первом «юридическом» значении), conclusion В предметной области «Business» (массив 2) payment, application, to reduce, to provide (во втором значении) В предметной области «Trade» (массив 3) - to develop, determination, application (в третьем значении)
Анализ контекстов и закономерностей употребления выделенных ключевых понятий в исследованных массивах позволил также определить наиболее значимые для экономических текстов тематические классы слов и словосочетаний, играющих важную роль не только в разрешении многозначности общеупотребительной лексики, но и в отражении сущности и особенностей экономических текстов вообще Особо значимыми выступают
следующие тематические классы слов и словосочетаний, обозначающих 1) «юридическое лицо / орган» court, company, counsel, committee, board of directors, etc 2) «финансовый/ юридический документ» shares, subsidiaries, regulations, updates, quotas, a credit card, warrant, letter of credit, report, press release, certificate, etc. 3) «официальный/ юридический документ» provision, law, regulation, etc 4) «юридические процедуры и решения» registration, issuance, transfer, permission, visa, determination letter, etc. 6) финансовые документы и платежи account, balance, price, fee, payment, salary, commitment, obligation, etc 7) «типы и виды выплат/ платежей» late/ severance/ tax equalization, etc payment, payment m whole/ m part/ m excess, etc, fixed/ contingent/ royalty/ bonus/ scheduled/ referral, etc payments 8) «положительные» или «отрицательные платежи (вознаграждение или убытки/ штрафы), reward, damage, etc 9) «количество» (в широком смысле) number, value, amount, rate, portion, etc и др.
Соответственно, выявленные закономерности и особенности в сочетаемости проанализированных слов свидетельствуют о их тенденции к терминологизации в специальном (экономическом) тексте и подтверждают ярко выраженную общую юридическую ориентацию экономических текстов на английском языке вообще и предметной области «Credit» в особенности
Сводные дистрибутивно-статистические данные о закономерностях и особенностях использования многозначной общеупотребительной лексики в массивах 1,2 и 3 представлены в таблицах 2, 3 и 4
Они далее были использованы для вычисления синхронного вектора для каждого их проанализированных слов (СВС). Соответствующий материал содержится в Приложении 2
В целом он показывает, что чем частотнее слово в массиве и чем в большем количестве значений оно употребляется, тем -больше у него будет детерминант Это объясняется тем, что у каждого значения есть свои детерминанты и чем больше у многозначного слова словоупотреблений и значений, тем с большим количеством слов оно сочетается
Таблица 2 Сводные дистрибутивно-статистические данные о закономерностях и особенностях использования многозначной общеупотребительной лексики в массиве 1
1 1 3 4 5 6
Массив 1 CREDIT Кол-во словоупотреблений Кол-во Значений в словаре Количество Значений в тексте Кол-во детерминант Порядок значения в словаре и контексте
provide 27 3 3 54 -
develop 16 4 1 65 +
use 20 3 1 116 +
support 34 2 1 45 +
determination 19 3 2 63 +
payment 46 3 3 161 +
application 42 4 3 90 +
issue 51 3 1 129 -
apply 29 5 3 117 -
conclusion 7 4 3 24 -
reduce 13 3 1 36 +
realize 7 4 1 11 -
Таблица 3 Сводные дистрибутивно-статистические данные о закономерностях и особенностях Использования многозначной общеупотребительной лексики в массиве 2
1 2 3 4 5 6
Массив 2 BUSINESS Кол-во словоупотреблений Кол-во значений в словаре Количество Значений в тексте Кол-во детерминант Порядок значения в словаре и контексте
provide 15 3 2 38 -
develop 6 4 1 9 +
use 20 3 1 88 +
support 0 2 0 0 -
determination 13 3 2 18 +
payment 98 3 3 324 +
application 15 4 2 45 +
issue 51 3 1 116 -
apply 26 5 3 83 -
conclusion 0 4 0 0 -
reduce 25 3 1 58 +
realize 7 4 2 14 -
Таблица 4 Сводные дистрибутивно-статистические данные о закономерностях и особенностях использования многозначной общеупотребительной лексики в массиве 3
1 2 3 4 S 6
Массив 3 TRADE Кол-во словоупотреблений Кол-во значений в словаре Количество Значений в тексте Кол-во детерминант Порядок значения в словаре в контексте
provide 12 3 3 15 -
develop 10 4 2 46 +
use 20 3 1 111 +
support 5 2 1 12 +
determination 23 3 2 80 +
payment 82 3 2 263 +
application 25 4 2 46 -
issue 32 3 1 90 -
apply 14 5 3 55 -
conclusion 1 4 1 5 +
reduce 21 3 1 57 +
realize 8 4 2 31 -
В заключении подведены итоги исследования и сформулированы основные выводы
Проблема разрешения лексической многозначности остается одной из наиболее актуальных в теоретическом и прикладном отношении Наиболее остро в настоящее время стоит вопрос о распознавании значений многозначной лексики в контексте/ речи Особо заинтересованными в решении данного вопроса направлениями выступают алгоритмическая обработка текста в системах искусственного интеллекта, особенно при переводе с одного языка на другой, обучение иностранному языку и переводу, создание разнообразных справочников, пособий и словарей, особенно нового, активного типа, и мн. др
Изучение возможностей КС в разрешении лексической многозначности в текстах на английском языке, относящихся к новым для российской экономики предметным областям, и в выявлении закономерностей и особенностей функционирования многозначной лексики в специальном тексте проводилось в данном исследовании методами корпусной лингвистики
Корпусная лингвистика является одной из самых востребованных областей исследования в современном языкознании, причем не только в прикладном, но и теоретическом Она обеспечивает технологизацию сбора и обработки лингвистической информации, ее репрезентативность, надежность и функциональность, так как отражает использование языковых средств в реальных текстах и коммуникативных ситуациях. Она повышает значение и валидность квантитативных методов в лингвистике, позволяет более эффективно исследовать разнообразные синхронные и диахронные варианты языка, сравнивать их и т п В результате корпусная лингвистика формирует в лингвистике новую, «корпусную», «технологическую» идеологию в отношении к эмпирическому материалу и переориентирует теоретическую и прикладную лингвистику с исследования системы и структуры языка на изучение речи/ текста/ дискурса, т е. на его реальное функционирование.
В прикладной лингвистике при этом значительно расширяются возможности составления разного рода словарей, в том числе принципиально нового, «активного» типа комбинаторных, толково-комбинаторных, тезаурусов-онтологий, устойчивых оборотов и словосочетаний, в том числе и терминологических, и тп Значительно повышается также эффективность разработок по лингвистическому обеспечению разнообразных систем алгоритмической обработки информации на ЕЯ, компьютерных обучающих и дидактических систем, систем класса ИИ, в особенности машинного перевода.
Важными инструментами представления лингвистической информации в прикладной лингвистике становятся словари-конкордансы и контекстологические словари Они позволяют упорядочивать лингвистическую информацию о функционировании языковых средств в реальных коммуникативных ситуациях и использовать ее в алгоритмических процедурах. При этом открываются широкие возможности их совершенствования, совмещения со смежными прикладными и теоретическими разработками, а также их использования в качестве средства исследования языков для специальных целей, особенно новых предметных областей Это объясняется
тем, что КС способен аккумулировать и представлять в систематизированном и явном/ формализированном виде такие типы информации, которых нет в традиционных словарях
Использование КС в разработке методики интегрального исследования функционирования многозначной лексики в тексте показало, что он представляет собой важный эвристический инструмент получения и упорядочения формально-грамматической, семантической, лексикографической, синтагматической, «тематической», сочетаемостной и статистической информации о многозначной лексике и ее употреблении в реальных текстах
КС как важный инструмент представления лингвистических данных о многозначной лексике не исчерпал свои эвристические и прикладные возможности В сочетании с дополнительными смежными способами представления лингвистической информации он может стать организующим компонентом в методике интегрального представления лингвистической информации для разрешения многозначности общеупотребительной лексики в реальных текстах, для описания особенностей ее употребления в конкретной предметной области, для выявления лингвистических особенностей языка самой предметной области, для изучения синхронного состояния многозначной общеупотребительной лексики и т п
Проведенное исследование также показало, что идея традиционного КС, опирающегося на понятие «общего выхода» (без детерминант) и на пословно-пооборотный перевод текста (с английского языка на русский) может быть уточнена в нескольких отношениях
Так, разработанная в данном исследовании методика на основе КС свидетельствует, что, во-первых, все значения многозначной лексики имеют в тексте свои детерминанты. Во-вторых, выясняется, что общий выход КС, подразумевающий пословный перевод, в специальном тексте может привести к некорректному результату, поскольку в нем общеупотребительная лексика не только приобретает терминологизированное значение, но и входит в терминологизированные словосочетания, обороты и конструкции Поэтому
часто она не может быть переведена вне контекста, а требует идиоматичного перевода- в составе целого оборота и в соответствии с принятым способом выражения заданного смысла в языке перевода (Ср например, такие устойчивые обороты, как support line/ function/ staff/ charges/ period/ hours, etc)
В-третьих, КС нуждается в «настройке» на предметную область Это можно проиллюстрировать следующим примером В контекстологическом словаре общеупотребительной лексики, созданном на материале газетных текстов [Марчук 1976] многозначное существительное determination в первом значении «решимость» имеет две детерминанты «одушевленное существительное» и предлог «of» (ср the determination of smb) Если сравнить этот алгоритм перевода с примером из исследованного экономического текста in the determination of such person's parachute payment, то видно, что здесь ключевым словом для установления значения будет не одушевленное существительное (person), а экономическое понятие payment, которого, естественно, нет в указанном словаре Причем соответствующее «экономическое» (математическое) значение многозначного существительного determination («вычисление», которого, кстати, нет в указанном словаре) оказывается весьма актуальным в экономическом тексте, тогда как в значении «решимость» оно в нем не употребляется.
Для того чтобы использовать КС как инструмент перевода, он должен составляться на очень большом массиве параллельных текстов При этом возможности корпусной лингвистики позволяют включать в него значительное количество устойчивых словосочетаний и их переводов Это может значительно повысить эффективность использования КС в действующих системах алгоритмической обработки информации и во всех смежных разработках
В целом можно заключить, что современные компьютерные технологии корпусной лингвистики значительно расширяют возможности использования контекстологического словаря не только в области алгоритмической обработки
информации, но и в ряде смежных прикладных задач, особенно дидактических, методических и лексикографических, а также в теоретических исследованиях
Основные положения диссертационного исследования отражены в следующих публикациях:
1 Сушилин А А Вопросы типологии компьютерных словарей // Проблемы теории языка и переводоведения сб статей -М,2003 -№15 -С 54-64
2 Сушилин А А Многоязычный электронный словарь (ABBY LINGVO 9.0) для PC и POCKET PC // Проблемы теории языка и переводоведения сб статей - M, 2004 - № 22 - С. 55-63
3 Сушилин А А Разработка контекстологического словаря по международным соглашениям и контрактам // Перевод и переводоведение сб тезисов - M МГОУ, 2005 - С. 53
4 Сушилин А. А. Лексика языка англоязычных контрактов (договоров) и соглашений // Проблемы теории языка и переводоведения • сб статей - M, 2005 -№28 -С 69-74
5 Сушилин А А Контекстологический словарь и разрешение лексической многозначности на примере англоязычных контрактов и международных соглашений / А. А Сушилин, МГОУ - M, 2006 - 16 с - Деп в ВИНИТИ Рос акад наук 29 12 06, № 1142В06
6 Сушилин А А Роль и функции контекстологического словаря в алгоритмической обработке контрактов и международных соглашений (на материале английского языка)// Вестник МГОУ, серия «Лингвистика», №2 -M Изд-во МГОУ, 2007 -С 201-208
laxa i № 345. QftseM 1 n.ji. rnpw i 00 ¡kj.
Omcia ratio B OOO «nerpopyui». t , MoCKBa, y.i. Ila.nixa-2a, Te.i. 250-92-06 www .posta tor, ru
Оглавление научной работы автор диссертации — кандидата филологических наук Сушилин, Алексей Анатольевич
ВВЕДЕНИЕ.
ГЛАВА 1. КОРПУСНАЯ ЛИНГВИСТИКА, КОНТЕКСТОЛОГИЧЕСКИЙ СЛОВАРЬ И СОВРЕМЕННЫЕ ПРОБЛЕМЫ ОБРАБОТКИ ИНФОРМАЦИИ НА ЕСТЕСТВЕННОМ ЯЗЫКЕ.
1.1. Корпусная лингвистика как развивающаяся область современного языкознания.
1.2. Опыт создания корпуса текстов и его использования в теоретической и прикладной лингвистике.
1.3. Корпусная лингвистика и основные проблемы современного машинного перевода.
1.4. Значение словарей - конкордансов в корпусной лингвистике при описании терминологии.
1.5. Значение контекста в идентификации значения многозначного слова и контекстологическое представление (нового) термина.
1.5.1. Автоматический контекстологический словарь и теория детерминант.
1.5.2. Толково-комбинаторный словарь и устойчивая сочетаемость слова.
1.5.3. Роль общеупотребительной лексики в терминологии. Неоднозначность языка и многозначность термина.
1.6. Методика исследования синхронного состояния общеупотребительной лексики (на материале экономических текстов на английском языке).
1.7. Роль диахронии в изучении словарного состава языка.
1.8. Методика интегрального исследования особенностей функционирования многозначной общеупотребительной лексики в текстах смежной (экономической) тематики на основе контекстологического словаря.
1.8.1. Сбор материала исследования: поиск, отбор и упорядочение корпуса текстов англоязычных контрактов и соглашений.
Их лингвистическая характеристика.
1.8.2. Систематизация материала исследования: разбиение на темы.
1.8.3. Отбор объекта исследования - ключевых понятий.
1.8.4. Выбор контекстов употребления ключевых понятий: предложений, содержащих искомый элемент.
1.8.5. Приведение контекста к пропозициональной форме.
1.8.6. Выделение детерминант.
1.8.7. Организация материала в виде таблицы. Разработка формата, содержания и способа представления данных.
1.8.8. Выбор инструмента исследования - словаря.
1.8.9. Возможности и достоинства разработанной методики интегрального представления данных.
1.9. Синхронический вектор слова.
Выводы
ГЛАВА 2. КОНТЕКСТОЛОГИЧЕСКИЙ СЛОВАРЬ И РАЗРЕШЕНИЕ ЛЕКСИЧЕСКОЙ МНОГОЗНАЧНОСТИ: НА ПРИМЕРЕ АНГЛОЯЗЫЧНЫХ КОНТРАКТОВ (ДОГОВОРОВ) И СОГЛАШЕНИЙ.
2.1. Контекстологические принципы распознавания значений многозначной общеупотребительной лексики и ее дистрибутивно-статистические характеристики в (новых) смежных предметных областях экономики.
2.1.1. Контекстологические принципы распознавания значений глагола to provide и его дистрибутивно-статистические характеристики.
2.1.2. Контекстологические принципы распознавания значений глагола to develop и его дистрибутивно-статистические характеристики.
2.1.3. Контекстологические принципы распознавания значений глагола to use и его дистрибутивно-статистические характеристики.
2.1.4. Контекстологические принципы распознавания значений существительного support и его дистрибутивно-статистические характеристики.
2.1.5. Контекстологические принципы распознавания значений существительного determination и его дистрибутивностатистические характеристики.
2.1.6. Контекстологические принципы распознавания значений существительного payment и его дистрибутивно-статистические характеристики.
2.1.7. Контекстологические принципы распознавания значений существительного application и его дистрибутивно-статистические характеристики.
2.1.8. Контекстологические принципы распознавания значений глагола to issue и его дистрибутивно-статистические характеристики.
2.1.9. Контекстологические принципы распознавания значений глагола to apply и его дистрибутивно-статистические характеристики.
2.1.10. Контекстологические принципы распознавания значений существительного conclusion и его дистрибутивно-статистические характеристики.
2.1.11. Контекстологические принципы распознавания значений глагола to reduce и его дистрибутивно-статистические характеристики.
2.1.12. Контекстологические принципы распознавания значений глагола to realize и его дистрибутивно-статистические характеристики. 155 2.2. Закономерности и особенности использования многозначной общеупотребительной лексики в (новых) смежных предметных областях экономики.
Выводы.
Введение диссертации2007 год, автореферат по филологии, Сушилин, Алексей Анатольевич
Диссертация посвящена исследованию возможностей контекстологического словаря в разрешении многозначности общеупотребительной лексики в текстах на английском языке, относящихся к новым для российской экономики смежным предметным областям.
Актуальность темы исследования объясняется потребностью совершенствования процедур разрешения многозначности в алгоритмической обработке информации на иностранном языке, необходимостью настройки соответствующих систем на конкретную предметную область и важностью изучения особенностей использования общеупотребительной лексики в новых предметных областях.
Распознавание значений многозначной лексики в контексте ее реального употребления представляет собой одну из наиболее серьезных проблем в системах алгоритмической обработки текстов. Одним из наиболее эффективных средств ее решения выступает контекстологический словарь (КС). Идея использования контекстологического словаря в алгоритмическом переводе текстов была выдвинута, разработана и опробована на практике Ю.Н. Марчуком [1976].
Несмотря на конструктивность и эффективность использования КС в алгоритмической обработке текстов, он не получил широкого распространения в первую очередь потому, что его составление сопряжено с обработкой значительных объемов лингвистической информации, ее глубокой систематизацией и обязательной формализацией. Однако развитие методов корпусной лингвистики открывает в этом отношении новые перспективы в использовании КС в алгоритмизации разрешения лексической многозначности.
Исходными гипотезами исследования выступают предположения о том, что, во-первых, многозначная общеупотребительная лексика может приобретать в новых предметных областях терминологизированный характер, во-вторых, что в функционировании многозначной общеупотребительной лексики в смежных предметных областях экономики есть как сходные, так и отличительные черты, и, в-третьих, что КС может стать эффективным инструментом разработки методики интегрального исследования особенностей функционирования многозначной общеупотребительной лексики в текстах смежной (экономической) тематики.
Соответственно, целью исследования является использование методов корпусной лингвистики в разработке методики интегрального исследования закономерностей и особенностей функционирования многозначной общеупотребительной лексики в текстах смежной (экономической) тематики, центральным компонентом которой выступает контекстологический словарь.
В соответствии с целью исследования были поставлены следующие конкретные задачи:
1) Проанализировать роль корпусной лингвистики в современных лингвистических исследованиях, в составлении контекстологических словарей и изучении синхронного состояния многозначной лексики, а также определить роль контекстологического словаря в алгоритмической обработке текста.
2) Сформировать материал исследования - представительный корпус экономических текстов новых предметных областей - контрактов и соглашений на английском языке, и разбить его на темы с тем, чтобы они образовали смежные предметные области: «Credit», «Business» и «Trade»;
3) Отобрать в качестве объекта исследования набор ключевых понятий -многозначных общеупотребительных слов, существительных и глаголов, которые способны воплощать характерные для данной предметной области понятия;
4) Разработать на основе принципов составления КС методику формального распознавания значений многозначной общеупотребительной лексики и исследования особенностей ее функционирования в специальном тексте;
5) Сравнить данные об использовании многозначной общеупотребительной лексики в смежных предметных областях и определить закономерности и особенности в ее функционировании;
6) На основе полученных результатов охарактеризовать роль и функции контектологического словаря в алгоритмической обработке специальных текстов.
Объектом исследования является многозначная общеупотребительная лексика (12 единиц) и контексты ее использования в корпусе текстов: свыше 900 единиц.
Предметом исследования является изучение синхронного состояния многозначной общеупотребительной лексики с помощью контекстологического словаря: выявление закономерностей и особенностей ее функционирования в текстах на английском языке, относящихся к новым для российской экономики смежным предметным областям.
Материалом исследования послужил корпус современных американских экономических текстов контрактов и соглашений, относящихся к наиболее важным для становления современной российской экономики новым областям знания, общим объемом 995 тыс. словоупотреблений.
Основные методы, применяемые в настоящей работе, определяются задачами исследования. В диссертации использовались следующие методы исследования: корпусный, алгоритмический, дистрибутивный, статистический, контекстологический, комбинаторный, компонентный, сопоставительный, трансформационный, семантический и лексикографический.
Основные результаты исследования, выносимые на защиту:
1. Разработанная в диссертации методика интегрального исследования особенностей функционирования многозначной общеупотребительной лексики в текстах смежной (экономической) тематики на основе контекстологического словаря позволяет:
1) уточнять и систематизировать контекстологические принципы идентификации значений многозначной общеупотребительной лексики в (специальном) тексте;
2) выявлять и систематизировать закономерности и особенности ее употребления в трех новых для российской экономики смежных предметных областях;
3) охарактеризовать общие и отличительные черты языка самих исследованных смежных предметных областей экономики;
4) описать и обосновать роль и функции контекстологического словаря в алгоритмической обработке специального текста;
5) сделать выводы относительно перспектив применения контекстологического словаря в алгоритмических и других прикладных разработках: дидактических, методических, лексикографических и др.
2. Наиболее показательными способами идентификации значений многозначной лексики в контексте выступают: (1) исходная сентенциальная формула, отражающая семантико-синтаксические особенности употребления многозначного слова в данном значении; (2) лексико-грамматическая модель, отражающая типичные синтагматические контексты его употребления; (3) семантические/ тематические классы слов, с которыми типично сочетается данное многозначное слово в данном значении.
3. Многозначная общеупотребительная лексика в специальном тексте служит для выражения важных общедисциплинарных и междисциплинарных понятий, для организации и развертывания текста, а также для упорядочения специальной, терминологической лексики. При этом она чаще всего используется не во всех своих словарных значениях, в основном сохраняет свои основные значения, отражает намечающиеся тенденции в изменениях в организации ее словарных значений и/ или ее «тонкую настройку» на конкретную предметную область.
В специальном тексте происходит «специализация» и терминологизация значений многозначной общеупотребительной лексики. Причем в экономическом тексте значения общеупотребительной лексики могут приобретать не только экономический, но и ярко выраженный юридический характер, а самой важной ее чертой оказывается ее сочетаемость с целыми классами тематически маркированных понятий и терминов, которые в содержательном отношении обозначают центральные для данной предметной области категории явлений и объектов.
4. Из трех исследованных массивов текстов, относящихся к смежным областям экономики, предметная область «Credit» более всего ориентирована на юридические отношения, «Business» - на финансовые отношения, а «Trade» - на экономические. При этом во всех трех смежных предметных областях наблюдается явная тенденция использования многозначной общеупотребительной лексики в юридически маркированных значениях, что свидетельствует об общей четкой ориентации экономических текстов на английском языке на следование букве закона и договора.
5. КС, как инструмент, разработанный для использования в прикладных целях, отличается наглядностью, эксплицитностью и формализованностью, и потому может получить широкое применение при решении большого круга новых прикладных задач. К ним относится не только совершенствование алгоритмической обработки текста и ее интеграция в новые компьютерные технологии, но и целый комплекс дидактических и программных приложений. Это разработка дидактических и компьютерных программ «активного типа» по обучению иностранному языку и переводу, составление комбинаторных и толково-комбинаторных словарей, тезаурусов-онтологий, учебных пособий и справочников и активного типа»: новой, активной, тематической и т.п. лексики, словарей сочетаемости, терминологизированных понятий, словосочетаний, оборотов и конструкций, и т.д.
КС открывает новые перспективы в дальнейшем изучении специальных текстов и особенностей функционирования в них многозначной лексики не только в прикладных, но и теоретических целях. Они предопределяются, в первую очередь, развитием корпусной лингвистики. Она предоставляет принципиально новые возможности в составлении контекстологического словаря, позволяет повысить его качество и эффективность в описании активной и специальной лексики, и тем самым способствовать его интеграции в разнообразные программные продукты и исследовательские технологии.
Научная новизна исследования заключается в изучении новых для российской экономики предметных областей, терминология которых на русском языке еще не устоялась, и которые испытывают поэтому потребность в лексикографических и алгоритмических описаниях: словарях различных типов (толковых, одноязычных, двуязычных, энциклопедических и т.д.), формальных процедур перевода на русский язык и др.
Разработанная в диссертации методика интегрального исследования особенностей функционирования многозначной общеупотребительной лексики в текстах смежной (экономической) тематики на основе контекстологического словаря, в этом отношении позволяет: 1) выделять новые значения у многозначной лексики; 2) уточнять значения многозначной лексики в специальном тексте; 3) фиксировать несвободную/ устойчивую сочетаемость многозначной лексики, причем в каждом из значений; 4) выявлять взаимосвязь между толкованием многозначной лексики, ее сочетаемостью и лексико-грамматическими моделями ее употребления; 5) изучать синхронное состояние многозначной общеупотребительной лексики: выявлять закономерности и особенности ее использования в новых для российской экономики смежных предметных областях.
Теоретическая значимость диссертации состоит в разработке принципов исследования синхронного состояния многозначной общеупотребительной лексики. Они заключаются в интегральном представлении семантической, лексикографической, контекстологической и статистической информации о многозначной общеупотребительной лексике и ее использовании в специальном тексте и позволяют: уточнять формальные процедуры распознавания ее значений в контексте, описывать особенности в ее функционировании в конкретной предметной области, выявлять лингвистические особенности языка самой предметной области и изучать синхронное состояние многозначной общеупотребительной лексики в новых предметных областях.
Практическая значимость работы определяется возможностью использования результатов проведенного исследования в таких прикладных направлениях, как: 1) разработка лингвистического обеспечения систем компьютерной обработки документов, в том числе в Интернете; систем класса «искусственный интеллект», особенно машинного перевода; создание новых ме-тапоисковых систем; 2) алгоритмическая обработка специальной информации на естественном языке: тематическая обработка специальных текстов и построение тематических словников, реляционных баз данных, процессоров по извлечению предметных знаний, создание «автоматизированного рабочего места эксперта» по составлению терминологических словарей, словарей словосочетаний конкретной предметной области и т.п.; 3) методика преподавания специального перевода и перевода контрактов и соглашений с английского языка на русский; компьютеризация методики преподавания иностранного языка и перевода; 4) лексикографическая практика: составление специальных одноязычных и двуязычных словарей, глоссариев, конкордансов и т. п., словарей нового, активного типа: частотных словарей словосочетаний и словарей терминологических словосочетаний конкретной предметной области, комбинаторных и толково-комбинаторных словарей, тезаурусов-онтоло-гий, учебных пособий и справочников «активного типа»: новой, активной, тематической и т.п. лексики, словарей сочетаемости, терминологизирован-ных оборотов и конструкций, и т.д. 5) чтение лекций по корпусной лингвистике и автоматической обработке текстов.
Достоверность результатов и выводов исследования обеспечивается большим объемом исследованного лингвистического материала, системным и наглядным представлением полученных лингвистических данных в виде таблиц и подтверждением высказываемых положений языковыми примерами.
Апробация работы. Основные положения диссертации обсуждались на различных Международных и региональных научных конференциях: на X Международной Юбилейной научной конференции студентов, аспирантов и молодых ученых "Ломоносов-2003", посвященной 250-летию МГУ (Москва, 15-18 апреля 2003 г.); на научных конференциях в МГОУ (Москва 17 апреля 2003 г.; 16 апреля 2004 г.; 18 апреля 2005 г.). Основные положения работы изложены в 6 публикациях.
Структура диссертации. Работа состоит из введения, двух глав, заключения, библиографии и приложений. Текст диссертации иллюстрируется рисунками и таблицами.
Заключение научной работыдиссертация на тему "Роль и функции контекстологического словаря в алгоритмической обработке контрактов и международных соглашений"
ВЫВОДЫ
Для определения роли и функций контекстологического словаря (КС) в алгоритмической обработке информации в данной диссертации была разработана «Методика интегрального исследования особенностей функционирования многозначной общеупотребительной лексики в текстах смежной (экономической) тематики на основе контекстологического словаря». Она заключается в интегральном представлении семантической, лексикографической, контекстологической, синтагматической и статистической информации о многозначной лексике с целью идентификации и характеристики ее значений в контексте. В основу методики положена идея КС как инструмента алгоритмического распознавания значений многозначной лексики в контексте, и словаря-конкорданса как инструмента составления КС.
Применение разработанной методики к анализу функционирования многозначной общеупотребительной лексики в специально сформированном корпусе современных экономических текстов, относящихся к трем новым для отечественной экономики смежным предметным областям ("Credit",
Business" и "Trade"), позволяет: 1) уточнять и систематизировать контекстологические принципы идентификации значений многозначной общеупотребительной лексики в (специальном) тексте; 2) выявлять и систематизировать закономерности и особенности ее употребления в трех новых для российской экономики смежных предметных областях; 3) охарактеризовать общие и отличительные черты, языка самих исследованных смежных предметных областей экономики; 4) описать и обосновать роль и функции контекстологического словаря в алгоритмической обработке специального текста; 5) сделать выводы относительно перспектив применения контекстологического словаря в алгоритмических и других прикладных разработках: дидактических, методических, лексикографических и др.
Проведенное исследование показало, что возможности контекстологического словаря в алгоритмической обработке специальных текстов заключаются в том, что он является эффективным средством распознавания значений многозначной лексики, позволяет выявлять характерные контексты ее употребления и упорядочивать их, систематизировать закономерности и особенности ее употребления в специальном (экономическом) тексте, а также может быть использован в разработке методики интегрального исследования функционирования многозначной лексики в тексте. ^
1. Контекстологический словарь является эффективным средством распознавания значений многозначного слова в реальном контексте его употребления, в реальной коммуникативной ситуации. Это объясняется тем, что КС способен аккумулировать и представлять в систематизированном и явном/ формализированном виде такие типы информации, которых нет в традиционных словарях.
Как показало исследование, в большинстве традиционных одноязычных и двуязычных словарей отсутствуют сведения о формальных способах разграничения значений многозначной лексики. Они просто иллюстрируются наиболее типичными примерами, а в самых «продвинутых» типах словарей приводится минимальный и только самый типичный формально-грамматический контекст. В большинстве случаев такая информация оказывается недостаточной для формального распознавания значения многозначного слова в контексте. Это значительно затрудняет практическое использование традиционных словарей, особенно на начальных этапах изучения иностранного языка, при обучении переводу, при составлении автоматических словарей в системах алгоритмической обработки текста и т.д.
2. КС позволяет выявлять характерные для данного типа текстов контексты употребления многозначной лексики.
Как показало исследование, многозначная общеупотребительная лексика используется в специальном (экономическом) тексте чаще всего в контекстах, которые не отражены в традиционных словарях. Так, многозначная лексика, особенно глагольная, используется в реальных текстах чаще всего не в своей «словарной» форме и/ или в зафиксированной в словаре «исходной», «канонической», наиболее показательной формально-грамматической конструкции, а в «модифицированной», «производной», контекстно-зависимой (модализованной, диатезно преобразованной, оценочно маркированной и т.д.) форме. При этом формальные грамматические детерминанты значения многозначного слова находятся не в непосредственном его окружении, а в более широком контексте или же просто подразумеваются организацией текста. В результате для распознавания значения требуется дополнительная информация. Например, многозначное существительное payment в первом значении («paying») далеко не всегда употребляется в зафиксированной в словаре (Hornby Advance d) формуле «in payment , for», а используется в «производных» от нее лексико-грамматических моделях: payment to / by/ о if in ас cordance wit h и мн. др. Глагол to provide в третьем («пропозициональном») значении употребляется в исследованных массивах только в пассивной форме, в которой формально не просматривается связь с зафиксированной в словаре для этого значения грамматической конструкцией «to provide that».
3. КС позволяет упорядочивать лингвистическую информацию о контекстах употребления многозначной лексики и систематизировать способы идентификации ее значений в тексте.
Так, проведенное исследование показало, что наиболее показательными способами представления лингвистической информации, релевантной для идентификации значений многозначной лексики в контексте, выступают:
1) исходная сентенциальная формула, отражающая семантико-синтаксические особенности употребления многозначного слова в данном значении. Такая информация наиболее релевантна для распознавания значений многозначных глаголов, значение которых зависит не только от характера объекта, которым они управляют, но и от характера субъекта соответствующего действия: одушевленного или неодушевленного. Например, первое значение многозначного глагола to apply лучше всего представимо в виде сентенциальной формулы Smb applies for (a visa/ registration, etc.);
2) лексико-грамматическая модель, отражающая типичные синтагматические контексты его употребления. Так, второе значение многозначного глагола to provide лучше всего представимо в виде лексико-грамматической модели to provide smth/ smb (with/ for/ to);
3) семантические/ тематические классы слов, с которыми типично сочетается данное многозначное слово в данном значении. Так, наиболее важным контекстуальным маркером/ детерминантой употребления многозначного глагола to provide в третьем (весьма характерном для массива 3) «пропозициональном» значении «to stipulate that» выступает его сочетаемость с существительными, эксплицирующими его «пропозициональную» валентность «на текст» (придаточное изъяснительное). В качестве таковых в исследованных экономических текстах выступает лексика, обозначающая «документ», точнее, «юридический документ» или его вид/ тип/ часть и т.п.: document, agreement, obligation, notice, note, paragraph, etc.
4. КС позволяет выявлять и систематизировать лингвистическую информацию о закономерностях и особенностях употребления многозначной общеупотребительной лексики в специальном (экономическом) тексте и определять его лингвистическую специфику.
Так, в исследованном массиве экономических текстов наблюдается «специализация» многозначной общеупотребительной лексики и ее «тонкая настройка» на данную предметную область в целом и на входящие в нее смежные, более узкие предметные области. Кроме того, наблюдается «специализация» грамматических форм употребления многозначной общеупотребительной лексики в данных типах текстов.
В частности, специфика употребления многозначной общеупотребительной лексики в экономическом тексте заключается, с одной стороны, в сокращении количества ее значений по сравнению с количеством ее значений в общеупотребительном языке/ словаре, а с другой стороны, в «сужении» и «специфицикации» ее значений, которые уточняются и чаще всего терминологизируются (ср. support line/ staff/ period/ hours/ functions/ charges, etc.). При этом оказывается, что большинство из соответствующих значений приобретает не экономический, как можно было бы предположить, а «юридический» характер.
Например, глагол to issue используется в экономических текстах только в своем третьем значении «to publish/ put into circulation», и при этом сочетается с такими «объектами» и конструкциями, которые указывают на «официальность» (юридическую значимость) производимой при этом акции: to issue shares/ subsidiaries/ regulations/ updates/ quotas/ a credit card/ debt/ warrant/ letter of credit/ report/ press release/ certificate, etc.; to issue in accordance with/ in compliance with/ with respect to/ in violation of/ by way of dividend/ with a (greater) aggregate component/ in exchange/ in an amount/ under an indenture, etc. У существительного application два значения приобретают юридический характер; у determination первое значение приобретает ярко выраженный юридический характер, а второе - «количественный», и т.д.
Специализация» грамматических форм употребления многозначной общеупотребительной лексики при этом касается чаще всего ее числа и залога. Так, в исследованных экономических текстах многозначный глагол to use, во-первых, теряет свою многозначность, а во-вторых, чаще всего употребляется в пассивной форме. Многозначное существительное payment во втором значении («sum») используется только во мн. ч. и при этом входит в целый ряд устойчивых словосочетаний, ср. fixed/ contingent/ royalty/ bonus/ scheduled/ referral/ payments; to make/ receive/ remit, etc. payments.
В результате оказывается, что для каждой предметной области необходима «тонкая настройка» на нее словаря общеупотребительной лексики: учет наиболее характерных моделей и форм употребления, сочетаемости и т.п.
5. КС может быть использован в разработке методики интегрального исследования функционирования многозначной лексики в тексте. При этом КС выступает в качестве эвристического инструмента получения и организации формально-грамматической, семантической, лексикографической, синтагматической, «тематической», сочетаемостной и статистической информации о многозначной лексике и ее употреблении в реальных текстах. Так, разработанная в данном исследовании методика позволяет:
1) выделять новые значения у данного многозначного слова, в частности, показывать необходимость выделения из одного словарного значения слова двух автономных. Так, исследование показало, что глагол to develop в переходном и непереходном значении характеризуется непересекающимися контекстами употребления, находящимися в отношении дополнительной дистрибуции, что свидетельствует о несинонимичности соответствующих значений;
2) уточнять значения многозначного слова в специальном тексте. Так, исследование показало, что многозначность общеупотребительной лексики в специальном тексте сокращается и ограничивается, но вместе с тем еще и «преобразуется»: «реорганизуется», специализируется, унифицируется и «настраивается» на данную предметную область. Например, было установлено, что существительное determination в экономическом тексте в первом значении обозначает не просто «решение» (как в общеупотребительном языке), а «(официальное) решение/ постановление (официального лица/ органа)», поскольку окружающий его контекст содержит такие детерминанты, как court, company, counsel, committee, board of directors, etc., которые в целом составляют тематический класс «официальное лицо/ орган»;
3) фиксировать несвободную/ устойчивую сочетаемость многозначного слова, причем в каждом из значений. Так, исследование показало, что сочетаемость многозначной общеупотребительной лексики в специальном тексте «специализируется», «терминологизируется», расширяется и «переориентируется» на данную предметную область. В результате проявляется важность составления специальных («настроенных» на конкретную предметную область) словарей сочетаемости, комбинаторных и толково-комбинаторных словарей, словарей устойчивых (терминологических и тер-минологизированных) оборотов, словосочетаний и конструкций, тезаурусов-онтологий, словарей активной/ тематической лексики и т.п., и в целом -выявления особенностей несвободной сочетаемости многозначной общеупотребительной лексики в специальном тексте;
4) выявлять взаимосвязь между толкованием многозначной лексики, ее сочетаемостью и лексико-грамматическими моделями ее употребления. В результате появляется возможность показать, что толкование слова/ идентификация значения многозначного слова в контексте и его перевод на иностранный язык представляют собой хотя и тесно взаимосвязанные, но, тем не менее, достаточно автономные этапы и задачи не только при понимании (иноязычного) текста, но и в алгоритмической обработке информации.
Это объясняется тем, что в большинстве случаев одна и та же многозначная лексика, в зависимости от контекста, может выражать разные понятия, причем ее перевод на иностранный язык будет предопределяться, в первую очередь, внутриязыковыми правилами идиоматичности выражения заданного смысла в языке перевода и наличием соответствующего терминологизированного выражения в нем. Это подтверждается и тем, что, во-первых, почти все из проанализированных ключевых слов входят в устойчивые (и потому терминологизированные) словосочетания и обороты, и, во-вторых, тем, что при этом они сочетаются не с отдельными терминами, а с целыми тематическими классами слов, которые представляют собой открытый ряд. При этом проведенное исследование показывает, что качество перевода (в данном случае с английского на русский) будет в значительной степени зависеть не только от корректной идентификации значения многозначного слова в контексте, но и от качества его толкования;
5) изучать синхронное состояние многозначной общеупотребительной лексики. Так, исследование показало, что статистические данные об особенностях использования многозначной общеупотребительной лексики в специальном тексте свидетельствуют о несовпадении «активного словаря» даже у смежных предметных областей; о несовпадении количества употреблений в них конкретного многозначного слова в данном значении; о несовпадении «основного» и «периферийного» значений данного многозначного слова в общеупотребительном словаре и специальном тексте. Например, глагол to issue в исследованных массивах употребляется только в своем третьем, «последнем» значении, причем достаточно активно. Это может свидетельствовать о том, что и в общеупотребительном языке это значение причем весьма важное в современном мире: «издавать, публиковать») постепенно переходит из периферийного в основное, наиболее востребованное.
В целом проведенное исследование показывает, что контекстологический словарь как эффективный инструмент представления лингвистических данных о" многозначной лексике не исчерпал свои эвристические и прикладные возможности. В сочетании с дополнительными смежными способами представления лингвистической информации он может стать организующим компонентом в методике интегрального представления лингвистической информации для распознавания значений многозначной лексики в реальных контекстах ее употребления, для описания особенностей ее употребления в конкретной предметной области, для выявления лингвистических особенностей языка самой предметной области, для изучения синхронного состояния многозначной общеупотребительной лексики и т.п.
ЗАКЛЮЧЕНИЕ
Главное в исследовании языка - это выявление закономерностей и особенностей его устройства и использования в разнообразных ситуациях, с разнообразными целями и для выражения определенного/ заданного смысла. При этом проблема описания лексической многозначности остается одной из наиболее актуальных в теоретическом и прикладном отношении. Наиболее остро в настоящее время стоит вопрос о распознавании значений многозначной лексики в контексте/ речи. Особо заинтересованными в решении данного вопроса направлениями выступают алгоритмическая обработка текста в системах искусственного интеллекта, особенно при переводе с одного языка на другой, обучение иностранному языку и переводу, создание разнообразных глоссариев, справочников, пособий и словарей, особенно нового, активного типа, и мн. др.
Изучение возможностей контекстологического словаря в разрешении лексической многозначности в текстах на английском языке, относящихся к новым для российской экономики смежным предметным областям, и в выявлении закономерностей и особенностей ее функционирования в специальном тексте проводилось в данном исследовании методами корпусной лингвистики.
Корпусная лингвистика является одной из самых востребованных областей исследования в современном языкознании, причем не только в прикладном, но и теоретическом. Она обеспечивает технологизацию сбора и обработки лингвистической информации, ее репрезентативность, надежность и функциональность, так как отражает использование языковых средств в реальных текстах и коммуникативных ситуациях. Она повышает значение и валидность квантитативных методов в лингвистике, позволяет более эффективно исследовать разнообразные синхронные и диахронные варианты языка, сравнивать их и т.п. (ср. общеупотребительный, специальный, профессиональный и т.п. язык, язык печати, художественной литературы и т.п.).
В результате корпусная лингвистика формирует в лингвистике новую, «корпусную», «технологическую» идеологию в отношении к эмпирическому материалу и переориентирует теоретическую и прикладную лингвистику с исследования системы и структуры языка на изучение речи/ текста/ дискурса, т.е. на его реальное функционирование.
В прикладной лингвистике при этом значительно расширяются возможности составления разного рода словарей, в том числе принципиально нового, «активного» типа: комбинаторных, толково-комбинаторных, тезаурусов-онтологий, устойчивых оборотов и словосочетаний, в том числе и терминологических, и т.п. Значительно повышается также эффективность разработок по лингвистическому обеспечению разнообразных систем алгоритмической обработки информации на естественном языке, компьютерных обучающих и дидактических систем, систем класса ИИ, в особенности машинного перевода.
Важными инструментами представления лингвистической информации в прикладной лингвистике становятся словари-конкордансы и контекстологические словари. Они позволяют упорядочивать лингвистическую информацию о функционировании языковых средств в реальных коммуникативных ситуациях и использовать ее в алгоритмических процедурах. При этом открываются широкие возможности их совершенствования, совмещения со смежными прикладными и теоретическими разработками, а также их использования в качестве средства исследования языков для специальных целей, особенно новых предметных областей.
Так, проведенное исследование показало, что разработанная в диссертации «Методика интегрального исследования особенностей функционирования многозначной общеупотребительной лексики в текстах смежной (экономической) тематики на основе контекстологического словаря» позволяет:
1) уточнять и систематизировать контекстологические принципы идентификации значений многозначной общеупотребительной лексики в (специальном) тексте;
2) выявлять и систематизировать закономерности и особенности ее употребления в трех новых для российской экономики смежных предметных областях;
3) охарактеризовать общие и отличительные черты языка самих исследованных смежных предметных областей экономики;
4) описать и обосновать роль и функции контекстологического словаря в алгоритмической обработке специального текста;
5) сделать выводы относительно перспектив применения контекстологического словаря в алгоритмических и других прикладных разработках: дидактических, методических, лексикографических и др.
1. Возможности контекстологического словаря в алгоритмической обработке специальных текстов заключаются в том, что он является эффективным средством распознавания значений многозначной лексики, позволяет выявлять характерные контексты ее употребления и упорядочивать их, систематизировать закономерности и особенности ее употребления в специальном (экономическом) тексте, а также может быть использован в разработке методики интегрального исследования функционирования многозначной лексики в тексте. Это объясняется тем, что КС способен аккумулировать и представлять в систематизированном и явном/ формализированном виде такие типы информации, которых нет в традиционных словарях.
Так, проведенное исследование показало, что наиболее показательными способами представления лингвистической информации, релевантной для идентификации значения многозначной лексики в контексте, выступают: (1) исходная сентенциальная формула, отражающая семантико-синтаксические особенности употребления многозначного слова в данном значении; (2) лексико-грамматическая модель, отражающая типичные синтагматические контексты его употребления; (3) семантические/ тематические классы слов, с которыми типично сочетается данное многозначное слово в данном значении.
Использование КС в разработке методики интегрального исследования функционирования многозначной лексики в тексте показало, что он представляет собой важный эвристический инструмент получения и упорядочения формально-грамматической, семантической, лексикографической, синтагматической, «тематической», сочетаемостной и статистической информации о многозначной лексике и ее употреблении в реальных текстах.
Так, разработанная в данном исследовании методика позволяет: 1) выделять новые значения у данного многозначного слова; 2) уточнять значения многозначного слова в специальном тексте; 3) фиксировать несвободную/ устойчивую сочетаемость многозначного слова, причем в каждом из значений; 4) выявлять взаимосвязь между толкованием многозначной лексики, ее сочетаемостью и лексико-грамматическими моделями ее употребления; 5) изучать синхронное состояние многозначной общеупотребительной лексики: выявлять закономерности и особенности ее использования в современных специальных текстах.
2. Основные закономерности и особенности использования многозначной общеупотребительной лексики в новых (для российской экономики) смежных предметных областях («Credit», «Business», «Trade»), которые были установлены в ходе исследования, можно обобщить следующим образом.
Многозначная общеупотребительная лексика в большинстве случаев сохраняет свою многозначность в специальном (экономическом) тексте (на английском языке), однако при этом она используется чаще всего не во всех своих словарных значениях. Так, из 12 проанализированных слов {to provide, to develop, to use, support, determination, payment, application, to issue, to apply, conclusion, to reduce, to realize) 8 употребляются в двух и более значениях, и только два из них употребляются во всех массивах во всех своих словарных значениях: to provide, payment. Многозначная лексика, теряющая свою многозначность в специальном (экономическом) тексте, чаще всего используется в своих основных, исходных (первом и втором) значениях. При этом в любом случае значения многозначной общеупотребительной лексики в специальном (экономическом) тексте стремятся к терминологизации.
Использование в экономическом тексте общеупотребительной многозначной лексики в основных словарных значениях говорит о том, что она обозначает широкие общедисциплинарные понятия и потому играет в специальном тексте важную организующую и текстообразующую роль {to develop, determination, payment, application, to use, support, to reduce). Ее использование в специальном тексте не в основных словарных значениях свидетельствует о намечающейся тенденции к реорганизации ее словарных значений и/ или ее «тонкую настройку» на конкретную предметную область. Лексику, одинаково характерную для смежных областей знания, можно определить как выражающую важные для данной предметной области в целом междисциплинарные понятия {to use, determination, to apply, to realize, to reduce).
При этом использование многозначной общеупотребительной лексики преимущественно в одной и той же грамматической форме и/ или значении свидетельствует о важности передаваемого ими смысла для данной предметной области в целом и об устойчивости его выражения данной формой/ конструкцией. Лексику, более характерную для данной смежной предметной области, можно определить как обозначающую в ней ключевые специальные понятия, служащие для упорядочения терминологической лексики.
В целом многозначная общеупотребительная лексика в специальном тексте служит для выражения важных общедисциплинарных и междисциплинарных понятий, для организации и развертывания текста, а также для упорядочения специальной, терминологической лексики. При этом многозначная общеупотребительная лексика чаще всего используется не во всех своих словарных значениях, в основном сохраняет свои основные значения, отражает намечающиеся тенденции в изменениях в организации ее словарных значений и/ или ее «тонкую настройку» на конкретную предметную область.
3. В специальном тексте происходит «специализация» и терминологизация значений многозначной общеупотребительной лексики и лексики, теряющей свою многозначность. Причем в экономическом тексте значения общеупотребительной лексики могут приобретать не только экономический, но и ярко выраженный юридический характер, а самой важной ее чертой оказывается ее сочетаемость с целыми классами тематически маркированных понятий и терминов, которые в содержательном отношении обозначают центральные для данной предметной области категории явлений и объектов.
Исследование также показало, что из трех исследованных массивов текстов, относящихся к смежным областям экономики, предметная область «Credit» более всего ориентирована на юридические отношения, «Business» -на финансовые отношения, a «Trade» - на экономические. При этом во всех трех смежных предметных областях наблюдается явная тенденция использования многозначной общеупотребительной лексики в юридически маркированных значениях, что свидетельствует об общей четкой ориентации экономических текстов на следование букве закона и договора.
4. Контекстологический словарь как важный инструмент представления лингвистических данных о многозначной лексике не исчерпал свои эвристические и прикладные возможности. В сочетании с дополнительными смежными способами представления лингвистической информации он может стать организующим компонентом в методике интегрального представления лингвистической информации для распознавания значений многозначной лексики в реальных контекстах ее употребления, для описания особенностей ее употребления в конкретной предметной области, для выявления лингвистических особенностей языка самой предметной области, для изучения синхронного состояния многозначной общеупотребительной лексики и т.п.
КС, как инструмент, разработанный для использования в прикладных целях, отличается наглядностью, эксплицитностью и формализованностью, и потому может получить широкое применение при решении большого круга новых прикладных задач. К ним относится не только совершенствование алгоритмической обработки текста и ее интеграция в новые компьютерные технологии, но и целый комплекс дидактических и программных приложений. Это разработка дидактических и компьютерных программ «активного типа» по обучению иностранному языку и переводу, составление комбинаторных и толково-комбинаторных словарей, тезаурусов-онтологий, учебных пособий и справочников «активного типа»: новой, активной, тематической и т.п. лексики, словарей сочетаемости, терминологизированных понятий, словосочетаний, оборотов и конструкций, и т.д.
5. КС открывает новые перспективы в дальнейшем изучении специальных текстов и особенностей функционирования в них многозначной лексики не только в прикладных, но и теоретических целях. Они предопределяются, в первую очередь, развитием корпусной лингвистики. Она предоставляет принципиально новые возможности в составлении контекстологического словаря, позволяет значительно повысить его качество и эффективность в описании активной и специальной лексики, и тем самым способствовать его интеграции в разнообразные программные продукты и исследовательские технологии, и т.д.
Проведенное исследование также показало, что идея традиционного КС, опирающегося на понятие «общего выхода» (без детерминант) и на пословно-пооборотный перевод текста (с английского языка на русский) может быть уточнена в нескольких отношениях.
Так, разработанная в данном исследовании методика на основе КС свидетельствует, что, во-первых, все значения многозначной лексики имеют в тексте свои детерминанты. Во-вторых, выясняется, что общий выход КС, подразумевающий пословный перевод, в специальном тексте может привести к некорректному результату, поскольку в нем общеупотребительная лексика не только приобретает терминологизированное значение, но и входит в терминологизированные словосочетания, обороты и конструкции. Поэтому часто она не может быть переведена вне контекста, а требует «идиоматичного» перевода: в составе целого оборота и в соответствии с принятым способом выражения заданного смысла в языке перевода. (Ср. например, такие устойчивые обороты, как support line/ function/ staff/ charges/ period/ hours, etc.)
В-третьих, КС нуждается в «настройке» на предметную область. Это можно проиллюстрировать следующим примером. В контекстологическом словаре общеупотребительной лексики, созданном на материале газетных текстов [Марчук 1976] многозначное существительное determination (с. 42) в первом значении «решимость» имеет две детерминанты: «одушевленное существительное» и предлог «of» (ср. the determination of smb). Если сравнить этот алгоритм перевода с примером из исследованного экономического текста: in the determination of such person's parachute payment, то видно, что здесь ключевым словом для установления значения будет не одушевленное существительное (person), а экономическое понятие payment, которого, естественно, нет в указанном словаре. Причем соответствующее экономическое» (математическое) значение многозначного существительного determination («вычисление», которого, кстати, нет в указанном словаре) оказывается весьма актуальным в экономическом тексте, тогда как в значении «решимость» оно в нем не употребляется.
6. Эффективность использования КС на практике зависит от нескольких существенных обстоятельств. Это, во-первых, его «настройка» на конкретную предметную область; во-вторых, его постоянное пополнение новой лингвистической информацией, и, в-третьих, совершенствование его организации в соответствии с современным уровнем развития лингвистической науки.
7. Для того чтобы использовать КС как инструмент перевода, он должен составляться на очень большом массиве параллельных текстов. При этом возможности корпусной лингвистики позволяют включать в него значительное количество устойчивых / «идиоматичных» словосочетаний и их переводов. Это может значительно повысить эффективность использования КС в действующих системах алгоритмической обработки информации и во всех смежных разработках.
В целом можно заключить, что современные компьютерные технологии корпусной лингвистики значительно расширяют возможности использования контекстологического словаря не только в области алгоритмической обработки информации, но и в ряде смежных прикладных задач, особенно дидактических, методических и лексикографических, а также в теоретических исследованиях.
Список научной литературыСушилин, Алексей Анатольевич, диссертация по теме "Прикладная и математическая лингвистика"
1. Автоматический перевод: сб. ст. : пер. с англ., итал., нем., фр. / под ред. О.С. Кулагиной и И.А. Мельчука. - М. : Прогресс, 1971. - 368 с.
2. Апресян Ю.Д. Избранные труды. В 2 т. T. II. Интегральное описание языка и системная лексикография / Ю.Д. Апресян. М. : Школа «Языки русской культуры». - 1995. - 766 с.
3. Апресян Ю.Д. Об интегральном словаре русского языка / Ю.Д.Апресян// Семиотика и информатика. М., 1991.-Вып. 32.-С. 3-15.
4. Арапов М.В. Квантитативная лингвистика / М.В. Арапов; отв. ред. Ю.Н. Караулов. -М. : Наука, 1988. 185 с.
5. Баранов А.Н. Введение в прикладную лингвистику : учеб. пособие / А.Н. Баранов. М. : Эдиториал УРСС, 2001. - 360 с. : ил.
6. Баранов А.Н. Автоматизация лингвистических исследований: корпус текстов как лингвистическая проблема // Русистика сегодня. 1998. -№ 1-2.-С. 179-191.
7. Бахарлуи Роя. Разрешение лексической многозначности в системе компьютерного обучения иностранным языкам : англо-персидская лексика : автореф. дис. . канд. филол. наук / Бахарлуи Роя. М., 2006. - 25 с.
8. Бахарлуи Роя. Разрешение лексической многозначности в системе компьютерного обучения иностранным языкам : англо-персидская лексика : дис. канд. филол. наук / Бахарлуи Роя. -М., 2006. 145 с.
9. Борисова Л.И. Ложные друзья переводчика: Общенаучная лексика: Английский язык: учеб. пособие по науч.-техн. пер. / Л.И. Борисова. М. : НВИ-ТЕЗАУРУС, 2005. - 212 с.
10. Варинская В.М. Контекстологический словарь как элемент обучающих систем: дис. . канд. филол. наук / В.М. Варинская. М., 2005. -182 с. : ил. -Прил. (130 е.).
11. Головин Б. Н. Введение в языкознание / Головин Б. H. М. : Высш. шк., 1966.-332 с.
12. Гоциридзе Д.З. Очерки по истории западноевропейского и русского перевода / Д.З. Гоциридзе, Г.Т. Хухуни. Тбилиси : Изд-во Тбил. ун-та, 1986. -252 с.
13. Гринев С. В. Введение в терминографию / C.B. Гринев. М. : МПУ, 1995.- 158 с.
14. Гринев С. В. Введение в терминоведение / C.B. Гринев. М. : Моск. Лицей, 1993.-310 с.
15. Денисов П. Н. Лексика русского языка и принципы ее описания / П.Н. Денисов. М.: Рус. яз., 1993. - 245 с.
16. Естественный язык, искусственные языки и информационные процессы в современном обществе / под ред. Р. Г Котова. М. : Наука, 1988. - 174 с.
17. Жданов А. А. Деловые письма и контракты / A.A. Жданов, И.Ф. Жданова. М.: Филоматис, 2002. - 288 с.
18. Ивлева Г. Г. Тенденции развития слова и словарного состава / Г.Г. Ивлева. -М.: Наука, 1986. 135 с.
19. Искусственный интеллект : справочник. В 3 кн. / Под ред.
20. B.Н. Захарова, В.Ф. Хорошевского. М.: Радио и связь, 1990—
21. Кн. 1: Системы общения и экспертные системы / Э.В. Попов и др.. -461 с.: ил.
22. Кн. 2: Модели и методы / Д.А. Поспелов и др.. 304 с.: ил. Кн. 3: Программные и аппаратные средства / [В.Н. Захаров и др.]. -363 с.: ил.
23. Кобозева ИМ. Лингвистическая семантика / И.М. Кобозева ; Моск. гос. ун-т им. М.В. Ломоносова, Филол. фак. М. : Эдиториал УРСС, 2000. -352 с.
24. Корпусная лингвистика в России / Сост. Е.В. Рахилина, С. А. Шаров // Научно-техническая информация: ежемес. науч.-техн. сб. Сер.2, Информационные процессы и системы / ВИНИТИ. М., 2003. - №6. - 35 с.
25. Корреляционная типология глагольных систем индоевропейских и иноструктурных языков : монография. / [Г.Г. Сильницкий, М.В. Ерзенкина,
26. C.А. Сергутин ; отв. ред. Г.Г. Сильницкий. ; Рос. акад. наук, Ин-т лингвист, исслед. [и др.]. Смоленск : СГПУ, 1999. - 320 с.
27. Красивова А.Н. Деловой русский язык: учеб.-практ. пособие / А.Н. Красивова. М.: Изд-во МФА, 2001.- 80 с.
28. Крылов С. А. Обучаемость системы АП как основа осуществимости безошибочного автоматического перевода, или О переходе количества в качество / С.А. Крылов. М., 2004. - 220 с.
29. Крюкова О.П. Самостоятельное изучение иностранного языка в компьютерной среде / О.П. Крюкова. М.: Логос, 1998. - 127 с.
30. Культура русской речи : учеб. для вузов / под ред. JI. К. Граудиной и проф. Е. Н. Ширяева. М. : Норма : ИНФРА-М, 1998. - 550 с.
31. Леонтьева H.H. Автоматическое понимание текстов : системы, модули, ресурсы : учеб. пособие для студентов, лингвист, фак. вузов / H.H. Леонтьева. М. : ACADEMIA, 2006. - 304 с. - (Учебное пособие) (Высшее профессиональное образование. Языкознание).
32. Леонтьева H.H. К теории автоматического понимания естественных текстов. Ч. 2. Семантические словари: состав, структура, методика создания / H.H. Леонтьева. М.: Изд-во Моск. ун-та, 2000. - 40 с.
33. Леонтьева H.H. Система ФРАП и проблема оценки качества автоматического перевода / H.H. Леонтьева, С.Л. Никогосов // Машинный перевод и прикладная лингвистика. М., 1980. - Вып. 20. - С. 57-78.
34. Лингвистическое обеспечение системы ЭТАП-2 / Ю.Д. Апресян и др. ; отв. ред. Р. Л. Добру шин. -М. : Наука, 1989. 295 с. : ил.
35. Литвин Ф. А. Многозначность слова в языке и речи : учеб. пособие для студентов пед. ин-тов / Ф.А. Литвин. -2-е изд., стер. Москва : URSS : КомКнига, 2005.- 118 с.
36. Лукашевич Н.В. Тезаурус для автоматического концептуального индексирования как особый вид лингвистического ресурса / Н.В. Лукашевич,
37. Б.В. Добров // Труды Международного семинара «Диалог-2002» по компьютерной лингвистике и ее приложениям (Протвино, 2002 г.). В 2 т. Т. 2. Прикладные проблемы. М.: Наука, 2002. - С. 273 - 279.
38. Магомедова А. Н. Корпусная лингвистика и контекстное разрешение лексической многозначности слов (на материале английского языка) : дис. . канд. филол. наук / А.Н. Магомедова. Махачкала, 2004. -135 с.
39. Макарова Н. В. Статистика в Excel / H.B. Макарова, В.Я. Трофимец. М.: Финансы и статистика, 2003. - 386 с.
40. Максименко О.И. Система автоматической классификации текстовой информации / О.И. Максименко, Э.И. Королев // Техника средств связи. 1989. - № 3. - С. 56-60.
41. Максименко О.И. Формальные методы в современной прикладной лингвистике / О.И. Максименко. М.: Нар. учитель, 2002. - 255 с.
42. Мартыненко Г.Я. Методы статистического моделирования в языкознании // Прикладное языкознание : учебник / отв. ред. A.C. Герд. -СПб.: Изд-во С.-Петербург, ун-та, 1996. С. 201-223.
43. Марчук Ю.Н. Вычислительная лексикография / Ю.Н. Марчук. М. : ВЦП, 1976.- 183 с.
44. Марчук М. В. Динамика лексических значений многозначных слов (лексика основного терминологического слоя): дис. в форме науч. докл. д-ра филол. наук / М.В. Марчук. М.: МГПУ, 1996. - 59 с.
45. Марчук М. В. К развитию лексических значений многозначных слов : дис. канд. филол. наук / М.В. Марчук. JI.: ЛГУ, 1988. - 125 с.
46. Марчук Ю. Н. Корпусная лингвистика и контекст / Ю.Н. Марчук, А.Н. Магомедова // Теоретические и практические аспекты лингвистики и лингводидактики : межвуз. сб. науч. тр. Сургут : Изд-во СурГУ, 2002. -С. 123-128.
47. Марчук Ю. Н. Модель «текст-текст» и переводные соответствия в теории машинного перевода / Ю.Н. Марчук // Проблемы компьютерной лингвистики. Минск, 1997. - С. 21-29.
48. Марчук Ю.Н. О статье Д. Радо «Принципы систематической транслятологии» / Ю.Н. Марчук // Babel. Budapest, 1982. - XXVIII, N 2. - P. 82-87.
49. Марчук Ю.Н. Основы компьютерной лингвистики : учеб. пособие / Ю.Н. Марчук. -2-е изд., доп. М.: Нар. учитель, 2000. - 226 с.
50. Марчук Ю.Н. Основы терминографии / Ю.Н. Марчук. М. : НИИ МГУ, 1992.-75 с.
51. Марчук Ю.Н. Проблемы машинного перевода / Ю.Н. Марчук. М.: Наука, 1983.-232 с.
52. Марчук Ю. Н. Терминологическая работа Всероссийского Центра переводов / Ю.Н. Марчук // Терминоведение. М. : Моск. Лицей, 1996. -Вып. 1-3.-С. 14-18.
53. Марчук Ю.Н. Уроки начального периода развития машинного перевода в СССР : докл. на III Науч. конф. Воен. ун-та «Теория перевода и практика подготовки переводчиков» (18 февр. 1999 г.) / Ю.Н. Марчук. М., 1999.-С. 201-212.
54. Маслов Ю. С. Введение в языкознание / Ю.С. Маслов. М. : Высш. шк., 1987.-272 с.
55. Машинный перевод и прикладная лингвистика : сб. статей. М., 1958-1985.-280 с.
56. Мельников Г.И Системология и языковые аспекты кибернетики / Г.И. Мельников. М.: Сов. радио, 1978. - 367 с.
57. Мельчук И.А. Опыт теории лингвистических моделей «Смысл <=> Текст». Семантика, синтаксис / И.А. Мельчук. М.: Наука, 1974. - 314 с.
58. Мински М. Фреймы для представления знаний : пер. с англ. / М. Мински. М.: Энергия, 1979. - 149 с.
59. Михайлов М.Н. Компьютерное обеспечение корпуса тексов (взгляд пользователя) / М.Н.Михайлов // Русистика сегодня. 1998. - №1-2. -С. 192-201.
60. Моторин Ю.А. Реализация автоматического перевода на современных серийных ЭВМ общего назначения / Ю.А. Моторин, Ю.Н. Марчук // Вопросы радиоэлектроники. 1970. - (Серия ЭВТ, вып. 7). -С. 20-39.
61. Нариньяни A.C. Проблема понимания ЕЯ-запросов к базам данных решена / A.C. Нариньяни // Компьютерная лингвистика и интеллектуальные технологии : тр. междунар. конф. «Диалог-2005» (Звенигород, 1-6 июня 2005 г.). М.: Наука, 2005. - С. 382-387.
62. Нелюбин J1.J1. Инженерно-лингвистическое моделирование и компьютерная лингвистика / J1.J1. Нелюбин // Проблемы компьютерной лингвистики. Минск, 1997.-С. 18-21.
63. Нелюбин J1.JL История и теория перевода в России : учебник / J1.J1. Нелюбин, Г.Т. Хухуни ; М-во образования РФ, Мое. пед. ин-т. М. : Нар. учитель, 1999.- 138 с.
64. Нелюбин J1.J1. Компьютерная лингвистика и машинный перевод / Л .Л. Нелюбин. М.: ВЦП, 1991. - 151 с.
65. Нелюбин Л.Л. Перевод и прикладная лингвистика / Л.Л. Нелюбин. -М.: Наука, 1983.-241 с.
66. Персикова Т.Н. Межкультурная коммуникация и корпоративная культура : учеб. пособие для студентов вузов / Т.Н. Персикова. М. : Логос, 2002. - 224 с. - (Учебник XXI века).
67. Пинкер С. Язык как инстинкт / Стивен Линкер ; пер. с англ. Е.В. Кайдаловой ; общ. ред. В.Д. Мазо. М.: УРСС, 2004. - 455 с.: ил.
68. Пиотровский Р.Г. Инженерная лингвистика и теория языка / Р.Г. Пиотровский. Л. : Наука, 1979. - 111 с.
69. Пиотровский Р.Г. Лингвистический автомат и его речемыслительное обоснование / Р.Г. Пиотровский. Минск : МГЛУ, 1999. -196 с.
70. Пиотровский Р.Г. Математическая лингвистика / Р.Г. Пиотровский, К.Б. Бектаев, А.А. Пиотровская. М. : Высш. шк., 1977. - 383 с.
71. Пиотровский Р.Г. Методы автоматического анализа и синтеза текста : Учеб. пособие для ин-тов и фак. иностр. яз. / Р.Г. Пиотровский [и др.]. Минск : Вышэйш. шк.а, 1985. - 222 с.
72. Поляков В.Н. Интеллектуальная поисковая машина. Концептуальный проект / В.Н. Поляков // Труды Казанской школы по компьютерной и когнитивной лингвистике TEL-2000 (Казань, 17-20 окт.2000 г.). Казань. Изд-во Сэлэт, 2000. - Вып. 5. - С. 172-176.
73. Поляков В.Н. Частотный метод выявления устойчивых словосочетаний / В.Н. Поляков, O.A. Павлов // Труды Казанской школы по компьютерной и когнитивной лингвистике TEL-2001 (Казань. 22-28 окт.2001 г.). -Казань, 2001. -Вып. 6. С.148-153.
74. Рейхман У.Дж. Применение статистики / У.Дж. Рейхман. М. : Статистика, 1969. - 295 с.
75. Реформатский A.A. Введение в языкознание : учеб. для филол. специальностей высш. пед. учеб. заведений. / A.A. Реформатский ; предисл.
76. B.А. Виноградова. -М.: Аспект Пресс, 1996. 536 е., портр.
77. Рождественский Ю.В. Введение в прикладную филологию : Яз. семиотика / Ю.В. Рождественский, A.A. Волков, Ю.Н. Марчук ; МГУ им. М.В. Ломоносова, Филол. фак., Каф. сравнит.-ист., общ. и прикл. языкознания. М.: МГУ, 1988. - 116 с.
78. Рождественский Ю.В. Типология слова / Ю.В. Рождественский. -М.: Высш. шк., 1969.-321 с.
79. Рубашкин В.Ш. Корпусная поддержка в процедурах обработки текста и семантического описания лекции / В.Ш. Рубашкин // Доклады научной конференции «Корпусная лингвистика и лингвистические базы данных». СПб., 2002. - С. 139-145.
80. Рябцева H.K. Язык и естественный интеллект / Н.К. Рябцева. М. : Academia, 2005.-639 с.
81. Сидоров Е.В. Основы коммуникативной лингвистики / Е.В. Сидоров. М. : ВКИ, 1986. - 167 с.
82. Сичинава Д.В. К задаче создания корпусов русского языка в Интернете / Д.В. Сичинава // Научно-техническая информация: ежемес. науч.-техн. сб. Сер.2, Информационные процессы и системы / ВИНИТИ. -М, 2002.-№8.-С. 25-31.
83. Степанов Ю.С. Методы и принципы современной лингвистики / Ю.С. Степанов. -М. : Эдиториал УРСС, 2005. 312 с.
84. Столяров A.M. EXCEL 2000 для себя / А.М.Столяров, Е.С. Столярова. М.: ДМК Пресс, 2002. - 336 с.
85. Сушилин A.A. Вопросы типологии компьютерных словарей /
86. A.A. Сушилин // Проблемы теории языка и переводоведения : сб. ст. М., 2003.-№ 15.-С. 54-64.
87. Сушилин A.A. Лексика языка англоязычных контрактов (договоров) и соглашений / A.A. Сушилин // Проблемы теории языка и переводоведения: сб. ст. М., 2005. - № 28. - С. 69-74.
88. Сушилин A.A. Многоязычный электронный словарь (ABBY LINGVO 9.0) для PC и POCKET PC / A.A. Сушилин II Проблемы теории языка и переводоведения : сб. статей. М., 2004. - № 22. - С. 55-63.
89. Сушилин A.A. Разработка контекстологического словаря по международным соглашениям и контрактам / A.A. Сушилин II Перевод и переводоведение: сб. тез. М.: МГОУ, 2005. - С. 53.
90. Сушилин A.A. Контекстологический словарь и разрешение лексической многозначности на примере англоязычных контрактов и международных соглашений / А. А. Сушилин; МГОУ. М., 2006. — 16 с.— Деп. в ВИНИТИ Рос. акад. наук 29.12.06, № 1142В06.
91. Сушилин A.A. Роль и функции контекстологического словаря в алгоритмической обработке контрактов и международных соглашений (на материале английского языка) / A.A. Сушилин // Вестн. МГОУ. Сер. «Лингвистика», №2. -М.: Изд-во МГОУ, 2007. С. 201-208.
92. Татаринов В.А. История отечественного терминоведения : В 3 т. /
93. B.А. Татаринов. М.: Моск. Лицей.
94. Т. 1 : Классики терминоведения. 1994. - 407 с. Т. 2 : Направления и методы терминологических исследований. - 1995. -333 с.
95. Татаринов В.А. Теория терминоведения. В 3 т. Т. 1. Теория термина: история и современное состояние / В.А. Татаринов. М.: Моск. Лицей, 1996.-311 с.
96. Телегин J1.A. Метафоризация в языке и лингводидактике / JI.A. Телегин // Язык и мир его носителя : Материалы междунар. конф. MAAL'95. -М., 1995.
97. Теория и практика английской научной речи / Г.И. Ахманова и др.; под ред. М.М. Глушко. М.: МГУ, 1987. - 240 с.
98. ТулдаваЮ. Проблемы и методы квантитативно-системного исследования лексики / Ю. Тулдава. Таллин : Валгус, 1987. - 204 с.
99. Убин И.И. ЭВМ и словарь : метод, пособие / И.И. Убин. М. : ВЦП, 1992.-179 с.
100. Уфимцева A.A. Лексическое значение : Принцип семиол. описания лексики / A.A. Уфимцева. М.: Наука, 1986. - 239 с.
101. Фрэнсис У.Н. Проблемы формирования и машинного представления большого корпуса текстов / У.Н. Фрэнсис // Новое в зарубежной лингвистике. М., 1983. - Вып. XIV : Проблемы и методы лексикографии. - С. 334-353.
102. Чалкова Е.Г. Системно-коммуникативный метод обучения языку // Психол. журн. 1983. - №5. - С. 83-91.
103. Шаров С.А. Параметры описания текстов корпуса, а также Корпусная лингвистика в России / С.А. Шаров // Научно-техническая информация: ежемес. науч.-техн. сб. Сер.2, Информационные процессы и системы / ВИНИТИ. М., 2003. - №5-6.
104. Шубик С.А. Статистические методы в лингвистике / С.А. Шубик // Статистика речи и автоматический анализ текста 1980. Л., 1980. - С. 52-63.
105. Barlow M. Corpora for Theory and Practice / M. Barlow // IJCL. -Amsterdam, 1996. 1/1. - P. 3-37.
106. Brown R. Adding Linguistic Knowledge to a Lexical Example-Based Translation System / R. Brown // Proceedings of the Eighth Intern. Conf. on Theoret. and Methodol. Issues in Machine Translation (TMI-99) (Chester, UK, August 23-25, 1999. P. 22-32
107. Bybee J.L. Back to the Future / J.L. Bybee, W. Pagliuca, P. Perkins // Approaches to Grammaticalization. Amsterdam, 1991. - Voll. II. - P. 17-58.
108. Caraballo S.A. Automatic Construction of a Hypemym-labeled Noun Hierarchy from Text / S.A. Caraballo // Proceedings of the 37th Annual Meeting of the ACL.-1999.-P. 120-126.
109. Ciaramita M. Explaining away Ambiguity: Learning verb selectional preference with Bayesian networks / M. Ciaramita , M. Johnson // Proceedings of the 18th Intern. Conf. on Computational Linguistics. 2000. - Vol. 1. - P. 124130.
110. Dahl Osten. Tense and Aspect Systems / Osten Dahl. Oxford Oxfordshire. ; New York, NY : B. Blackwell, 1985. - 213 p.
111. Dagan I. Similarity-Based Methods For Word Sense Disambiguation / I. Dagan, L. Lee, F. Pereira // Proceedings of ACL-EACL, 1997. P. 56-63.
112. Dear Sirs!: Деловая переписка по-английски. M.: Изд. об-ние «Культура», 1993.-328 с.
113. Extending a Thesaurus by Classifying Words / Т. Tokunaga et. al. // Proceedings of the ACL-EACL Workshop on Automatic Information Extraction and Building of Lexical Semantic Resources. 1997. - P. 16-21.
114. Harris B. El-Text: A New Concept in Translation Theory / B. Harris // Language Monthly. 1988. - 54, March. - P. 34-40.
115. Hearst M. Customizing a Lexicon to Better Suit a Computational Task / M. Hearst, H. Schiitze // Proceedings of the SIGLEX Workshop on Acquisition of Lexical Knowledge from Text. Columbus, Ohio. - 1993. - P. 55-69.
116. Herdan G. Language as Choice and Chance / G. Herdan. Groningen : P. Noordhoff N. V., 1956. - 356 p.
117. Hwee Tou Ng. Integrating Multiple Knowledge Sources to Disambiguate Word Sense: an examplar-based approach / Tou Ng Hwee, B.H. Lee // Proceedings of the 34th Annual Meeting of the ACL. 1996. - P. 40-47.
118. Jager G. Translation und Translationslinguistik / G. Jager. Halle (Saale): VEB Max Niemeyer Verlag, 1975. - 214 p.
119. Lee L. Measures of Distributional Similarity / L. Lee // Proceedings of the 37th Annual Meeting of the ACL. 1999. - P. 25-32.
120. Madche A. Discovering Conceptual Relations from Text / A. Madche, S. Staab // Proceedings of ECAI, 2000. 2000. - P. 321-324.
121. Marchuk Yu. N. Basic Trends in Modern Machine Translation Research / Yu. N. Marchuk // SPECOM' 2001 : Intern. Workshop Speech and Computer (Moscow, Oct. 29-31, 2001): Proceedings. P. 8-11.
122. Marcus Mitchell P. Building a Large Annotated Corpus of English: The Penn Treebank / Mitchell P. Marcus, Beatrice Santorini, Mary Ann Marcinkiewicz. S. 1., 2004. - P.313-330.
123. Masterman M. Semantic Message Detection for Machine Translation, Using an Interlingua / M. Masterman // Semantic Problems in Language: Colloquium report. Cambridge (England), 1962. - P.438- 475.
124. Miram G.E. Translation Algorithms / G.E. Miram. Kyiv : «Twin inter», 1998.- 175 p.
125. Pawley A. Grammarian's Lexicon, Lexicographer's Lexicon: Worlds apart / A. Pawley // Words: Konferenzer 36: Proceedings of an Intern. Symposium / Jan Svartvik (ed.).- Stockholm, 1996.-P. 189-211.
126. Pereira F. Distributional Clustering of English Words / F. Pereira, N. Tishby , L. Lee // In Proceedings of the «Meeting of the Association for Computational Linguistics». 1993. - P. 183-190
127. Pinker S. The Language Instinct / Steven Pinker. New York: William Monro w, 1994.-494 p.
128. Procter P. A Revolution in Lexicography for the Learner / P. Procter // Words: Konferenzer 36: Proceedings of an Intern. Symposium / Jan Svartvik (ed.). Stockholm, 1996. - P. 243-249.
129. Resnik, P. Selectional Preference and Sense Disambiguation, In Proceedings of the ACL SIGLEX Workshop on Tagging Text with Lexical Semantics, 1997.- p. 52-57.
130. Sinclair J. Corpus, Concordance, Collocation / J. Sinclair. 2 ed. -Oxf.: OUP, 1992.- 179 p.
131. A Statistical Approach to Machine Translation / P.Brown et. al. // Computational Linguistics. 1990. - 16 (2). - P. 79-85.
132. Teubert W. Corpus Linguistics and Lexicography / W. Teubert // IJCL. -Philadelphia, 2001.- P. 125-153.
133. Wilks. Y. The Application of CLRU's Method of Semantic Analysis to Information retrieval / Y. Wilks. Cambridge : Cambridge Language Research Unit Memo. - ML. 173, 1965. - 173 p.
134. Yarowsky D. Hierarchical Decision Lists for Word Sense Disambiguation. Computers and the Humanities, 2000, 34(2). P. 179-186.
135. Years in Machine Translation / Hutchins W.J. (ed). Amsterdam ; Philadelphia : John Benjamin Publ.Co., 2000. - 415 p.1. СПИСОК СЛОВАРЕЙ:
136. Долганов И.Г. Англо-русский и русско-английский словарь международных соглашений и контрактов / И.Г. Долганов. М. : ACT, 2002. - 224 с.
137. Лингвистический энциклопедический словарь / гл. ред. В.Н. Ярцева. М.: Сов. энцикл., 1990. - 685 с.
138. Марчук Ю.Н. Контекстологический словарь для машинного перевода многозначных слов с английского языка на русский : в 2 ч. / Ю.Н. Марчук. -М.: ВЦП, 1976. -Ч. 1.-264 е.; Ч. 2-256 с.
139. Меркулова С.В. Толковый словарь страховых терминов = Dictionary of Insurance Terms / С.В. Меркулова. М. : Изд-во МАИ, 2000. -136 с.
140. Новый объяснительный словарь синонимов русского языка / под ред. Ю.Д. Апресяна. М.: Языки рус. культуры, 1997. - 512 с.
141. Пивовар А.Г. Большой англо-русский финансово-экономический словарь / А.Г. Пивовар ; под ред. В.И. Осипова. 2-е изд., испр. - М.: Изд-во. «Экзамен», 2003-960 с.
142. Русский семантический словарь / ред. Н.Ю. Шведова. М. : Азбуковник, 2000. - 800 с.
143. Семенов А.Л. Контекстологический словарь основных терминов маркетинга / А.Л. Семенов. М.: ВЦП, 1994. - 122 с.
144. Толково-комбинаторный словарь современного русского языка : Опыты семантико-синтакс. описания рус. лексики / И.А. Мельчук и др. -Wien : Wiener Slavistischer Almanach, 1984. 992 p.
145. Benson M. The BBI Combinatory Dictionary of English / M. Benson, E. Benson, R. Ilson. John Benjamins Publ. Сотр., 1986 - 286 P.
146. Hornby A.S. Oxford Advanced Learner's Dictionary of Current English / A.S. Hornby. Oxford : Oxford Univ. Press,1988. - 1580 p.
147. Longman Dictionary of English Idioms. Harlow ; London, 1979.353 p.
148. Longman Register of New Words. Harlow; London, 1990. - 434 p.
149. Marchuk Y.N. The Contextological Dictionary: Use in Programmed Language Teaching. In Computers and the Humanities / Y.N. Marchuk // Computers & Humanities. North-Holland Publ., Fla., US, 1979. - P. 277-281.
150. Webster's New World Dictionary. D.B.Guralnik (Ed.). New Delhi: Oxford and IBH, 1975. -882 p. (WNWD).
151. Список источников на английском языке:
152. Вид контракта «CREDIT». Материал из контрактов и соглашений взят, начиная с 25 апреля 1997 21 февраля 2001г. г.
153. Вид контракта «BUSINESS». Материал из контрактов и соглашений взят, начиная с 21 января 1997 15 июля 2003 г. г.
154. Вид контракта «TRADE». Материал из контрактов и соглашений взят, начиная с 8 октября 1998 27 июня 2000г. г.