автореферат диссертации по филологии, специальность ВАК РФ 10.02.21
диссертация на тему: Именные группы в заголовке и реферате как отражение концепта текста
Полный текст автореферата диссертации по теме "Именные группы в заголовке и реферате как отражение концепта текста"
На правах рукописи УДК 81'33.373-374
□03053502
БОРОДИНА ОЛЬГА АЛЕКСАНДРОВНА
ИМЕННЫЕ ГРУППЫ В ЗАГОЛОВКЕ И РЕФЕРАТЕ КАК ОТРАЖЕНИЕ КОНЦЕПТА ТЕКСТА
Специальность: 10.02.21 — прикладная и математическая лингвистика
АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата филологических наук
Санкт-Петербург 2007
003053502
Работа выполнена на кафедре прикладной лингвистики государственного образовательного учреждения высшего профессионального образования «Российский государственный педагогический университет им. А. И. Герцена»
Научный руководитель: доктор филологических наук профессор
БЕЛЯЕВА Лариса Николаевна
Официальные оппоненты: доктор филологических наук профессор
МАРТЬЯНОВА Ирина Анатольевна
кандидат филологических наук доцент МИТРОФАНОВА Ольга Александровна
Ведущая организация: Пермский государственный технический
университет
Защита состоится « » ¿¿^у 2007 года в
на заседании диссертационного совета Д 212.199.17 по защите диссертаций на соискание ученой степени доктора наук в Российском государственном педагогическом университете им. А. И. Герцена по адресу: 191186, г. Санкт-Петербург, наб. р. Мойки, д. 48, корп. 14, ауд. 314.
С диссертацией можно ознакомиться в фундаментальной библиотеке Российского государственного педагогического университета им. А. И. Герцена.
Автореферат разослан « /<?
2007 года.
Ученый секретарь диссертационного совета доктор филологических наук профессор
Л. А. Пиотровская
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность темы реферируемой работы продиктована, во-первых, насущными проблемами прикладной лингвистики, связанными с необходимостью совершенствования автоматических систем реферирования (аннотирования) текста; во-вторых, неослабевающим интересом к когнитивным исследованиям в разных областях современной лингвистики; в-третьих, усилением роли английского языка как языка межнационального и межкультурного общения.
Современная прикладная лингвистика выдвигает на первый план проблему исследования семантической организации целостного текста. Постановка этой проблемы обусловлена тем, что развитие ряда наук (в частности стилистики, структурной и прикладной лингвистики, особенно — направления, связанного с автоматическим анализом текста) потребовало установления закономерностей построения целостных текстов различных функциональных стилей и анализа их семантической структуры.
Семантическая структура конкретных типов текстов изучена в лингвистике недостаточно. Мало внимания уделяется содержательной стороне текста, отбору элементов с учетом основных компонентов речевой ситуации при формировании структуры высказывания. Это касается и текстов научных рефератов (В. В. Богданов, Ю. Г. Волков, Ю. В. Францифиров, Е. П. Павлова) как вторичных документов, изучение которых играет на сегодняшний день особую роль. Важность такого исследования обусловлена прежде всего тем, что постоянно растущий объем научной информации существенно затрудняет сбор необходимых данных методом поиска в массивах первичных документов. Угроза возникновения информационной перегрузки пользователя определяет необходимость формирования массивов вторичных документов и проведения поиска в них релевантной информации (Л. Н. Беляева, В. В. Богданов, В. П. Захаров).
Специфика научных рефератов как особого типа вторичных текстов обусловлена, с одной стороны, тем, что они представляют собой определенный жанр с особой семантической структурой и лексиконом. С другой стороны, семантическая структура текста рефератов зависит от общей задачи текста — кратко передать основное содержание базисного произведения, т. е. ту информацию, которая непосредственно выражена совокупностью лексических единиц, составляющих конкретный текст. Ключом к концепту текста, его маркером являются элементы, которые содержатся в заголовке (И. В. Арнольд, Т. П. Карпилович, А. А. Леонтьев, А. Г. Ханжин).
В связи с тем, что основной целью научного реферата является передача в спрессованном виде той информации, которая заложена в тексте первоисточника, выбор и организация языковых единиц в нем происходят по определенным принципам. Следовательно, тексты рефератов строятся в соответствии с определенными требованиями и правилами, что делает
изучение семантической и композиционной структуры текстов рефератов актуальным.
В последние годы особую важность приобретает, с одной стороны, изучение закономерностей и особенностей языковых процессов и явлений, с другой — создание учебных и методических материалов, призванных оптимизировать учебный процесс, совершенствовать анализ в системах машинной обработки текстов. Как следствие, семантика текста становится областью особого интереса многих отечественных и зарубежных лингвистов (А. А. Брудный, Л. С. Выготский, Т. А. ван Дейк, Н. И. Жинкин,
A. А. Залевская, И. А. Зимняя, В. Б. Касевич, А. А. Леонтьев, Р. Л. Солсо и др.). Соответственно, результаты теоретических исследований особенностей семантической структуры конкретного типа текста обладают большой теоретической и практической ценностью.
Изучение концепта текста — основного максимально свернутого его содержания — и отражающих его элементов приобретает особую актуальность и в свете требований к эффективности процесса научной коммуникации. В реферируемом исследовании анализ концепта текста проведен на материале корпуса текстов рефератов научных статей и монографий последних лет по лингвистике на английском языке. Выбор именно научного стиля обусловлен его стилеобразующими факторами, а также отсутствием специальных работ в этой области.
Теоретической основой исследования являются следующие концепции и положения: теория концепта текста (А. А. Брудный, В. И. Ка-расик, В. В. Красных, А. А. Леонтьев, Г. Г. Слышкин), теория фреймов (Т. А. ван Дейк, М. Минский, Е. А. Шингарева, Е. Chingareva-Slavine), концепция корпусной лингвистики (А. Н. Баранов, А. А. Виландеберк,
B. П. Захаров, В. В. Рыков, У. Н. Френсис, С. А. Шаров, С. О. Савчук, S. А. Gauch, S. Hundston, М. Oakes, J. Sinclair), а также положение о том, что тип текста определяет его семантическую структуру, лексический состав, морфологическое наполнение (И. В. Арнольд, Н. С. Бабенко, Л. Н. Беляева, В. В. Дементьев, Б. А. Зильберт, М. Г. Маловичко, Е. С. Троянская, В. И. Чернявская).
Объект исследования — семантическая структура специальных вторичных текстов.
Предмет исследования — английские именные группы в заголовках и особенности их актуализации в текстах научных рефератов.
Гипотеза исследования — именные группы заголовка отражают концепт текста научных рефератов и актуализируются в тексте за счет полного или частичного повтора.
Цель исследования — анализ семантической структуры научных рефератов и разработка методов выявления концепта текста на основе реа-
лизации частных концептуальных значений номинирующих элементов, позволяющих определить поисковый образ текста.
Цель исследования определяет его конкретные задачи, а именно:
• создание специального корпуса текстов научных рефератов и определение процедуры его анализа для организации и проведения исследования концепта текста;
• исследование семантической, лексической и композиционной специфики научных рефератов как особого типа вторичного научного текста с применением методов компьютерного анализа;
• применение метода фреймового анализа текста для описания способов актуализации концепта текста, а именно: выявление признаков фрейма исследуемого типа текста, а также соответствующих им значений, обеспечивающих реализацию определенных типов концептов;
• анализ заголовков научных рефератов для выявления структурных, частотных и лексико-семантических особенностей входящих в них именных групп;
• описание и классификация именных групп, отражающих концепт текста, установление принципов их отбора для определения концепта текста при решении задач автоматизации тематической рубрикации.
Материал исследования — тексты научных рефератов, представленные на Интернет-сайте http://home.t-online.de/home/LINCOM.EUROPA, а также публикуемые в ежегодном реферативном журнале "Lincom Europa project line. Linguistics and Anthropology". Исследованию подверглись тексты, составленные авторами, для которых английский язык является родным, и авторами, для которых родными являются другие языки. Всего было исследовано более 400 текстов общим объемом свыше 110 ООО словоупотреблений.
В соответствии с целью и задачами исследования в работе применяются следующие методы: метод лингвостатистического анализа текста, метод фреймового анализа, метод моделирования, метод контекстуально-интерпретационного анализа, метод непосредственного наблюдения над языковым материалом с последующим теоретическим обобщением полученных результатов, методы лексико-семантического анализа и анализа словарных дефиниций, методы информационных технологий. Методологической базой работы являются принципы и методы корпусной лингвистики.
Научная новизна исследования заключается в следующем:
1) впервые методы корпусной лингвистики использованы при исследовании семантической структуры текста научных рефератов как особого типа вторичного научного текста;
2) создан специальный исследовательский корпус текстов, соотнесенный с базой лексических данных в виде системы словарей и конкордансов;
3) разработана и экспериментально апробирована особая процедура лексикографического анализа специального корпуса текстов, направленная на изучение семантической структуры текста научных рефератов;
4) семантическая структура вторичного текста исследована в аспекте автоматизации тематического анализа текста;
5) впервые именные группы заголовка вторичных текстов рассмотрены как опорные элементы поискового образа текста;
6) для представления семантической структуры текстов научных рефератов построен фрейм текста данного типа и установлены принципы заполнения слотов фрейма на основе анализа именных групп заголовков;
7) разработана процедура анализа концепта текста с позиции теории фреймов.
На защиту выносятся следующие положения.
1. Специальный корпус текстов научных рефератов является адекватной базой для исследования концепта текста и установления процедур автоматизации его анализа.
2. Как особый тип вторичного текста, научный реферат семантически адекватен первичному тексту и может рассматриваться как его полноценный аналог, что определяет возможность проведения информационного поиска на основе массивов вторичных документов.
3. При создании и совершенствовании систем автоматического реферирования следует учитывать, что тексту научного реферата соответствует фрейм со следующими слотами: история вопроса, цель исследования, суть исследования, результат исследования, практическая апробация, перспективы, характеристика первичного текста.
4. Именные группы заголовка научных рефератов актуализируются в тексте рефератов во всех узлах фрейма за счет лексического и семантического повторов, отражают концепт конкретного текста и могут рассматриваться как ключевые элементы при создании его поискового образа.
5. Информационная компрессия исходного текста приводит к семантическому и структурному усложнению именных групп заголовка в тексте реферата.
Теоретическая значимость исследования заключается в следующем:
1) определены принципы создания специального корпуса текстов и методы его обработки при исследовании концепта текста;
2) разработана методологическая основа исследования с позиции теории фреймов текстовых категорий в текстах различных жанров;
3) установлены закономерности композиционной и семантической организации научных рефератов как особого типа вторичного документа;
4) выявлены структурные и лексико-семантические особенности именных групп заголовков научных рефератов как ключевых элементов, отражающих концепт текста;
5) обоснована плодотворность применения метода фреймового анализа семантической структуры текста для обеспечения автоматического поиска релевантной информации с опорой на именные группы заголовка.
Практическая значимость исследования. Результаты исследования могут найти применение в лингвистических исследованиях, направленных на совершенствование баз описания концептуальных полей разных языков, служащих для разработки систем информационного поиска, систем автоматического реферирования, а также систем распознавания конкретных типов текстов.
Рекомендации об использовании результатов диссертационного исследования. Результаты исследования могут быть использованы для совершенствования систем автоматической переработки текстов, при решении задач информационного поиска и автоматизации реферирования. Основные положения и результаты исследования могут также найти применение в курсах «Английская письменная научная речь» и «Особенности номинации при межкультурной коммуникации», а также в лекционно-се-минарских курсах «Лингвистика текста», «Интерпретация текста», «Курс функциональной стилистики». Кроме того, на основе выводов, сделанных в работе, могут быть внесены коррективы в методику преподавания иностранных языков в технических вузах, в частности, при обучении аннотированию, реферированию и выборочному или сокращенному переводу.
Апробация работы. Основные положения диссертации были представлены в докладах на международных конференциях «Прикладная лингвистика без границ» (март 2004) и «Прикладная лингвистика в науке и образовании» (март 2006), а также на заседаниях кафедры прикладной лингвистики РГПУ им. А. И. Герцена. По теме диссертации опубликовано 6 работ общим объемом 6,65 п. л.
Объем и структура работы. Диссертация состоит из введения, трех глав, заключения, списка принятых сокращений, списка использованной литературы (161 наименование, из них 25 на иностранных языках), списка использованных словарей (7 наименований) и 4 приложений. Основные научные результаты работы представлены в 20 таблицах и 6 рисунках. Общий объем работы 236 стр., из них 154 —- основное содержание работы и 82 — приложения.
ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ
Во введении обосновывается выбор темы исследования и ее актуальность, определяются объект, предмет, цель, задачи, гипотеза, теоретическая основа, материал и методы исследования, раскрыта его научная новизна, сформулированы положения, выносимые на защиту, аргументируется теоретическая и практическая значимость, даны рекомендации по использованию результатов исследования, отражена апробация работы.
Первая глава диссертации «Текст научных рефератов как объект лингвистического исследования» представлена шестью параграфами, в которых проводится анализ понимания термина «текст» в современной лингвистике, рассматривается специфика научного текста в целом и текста научных рефератов как особого вида вторичного текста в частности, определяется понятие «концепт текста». При исследовании структуры научного реферата особое внимание уделяется заголовку как ключу к концепту текста; обосновывается необходимость изучения повтора именных групп заголовка в реферате для определения концепта текста.
Научный реферат, как особый тип специального научного текста, характеризуется, с одной стороны, всеми стилистическими чертами, присущими научному тексту, которые отражаются в его семантической структуре, лексическом составе, морфологическом наполнении. С другой стороны, будучи вторичным текстом, научный реферат содержит конечные результаты аналитико-синтетической переработки первичного текста, является семантически адекватным основному содержанию базисного произведения и выполняет прежде всего коммуникативно-посредническую функцию, так как служит средством распространения в научном обороте информации о новых достижениях.
В соответствующих электронных и печатных изданиях научный реферат дается не изолированно, а совместно с библиографическим описанием, включающим в себя заголовок, фамилию автора и выходные данные. В реферативных журналах используются разные виды рефератов; наиболее распространены следующие три:
1) реферат с последовательностью:
• заголовок,
• библиографическое описание,
• текст реферата;
2) реферат с тематическим предложением 1 на первом месте:
• тематическое предложение,
• текст реферата,
• библиографическое описание;
' Под тематическим предложением понимается наиболее важное в информационном отношении предложение, извлеченное из текста реферата.
3) реферат с заголовком на первом месте:
• заголовок,
• тематическое предложение,
• текст реферата,
• библиографическое описание (без повторения заголовка) (В. В. Богданов).
В композиционном плане исследуемый научный реферат является модификацией реферата первого типа, суть которой заключается в том, что, помимо заголовка и фамилии автора, сначала иногда располагаются сведения о научной организации, которую представляет конкретный автор, в то время как информация о выходных данных не приводится. Вместо этого после текста реферата факультативно приводится оглавление реферируемого издания и дается ссылка на адрес конкретного реферата на сайте в Интернете, его порядковый номер, полное количество страниц и стоимость реферируемого издания (см. рис.).
Рисунок. Композиционная структура текста научного реферата
Основная часть семантической информации, передаваемой текстом научного реферата, заложена в его лексике (Л. Н. Беляева, О. В. Иванова, Е. С. Троянская). При этом наибольшей семантической насыщенностью характеризуются имена существительные и именные группы, т. е. словосочетания, ядерным элементом которых являются существительные (Л. Н. Беляева). Именная группа, помещенная в заголовок, отражает основное, максимально свернутое содержание текста — его концепт, которое затем раскрывается с необходимой степенью подробности (ср.: И. Р. Гальперин, Н. И. Колесникова, К. А. Кулакова). Данное утверждение позволило сделать вывод о том, что при исследовании концепта текста необходимо рассматривать актуализацию именных групп заголовка в тексте реферата,
поскольку именно они могут рассматриваться как обобщенный маркер описываемой в тексте ситуации или объекта.
Именные группы заголовка состоят из отдельных слов и словосочетаний, значение которых раскрывают как парадигматические отношения, существующие в языке, так и синтагматические отношения, существующие в речи. Следовательно, концепт текста формируется совокупностью всего комплекса отношений (парадигматических и синтагматических), в которые вступают слова, составляющие именную группу в заголовке и реферате. В связи с этим более пристальное внимание в диссертации уделяется актуализации именных групп заголовка в реферате, так как в тексте большего объема создается возможность для их развертывания или сжатия за счет повтора в более широком контексте.
Под повтором в реферируемой работе понимается:
• лексический повтор —повторение слова или словосочетания в составе предложения, абзаца или целого текста (И. В. Арнольд);
• семантический повтор — повторение слов, содержащих общие семы (Э. М. Добрускина, В. Е. Берзон); в диссертации рассматриваются повторы в научном реферате только тех слов, которые входят в именные группы заголовка.
Для исследования повторов именной группы заголовка в структуре реферата необходимо было решить следующие задачи:
1) выявить, насколько часто в реферате повторяется конкретная именная группа заголовка (полностью и частично), что позволило определить ее значимость для каждого отдельного текста;
2) установить, в каких контекстах встречается конкретная именная группа полностью, а в каких — отдельные ее элементы; это дало возможность уточнить синтагматические отношения элементов данной именной группы;
3) выявить для каждого элемента конкретной именной группы все однокоренные слова, синонимы и, в целом, единицы, содержащие общие семы, что позволило установить парадигматические отношения элементов данной именной группы.
В целом, уточнение синтагматических и парадигматических отношений элементов конкретных именных групп заголовка стало основой выявления их значения и определения концепта конкретного текста.
Для решения перечисленных выше задач при анализе рефератов использовалась традиционная методика лингвостатистического анализа, предполагающая построение алфавитного, а затем и алфавитно-частотного и частотного словников (Р. Г. Пиотровский, П. М. Алексеев, А. С. Герд, В. В. Богданов, И. В. Азарова и др.). Изучение алфавитного и частотного словников позволило выявить частоту лексических единиц, составляющих конкретную именную группу, их значимость для всего текста, а также вычленить все лексические единицы, содержащие общие семы.
Кроме того, для каждого реферата были составлены конкордансы, представляющие собой словоуказатели с контекстами, в которых отмечены все вхождения той или иной словоформы в заданный массив текстов и контекстов, иллюстрирующих соответствующее словоупотребление без распределения по значениям и без толкования. Полученные конкордансы наглядно демонстрируют характер сочетаемости элементов, входящих в именную группу заголовка, и позволяют выявить не только прогнозируемую сочетаемость (полный повтор именных групп заголовка), но и варианты окказиональной сочетаемости элементов заглавия с другими лексическими единицами текста и, следовательно, уточнить их парадигматические и синтагматические отношения, значимые для определения концепта конкретного текста.
Вторая глава диссертации «Корпус текстов как основа исследования соотношения заголовок уб реферат», содержащая пять параграфов, посвящена особенностям организации корпусов текстов и, в частности, корпуса текстов научных рефератов. В данной главе определяется процедура анализа специального корпуса текстов, позволяющая исследовать концепт текста; выявляются структурные и лексико-семантические особенности именных групп в заголовках текстов научных рефератов.
Изучение концепта текста как сложного языкового явления требует опоры на речевой материал, что определяет необходимость создания некоторого массива однотипных речевых произведений — специализированного корпуса текстов — и применения особой процедуры анализа данных двумя способами: вручную и при помощи средств автоматической обработки текста. Первый способ предполагает: 1) создание общей базы текстов; 2) редактирование и форматирование каждого текста, вошедшего в корпус; 3) создание общей базы заголовочных комплексов текстов научных рефератов; 4) фрагментацию заголовков на отдельные именные группы; 5) лексико-семантический анализ именных групп, вошедших в заголовок; 6) анализ повторов именных групп заголовка в текстах научных рефератов. Второй способ предполагает создание частотного и алфавитно-частотного словников и конкорданса всего корпуса текстов, корпуса заголовочных комплексов, а также каждого отдельно взятого текста. Соблюдение процедуры анализа данных позволило выделить в корпусе элементы, отражающие концепт текстов научных рефератов.
В результате анализа полученного корпуса текстов были выявлены одно-, двух-, трех- и многокомпонентные простые именные группы, входящие в структуру заголовка, представленные 45 структурными моделями. Однако сохраняется характерная для специальных текстов в целом тенденция к частотному использованию базовых моделей именных групп, приведенных в таблице 1.
Таблица 1. Основные структурные модели заголовков научных рефератов
Структура именной группы заголовка Модель Частота именной группы модели Примеры
Однокомпонентная именная группа Noun 590 acquisition (The Acquisition of L2-English Spelling)
Двухкомпонентная именная группа Adjective + Noun 327 special emphasis (An Empirical Examination with Svecial Emphasis on Temporal Adverbials)
Nouni + Noun2 50 case assignment (A Reduced Theory of Theta-Role and Case Assignment and Binding)
Participle II + Noun 13 associated dialects (A Study of the Phonetics and Phonology of Yaraldi and Associated dialects)
Gerund/ Participle 1 + Noun 5 teaching pronunciation (Techniques of Teaching Pronunciation in ESL)
Трехкомпонентная именная группа Adjective i+Adjective 2 + Noun 61 cognitive linguistic approach (A Cognitive Linguistic Approach to Verbal Meaning)
Adjective + Noun 1 + Noun 2 21 cognitive grammar analysis (A Cognitive Grammar Analysis)
Noun 1 + Adjective + Noun 2 6 subject personal pronouns (Subject personal pronouns in Spanish Narratives of Puerto Ricans in New York City)
Nouni + Noun 2 + Noun3 5 feature geometry analysts (A feature geometrv analysis)
Четырех-компонентная именная группа Adjective i + Adjective 2 + Noun | + Noun 2 13 indirect imperative sentence types (The Intona-tional Phonology of Direct and Indirect Imperative Sentence Types in Seoul Korean)
Adjective + Noun 1 + Noun 2 +Noun 3 4 optimal domains theory analysis (An Optimal Domains Theory Analysts)
Исследование компонентной структуры именных групп заголовков научных рефератов показало, что именное словосочетание, состоящее из двух и более элементов, складывается из следующих категориальных элементов: номинация лингвистического понятия + признак (свойство).
Так, например, следующие заголовки рефератов:
A Classified Vocabulary of the Icibemba Language;
A Comparative Grammar of the Dravidian Languages — содержат в своей структуре несколько простых именных групп, ядром каждой из которых является существительное, выражающее лингвистическое понятие (grammar, language, languages, vocabulary), и прилагательное или причастие в качестве определителя ядерного элемента, описывающее некоторый признак соответствующего явления (classified, comparative, Dravidian, Icibemba).
При анализе структурных особенностей именных групп заголовков научных рефератов было выявлено, что в одном заголовочном комплексе может быть несколько именных групп, содержащих дефисные конструкции в распространителе или в ядре (см. табл. 2). Анализ исследуемого материала показал, что дефисные конструкции, функционирующие как определения, могут быть результатом свертывания ряда синтаксических конструкций.
Таблица 2. Структура дефисных конструкций в именных группах заголовков
Порядковый номер модели Модель Примеры Частота Доля в % от общего числа дефисных конструкций
1. n, + n2 image-schemas tone-vowel (interaction) 21 42,85
2. AI + A2 lexical-semantic (information) Paleo-balkanic (affinities) 11 22,44
3. n + pii contact-induced (perspectives) 7 14,28
4. а + n lons-distance (reflexives) 4 8,16
5. n + а noun-attributive (constructions) 1 2,04
6. Abb + N/A L2-Enelish (spelling) 1 2,04
7. n1 + N2 + N3 Lexicon-Grammar-Interaction 3 6,12
8. n, + n2+а lexeme-class-deoendent (deviations) 1 2,04
Примечание А — имя прилагательное, Abb — аббревиатура, N — имя существительное, Р II— причастие II, / — признак конверсионной омонимии формы
Исследование массива заголовочных комплексов научных рефератов позволило сделать вывод о том, в заголовках данного типа текстов номи-
нируется некоторое сложное лингвистическое понятие, отражающее соответствующее лингвистическое явление, исследуемое автором / авторами первичного текста. С целью компрессии информации для номинации выбираются емкие по содержанию лексические единицы и словосочетания, обладающие способностью «разворачиваться» в более крупные единицы как в плане выражения, так и в плане содержания.
В третьей главе диссертации «Фрейм как метод моделирования концепта текста научных рефератов» изучается семантическая структура текстов научных рефератов с позиций фреймового подхода; выявляются основные способы языкового выражения признаков фрейма в тексте, дается описание их содержательной стороны. В данной главе описываются также способы актуализации именных групп заголовков в слотах фрейма и характеризуется концепт текстов научных рефератов предметной области «Лингвистика». Это позволило выявить, насколько заголовок информативен и способен ли он отражать содержание и представлять концепт конкретного текста.
В лингвистике метод фреймового анализа применяется для распознавания и записи информации, заложенной в тексте, обладающем стандартизованной глубинной семантической структурой и типовой внешней формой. Тексты научных рефератов отвечают названным критериям, что позволяет использовать этот метод для их анализа. Фрейм представляет собой иерархическую структуру, состоящую из узлов и связей между ними. Верхние уровни содержат информацию о прототипической ситуации, а нижние — пустые узлы, так называемые слоты (slots), которые заполняются конкретными данными, характеризующими описываемую ситуацию.
Будучи семиотическим объектом, текст имеет некоторый референт, опираясь на который семантическую структуру конкретного текста можно представить в виде фрейма.
В связи с тем, что в качестве референта научного текста выступает научно-исследовательская работа, при создании лингвистического фрейма текста данного типа в качестве его основных признаков выделены сведения об объектах и ситуациях, описанных в нем: история вопроса, цель исследования, суть исследования, результат исследования, практическая апробация, перспективы (К.А.Кулакова).
Выступая в качестве хранителей информации первоисточника в спрессованном виде, так называемые вторичные тексты, в частности тексты научных рефератов, являются семантически адекватными основному содержанию базисного текста. Следовательно, текст научных рефератов отражает основные семантические области соответствующего первичного текста, что дает возможность построить лингвистический фрейм реферата, основываясь на множестве признаков первичных научных текстов и их значений. Анализ корпуса текстов научных рефератов позволил создать лингвистический фрейм таких текстов с вышеперечисленными признаками
первичного научного текста, а также выявить и описать значение признаков созданного фрейма.
Так, например, слот фрейма «история вопроса» предполагает включение: (1) информации о том, кем, где и когда проводилась научная разработка; (2) краткой истории научной проблемы, основных принципов, на которые опирается исследование; а также (3) состояния проблемы на момент проведения исследования.
В слоте фрейма «цель исследования» содержится информация о том, (4) для чего / кого и с какой целью исследуется данная проблема;
(5) каковы пределы поставленных перед исследователями задач; дается
(6) обоснование актуальности исследования. В этом же слоте отражается
(7) возможность применения результатов исследования.
В слоте фрейма «суть исследования» представлены сведения о самом научном исследовании: характеризуются (8) особенности материала исследования; (9) процесс и методы исследования; описывается (10) обработка и систематизация результатов конкретного исследования; а также (11) интерпретируются конкретные факты.
В слот фрейма «практическая апробация» включается информация о том, (12) где, кем и каким образом данная научная разработка либо ее результаты используются на практике.
Научно-исследовательская работа подразумевает формулировку выводов в виде (13) следствий, вытекающих из проведенного исследования, что находит отражение в слоте «результат исследования».
Информация из слота «перспективы» указывает на (14) возможности и направления дальнейших исследований в данной области; на (15) планы и задачи, которые исследователи считают необходимым решить в будущем; а также на (16) предполагаемые области применения результатов научной работы, проведенной в рамках конкретного исследования.
Особенностью текста научных рефератов является то, что признаками фрейма являются в том числе и сведения о конкретном первичном тексте, на базе которого он был построен; в связи с этим в диссертации выделен также слот фрейма научных рефератов «характеристика первичного текста». Данный слот предполагает включение информации (17) об авторе / авторах первичного текста, сфере их научных интересов, ранее опубликованных работах; (18) об истории создания первичного текста; (19) о структуре первичного текста, особенностях расположения глав и частей первичного научного произведения, имеющихся приложениях и иллюстративном материале.
Таким образом, концепт текста данного типа может быть исследован при помощи фреймового метода. При этом следует отметить, что некоторые слоты фрейма применительно к каждому конкретному тексту могут оставаться незаполненными. В то же время часть текста может оказаться неохваченной фреймом и, как следствие, быть неинформативной с точки зрения набора его признаков.
Ниже использованный в реферируемой диссертации фреймовый метод анализа иллюстрируется на примере одного текста научного реферата.
A Priori Artificial Languages
Alan Libert
University of Newcastle
The best known artificial language is Esperanto. However, hundreds of other artificial languages have been proposed, although some have not progressed beyond the stage of sketches and few have seen much actual use. Those which are not consciously based on natural languages are called a priori languages. Such languages have been less successful than artificial languages built with elements of natural languages, such as Esperanto and Interlingua.
However, a priori languages are of considerable theoretical interest, in particular from the point of view of language universale: if a universal property holds even of languages created "from scratch", then it can indeed be seen as a property of any (usable) human language. Therefore, in the description of the grammars of several a priori languages, particular attention will be given to whether their features are in accord with proposed universale, of both the Greenbergian and Chomskyan types.
After an introduction one chapter each will be devoted to phonetics / phonology, writing systems, lexicon, morphology, syntax, and semantics. The languages described include Babm, Fitusa, Loglan / Lojban, and Suma. Most of these languages have received very little attention, even from scholars studying artificial languages.
В данном тексте актуализированы не все слоты, при этом в каждом из них отражена лишь часть соответствующей информации :
■ (2) краткая история научной проблемы (слот «история вопроса»):
The best known artificial language is Esperanto. However, hundreds of other artificial languages have been proposed, although some have not progressed beyond the stage ofsketches and few have seen much actual use;
* (6) обоснование актуальности исследования (слот «цель исследования»):
Most of these languages have received very little attention, even from scholars studying artificial languages:
" (8) особенности материала исследования (слот «суть исследования»):
Those which are not consciously based on natural languages are called a priori languages. Such languages have been less successful than artificial languages built with elements of natural languages, such as Esperanto and Interlingua;
' В тексте реферата подчеркиванием выделены все контексты, в которых встречаются элементы именной группы заголовка в структуре реферата.
■ (9) процесс и методы исследования (слот «суть исследования»):
Therefore, in the description of the grammars of several a priori languages, particular attention will be given to whether their features are in accord with proposed umversals, of both the Greenbergian and Chomskyan types',
■ (И) интерпретация фактов (слот «суть исследования»):
However, a priori languages are of considerable theoretical interest, in particular from the point of view of language universals: if a universal property holds even of languages created "from scratch ". then it can indeed be seen as a property of anv (usable) human language:
■ (19) структура первичного текста (слот «характеристика первичного
текста»):
After an introduction one chapter each will be devoted to phonetics / phonology, writing systems, lexicon, morphology, syntax, and semantics. The languages described include Babm, Fitusa, Loglan/Lojban, and Suma.
Анализ фрагментов текста, заполняющих слоты фрейма, позволил сделать вывод о том, что все элементы именной группы заголовка A priori artificial languages неоднократно повторяются в структуре реферата, о чем свидетельствуют данные частотного словника реферата (см. табл. 3), и актуализируется в широком диапазоне контекстов во всех слотах фрейма.
Таблица 3. Фрагмент частотного словника реферата A priori Artificial languages
Ранг словоформы Словоформа Частота употребления словоформы
1. languages 13
2. of 13
3 the 7
4. a 6
5. and 5
6. artificial 5
7. have 5
8. are 4
9. priori 4
10. be 3
Примечание: лексические единицы, входящие в данную именную группу, выделены жирным шрифтом.
Так, например, в следующем фрагменте текста, заполняющем слот «история вопроса»: The best known artificial language is Esperanto. However, hundreds of other artificial languages have been proposed, although some have not progressed beyond the stage of sketches and few have seen much actual
use, — данная именная группа актуализируется дважды за счет лексического повтора.
Помимо лексического повтора, в слотах фрейма представлен повтор семантический. В качестве семантического повтора можно рассматривать использование лексических единиц Esperanto, Babm, Fitusa, Loglan / Lojban, Suma, lexicon, morphology, phonetics /phonology, syntax, writing systems и других, так как они наиболее тесно связаны с понятием 'язык' ('language').
Все лексические единицы, которые с учетом их парадигматических, синтагматических и интегративных отношений можно отнести к одному лексико-семантическому полю, реализованному в конкретном тексте, представляют собой лексический и семантический повтор именной группы заголовка, отражают основную тему, маркированную им, и формируют концепт текста. В рассматриваемом реферате таким концептом является понятие 'artificial language', входящее в ядро соответствующего поля. Это позволило сделать вывод о том, что именные группы заголовка научных рефератов отражают концепт конкретного текста.
На основе анализа повторов именных групп заголовков в текстах рефератов, вошедших в исследуемый корпус текстов, был выявлен общий сложный концепт для всего корпуса текстов — понятие 'human language', представленное, например, следующими именными группами заголовков: Biri, Calming, Cantonese, Czech, Dakhat, Daur, Degema, Divehi, Dogon, Enets, Eve пи др.
Общий концепт актуализирует иерархическую систему субконцептов, которые, в свою очередь, отражают концепты конкретных текстов научных рефератов, представленных именными группами заголовков.
Так, например, субконцепт 'grammar' предполагает актуализацию следующих понятий, эксплицируемых соответствующими лексемами: phonology, morphology, syntax, semantics, отражающих концепты соответствующих текстов:
tonal phonology (The Tonal Phonology ofJita); intonational phonology (The Intonational Phonology of Direct and Indirect Imperative Sentence Types in Seoul Korean)', Ket prosodie phonology (Ket Prosodie Phonology): comparative morphology (Comparative Morphology of the Omotic Languages)-,
Hindi morphology (Hindi Morphology);
prosodie syntax (The Prosodie Syntax of Chinese)',
Maithili syntax (Issues in Maithili Syntax):
verb semantics ( Verb Semantics. Diathesis and Aspect) и др.
Таким образом, в результате исследования корпуса текстов научных рефератов сделан вывод о том, что именные группы заголовков научных рефератов отражают концепт конкретных текстов и одновременно актуа-
лизируют сложный концепт, характеризующий все тексты данного типа соответствующей предметной области.
В приложениях представлены фрагменты частотного словника (Приложение 1), конкорданса (Приложение 2), алфавитно-частотного словника корпуса текстов научных рефератов (Приложение 3), а также пример процедуры анализа корпуса текстов научных рефератов с частотным, алфавитно-частотным словниками и фрагментом конкорданса отдельного текста (Приложение 4).
ЗАКЛЮЧЕНИЕ
Исследование семантической структуры текстов научных рефератов как особого типа вторичных текстов, а также структурно-семантических особенностей именных групп заголовков и способов их актуализации в текстах научных рефератов позволило сделать следующие выводы.
1. Знание особенностей и правил создания письменных научных текстов на английском языке важно не только для ученых и переводчиков, но и для решения прикладных задач: машинного перевода, распознавания конкретных типов текста, а также для совершенствования систем информационного поиска и систем автоматической переработки текста (реферирования и аннотирования).
2. Процедуру комплексного лексикографического анализа специального корпуса текстов, направленного на исследование концепта текста, целесообразно осуществлять двумя способами: с одной стороны, вручную, с другой — при помощи средств автоматической обработки текста. Первый из названных способов анализа корпуса текстов требует строгого соблюдения последовательности этапов: 1) создание общей базы текстов, 2) редактирование и форматирование каждого текста, вошедшего в корпус, 3) создание общей базы заголовочных комплексов текстов научных рефератов, 4) фрагментация заголовков на отдельные именные группы, 5) лексико-семантический анализ именных групп, вошедших в заголовок, 6) анализ повторов именных групп заголовка в текстах научных рефератов. Второй способ предполагает создание частотного и алфавитно-частотного словников и конкорданса всего корпуса текстов, корпуса заголовочных комплексов, а также каждого отдельно взятого текста. Последовательное соблюдение названных этапов позволило выделить в корпусе текстов научных рефератов те элементы, которые отражают концепт текстов данного типа.
3. Контекстуально-интерпретационный, лексико-семантический и семантико-синтаксический анализ являются плодотворными методами лингвистического исследования по отношению к корпусу текстов научных рефератов. Такой анализ дает возможность выявить особенности семантической и композиционной организации данного типа текстов.
4. Тексты научных рефератов как особый тип вторичных текстов характеризуются собственной семантической структурой, являются семанти-
чески адекватными первичным текстам и отражают типовой референт первичных текстов, что позволяет построить фрейм данного типа текста, опираясь на семантическую структуру первичного научного исследования.
5. Моделирование семантики текстов научных рефератов в виде фреймовой структуры позволило представить стандартный текст данного типа в виде фрейма с семью признаками: «история вопроса», «цель исследования», «суть исследования», «практическая апробация», «результат исследования», «перспективы», «характеристика первичного текста». Данные признаки характеризуют основные семантические области, находящие отражение в рассматриваемых текстах.
6. Именные группы заголовков текстов научных рефератов в структурном плане представляют собой одно-, двух-, трех- и многокомпонентные словосочетания, а в семантическом плане — сочетание двух категориальных элементов — предмет (субстанция или явление) и признак (свойство) — и не только отражают концепты конкретных текстов, но и позволяют определить общий концепт текстов данного типа и соответствующий предметной области как 'human language'.
7. В связи с тем, что сегодня все более актуальными становятся проблемы разработки и использования лингвистических автоматов разного уровня, применения информационных технологий и формальных методов при лингвистическом анализе, создании систем обучения языку, проведенное исследование может способствовать дальнейшему развитию совместной творческой работы лингвистов и программистов, лингвистов и методистов, лингвистов и специалистов по обработке и передаче информации.
Таким образом, исследование именных групп в заголовке и реферате позволило выделить jb текстах научных рефератов на английском языке те структурные элементы, которые отражают концепт соответствующего типа текста и конкретной предметной области. С одной стороны, выявление соответствующих лексических единиц из корпуса текстов дает возможность создать концептуальный словарь-справочник предметной области «лингвистика»; с другой стороны, сама процедура анализа концептов может служить методологической базой дальнейшего исследования текстовых категорий в текстах различного типа.
По теме диссертации опубликованы следующие работы.
1. Бородина О. А. Текст — реферат — концепт в аспекте номинации // Прикладная лингвистика без границ : междунар. конф., 25-26 марта 2004 : материалы [II науч.-практ.] конф. / М-во образования Рос. Федерации, Акад. постпед. проф. Образования, Рос. гос. пед. ун-т им. А. И. Герцена, Филол. фак., Каф. приклад, лингвистики, Ассоциация приклад, лингвистики Санкт-Петербурга ; [редкол.: JI. Н. Беляева, JI. А. Девель, О. Н. Камшилова]. — СПб.: Инфо-да, 2004. — С. 66-71 (0,25 п. л.).
2. Бородина О. А. Особенности повтора именной группы заголовка в структуре реферата // Ученые записки / Ленингр. гос. ун-т им. А. С. Пушкина. — СПб., 2005. — Т. 14, вып. 3 : Вопросы германской и романской филологии : сб. ст. / [ред.: Н. Л. Шадрин (науч. ред.), С. И. Алаторцев, Ю. В. Сергаева]. — С. 23-31 (0,5 п. л.).
3. Бородина О. А. Текст научных рефератов как объект лингвистического исследования : [учеб.-метод. пособие] / Рос. гос. пед. ун-т им. А. И. Герцена. — СПб. : Инфо-да : Изд-во Рос. гос. пед. ун-та им. А. И. Герцена, 2005. — 74 с. (4,65 п. л.).
4. Бородина О. А. Текст как объект лингвистического исследования // Прикладная лингвистика: новый век / Рос. гос. пед. ун-т им. А. И. Герцена, Филол. фак., Каф. приклад, лингвистики. — СПб. : ЛЕМА, 2006. — Вып. 1 : сб. науч.-метод. ст. — С. 25-35 (0,65 п. л.).
5. Бородина О. А. Фреймовый подход к моделированию концепта текста // «Прикладная лингвистика в науке и образовании», третья между-нар. науч. конф., 16-17 марта 2006, С.-Петербург / М-во образования Рос. Федерации, Учеб.-метод. об-ние по направлениям пед. образования, Рос. Акад. естеств. наук, Рос. гос. пед. ун-т им. А. И. Герцена, Филол. фак., Каф. приклад, лингвистики, С-Петерб. гос. ун-т, Филол. фак., Каф. мат. лингвистики ; [редкол.: Л. Н. Беляева, О. Н. Камшилова, Е. Ю. Северино-ва]. — СПб.: [б. и.], 2006. — С. 26-31 (0,3 п. л.).
6. Бородина О. А. Структура фрейма текста научных рефератов // Известия Российского государственного педагогического университета им. А. И. Герцена : научный журнал. Аспирантские тетради. — СПб,
Подписано в печать 12.01.2007 Формат 60x84 1/16. Бумага офсетная. Печать офсетная. Усл. печ. л. 1,2. Тираж 100 экз. Заказ № 429.
Отпечатано в ООО «Издательство "JIEMA"»
199004, Россия, Санкт-Петербург, В.О., Средний пр., д.24, тел./факс: 323-67-74 e-mail: izd_lema@mail.ru
Оглавление научной работы автор диссертации — кандидата филологических наук Бородина, Ольга Александровна
ВВЕДЕНИЕ.
ГЛАВА 1. ТЕКСТ НАУЧНЫХ РЕФЕРАТОВ
КАК ОБЪЕКТ ЛИНГВИСТИЧЕСКОГО ИССЛЕДОВАНИЯ.
1.0. Общие замечания.
1.1. Понятие текста в современной лингвистике.
1.2. Научный текст как вид специального текста.
1.3. Научный реферат как особый тип научного текста.
1.4. Заголовок в аспекте понимания научного текста.
Понятие «концепт текста».
1.5. Понятие повтора. Повтор именных групп как отражение концепта текста.
1.6. Выводы по главе 1.
ГЛАВА 2. КОРПУС ТЕКСТОВ КАК ОСНОВА ИССЛЕДОВАНИЯ
СООТНОШЕНИЯ ЗАГОЛОВОК VS ТЕКСТ.
2.0. Общие замечания.
2.1. Типология корпусов текстов.
2.2. Принципы создания корпуса текстов научных рефератов. Процедура анализа корпуса текстов научных рефератов при исследовании концепта текста.
2.3. Именные группы в заголовке научных рефератов (структурно-семантический анализ).
2.4. Дефисные конструкции в составе именных групп в заголовке научных рефератов.
2.5. Выводы по главе 2.
ГЛАВА 3. ФРЕЙМ КАК МЕТОД МОДЕЛИРОВАНИЯ
КОНЦЕПТА ТЕКСТА НАУЧНЫХ РЕФЕРАТОВ.
3.0. Общие замечания.
3.1. Построение фреймовой модели структуры текста научных рефератов.
3.2. Основные способы актуализации именных групп заголовка в слотах фрейма текстов научных рефератов.
3.3. Выводы по главе 3.
Введение диссертации2007 год, автореферат по филологии, Бородина, Ольга Александровна
Актуальность темы данной работы продиктована, во-первых, насущными проблемами прикладной лингвистики, связанными с необходимостью совершенствования автоматических систем реферирования (аннотирования) текста; во-вторых, неослабевающим интересом к когнитивным исследованиям в разных областях современной лингвистики; в-третьих, усилением роли английского языка как языка межнационального и межкультурного общения.
Современная прикладная лингвистика выдвигает на первый план проблему исследования семантической организации целостного текста. Постановка этой проблемы обусловлена тем, что развитие ряда наук (в частности стилистики, структурной и прикладной лингвистики, особенно — направления, связанного с автоматическим анализом текста) потребовало установления закономерностей построения целостных текстов различных функциональных стилей и анализа их семантической структуры.
Семантическая структура конкретных типов текстов изучена в лингвистике недостаточно. Мало внимания уделяется содержательной стороне текста, отбору элементов с учетом основных компонентов речевой ситуации при формировании структуры высказывания. Это касается и текстов научных рефератов (ср.: Богданов 1996; Волков 2003; Францифиров 2003) как вторичных документов, изучение которых играет на сегодняшний день особую роль. Важность такого исследования обусловлена прежде всего тем, что постоянно растущий объем научной информации существенно затрудняет сбор необходимых данных методом поиска в массивах первичных документов. Угроза возникновения информационной перегрузки пользователя определяет необходимость формирования массивов вторичных документов и проведения поиска в них релевантной информации (Богданов 1996; Беляева 2001; Захаров 2002 а).
Специфика текстов научных рефератов как особого типа вторичных текстов обусловлена, с одной стороны, тем, что они представляют собой определенный жанр с особой семантической структурой и лексиконом. С другой стороны, семантическая структура текста рефератов зависит от общей целевой характеристики текста — кратко передать основное содержание базисного произведения, т. е. ту информацию, которая непосредственно выражена совокупностью лексических единиц, составляющих конкретный текст (ср.: Иванова 1986; Черкашина 2001; Романова 2004; Слышкин 2004; Серажим <http://www.zsu. zp.ua/herald/ articles645.pdf>). Ключом к концепту текста, его маркером являются элементы, которые содержатся в заголовке (ср.: Ханжин 1986; Арнольд 1999; Романова 2004; Карпилович 2005; Леонтьев 2005).
В связи с тем, что основной целью научного реферата является передача в спрессованном виде той информации, которая заложена в тексте первоисточника, выбор и организация языковых единиц в нем происходят по определенным принципам. Следовательно, тексты рефератов строятся в соответствии с определенными требованиями и правилами, что делает изучение семантической и композиционной структуры текстов рефератов актуальным.
В последние годы особую важность приобретает, с одной стороны, изучение закономерностей и особенностей языковых процессов и явлений, с другой — создание учебных и методических материалов, призванных оптимизировать учебный процесс, совершенствовать анализ в системах машинной обработки текстов. Как следствие, семантика текста становится областью особого интереса многих отечественных и зарубежных лингвистов (А. А. Бруд-ный, JI. С. Выготский, Т. А. ван Дейк, Н. И. Жинкин, А. А. Залевская, И. А. Зимняя, В. Б. Касевич, А. А. Леонтьев, Р. Л. Солсо и др.). Соответственно, результаты теоретических исследований особенностей семантической структуры конкретного типа текста обладают большой теоретической и практической ценностью.
Изучение концепта текста — основного максимально свернутого его содержания — и отражающих его элементов приобретает особую актуальность и в свете требований к эффективности процесса научной коммуникации. В настоящем исследовании анализ концепта текста проводится на материале корпуса текстов рефератов научных статей и монографий последних лет по лингвистике на английском языке. Выбор именно научного стиля обусловлен его стилеобразующими факторами, а также отсутствием специальных работ в этой области.
Теоретической основой исследования являются следующие концепции и положения: теория концепта текста (А. А. Брудный, В. И. Карасик, В. В. Красных, А. А. Леонтьев, Г. Г. Слышкин); теория фреймов (Т. А. ван Дейк, М. Минский, Е. А. Шингарева, Е. Chingareva-Slavine), концепция корпусной лингвистики (А. Н. Баранов, А. А. Виландеберк, В. П. Захаров, В. В. Рыков, С. О. Савчук, У. Н. Френсис, С. А. Шаров, S. A. Gauch, S. Hun-ston, М. P. Oakes, J. Sinclair), а также положение о том, что тип текста определяет его семантическую структуру, лексический состав, морфологическое наполнение (И. В. Арнольд, Н. С. Бабенко, Л. Н. Беляева, В. В. Дементьев, Б. А. Зильберт, М. Г. Маловичко, Е. С. Троянская, В. Е. Чернявская).
Объект исследования — семантическая структура специальных вторичных текстов.
Предмет исследования — английские именные группы в заголовках и особенности их актуализации в текстах научных рефератов.
Гипотеза исследования — именные группы заголовка отражают концепт текста научных рефератов и актуализируются в тексте за счет полного или частичного повтора.
Цель исследования — анализ семантической структуры научных рефератов и разработка методов выявления концепта текста на основе реализации частных концептуальных значений номинирующих элементов, что позволяет определить поисковый образ текста.
Цель исследования определяет его конкретные задачи, а именно:
• создание специального корпуса текстов научных рефератов и определение процедуры его анализа для организации и проведения исследования концепта текста;
• исследование семантической, лексической и композиционной специфики научных рефератов как особого типа вторичного научного текста с применением методов компьютерного анализа;
• применение метода фреймового анализа текста для описания способов актуализации концепта текста, а именно: выявление признаков фрейма исследуемого типа текста, а также соответствующих им значений, обеспечивающих реализацию определенных типов концептов;
• анализ заголовков научных рефератов для выявления структурных, частотных и лексико-семантических особенностей входящих в них именных групп;
• описание и классификация именных групп, отражающих концепт текста, установление принципов их отбора для определения концепта текста при решении задач автоматизации тематической рубрикации.
Материал исследования — тексты научных рефератов, представленные на Интернет-сайте http://home.t-online.de/home/LINCOM.EUROPA, а также публикуемые в ежегодном реферативном журнале "Lincom Europa project line. Linguistics and Anthropology". Исследованию подверглись тексты, составленные авторами, для которых английский язык является родным, и авторами, для которых родными являются другие языки. Всего было проанализировано более 400 текстов общим объемом свыше 110 ООО словоупотреблений.
В соответствии с целью и задачами исследования в работе применяются следующие методы: метод лингвостатистического анализа текста, метод фреймового анализа, метод моделирования, метод контекстуально-интерпретационного анализа, метод непосредственного наблюдения над языковым материалом с последующим теоретическим обобщением полученных результатов, методы лексико-семантического анализа и анализа словарных дефиниций, методы информационных технологий. Методологической базой работы являются принципы и методы корпусной лингвистики.
Научная новизна исследования заключается в следующем:
1) впервые методы корпусной лингвистики использованы при исследовании семантической структуры текста научных рефератов как особого типа вторичного научного текста;
2) создан специальный исследовательский корпус текстов, соотнесенный с базой лексических данных в виде системы словарей и конкордансов;
3) разработана и экспериментально апробирована особая процедура лексикографического анализа специального корпуса текстов, направленная на изучение семантической структуры текста научных рефератов;
4) семантическая структура вторичного текста исследована в аспекте автоматизации тематического анализа текста;
5) впервые именные группы заголовка вторичных текстов рассмотрены как опорные элементы поискового образа текста;
6) для представления семантической структуры текстов научных рефератов построен фрейм текста данного типа и установлены принципы заполнения слотов фрейма на основе анализа именных групп заголовков;
7) разработана процедура анализа концепта текста с позиции теории фреймов.
На защиту выносятся следующие положения.
1. Специальный корпус текстов научных рефератов является адекватной базой для исследования концепта текста и установления процедур автоматизации его анализа.
2. Как особый тип вторичного текста, научный реферат семантически адекватен первичному тексту и может рассматриваться как его полноценный аналог, что определяет возможность проведения информационного поиска на основе массивов вторичных документов.
3. При создании и совершенствовании систем автоматического реферирования следует учитывать, что тексту научного реферата соответствует фрейм со следующими слотами: история вопроса, цель исследования, суть исследования, результат исследования, практическая апробация, перспективы, характеристика первичного текста.
4. Именные группы заголовка научных рефератов актуализируются в тексте рефератов во всех узлах фрейма за счет лексического и семантического повторов, отражают концепт конкретного текста и могут рассматриваться как ключевые элементы при создании его поискового образа.
5. Информационная компрессия исходного текста приводит к семантическому и структурному усложнению именных групп заголовка в тексте реферата.
Теоретическая значимость исследования заключается в следующем:
1) определены принципы создания специального корпуса текстов и методы его обработки при исследовании концепта текста;
2) разработана методологическая основа исследования с позиции теории фреймов текстовых категорий в текстах различных жанров;
3) установлены закономерности композиционной и семантической организации научных рефератов как особого типа вторичного документа;
4) выявлены структурные и лексико-семантические особенности именных групп заголовков научных рефератов как ключевых элементов, отражающих концепт текста;
5) обоснована плодотворность применения метода фреймового анализа семантической структуры текста для обеспечения автоматического поиска релевантной информации с опорой на именные группы заголовка.
Практическая значимость исследования. Результаты исследования могут найти применение в лингвистических исследованиях, направленных на совершенствование баз описания концептуальных полей разных языков, служащих для разработки систем информационного поиска, систем автоматического реферирования, а также систем распознавания конкретных типов текстов.
Рекомендации об использовании результатов диссертационного исследования. Результаты исследования могут быть использованы для совершенствования систем автоматической переработки текстов, при решении задач информационного поиска и автоматизации реферирования. Основные положения и результаты исследования могут также найти применение в курсах «Английская письменная научная речь» и «Особенности номинации при межкультурной коммуникации», в лекционно-семинарских курсах «Лингвистика текста», «Интерпретация текста», «Курс функциональной стилистики».
10
Кроме того, на основе выводов, сделанных в работе, могут быть внесены коррективы в методику преподавания иностранных языков в технических вузах, в частности, при обучении аннотированию, реферированию и выборочному или сокращенному переводу.
Апробация работы. Основные положения диссертации были представлены в докладах на международных конференциях «Прикладная лингвистика без границ» (март 2004) и «Прикладная лингвистика в науке и образовании» (март 2006), а также на заседаниях кафедры прикладной лингвистики РГПУ им. А. И. Герцена. По теме диссертации опубликовано 6 работ общим объемом 6,65 п. л.
Объем и структура работы. Диссертация состоит из введения, трех глав, заключения, списка принятых сокращений, списка использованной литературы (161 наименование, из них 25 на иностранных языках), списка использованных словарей (7 наименований) и 4 приложений. Основные научные результаты работы представлены в 20 таблицах и 6 рисунках. Общий объем работы 236 стр., из них 154 — основное содержание и 82 — приложения.
Заключение научной работыдиссертация на тему "Именные группы в заголовке и реферате как отражение концепта текста"
3.3. Выводы к главе 3
1. Специфика текстов научных рефератов обусловлена, с одной стороны, тем, что рефераты являются языковым объектом определенного типа с особой семантической структурой и лексиконом; с другой стороны, связность текста рефератов зависит от общей целевой установки текста — кратко сообщить о сути первичного текста, что делает возможным применение теории фреймов для моделирования структуры содержания текстов данного типа.
2. Анализ корпуса текстов научных рефератов позволил выявить семь основных узлов фрейма текстов данного типа, отражающих, с одной стороны, типовой референт первичного текста (научно-исследовательская работа), с другой — вторичный референт реферата (первичный текст): история вопроса, цель исследования, суть исследования, результат исследования, практическая апробация, перспективы, характеристика первичного текста, а также соответствующие им типы информации (1-19), реализуемые в слотах фрейма.
3. Слоты фрейма заполняются целыми фрагментами текста, характеризующимися использованием стандартизованной лексики и синтаксических структур. При этом некоторые узлы фрейма могут оставаться незаполненными, в то время как определенные фрагменты текста научных рефератов могут являться неинформативными с точки зрения узлов фрейма соответствующего типа текста.
4. Лексические единицы, входящие в именные группы заголовков, актуализируются во всех слотах фрейма за счет лексического и семантического повтора. При этом актуализация именных групп заголовков в тексте реферата происходит при включении их в более сложные конструкции, уточняющие значение конкретной ИГ заголовка, а также при использовании лексических единиц, связанных с заголовочными отношениями типа часть — целое, род — вид.
5. Лексические единицы заголовков, с одной стороны, отражают концепт конкретного текста, с другой — актуализируют обобщенный концепт ('human language') текстов научных рефератов по лингвистике и соответствующей предметной области. Данный концепт номинируется в текстах рефератов именными группами, по отношению к которым заголовочные ИГ являются гипонимами.
ЗАКЛЮЧЕНИЕ
Исследование семантической структуры текстов научных рефератов как особого типа вторичных текстов, а также структурно-семантических особенностей именных групп заголовков и способов их актуализации в текстах научных рефератов позволило сделать следующие выводы.
1. Знание особенностей и правил создания письменных научных текстов на английском языке важно не только для ученых и переводчиков, но и для решения прикладных задач: машинного перевода, распознавания конкретных типов текста, а также для совершенствования систем информационного поиска и систем автоматической переработки текста (реферирования и аннотирования).
2. Процедуру комплексного лексикографического анализа специального корпуса текстов, направленного на исследование концепта текста, целе-; сообразно осуществлять двумя способами: с одной стороны, вручную, с другой — при помощи средств автоматической обработки текста. Первый из названных способов анализа корпуса текстов требует строгого соблюдения последовательности этапов: 1) создание общей базы текстов, 2) редактирование и форматирование каждого текста, вошедшего в корпус, 3) создание общей базы заголовочных комплексов текстов научных рефератов, 4) фрагментация заголовков на отдельные именные группы, 5) лексико-семантический анализ именных групп, вошедших в заголовок, 6) анализ повторов именных групп заголовка в текстах научных рефератов. Второй способ предполагает создание частотного и алфавитно-частотного словников и конкорданса всего корпуса текстов, корпуса заголовочных комплексов, а также каждого отдельно взятого текста. Последовательное соблюдение названных этапов позволило выделить в корпусе текстов научных рефератов те элементы, которые отражают концепт текстов данного типа.
3. Контекстуально-интерпретационный, лексико-семантический и се-мантико-синтаксический анализ являются плодотворными методами лингвистического исследования по отношению к корпусу текстов научных рефератов. Такой анализ дает возможность выявить особенности семантической и композиционной организации данного типа текстов.
4. Тексты научных рефератов как особый тип вторичных текстов характеризуются собственной семантической структурой, являются семантически адекватными первичным текстам и отражают типовой референт первичных текстов, что позволяет построить фрейм данного типа текста, опираясь на семантическую структуру первичного научного исследования.
5. Моделирование семантики текстов научных рефератов в виде фреймовой структуры позволило представить стандартный текст данного типа в виде фрейма с семью признаками: «история вопроса», «цель исследования», «суть исследования», «практическая апробация», «результат исследования», «перспективы», «характеристика первичного текста». Данные признаки характеризуют основные семантические области, находящие отражение в рассматриваемых текстах.
6. Именные группы заголовков текстов научных рефератов в структурном плане представляют собой одно-, двух-, трех- и многокомпонентные словосочетания, а в семантическом плане — сочетание двух категориальных элементов — предмет (субстанция или явление) и признак (свойство) — и не только отражают концепты конкретных текстов, но и позволяют определить общий концепт текстов данного типа и соответствующий предметной области как 'human language'.
7. В связи с тем, что сегодня все более актуальными становятся проблемы разработки и использования лингвистических автоматов разного уровня, применения информационных технологий и формальных методов при лингвистическом анализе, создании систем обучения языку, проведенное исследование может способствовать дальнейшему развитию совместной творческой работы лингвистов и программистов, лингвистов и методистов, лингвистов и специалистов по обработке и передаче информации.
Таким образом, исследование именных групп в заголовке и реферате позволило выделить в текстах научных рефератов на английском языке те структурные элементы, которые отражают концепт соответствующего типа текста и конкретной предметной области. С одной стороны, выявление соответствующих лексических единиц из корпуса текстов дает возможность создать концептуальный словарь-справочник предметной области «лингвистика»; с другой стороны, сама процедура анализа концептов может служить методологической базой дальнейшего исследования текстовых категорий в текстах различного типа.
СПИСОК ПРИНЯТЫХ СОКРАЩЕНИЙ
ИГ — именная группа
ДК — дефисная конструкция кл — корпусная лингвистика кт — корпус текстов
ЛЕ — лексическая единица с/ф — словоформа
РЖ — реферативный журнал
А — имя прилагательное
Асошр — сравнительная степень имени прилагательного
Abb — аббревиатура
Adv — наречие
G — герундий
N — имя существительное
N — имя существительное в притяжательном падеже
Nucar{) — количественное числительное
NUord — порядковое числительное
PI — причастие I
PII — причастие II
Pr — местоимение
131
Список научной литературыБородина, Ольга Александровна, диссертация по теме "Прикладная и математическая лингвистика"
1. Автоматизация в лексикографии и словари-конкордансы / А. С. Герд,
2. B. В. Богданов, И. В. Азарова, С. А. Аверина, Л. В. Зубова // Филол. науки. — 1981. —№ 1. — С. 72-78.
3. Адмони В. Г. Грамматический строй как система построения и общая теория грамматики / В. Г. Адмони ; отв. ред. В. М. Павлов. — Л. : Наука, 1988. —239 с.
4. Алексеев П. М. Частотные словари и приемы их составления / П. М. Алексеев // Статистика речи : сб. ст. / Акад. наук СССР, Науч. совет по кибернетике, Секция по семиотике; [отв. ред. Р. Г. Пиотровский]. — Л. : Наука, 1968. —С. 61-64.
5. Алексеев П. М. Частотные словари : учеб. пособие / П. М. Алексеев. — СПб.: Изд-во С.-Петерб. ун-та, 2001. — 155 с.
6. Арнольд И. В. Значение сильной позиции для интерпретации художественного текста / И. В. Арнольд // И. В. Арнольд. Семантика. Стилистика. Интертекстуальность : сб. ст. / науч. ред. П. Е. Бухаркин. — СПб. : Изд-во
7. C.-Петерб. ун-та, 1999 а. — С. 223-238.
8. Арнольд И. В. Интертекстуальность поэтика чужого слова / И. В. Арнольд // Там же. — СПб.: Изд-во С.-Петерб. ун-та, 1999 б. — С. 350-362.
9. Арнольд И. В. Лексико-семантическое поле в языке и тематическая сетка текста / И. В. Арнольд // Там же. — СПб. : Изд-во С.-Петерб. ун-та, 1999 в. —С. 250-259.
10. Ю.Арнольд И. В. Стилистика. Современный английский язык : учеб. для вузов / И. В. Арнольд. — 6-е изд. — М.: Флинта: Наука, 2004. — 383 с.11 .Арутюнова Н. Д. Фактор адресата / Н. Д. Арутюнова // Изв. АН СССР. Сер. лит. и яз. — 1981. — № 4. — С. 356-367.
11. АхутинаТ. В. Порождение речи : нейролингвист. анализ синтаксиса / Т. В. Ахутина. — М.: Изд-во Моск. ун-та, 1989. — 215 с.
12. Бабенко Н. С. О лингвистическом смысле разграничения текстов на жанры / Н. С. Бабенко // Лексика и стиль : сб. науч. тр. / Твер. гос. ун-т ; отв. ред. Е. В. Розен. — Тверь : Твер. гос. ун-т, 1993. — С. 6-9.
13. Баранов А. Н. Автоматизация лингвистических исследований : корпус текстов как лингвист, проблема / А. Н. Баранов // Русистика сегодня. — 1998. —№ 1/2. —С. 179-191.
14. П.Баранов А. Н. Введение в прикладную лингвистику / А. Н. Баранов. — М.: Эдиториал УРСС, 2001 а. — 358 с.
15. Беляева Л. Н. Автоматизация в лексикографии / Л. Н. Беляева, А. С. Герд, И. И. Убин // Прикладное языкознание : учебник / С.-Петерб. гос. ун-т ; отв. ред. А. С. Герд. — СПб. : Изд-во С.-Петерб. ун-та, 1996. — С. 318--333.
16. Беляева JI. Н. Лингвистические автоматы в современных информационных технологиях / Л. Н. Беляева. — СПб. : Изд-во Рос. гос. пед. ун-та им. А. И. Герцена, 2001. — 130 с.
17. Беляева Л. Н. Теория и практика перевода / Л. Н. Беляева. — СПб.: Изд-во Рос. гос. пед. ун-та им. А. И. Герцена, 2003 б. — 84 с.
18. Богданов В. В. Реферирование / В. В. Богданов // Прикладное языкознание : учебник / С.-Петерб. гос. ун-т ; отв. ред. А. С. Герд. — СПб. : Изд-во С.-Петерб. ун-та, 1996. — С. 389-398.
19. Брудный А. А. Понимание как философско-психологическая проблема / А. А. Брудный//Вопр. философии. — 1975. —№ 10, —С. 109-118.
20. Брудный А. А. Психологическая герменевтика / А. А. Брудный. — М.: Лабиринт-К, 2005. — 3-е изд., испр. и доп. — 336 с.
21. Бурлакова В. В. Основы структуры словосочетания в современном английском языке / В. В. Бурлакова / Ленингр. гос. ун-т им. А. А. Жданова. — Л.: б. и., 1975. — 128 с.
22. Васильев Л. Г. Лингвистические аспекты понимания : автореф. дис. . д-ра филол. наук : 10.02.21 / Васильев Лев Геннадьевич; С.-Петерб. гос. ун-т. —СПб., 1999. —35 с.
23. Вейзе А. А. Реферирование текста / А. А. Вейзе. — Минск : Изд-во Бела-рус. гос. ун-та, 1978. — 126 с.
24. Волков Ю. Г. Как написать диплом, курсовую, реферат / Ю. Г. Волков. — Ростов н/Д : Феникс, 2003. — 127 с.
25. Выготский Л. С. Мышление и речь / Л. С. Выготский // Собр. соч. : в 6 т. / гл. ред. А. В. Запорожец. — М. : Педагогика, 1982. — Т. 2 : Проблемы общей психологии. — С. 10-361.
26. Гальперин И. Р. Текст как объект лингвистического исследования / И. Р Гальперин. — М.: Наука, 1981. — 139 с.
27. ГердА.С. Предмет и основные направления прикладной лингвистики / А. С. Герд // Прикладное языкознание : учебник / С.-Петерб. гос. ун-т ; отв. ред. А. С. Герд. — СПб.: Изд-во С.-Петерб. ун-та, 1996 а. — С. 5-14.
28. Герд А. С. Специальный текст как предмет прикладного языкознания / А. С. Герд // Там же. — СПб. : Изд-во С.-Петерб. ун-та, 1996 6. — С. 68-90.
29. Головин Б. Н. Лингвистические основы учения о терминах / Б. Н. Головин, Р. Ю. Кобрин. — М.: Высш. шк„ 1987. — 104 с.
30. Гончаренко В. В. Фреймы для распознавания смысла текста / В. В. Гонча-ренко, Е. А. Шингарева ; отв. ред. Р. Г. Пиотровский. — Кишинев : Шти-инца, 1984, —198 с.
31. Грамматика английского языка: пособие для студентов пед. ин-тов и ун-тов / В. Л. Каушанская, Р. Л. Ковнер, Е. В. Кожевникова, Е. В. Прокофьева, 3. М. Райнерс, С. Е. Сквирская, Ф. Я. Цырлина. — 7-е изд. — М. : Страт, 2000. —319 с.
32. Дейк Т. А. ван. Язык. Познание. Коммуникация : сб. работ / Т. А. ван Дейк ; пер. с англ. яз. под ред. В. И. Герасимова ; сост. В. В. Петрова. — М.: Прогресс, 1989. —312 с.
33. Дементьев В. В. Изучение речевых жанров: обзор работ в современной русистике / В.В.Дементьев // Вопр. языкознания. — 1997. — № 1. — С. 109-121.
34. Дмитриева О. Л. Компьютеризация и ортологический словарь / О. Л. Дмитриева // Национальные лексико-фразеологические фонды : сб. ст. / Рос.акад. наук, Ин-т лингвист, исслед. ; отв. ред. Ф. П. Сороколетов. — СПб. : Наука, 1995. —С. 202-206.
35. Добрускина Э. М. Синтаксические сверхфразовые связи и их инженерно-лингвистическое моделирование / Э. М. Добру скина, В. Е. Берзон ; отв. ред. Р. Г. Пиотровский. — Кишинев : Штиинца, 1986. — 168 с.
36. Дубенец Э. М. Modern English lexicology : лекции и семинары / Э. М. Дубе-нец. —М.: Глосса-Пресс, 2002. — 192 с.
37. Ельмслев JI. Пролегомены к теории языка / JI. Ельмслев // Новое в лингвистике. — М.: Прогресс, 1960. — Вып. 1 / сост., ред., вступ. ст. В. А. Зве-гинцева. —С. 264-389.
38. A. А. Залевская. — М.: Гнозис, 2005. — 542 с.52.3ахаров В. П. Информационные системы : (док. поиск) : учеб. пособие /
39. B. П. Захаров. — СПб.: Изд-во С.-Петерб. ун-та, 2002 а. — 187 с.
40. Захаров В. П. Чешский национальный корпус текстов: организация и способы использования / В. П. Захаров // Корпусная лингвистика и лингвистические базы данных : докл. науч. конф., С.-Петербург, 5-7 марта 2002 г. /
41. Зимняя И. А. Лингвопсихология речевой деятельности / И. А. Зимняя ; Рос. акад. образования, Моск. психол.-социал. ин-т. — М.: Моск. психол,-социал. ин-т ; Воронеж : МОДЭК, 2001. — 432 с.
42. ИвановаО. В. Структура информационных сообщений : (на материале фр. газ.) : дис. . канд. филол. наук / Иванова О. В. ; Ленингр. гос. пед. ин-т им. А. И. Герцена. — Л., 1986. — 178 с.
43. Изюров А. М. Актуализация речевого субъекта в политическом дискурсе : (на материале соврем, нем. яз.): автореф. дис. . канд. филол. наук : 10.02.04 / Изюров Андрей Михайлович ; Рос. гос. пед. ун-т им. А. И. Герцена. — СПб., 2006. — 24 с.
44. Кабакчи В. В. Английский язык межкультурного общения : учеб.-справ. пособие / В. В. Кабакчи ; Рос. гос. пед. ун-т им. А. И. Герцена. — СПб. : Образование, 1993. — 200 с.
45. Калинина Е. А. Изучение лексико-статистических закономерностей на основе вероятностной модели / Е. А. Калинина // Статистика речи / АН СССР, Науч. совет по кибернетике, Секция семиотики ; отв. ред. Р. Г. Пиотровский. —Л. : Наука, 1968. — С. 64-93.
46. Карасик В. И. Культурные доминанты в языке / В. И. Карасик // Языковая личность: культурные концепты : сб. науч. тр. / Волгогр. гос. пед. ун-т, Помор, пед. ун-т ; науч. ред. В. И. Карасик. — Волгоград ; Астрахань : Перемена, 1996. —С. 3-16.
47. Карпилович Т. П. Когнитивно-коммуникативная модель смысловой компрессии научного текста : дис. д-ра филол. наук : 10.02.19, 10.02.21 / Кар-пилович Татьяна Павловна ; Минский гос. лингвист, ун-т. — Минск, 2005, —223 с.
48. Касевич В. Б. Языковые структуры и когнитивная деятельность / В. Б. Ка-севич // Язык и когнитивная деятельность : сб. ст. / АН СССР, Ин-т языкознания ; [отв. ред. Р. М. Фрумкина]. — М.: Наука, 1989. — С. 8-18.
49. Киселева А. А. Лингвистическое исследование структуры текста с точки зрения перлокутивного эффекта : автореф. дис. . канд. филол. наук : 10.02.21 / Киселева Анна Аркадьевна ; С.-Петерб. гос. ун-т. — СПб., 1998. — 19 с.
50. Колесникова Н. И. От конспекта к диссертации : учеб. пособие по развитию навыков письмен, речи / Н. И. Колесникова. — 2-е изд. — М. : Флинта : Наука, 2003. —288 с.
51. Корытная М. J1. Роль заголовка и ключевых слов в понимании художественного текста : автореф. дис. . канд. филол. наук : 10.02.19 / Корытная Марина Леонидовна ; Твер. гос. ун-т. — Тверь, 1996. — 16 с.
52. Костомаров В. Г. Русский язык на газетной полосе : некоторые особенности языка современной газетной публицистики / В. Г. Костомаров. — М. : Изд-во Моск. ун-та, 1971. — 267 с.
53. Красных В. В. От концепта к тексту и обратно : (к вопр. о психолингвистике текста) / В. В. Красных // Вестн. Моск. ун-та. Сер. 9, Филология. — 1998.—№1. —С. 53-70.
54. Кубрякова Е. С. Память и ее роль в исследовании речевой деятельности / Е. С. Кубрякова // Текст в коммуникации : сб. науч. тр. / АН СССР, Ин-т языкознания, Твер. с.-х. ин-т ; отв. ред. А. А. Романов, А. М. Шахнаро-вич. — М.: Наука, 1991. — С. Ф-21.
55. Кулакова К. А. Грамматическая категория в аспекте фреймового анализа : (на материале науч. тез.) : дис. . канд. филол. наук : 10.02.21 / Кулакова
56. Карина Анатольевна ; Рос. гос. пед. ун-т им. А. И. Герцена. — СПб., 2004. —164 с.
57. Лазарева Э. А. Заголовок в газете : учеб. пособие по курсу «Стилистика рус. яз.» / Э. А. Лазарева. — 2-е изд., перераб. и доп. — Екатеринбург : Изд-во Урал, ун-та, 2004. — 83 с.
58. Леонтьев А. А. Основы психолингвистики : учеб. для студентов вузов по специальности «Психология» / А. А. Леонтьев. — 4-е изд., испр.. — М. : Смысл : Academia, 2005. — 287 с.
59. Лингвистические ресурсы автоматизированного рабочего места филолога : коллектив, моногр. / Беляева Л. Н., Виландеберк А. А., Девель Л. А., Лар-ченков И. Н., Молчанова С. В., Нымм В. Р., Петрова-Маслакова Т. Н. — СПб.: Инфо-да, 2004. — 181 с.
60. Лурия А. Р. Язык и сознание / А. Р. Лурия ; под ред. Е. Д. Хомской. — 2-е изд.. — М.: Изд-во Моск. ун-та, 1998. — 335 с.
61. Макаров М. Л. Основы теории дискурса / М. Макаров. — М. : Гнозис, 2003. —277 с.
62. Мартьянова И. А. Киновек русского текста: парадокс литературной кинематографичное™ : монография. / И. А. Мартьянова. — СПб. : Сага, 2001. —224 с.
63. Мартьянова И. А. Текст киносценария и киносценарий текста : монография. / И. А. Мартьянова. — СПб. : Наука : САГА, 2003. — 208 с. (Серия «Филологическая мозаика»).
64. Мельников Г. П. Системология и языковые аспекты кибернетики / Г. П. Мельников ; под. ред. Ю. Г. Косарева. — М. : Сов. радио, 1978. — 368 с.
65. Методы автоматического анализа и синтеза текста / Р. Г. Пиотровский, В. Н. Билан, М. Н. Боркун, А. К. Бобков. — Минск : Вышэйш. шк., 1985. —222 с.
66. Минский М. Фреймы для представления знаний / М. Минский ; пер. с англ. О. Н. Гринбаума ; под ред. Ф. М. Кулакова. — М. : Энергия, 1979. — 151 с.
67. Моррис Ч. У. Основания теории знаков / пер. с англ. В. П. Мурат / Ч. У. Моррис // Семиотика : сб. ст. / сост., вступ. ст. и общ. ред. Ю. С. Степанова. — М.: Радуга, 1983. — С. 37-89.
68. Москальская О. И. Грамматика текста : (пособие по грамматике нем. яз. для ин-тов и фак. иностр. яз.) / О. И. Москальская. — М.: Высш. шк., 1981. — 183 с.
69. Москальчук Г. Г. Структура текста как синергетический процесс / Г. Г. Москальчук. — М.: Едиториал УРСС, 2003. — 294 с.
70. Никитин М. В. Курс лингвистической семантики : учеб. пособие к курсам языкознания, лексикологии и теорет. грамматики / М. В. Никитин. — СПб.: Науч. центр проблем, диалога, 1996. — 757 с.
71. Никитин М. В. Основания когнитивной семантики : учеб. пособие для вузов / М. В. Никитин. — СПб. : Изд-во Рос. гос. пед. ин-та им. А. И. Герцена, 2003. —277 с.
72. Никитина С. Е. Тезаурус по теоретической и прикладной лингвистике : (автомат, обраб. текста) / С. Е. Никитина. — М.: Наука, 1978. — 375 с.
73. Новиков А. И. Смысл как особый способ членения мира в сознании / А. И. Новиков // Языковое сознание и образ мира : сб. науч. ст. / Рос. акад. наук, Ин-т языкознания ; [отв. ред. Н. В. Уфимцева]. — М. : Ин-т языкознания РАН, 2000. — С. 33-38.
74. Пиотровский Р. Г. Лингвистический автомат и его речемыслительное обоснование : учеб. пособие для студентов языковых вузов по специальности «Приклад, лингвистика» / Р. Г. Пиотровский. — Минск : Минск, лингвист, ун-т, 1999. — 195 с.
75. Почепцов О. Г. Языковая ментальность: способ представления мира / О. Г. Почепцов // Вопр. языкознания. — 1990. —№ 6. — С. 110-122.
76. Реформатский А. А. Введение в языковедение : учеб. для вузов / А. А. Реформатский ; под ред. В. А. Виноградова. — [5-е изд., уточненное]. — М.: Аспект Пресс, 2001. — 536 с.
77. Рыков В. В. Корпусная лингвистика и лексикография — проблема репрезентативности Электронный ресурс. / В. В. Рыков // Корпусная лингвистика : [сайт]. — Режим доступа: http://rykov-cl.narod.ru/t32.html (11.11.06).
78. Рыков В. В. Прагматически ориентированный корпус текстов / В. В. Рыков // Тверской лингвистический меридиан : теорет. сб. / Твер. гос. ун-т ; отв. ред. И. П. Сусов. — Тверь : Твер. гос. ун-т, 1999. — Вып. 3. — С. 8996.
79. Серажим К. С. Текст як комунжацшне вираження дискурсу Электронный ресурс. / К. С. Серажим // BicH. 3anopi3. нац. ун-та : [электрон, версия журн.]. — Режим доступа: http://www.zsu.zp.ua/herald/articles645.pdf (3.09.04).
80. Сичинава Д. В. К задаче создания корпусов русского языка в Интернете Электронный ресурс. / Д. В. Сичинава // Русские корпуса : [сайт]. — Режим доступа: http://coфora.narod.ru/article.html (11.11.04).
81. Славгородская Л. В. О функции адресата в научной прозе / Л. В. Славго-родская // Лингвостилистические особенности научного текста : сб. науч. ст. / АН СССР, Каф. иностр. яз. ; [отв. ред. М. Я. Цвиллинг]. — М.: Наука, 1981. —С. 93-103.
82. Ш.СлышкинГ. Г. От текста к символу : лингвокультур. концепты прецедент. текстов в сознании и дискурсе / Г. Г. Слышкин. — М. : Academia, 2000. —125 с.
83. Соловьев В. И. Составление и редактирование рефератов: вопросы теории и практики / В. И. Соловьев // Жанры информационной литературы : обзор, реферат. — М.: Книга, 1983. — С. 201-318.
84. Сол со Р. Л. Когнитивная психология : пер. с англ. / Роберт Л. Сол со. — М.: Тривола, 1996. —598 с.
85. Соссюр Ф. де. Курс общей лингвистики / Ф. де Соссюр ; пер. со второго фр. изд. А. М. Сухотина ; ред. пер., предисл. и прим. Н. А. Слюсаревой ; послесл. Р. Энглера (пер. с фр. — Б. П. Нарумов). — М.: Лого<;, 1998. — XXIX, 236 е., xxii.
86. Суперанская А. В. Общая терминология : вопр. теории / А. В. Суперан-ская, Н. В. Подольская, Н. В. Васильева ; отв. ред. Т. Л. Канделаки. — 2-е изд., стер. — М.: УРСС, 2003. — 246 с.
87. Тишунина Н. В. Западноевропейский символизм и проблема взаимодействия искусств: опыт интермедиального анализа : монография / Н. В. Тишунина. — СПб.: Изд-во Рос. гос. пед. ун-та им. А. И. Герцена, 1998. — 159 с.
88. Третьякова Г. Н. Лексическая вариативность как фактор формирования точек стабильности в текстовом пространстве / Г. Н. Третьякова // Вестн. Минского гос. лингвист, ун-та. Сер. 1, Филология. — 2002. — № 10. — С. 39-47.
89. Троянская Е. С. Общая характеристика лексики стиля немецкой научной речи / Е. С. Троянская // Лингвостилистические особенности научного текста : сб. ст. / АН СССР, Каф. иностр. яз. ; [отв. ред. М. Я. Цвиллинг]. — М.: Наука, 1981. —С. 13-39.
90. Турко Л. Я. Частотный словарь русской разговорной речи / Л. Я. Турко // Статистика речи / АН СССР, Науч. совет по кибернетике, Секция семиотики ; отв. ред. Р. Г. Пиотровский. — Л.: Наука, 1968. — С. 191-200.
91. Филиппов К. А. Лингвистика текста : курс лекций / К.А.Филиппов. СПб.: Изд-во С.-Петерб. ун-та, 2003. — 334 с.
92. Францифоров Ю. В. От реферата к курсовой, от диплома к диссертации : практ. рук. по подгот., изложению и защите науч. работ / Ю. В. Францифоров, Е. П. Павлова. — М.: Книга сервис, 2003. — 128 с.
93. Ханжин А. Г. Тема, заглавие и индексирование / А. Г. Ханжин // Науч.-техн. информ. Сер. 2. — 1986. — № 7. — С. 22-27.
94. Худяков А. А. Семиозис простого предложения : монография / А. А. Худяков. — Архангельск : Помор, гос. ун-т им. М. В. Ломоносова, 2000. — 271 с.
95. Чижаковский В. А. Тезаурус в системах автоматической переработки текста / В. А. Чижаковский, Л. Н. Беляева ; отв. ред. Р. Г. Пиотровский. — Кишинев : Штиинца, 1983. — 163 с.
96. Шабес В. Я. Событие и текст / В. Я. Шабес. — М. : Высш. шк., 1989. — 175 с.
97. Шанский Н. М. Фразеология современного русского языка / Н. М. Шанский. — 4-е изд., испр. и доп.. — СПб.: Спец. лит., 1996. — 185 с.
98. Шаров С. А. Типология текстов для представительного корпуса / С. А. Шаров, С. О. Савчук // Тр. Междунар. конф. «Корпусная лингвистика' 2004», 11-14 окт. 2004 г., С.-Петербург / С.-Петерб. гос. ун-т. — СПб.: Изд-во С.-Петерб. ун-та, 2004. — С. 352-362.
99. Швейцер А. Д. Проблемы контрастивной стилистики : (к сопоставит, анализу функционал, стилей) / А. Д. Швейцер // Вопр. языкознания. — 1991. —№4. —С. 31-45.
100. Шингарева Е. А. Семиотические основы лингвистической информатики : учеб. пособие / Е. А. Шингарева. — JI. : Изд-во Ленингр. гос. пед. ин-та им. А. И. Герцена, 1987. — 84 с.
101. BeaugrandeR.-A.de. Introduction to Text Linguistics = Einfuhrung in die Textlinguistik. / Robert-Alain de Beaugrande, Wolfgang Ulrich Dressier. — London : Longman, 1981. — XV, 270 p.
102. Chingareva-SlavineE. Semiotique, linguistique et modelisation / Elena Chin-gareva-Slavine. — Paris: Hermes Science Publication, 2003. — 264 p.
103. Conrad S. Corpus Linguistics Approach for Discourse Analysis / S. Conrad // Annual Review of Applied Linguistics. — 2002. — Vol. 22. — P. 75-96.
104. Crystal D. How Many Millions? The Statistics of English Today / David Crystal // English Today. — 1985. — N 1. — P. 7-9.
105. Crystal D. The Cambridge Encyclopedia of the English Language / David Crystal. — Cambridge ; New York : Cambridge Univ. Press, 1995. — VII, 489 p.
106. DijkT. A. van. Textwissenschaft : Eine interdisziplinare Einfiihrung / Teun A. van Dijk. — Tubingen : M. Niemayer, 1980. — VIII, 285 S.
107. Gauch S. A Corpus Analysis Approach for Automatic Query Expansion and Its Extension to Multiple Databases / S. A. Gauch // ACM Transactions on Information Systems. — 1999. — Vol. 17. — P. 250-269.
108. Gledhill C. Collocation and Genre Analysis : the Phraseology of Grammatical Items in Cancer Research Abstracts and Articles / C. Gledhill // Zeitschrift fur Anglistik und Amerikanistik. — 1995. — N 43. — S. 11-29.
109. Heinemann W. Textlinguistik Heute — Entwicklung, Probleme, Aufgaben / W. Heinemann // Wiss. Zeitschrift Karl-Marx-Univ. Leipzig. — 1982. — J. 31, H.3. — S. 210-221.
110. Hunston S. Corpora in Applied Linguistics / Susan Hunston. — Cambridge : Cambridge Univ. Press, 2002. — XI, 241 p.
111. Hutchins J. Machine Translation and Human Translation : in Competition are in Complementation? / J. Hutchins // Machine Translation: Theory & Practice. — New Delhi, 2001. — P. 5-20.
112. Johansen J. D. Dialogic Semiosis : an Essay on Signs and Meaning / Jorgen Dines Johansen. — Bloomington : Indiana Univ. Press, 1993. — XV, 357 p.
113. Langacker R. W. A View of Linguistic Semantics / R. W. A. Langaker // Current Issues in Linguistic Theory. — 1988. — Vol. 50. — P. 49-91.
114. Leech G. A Brief Users' Guide to the Grammatical Tagging of the British National Corpus Electronic resource. / G. Leech // British National Corpus / Univ. of Oxford : [site]. — Mode of access:http://www.natcoф.ox.ac.uk/docs/gramtag.html (11.11.06).
115. Levelt W. J. M. Speaking: From Intention to Articulation / W. J. M. Levelt. — Cambridge MA : The MIT Press, 1993 (1998). — 566 p.
116. Luzon M. M. J. Collocational Frameworks in Medical Research Papers : a Genre-Based Study / M. M. J. Luzon // English for Specific Рифозез. — 2000. —N19. —P. 63-86.
117. Oakes M. P. Statistics for Софиэ Linguistics / Michael P. Oakes. — Edinburgh : Edinburgh Univ. Press, 1998. — XVI, 287 p.
118. Sinclair J. Софив Processing, 2000 — On-line Publications of The Tuscan Word Centre Electronic resource. / J. Sinclair // The Tuscan Word Centre. — Mode of access: http://www.twc.it (13.03.2003).
119. Representing Spoken Language in University Settings: the Design and Construction of the Spoken Component of the T2K-SWAL Софив / D. Biber,
120. R. Reppen, V. Clark, J. Walter // Corpus Linguistics in North America / Univ. of Michigan ; ed. by Rita C. Simpson & John M. Swales. — Ann Arbor : Michigan Univ. Press, 2001. — P. 48-57.
121. WeirzbickaA. Semantics: Primes and Universals / AnnaWeirzbicka. — Oxford ; New York : Oxford Univ. Press, 1996. — XII, 500 p.
122. Widdowson H. The Ownership of English / H. Widdowson // TESOL Qua-terly. — 1994. — Vol. 28, N 2. — P. 377-389.
123. СПИСОК ИСПОЛЬЗОВАННЫХ СЛОВАРЕЙ
124. История философии : энциклопедия / сост. и гл. науч. ред. А. А. Грица-нов. — Минск : Интерпрессервис : Книжный Дом, 2002. — 1376 с.
125. Ожегов С. И. Толковый словарь русского языка: 80000 слов и фразеол. выражений / С. И. Ожегов, Н. Ю. Шведова ; Рос. акад. наук, Ин-т рус. яз. им. В. В. Виноградова. — 4-е изд., доп. — М.: Азбуковник, 1999. — 944 с.
126. Современный словарь иностранных слов : ок. 20000 слов. — М. : Рус. яз., 1993. —741 с.
127. Языкознание : большой энцикл. слов. / гл. ред. В. Н. Ярцева. — 2-е изд.. —М.: Большая Рос. энцикл., 1998. — 685 с.
128. Longman Dictionary of Contemporary English / ed. by Q. Petcher. — newed. — Harlow: Longman House. — 1992. — 1458 p.
129. Macmillan English Dictionary : for Advanced Learners / ed. by Michael Rundell, Gwyneth Fox. — London : Macmillan, 2002. — 1692 p.
130. Oxford Advanced Learner's Dictionary. — 7th edition / ed. By Sally Wehmeier, Colin McLntosh, Joanna Turnbull, Michael Ashby. — Oxford : Oxford University Press, 2005. — 1780 p.