автореферат диссертации по филологии, специальность ВАК РФ 10.02.21
диссертация на тему: Принципы глоссирования для корпуса младописьменного языка
Полный текст автореферата диссертации по теме "Принципы глоссирования для корпуса младописьменного языка"
На правах рукописи
КОСОГОРОВА МАРИЯ АЛЕКСАНДРОВНА
ПРИНЦИПЫ ГЛОССИРОВАНИЯ ДЛЯ КОРПУСА МЛАДОПИСЬМЕННОГО ЯЗЫКА: МОРФОЛОГИЧЕСКАЯ СТРУКТУРА ЯЗЫКА ПУЛАР
Специальность 10.02.21 - Прикладная и математическая лингвистика
АВТОРЕФЕРАТ
диссертации на соискание ученой степени кандидата филологических наук
1 8 ОКТ 21)12
Москва-2012
005053647
005053647
Работа выполнена в отделе африканских языков Федерального государственного бюджетного учреждения науки Института языкознания Российской академии наук
научный руководитель:
кандидат филологических наук,
ведущий научный сотрудник отдела африканских языков ФГБУН «Институт языкознания РАН» Антонина Ивановна Коваль
официальные оппоненты:
доктор филологических наук, профессор, профессор кафедры африканистики Восточного факультета ФГБОУ ВПО «Санкт-Петербургский государственный университет» Валентин Феодосьевич Выдрин кандидат филологических наук, профессор факультета филологии ФГАОУ ВПО НИУ «Высшая школа экономики» Михаил Александрович Даниэль
ведущая организация:
ФГБОУ ВПО «Московский государственный университет имени М. В. Ломоносова», кафедра теоретической и прикладной лингвистики филологического факультета
Защита диссертации состоится «"¿5">> \<ОМщи9^20\2 года в Ай/ часов на заседании диссертационного совета Д 002.006.03 при Институте языкознания РАН по адресу: 125009 Москва, Б. Кисловский пер., д.1, с.1.
С диссертацией можно ознакомиться в читальном зале библиотеки Института языкознания РАН.
Автореферат разослан «ff/» ОГиги9^|/и9^2012 ]
Ученый секретарь
диссертационного совета , (А /A.B. Сидельцев/
' А (л
Общая характеристика работы
Объектом исследования являются актуальные проблемы, возникающие при создании текстового аннотированного корпуса младописьменного языка (на материале иулар). Создание корпусов текстов - это важнейшая задача современной лингвистики, поскольку они предоставляют исследователям практический материал для работы с различными языками мира.
Основная задача, которая стоит перед создателями глоссированного корпуса, -это информативная и экономичная разметка текстов, позволяющая осуществлять поиск по корпусу с максимальной точностью. Разработка качественного инвентаря глосс подразумевает детальное рассмотрение грамматических и лексических осо-бешюстей языка.
Язык пулар-фульфульде, данные которого выбраны в качестве эмпирического материала для исследования, относится к западно-атлантической языковой семье и является одним из крупнейших африканских языков. Он имеет много типологических особенностей, которые представляют значительный интерес для исследователей. Характерными особенностями языка, обеспечивающими ему неизменный интерес со стороны лингвистов, являются (помимо его масштабов, дисперсии и социолингвистических данных), в частности, сложная система именной классификации, процессы актантных преобразований в трёхзалоговой системе, связь фокали-зации со словоизменительной парадигматикой глагола, а также система чередований начальных согласных корня. Некоторые из этих типологических особенностей встречаются в других языках мира. Анализ этих особенностей и последующая разработка системы глоссирования для пулар-фульфульде может послужить опорой для создания аналогичных систем для других языков. Пример (1) предлагает три варианта глоссирования одной из таких особенностей - рамочной выделительной конструкции [ко ... коп].
(1)
а. Минималистичный вариант: глоссирование без указания аналитической связи между элементами
o faalaama wadde
o faal- aama wadde
wadde
ко o faalaa
ко o faal- aa
Reí 3.sgO хотеть- Pass.Pfv
kon kon Def
3.sgO хотеть- Раяя.Р^.Б дслать-АсМпГ Она захотела сделать то, что хотела.
б. Вариант с неполным указанием связи между элементами о faalaama wadde ко о faalaa
о faal- aama wadde ко о faal- aa
3.sgO хотеть- Pass.Pfv.s делать.Ас^Ш' Reí 3.sgO хотеть- Pass.Pfv Она захотела сделать то, что хотела.
коп коп Def.Rel
в. Вариант с полным указанием связи между элементами и её типа о Гаа1аата wadde ко о Гаа1аа
о faal- аата wadde ко о faal- аа
З^О хотеть- Ра-чя.РГу.з делать.Ас^пГ *|<с1 3.sgO хотеть-Равв-Р^
коп коп
*Def{*Fram<
Она захотела сделать то, что хотела.
Как следует из примера, существует несколько, на первый взгляд равноценных возможностей аннотации рамочной конструкции. При выборе варианта, который будет использован в корпусе пулар, учитываются, главным образом, такие лингвистические факты, как контекст, функциональность, возможные случаи омонимии и вариативности, а также возможность технической реализации выбранного решения.
Актуальность исследования определяется тем, что на современном этапе построение и развитие языковых корпусов находится в русле важнейших задач, востребованных современным состоянием языковедения, в том числе и для . бесписьменных или младописьменных языков. Создание, на примере пулар, принципов морфоглоссирования таких языков является актуальной исследовательской задачей, так как представляет собой необходимый этап собственно перед созданием корпуса.
Целью исследования является разработка и реализация системы глоссирования для языка пулар-фульфульде с учётом типологических особенностей этого языка.
Поставленная цель определяет следующие конкретные задачи исследования:
- определение проблемных с точки зрения глоссирования фрагментов грамматики языка;
- описание общих подходов, целесообразных для аннотирования текстов на языке;
- инвентаризация конкретных явлений, требующих индивидуального подхода, на синтаксическом, лексическом, морфологическом и фонологическом уровнях языка;
- определение конвенций глоссирования для каждого случая;
- принятие решения о возможности технической реализации предложенных конвенций.
На защиту выносятся следующие положения.
1. Существует теоретическая и техническая возможность реализации аннотированного корпуса языка пулар.
2. Хотя морфологические особенности синтетического языка зачастую не позволяют создать адекватной аннотации в рамках синхронного корпуса, существуют способы их отображения в глоссировании, которые могут считаться удовлетворительными.
3. В случае, когда создаётся система глоссирования для типологически редкого языка, целесообразно в релевантных случаях дублировать необходимую информацию, что в иных ситуациях было бы избыточным.
Научная новизна исследования состоит в том, что здесь впервые создаётся последовательная система глоссирования для языка пулар с учётом его типологических особенностей. Впервые разобраны способы морфологического аннотирования таких явлений как, в частности, классный циркумфикс, аналитические конструкции, надклассные местоимения.
Теоретическая значимость исследования определяется тем, что в ходе работы были рассмотрены возможные варианты решения проблем, неизбежно возникающих при попытке создать морфологическую аннотацию текстов на языке синтетической природы с элементами аналитизма. Также в ходе работы были выделены теоретико-грамматические свойства языка, формирующие ту платформу, с опорой на которую выдвигаются и апробируются соглашения по представлению корпусных данных. Результаты исследования могут также быть применены для аналогичных явлений в других языках.
Практическая значимость настоящей работы состоит в том, что, во-первых, её результаты применены для создания аннотировашюго корпуса языка пулар, что делает этот язык более доступным для лингвистических исследований, в том числе квантитативных и квалитативных. Во-вторых, результаты работы могут быть использованы для разработки аннотированных корпусов других младописьменных языков. Наконец, результаты работы могут найти применение при подготовке учебных курсов по общей морфологии, корпусной лингвистике, по африканскому языкознанию, а также при разработке практических грамматик, нацеленных на преподавание языка пулар-фульфульде.
Основным материалом исследования послужили текстовые данные, собранные в ходе лингвистической экспедиции в Республику Кот д'Ивуар под руководством В.Ф. Выдрина (январь-май 2010 года). Работа по сбору текстов проводилась с носителем языка пулар фута-джаллон, говор Сану-Лагорд-Тарамбали (аггломерация деревень к северу от Лабе, Республика Гвинея).
Тексты, изначально записанные в формате .WAV, были затем расшифрованы с помощью этого же носителя языка. В 2011 году для обработки собранных текстов пулар была разработана программа-парсер, направленная на морфоглоссирование данных с учётом лингвоспецифики языка. В результате этой работы в 2011 году был создан тестовый вариант корпуса пулар.
Апробация работы. Основные положения диссертации были представлены на XXV Международной конференции по источниковедению и историографии стран Азии и Африки «Востоковедение и африканистика в диалоге цивилизаций» (Санкт-Петербург, 22-24 апреля 2009 г.), на XII Конференции африканистов «Африка в условиях смены парадигмы мирового развития» (Москва, 24-26 мая 2011 г.), а также на XXVI Международной конференции «Модернизации и традиции» (Санкт-Петербург, 20-22 апреля 2011 г.), на Восьмой конференции по типологии и грамматике для молодых исследователей (Санкт-Петербург, ноябрь 2011 г.). Работа прошла обсуждение в отделе африканских языков ФГБУН «Институт языкознания РАН».
Структура работы. Работа состоит из введения, трёх глав, двух приложений и библиографии, насчитывающей более 100 наименований отечественных и зарубежных работ. Объём работы (без приложений) составляет 162 страницы машинописного текста.
Основное содержание работы
Глава 1. Обзор литературы и общая информация
Пулар-фульфульде — это один из самых известных языков Африки. Он относится к западно-атлантической языковой семье (северная группа, сенегамбийские языки), но территориально выходит далеко за пределы её основного ареала. Кочевое скотоводство, которое традиционно являлось основным ремеслом носителей языка - фульбе, обусловило распространение этого языка на весьма обширной территории к югу от Сахары, ограниченной Атлшггаческим океаном с запада и Голубым Нилом с востока. Особенностью языка является то, что он расположен в своём ареале не коптинуалыю, а дисперсно, занимая кое-где обширные области, а где-то образуя небольшие фулаязычные анклавы. В настоящее время можно выделить три диалектные зоны языка - западную (Сенегал, Гвинея), центральную (Мали, Буркина-Фасо, Нигер) и восточную (Нигерия, Камерун, Чад, Судан). Полидиалектные корпусные исследования пулар-фульфульде интересны отчасти из-за сложности
7
происходивших в течение многих веков миграций фульбе и сложной системы взаимоотношений между разными группами этого и других народов, получившейся в результате, а отчасти из-за того, что, по мпепию исследователей, фульбе от Сенегала, Гамбии и Гвинеи до Нигера и Камеруна говорят на одном языке.
Исследование диалектов языка пулар-фульфульде имеет более чем полутораве-ковую историю, начиная с первых опытов в грамматических описаниях и до капиталистических трудов, оказавших влияние на дальнейшее развитие фуланистики (А. Гаден, А. Лабуре, А. Клингенхебен, Д. Арнотг, Г.В. Зубко, Д. Ноа, П. де Вольф и др.) К настоящему времени создано значительное количество грамматик и разномасштабных словарей, специализированных исследований по грамматике, лексике, диалектологии. С материалами языка пулар-фульфульде работали также известнейшие африканисты как К. Майнхоф и Д. Вестерманн, а также теоретики языка и типологи (Э. Сепир, Дж. Гринберг, И.А. Мельчук, Г. Корбетг, В.А. Плунгян). Существование доступного аннотированного корпуса текстов на этом языке обеспечит данными по языку гораздо более широкий круг исследователей.
С этой целью было принято решение о создании такого корпуса, в тестовом варианте включающего в себя тексты лишь одного диалекта. Формируемый корпус можно квалифицировать как имеющий устное происхождение, поскольку, хотя для языка пулар и была разработана письменность на базе латиницы, устная форма существования всё же имеет более важную роль и пока является гораздо более надёжным источником текстов, нежели письменная. Корпус содержит тексты преимущественно фольклорного жанра: в его жанровый состав входят сказки (около половины всех текстов), социокультурные зарисовки из жизни информанта (менее половины всех текстов), а также присказки и сказания (несколько текстов).
В ходе первичной обработки собранных текстов возникла необходимость создания независимой программы-парсера, и эта задача была со временем успешно решена. В результате была разработана программа LightParser, предназначенная для автоматизированного глоссирования текстов. В качестве входной Информации парсер принимает цельные тексты и словари для их обработки. Далее пользователь может запустить как автоматический, так и пошаговый режим обработки слов тек-
8
ста. В случае возникновения неоднозначностей при обработке программа предоставляет пользователю возможность выбрать необходимый вариант вручную. Пар-сер имеет удобный пользовательский интерфейс, снабжён редактором текстов и словарей. Программа обеспечивает совместимость с другими программами, используемыми в данной области.
В перспективе предполагается включить в корпус данные по другим диалектам пулар-фульфульде, что, разумеется, потребует доработки парсера, а также изменения словаря. Также в перспективе планируется включение в состав корпуса строки перевода на другие языки: в данный момент рабочими языками корпуса являются пулар и русский, что осложняет его использование зарубежными исследователями.
Глава 2. Первичная подготовка текста и синтаксический уровень языка
Вторая глава посвящена проблемам, которые возникают при глоссировании и связаны с синтаксическим уровнем языка, а также с характерными для языка явле-Ш1ЯМИ, находящимися на стыке синтаксиса и морфологии. В текущих технических условиях эти проблемы решаются ещё на этапе предварительной подготовки текста, на данный момент ручной, в перспективе - автоматической. Разумеется, перечисляются лишь основные решения, менее же значительные вопросы остаются за рамками обсуждения.
Сегментирование текста на клаузы
Вопрос последовательной сегментации текстов на небольшие отрезки должен решаться с учётом синтаксических особешюстей языка. Язык пулар-фульфульде допускает значительную длину предложений, поэтому стандартное решение, где каждый отрезок равен одному предложешпо, не является оптимальным для текстов на этом языке. Однако формат корпуса, в котором потенциальный пользователь будет использовать синтаксические данные, делает невозможным и другое крайнее решение — разделение текста на элементарные дискурсивные единицы, поскольку в таком случае синтаксическая структура предложения может стать неочевидной. С
учётом этих доводов было принято решение разделять текст па предложения с возможностью дальнейшего их подразделения на сложносочинённые и сложноподчинённые части в случае необходимости. В настоящее время технические возможности позволяют провести лишь последовательную нумерацию каждой клаузы (пример 2а), однако в перспективе планируется ввести многоуровневую нумерацию клауз (пример 26). (2)
а.
(28) njaatigi ßeyngu sari inni
(28) njaatigi ßeyngu sari inn- i
(28) приятель. sgO >KeHa.sgNGU заяц говорить- Act.Pfv.w Приятель зайчихи сказал:
(29) ko hondun wondi
(29) ko hon- cfun won- d- i (29) Foc 3sg.Inter- sgDUN быть- Soc- Act.Pfv.Sb "Что у вас случилось?"
б.
(28) njaatigi 6eyngu sari
(28) njaatigi ßeyngu sari
(28) приятель-sgO жена^КОи заяц Приятель зайчихи сказал:
(28") ко hondun wondi
(28") ко hon- dun won- d- i
(281) Foc 3sg.Inter- sgDUN быть- Soc- Act.Pfv.Sb "Что y вас случилось?"
Проблема нулевой анафоры
Важная синтаксическая особенность языка связана с различием полипредикатных структур языка с нулевой и ненулевой анафорой кореферентного субъекта. В примере (За) при первом предикате субъект имеет полнолексемную реализацию, то есть в данном случае выражен именем существительным. Такая реализация обусловливает возможность нулевой анафоры этого субъекта при последующих пре-
10
1Ш11
inn- i
говорить- Act.Pfv.w
дикатах в рамках того же предложения. В примере (36) позиция субъекта при первом предикате заполнена пропоминальпой единицей, и такое воплощение не обладает достаточной силой референции, чтобы позволить использование нулевой анафоры. Оппозиция "нулевая vs. ненулевая анафора" ставит перед разработчиками корпуса вопрос: стоит ли указывать нулевой субъект при глоссировагти. Теоретически это возможно и будет иметь вид, представленный в примере (Зв). Однако такое решение технически трудно реализуемо, поэтому на данный момент нулевая анафора в разметке не указывается.
(3)
а.
debbo оп immü yalti ka yaasi
debb- о on imm- ii yalt- i ka yaasi
жепщина- sg.O Def.sgO встать- Md.Pfv.w выходить- Act.Pfv.w Prep наружу Женщина встала, вышла на двор.
б.
о immii о yalti ka yaasi
о imm- ii о yalt- i ka yaasi
3.sgO встать- Md.Pfv.w 3.sgO выходить- ActPfv.w Prep наружу Она встала, она вышла на двор.
в.
debbo on immii 0 yalti ka yaasi
dcbb- о on imm- ii 0 yalt- i ka yaasi
женщина- sg.O Def.sgO встать- Md.Pfv.w 3Sg.O выходить- Act.Pfv.w Prep наружу Женщина встала, вышла на двор.
Повторы, оговорки и вариативность
Тексты, использованные при создании корпуса пулар, имеют звуковое происхождение, то есть они были записаны на аудионоситель, а затем расшифрованы. При расшифровке возможно было бы исключить из записи все повторы и дискурсивные маркеры, поскольку при автоматической разметке, встретив нестандартную или ошибочную словоформу, программа-парсер может допускать ошибки. Однако, при использовании точной стенограммы аудиозаписи появляется возможность ис-
пользовать эту запись в корпусе в дальнейшем. Наличие звукового сопровождения глоссированного текста позволяет проводить исследования для гораздо большего числа областей науки, в частности, фонетики, дискурса, просодии. Для этой цели в тексте сохраняются все оговорки, повторы и ошибки, но для удобства понимания они расшифровываются в строке перевода. Также для исследований в этой области сохраняются и отмечаются все хезитации и дискурсивные маркеры, однако их классификация в текущие задачи не входит.
Также принципиальное решение принято в области орфографической вариативности. Письменная традиция (на латинице) возникла сравнительно недавно, поэтому (а также из-за большой диалектной вариативности) орфографическая и произносительная норма заметно варьирует, и возникает вопрос возможной унификации. Объективные причины диктуют отрицательный ответ, и встроенный словарь про-граммы-парсера имеет из-за этого возможность указания контекстно-вариативных лексем.
Аналитические формы
Аналитические глагольные формы - это регулярно использующиеся в языке пу-ла-фульфульде конструкции, которые, несмотря на свою внешнюю простоту, представляют значительную трудность для автоматического глоссирования, поскольку каждый элемент большинства конструкций может использоваться и отдельно. Наиболее распространённые глагольные аналитические конструкции - это статив и прогрессив (парадигмы «дуративного» регистра), оптатив, а также рамочные выделительные конструкции. Аналитические конструкции состоят из обязательного вспомогательного связочного элемепта и смысловой формы. Основной проблемой при маркировании таких конструкций стала обязательная демонстрация связи между двумя элементами. Используя существующий опыт, можно предложить три варианта маркирования одного и того же предложения со стативной конструкцией (представлены в примере (4)).
(4)
а. Значение конструкции (ЭЦ присваивается вспомогательному элементу
paykun kun no wondi e barehun
pay- кип кип no won- d- i с bare- hun
ребёнок- sgKUN Def.sgKUN CopSt быть- Soc-Act Prep собака-sgKUN Тот мальчик жил с собачкой.
б. Значение конструкции (St) присваивается основному элементу paykun kun no wondi e barehun pay- kun kun no won- d- i e bare- hun ребёнок- sgKUN Def.sgKUN Cop быть- Soc- Act.St Prep собака- sgKUN Тот мальчик жил с собачкой.
в. Значение конструкции (St) присваивается обоим элементам конструкции paykun kun no wondi e barehun pay- kun kun no won- d- i e bare- hun ребёнок-sgKUN Def.sgKUN Cop.St быть- Soc- Act.St Prep собака- sgKUN Тот мальчик жил с собачкой.
На данный момент корпус использует вариант, представленный в примере (46), поскольку оп наиболее легко реализуется технически. Однако в перспективе развитие программы позволит маркировать аналитические конструкции с помощью способа, разработанного на базе решения (4в). Он представлен в примере (5) и представляет собой систему внутренних сносок, связывающих элементы конструкции, более адекватную и экономичную, чем решение (4в). (5)
barehun kun no humpitii
bare- hun kun no humpit- ii
собака- sgKUN Def.sgKUN *Cop *иметь.сведения- Md.Pfv{*St} Собачка знает.
Конструкции с фокусом контраста
Морфология глагола пулар отражает типологически примечательную связь с синтактико-коммуникативной организацией высказывания. Благодаря этой связи "глаголы получают особое морфологическое оформление в случае, если высказы-
вание построепо говорящим с контрастивпым выделением 1) субъекта, 2) глагольного предиката (сказуемого), 3) прочих аргументов предиката (дополнения или обстоятельства)" Контрастивная конструкция в диалектах пулар (западная диалектная зона языка пулар-фульфульде) состоит, как правило, из двух элементов - собственно глагольной формы, состоящей из двух обязательных элементов - глагольной основы и видо-залогового аффикса соответствующей приконтрастивной парадигмы, и собственно фокализованного элемента. В случае с контрастивно выделенным субъектом или второстепенным членом предложения, фокализованный элемент может вводиться лексемой ко, помеченной глоссой Foc (см. пример (6)).
(6)
бе haldi ко катбе jombinndirta
бе hal- d- i ко кашбе jomb- inndir- ta
З.рГВЕ говорить- Soc- Act.Pfv.w Foc Emph.3.plBE жениться- Reep- Act.Pot.Sb Они договорились, что [это именно] они поженятся.
Однако в случае с аутофокализованным глаголом вокализуемая составляющая содержится в самом глаголе. Это затрудняет определение фокализованной конструкции и, таким образом, её обработку программой-парсером. Также наличие аутофокализованного глагола предопределило ещё одно важное решение, принятое при создании корпуса: фокализованные субъект и объект решено было не выделять специальным образом, оставив лишь маркировку прифокусной глагольной парадигмы и, при его наличии, фокусный элемент ко.
Другая сложность такой конструкции с точки зрения автоматической разметки состоит в частичной или полной омонимии базисных и коптрастивных парадигм. Если в предложении присутствует контрастивно выделенный член, омонимию можно разрешить достаточно легко, однако при отсутствии фокализующего ко приходится ориентироваться на второстепенные критерии, как-то: связь с соседними предикатами, акцентно-просодические средства, общий смысл фразы и др. Очевидно, что машина не в состоянии выполнить тонкий анализ, который зача-
1 Коваль А.И., Нялибули Б.А. Глагол фула в типологическом освещении. М.: Ин-г Языкознания РАН, Ин-т Русского Языка РАН, 1997. С. 26.
стую требуется для снятия омонимии форм из приконтрастивных глагольных парадигм. В корпусе пулар встречаются такие спорные моменты, и в случае, когда определить тип парадигмы невозможно, было принято решение использовать базисную маркировку.
Глава 3. Морфологический уровень языка и реализация строки глоссирования
Третья глава посвящена проблемам, возникающим на морфологическом уровне при сегментации текстов, а также таким вопросам оформления строки глосс, как способ указания заимствований, вид глагола, необходимая и избыточная лингвистическая информация.
Морфемная граница
При глоссировании текстов на пулар возникает ряд проблем, не в последнюю очередь из-за весьма сложной структуры языка, препятствующей морфочленению. Существует общая языковая тенденция в сторону упрощения и унификации сложных морфонологических узлов, и в результате этих процессов на морфемном шве зачастую происходят процессы, делающие разбиение на морфемы практически невозможным. В случае, если глоссируется регулярно встречающаяся двуморфемная форма, состоящая из корня и аффиксального показателя (именного класса, видо-залогового и др.), проблем при разметке возникает существенно меньше, чем в случае более распространённой ситуации, когда простая аддитивная модель состоит из трёх и более морфем, многие из которых отделимы в диахронической перспективе, но на синхронном уровне уже неразделимы. Это ставит перед создателями корпуса важную задачу: позиционируя корпус как синхронный, отделить тс основы, которые, тем не менее, стоит указать как составные, от тех, чей состав уже принадлежит к области диахронического анализа. Также морфочленение затрудняют разнообразные и многочисленные процессы на стыке морфем, как-то: ассимиляции, возникновение вокалической прослойки и др. Случаи фузионного сращения морфем также составляют значительную трудность при морфочленении. При-
мер (7) демонстрирует глагольный показатель, слитый с прямообъектным местоимением и геминатой просодического происхождения.
(7)
о yennimmi о yenn- immi 3.sgO бранить- Act.Pfv.w.DO. 1 Sg Он бранил меня.
Значимый морфолошческий нуль
Нулевая морфема - это весьма распространённое явление в языке пулар. К числу нулевых морфем, которые решено было обязательно отмечать в тексте, относится, главным образом, видо-залоговый аффикс (только активного залога). Этот регулярный элемент глагольной словоформы может иметь нулевое воплощение в некоторых формах индикатива (см. пример (8)).
(8)
kun nannoo fow
кип пап- 0- поо fow
3.sgKUN слышать- Act.Pfv.w- Retr всё Она всё слышала.
Также нулевую морфему возможно отмечать в императиве единственного числа активного залога. Отметим также, что омонимичная форма, в сочетании с соответствующей копулой, используется для образования аналитической формы оптатива.
(9)
aritoy
ar- it- оу- 0
приходить- Iter- Dist- Act.Imp.2Sg Приходи в другой раз.
И, наконец, закрывает список нулевых морфем, которые эксплицитно присутствуют в корпусе пулар, нулевой аффикс имён существительных, входящих в неличный подкласс лично-сингулярного класса О, объединяющего в себе многие заимствования. Как следует из терминологии, у класса есть и основное, личное воплощение, которое объединяет в себе имена родства, названия профессий и т.д.
Личные имена класса О нормально оформляются материальным показателем соот-
16
ветствующей ступени, а имена неличного О-подкласса часто оформляются нулевым аффиксом, тем не менее, требуя согласования по классу О (см. пример (10)). (10)
Ьакю уогсГо
ЬаЮо- 0 у о г- 0- сГо
лодка- ,<щО быть.сухим- А<М.Р1Г\'[РСР]- йсО сухая лодка
Но периодически в текстах на языке пулар, независимо от диалекта, можно встретить не оформленную по классу именную основу. Имена с такими основами имеют односоставную структуру (только корень), употребляются лишь в контекстах, не требующих согласования по классу (т.е. без атрибута), а также закономерно не содержат грамматического значения. Такие основы вполне могут, быть оформлены по определённому именному классу с помощью аффикса, и тогда они потеряют генерическое значение, но приобретут численно-грамматические характеристики (см. пример (11)). (И)
а) gerto 'курица-куры', но
б) gerto-gal ,кypицa-sgNGAL'
gertoo-de 'курица-рШЕ'
Стоит отмстить, что прочие случаи, где морфологический нуль не будет иметь выражения в разметке, единичны и спорны, и это обусловило отказ от дополнительной сегментации по умолчанию. Технически оформление обязательного морфологического нуля осуществляется путём его вставки в исходный текст и последующего анализа программой. Классный циркумфпке
Обширная система именных классов является, как уже было сказано, характерной особенностью языка пулар-фульфульде (свыше двадцати именных классов). Разграничегше существительных по именным классам производится с помощью комплекса из трёх критериев: синтаксического, морфологического и семантического. При создании аннотированного корпуса языка пулар наибольшее внимание,
17
очевидно, уделяется морфологическому критерию разделения на именные классы. Согласно ему, существительное, принадлежащее к какому-либо именному классу языка пулар-фульфульде, как и согласованный с этим существительным атрибут, оформляются единовременно двумя способами, формирующими так называемый классный циркумфикс. Во-первых, каждый класс имеет определённый набор классных аффиксов завершающих словоформу, а во-вторых, каждый класс, в релевантных случаях, требует использования одного из трёх типов начального корневого согласного — на ступени смычного, несмычного или преназализованно-смычного. Такое оформление составляет общеязыковую модель, от диалекта к диалекту допускающую большее или метшее варьирование. Факт наличия этой системы должен быть отражён в разметке. Образец типичного оформления классного циркум-фикса в согласованных атрибутах показан в примере го диалекта масина (12).
(12)
taali da66i
taal- i 0cda66- i
сказка- plDI "'короткий- pTOI 'сказки короткие'
nyiikoy ndanewoy
nyii- koy PtHl0cndane- woy
зуб- plKOY котбелый- plKOY 'беленькие зубки'
nyannde wootere
nyan- nde NOcvvoote- re
ОТЕдень- sgNDE ВЕодин- sgNDE 'один день'
Технически такой подход пока не реализован, поскольку диалект пулар фута-джаллон, на оспове текстов которого закладывается корпус, использует циркумфикс лишь частично - в этом диалекте утрачена продуктивная система анлаутного согласования. Благодаря этому в корпусе пулар на данный момент используется минималистский подход к оформлению циркумфикса: согласование в именной
группе глоссируется без указания ступени анлаута вообще. То же относится и к ан-лауту глагола, способному в большинстве диалектов - но не в диалекте фута-джаллон - служить средством согласования глагола с подлежащим по числу. Разумеется, в реализуемом подходе есть существенные минусы в общеизвестном плане, но он удовлетворительно отражает ситуацию в пулар фута-джаллон. В перспективе же должна быть разработана система, позволяющая с большей или меньшей степенью автоматизма проводить разметку именной и глагольной групп с указанием, в релевантных случаях, ступени анлаута и связи её с именным классом или глагольной парадигмой, а также конвертировать результат в формат хт1.
Заимствования
При создании анпотировапного корпуса пулар информация о заимствованиях была опущена, поскольку при всей безусловной привлекательности её с описательной точки зрения, она выходит за рамки задачи по синхронному представлению языка. Однако совершенно исключать заимствования из поля зрения не следует, в основном из-за их несоответствия стандартным моделям языка.
Интегрированные заимствования, впрочем, никакой особой сложности для автоматической разметки не представляют, поскольку они полностью подчинены правилам языка, и неисконность корня является лишь «академическим фактом», неспособным как-либо повлиять на процесс разметки. По-другому обстоит дело с варваризмами и не вполне интегрированными заимствованиями.
В качестве примеров не вполне интегрированного и интегрированного заимствований хорошо подходят имена, представленные в примере (13). Словоформа под литерой а) представляет собой недавно пришедшую в язык словоформу. Стоит заметить, что имеиа, пришедшие в язык пулар из других языков, в большинстве своём, попадают в неличный подкласс класса О, принимающий заимствования. В диалектах пулар-фулъфульде принимать заимствования способны и другие классы, но неличный О-подкласс является средоточием заимствований на всём пространстве пулар-фульфульде. Лексика, попадающая в этот подкласс, трактуется как получающая формальный нулевой аффиксальный показатель класса, что обеспечивает способность единиц участвовать в процессе согласования и прономинализации.
19
Под литерой б) находятся интегрированные заимствования, то есть, те, которые локализуются в каком-то другом классе, но выбор этого класса осуществляется преимущественно по формальным. В первом случае классификация произошла по семантическому признаку, то есть, понятие «финиковая пальма» семантически относится в «класс деревьев» К1, и, соответственно, оформляется по этому классу. Во втором же случае важную роль в классификации сыграл фонетический фактор: из-за наличия в языке общеизвестного класса N001,, существительное было ложно переразложено и отнесено именно к этому классу, хотя семантически ничего общего с его полем не имеет.
Однако не всем заимствованиям удаётся подпасть под один из этих признаков и покинуть «свалочный класс», как его называют типологи. Некоторые заимствованные словоформы, даже старые, так и остались оформленными по неличному О-подклассу, или же вовсе в форме неоформленной по классу основы. (13)
а)
кагеиш оп
кагайп- 0 оп
бензин- 5ёО Ре^О
6)
tamaroohi kin
tamaroo- hi kin финик- sgKI Def.sgKI 'финиковая пальма'
lekkol ngol
lekk- ol ngol
школа -sgNGOL Def.sgNGOL 'школа'
При глоссировании заимствований возникает лишь одна проблема: вне контекста невозможно отличить не вполпе интегрированные заимствования от интегрированных по фонетическому признаку. Зачастую для этого требуется экспертная оценка носителя. Если же экспертная оценка невозможна, то в неочевидных случа-
20
ях решено было определять спорные заимствования как неинтегрированные, чтобы избежать более грубой ошибки - определения имени в неправильный класс.
При этом интегрированные заимствования не представляют сложности для разметки и рассматриваются как стандартная лексика.
В Заключении подводятся итоги проведённого исследования. Основные результаты работы состоят в следующем:
• разработана система программного обеспечения, рассчитанная на использование с языком пулар-фульфульде;
• разработана система и конвенции глоссирования языка пулар фута-джаллон с учётом его лингвоспецифики и типологических особенностей;
• предложен способ транскрибирования устной речи с учётом перспективы последующего глоссирования;
• предложен формат представления глоссированных текстов на языке пулар фута-джаллон;
• исследованы синтаксические явления языка, представляющие трудность для глоссирования, и выработана стратегия их обработки;
• рассмотрены морфологические процессы в языке и предложены способы их адекватного отображения в морфологической разметке;
• определены случаи надклассных местоимений и предложены способы их отображения в глоссировании;
• составлен список грамматических категорий языка пулар фута-джаллон и обосновано частичное использование этих категорий в морфологической разметке;
• внесены предложения по техпике перевода некоторых видов лексем, в частности, введено понятие квазиперевода.
Публикации
По теме диссертации опубликованы следующие работы.
• Косогорова М.А. К вопросу о согласовании по категории именного класса в пулар-фульфульде // Труды Института лингвистических исследований РАН. T. VII. Ч. 3. Отв. ред. Д.В. Герасимов. СПб.: Изд-во «Наука», 2011г. Сс. 322-326.
• Косогорова М.А. Christiane Seydou. L'épopée peule de Boûbou Ardo Galo: Héros et rebelle. Paris: Éditions Karthala, 2010. (Рецепзия) // Вопросы языкознания №3. 2012. Ce. 147-149.
• Коваль А.И., Косогорова М.А. К проблемным вопросам морфоглоссирования текстов пулар-фульфульде // Вопросы филологии №36. М. 2012.
• Косогорова М.А. Анализ именных согласовательных моделей в авторском литературном тексте на фульфульде // Исследования по языкам Африки. Вып. 3. М.: Ин-т Языкознания РАН, 2009. Сс. 177-191.
• Косогорова М.А. К проблеме начально-корневых чередований в пулар-фульфульде в диалектологическом аспекте // Африканский сборник-2009. СПб.: Кунсткамера. 2009. Сс. 204-213.
• Косогорова М.А. К проблеме корневых чередований в пулар-фульфульде в диалектологическом аспекте // «Востоковедение и африканистика в диалоге цивилизаций»: XXV Международная конференция по источниковедению и историографии стран Азии и Африки. Тезисы докладов. Отв. Ред. H.H. Дьяков. СПб. 2009. С. 119.
• Коваль А.И., Косогорова М.А. К принципам морфоглоссирования текстов пулар: проблемные вопросы // «Модернизация и традиции»: XXVI Международная конференция по источниковедению и историографии стран Азии и Африки. Тезисы докладов. Отв. ред. H.H. Дьяков и A.C. Матвеев. СПб. 2011. Сс. 282-283.
• Косогорова М.А. К проблеме глоссирования имён существительных в языке фула // «Модернизация и традиции»: XXVI Международная конференция по источниковедению и историографии стран Азии и Африки. Тезисы докладов. Отв. Ред. H.H. Дьяков и A.C. Матвеев. С Пб. 2011. Сс. 283-285.
• Косогорова М.А. К вопросу о семантических воплощениях именных классов в языке пулар (диалект фута-джаллон) // XII Конференция африканистов «Африка в условиях смены парадигмы мирового развития». М. 2011. Сс. 185-186.
Подписано в печать:
30.09.2012
Заказ № 7656 Тираж - 150 экз. Печать трафаретная. Типография «11-й ФОРМАТ» ИНН 7726330900 115230, Москва, Варшавское ш., 36 (499) 788-78-56 www.autoreferat.ru
Оглавление научной работы автор диссертации — кандидата филологических наук Косогорова, Мария Александровна
Введение.
Глава 1. Обзор литературы и общая информация.
1.1. Сведения об исследуемом языке.
1.2. История изучения языка пулар фута-джаллон.
1.3. Состояние корпусных исследований.
1.4. Технические характеристики корпуса.
1.5 Образец аннотированного текста 1.
Глава 2. Первичная подготовка текста и синтаксический уровень языка.
2.1. Сегментирование текста на клаузы.
2.2. Проблема нулевой анафоры и варианты решения.
2.3. Вариативность в орфографии и возможность унификации.
2.4. Повторы, оговорки, хезитации и их отображение в разметке.
2.5. Аналитические формы: статив и прогрессив.
2.6. Аналитические формы: рамочные конструкции.
2.7. Конструкции с фокусом контраста и их отображение в разметке.
2.8. Устойчивые выражения и фразеологические конструкции.
2.9. Образец аннотированного текста 2.
Глава 3. Морфологический уровень языка и реализация строки глоссирования.
3.1. Морфемная граница и проблемы при сегментации.
3.1.1. Простой случай: очевидная граница.
3.1.2. Более сложные случаи: процессы на стыке морфем.
3.1.3. Случаи фузии.
3.2. Сложные местоимения: парадигма и способы глоссирования.
3.3. Значимый нуль в глагольной словоформе.
3.4. Значимый нуль как показатель именного класса.
3.5. Классный циркумфикс.
3.5.1. Определение, диалектная ситуация.
3.5.2. Отображение общеязыковой нормы в разметке.
3.6. Общий формат строки глоссирования.
3.7. Заимствования и степень подробности их разметки.
3.8. Проблема необходимой и избыточной информации в разметке.
3.8.1. Диминутив, аугментатив и семантические поля именного класса.
3.8.2. Число и личностность при именном классе.
3.8.3. Прочие проблемы, связанные с лингвистической информацией.
3.9. Перевод и его отображение в строке глоссирования.
3.9.1. Вид глагола в переводе.
3.9.2. Служебные слова, предлоги, частицы, междометия.
3.9.3. Вопросы многозначности перевода.
3.9.4. Отсутствующие в языке реалии.
3.10. Образец аннотированного текста 3.
Введение диссертации2012 год, автореферат по филологии, Косогорова, Мария Александровна
В настоящем исследовании предлагается опыт создания аннотированного корпуса для младописьменного языка и предпринимаются попытки решить проблемы, связанные с этой задачей. Диссертация посвящена освещению теоретических вопросов аннотирования корпуса текстов на базе данных диалекта фута-джаллон (Гвинея) языка пулар-фульфульде.
Язык пулар-фульфульде, который относится к западно-атлантической семье, является одним из крупнейших африканских языков. Он имеет много типологических особенностей, которые представляют значительный интерес для исследователей-лингвистов, и упоминается во многих работах по типологии. Так, например, Гревил Корбетт в своём труде "Gender", упоминая пулар-фульфульде как "западно-атлантический язык, насчитывающий около 10 миллионов носителей и широко распространённый в Западной Африке" [Corbett 1991: 191], неизменно включает его в список языков, на основе которых автор проводит типологические исследования. Характерными особенностями языка, обеспечивающими ему неизменный интерес со стороны лингвистов, являются (помимо его масштабов, дисперсии и социолингвистических данных), в частности, "число граммем согласовательного класса, [которое] остаётся самым высоким среди всех надёжно засвидетельствованных языковых систем" [Плунгян 2003: 156], процессы актантных преобразований в трёхзалоговой системе, а также система чередований начальных согласных корня, которую отмечал в своей основополагающей работе «Язык» (1921) Эдвард Сепир, придав ей типологическую значимость как средству противопоставления 'людей' и 'вещей' [Сепир 1921/1993: 82].
Актуальность исследования определяется тем, что на современном этапе построение и развитие языковых корпусов находится в русле важнейших задач, востребованных современным состоянием языковедения , в том числе и для . бесписьменных или младописьменных языков. Создание, на примере пу-лар, принципов морфоглоссирования таких языков является актуальной иссле-довтельской задачей, так как представляет собой необходимый этап собственно перед созданием корпуса. Как определяют в своем предисловии роль обработанных корпусных источников для сегодняшних и последующих лингвистических исследований редакторы сборника «Корпусные исследования по русской грамматике», «. грамматика настоящего и будущего — это грамматика корпусная в широком смысле слова, то есть опирающаяся на огромные массивы информации, доступные с помощью поисковых систем, в виде баз данных и корпусов текстов» [Корпусные исследования 2009: 9]. Создание, таким образом, теоретической базы для аннотации текстов корпуса пулар можно признать обоснованной задачей, которая в перспективе поможет внести вклад в грамматические исследования по этому языку.
Поскольку интерес к языку пулар-фульфульде зародился достаточно давно, язык к настоящему времени оказался довольно хорошо описан, но, тем не менее, при использовании его в лингвистических исследованиях, можно столкнуться с труднодоступностью языкового материала, связанного с конкретным явлением. Это связано, прежде всего, с отсутствием отработанной традиции морфоглоссирования для этого языка, что, в общем, неудивительно, поскольку такая традиция разработана и успешно применяется лишь для некоторых хорошо изученных и известных европейских языков, а также для одиночных редких языков, которым повезло оказаться в поле зрения энергичного и целеустремлённого исследователя, создавшего для них такую систему, как, например, произошло с бамана [Выдрин 2011] или арчинским [Архипов е! а1. 2008] языками.
Научная новизна исследования состоит в том, что в ходе него впервые создана система глоссирования для языка пулар с учётом его типологических особенностей. Впервые разобраны способы морфологического аннотирования таких явлений как, в частности, классный циркумфикс, аналитические кон5 струкции, надклассные местоимения. Необходимость создания общеязыкового корпуса пулар-фульфульде существует уже достаточно давно, однако до недавнего времени в распоряжении лингвистов не было достаточной технической базы для реализации такого проекта. Из-за диалектного разнообразия и вариативности, а также ввиду отсутствия предыдущего опыта, создать аннотированный корпус сразу для всего пространства пулар-фульфульде не представляется возможным. Поэтому в качестве базовой задачи было решено создать аннотированный корпус пулар фута-джаллон, являющегося одним из крупнейших диалектов пулар-фульфульде, которому, в связи с его масштабом, некоторые исследователи (см, например, [Ethnologue 2010]) присваивают статус отдельного языка.
Объективности ради стоит заметить, что текстовый корпус (в значении — собрание текстов) на языке пулар-фульфульде - явление не новое. Исследователи уже публиковали сборники текстов на этом языке, однако акцент этих работ был скорее культурологический и литературоведческий, и эти публикации не могли дать удовлетворительной информации лингвисту-типологу, поскольку снабжались в лучшем случае пословным переводом. Особо в этой связи следует отметить работы известного французского фуланиста Кристиан Сей-ду, которая к настоящему моменту собрала и опубликовала уже три сборника великолепных эпических сказаний фульбе, снабжённых комментарием и построчным переводом. Строго пословным же переводом снабжены собранные и обработанные А.И. Коваль тексты сказок фульбе [Африканская сказка I 1984], [Язык африканского фольклора 1997], [Африканская сказка III 2005] и др. (преимущественно на диалекте масина). Такая деталь как морфологическая разметка сделала бы эти замечательные собрания текстов настоящей находкой не только для фуланистов и фольклористов, но и для лингвистов, не являющихся специалистами по языку.
Теоретическая значимость исследования определяется тем, что в ходе работы были рассмотрены возможные варианты решения проблем, неизбежно б возникающих при попытке создать морфологическую аннотацию текстов на языке синтетической природы с элементами аналитизма. Также в ходе работы были выделены теоретико-грамматические положения языка, формирующие ту платформу, с опорой на которую выдвигаются и апробируются соглашения по представлению корпусных данных. Результаты исследования могут также быть применены для аналогичных явлений в других языках.
Наряду с этими и другими теоретическими проблемами, предлагаемая грамматическая разметка нацелена также на аргументированное решение важнейшей задачи по выявлению уровня дивергентности диалекта (диалектов) относительно ядерной общеязыковой модели.
Практическая значимость настоящей работы состоит в том, что, во-первых, её результаты применены для создания аннотированного корпуса языка пулар, что делает этот язык более доступным для лингвистических исследований, в том числе квантитативных и квалитативных. Во-вторых, результаты работы могут быть использованы для разработки аннотированных корпусов других младописьменных языков. Наконец, результаты работы могут найти примение при подготовке учебных курсов по общей морфологии, корпусной лингвистике, по африканскому языкознанию, а также при разработке практических грамматик, нацеленных на преподавание языка пулар-фульфульде.
Основным материалом исследования послужили текстовые данные, собранные в ходе лингвистической экспедиции в Республику Кот д'Ивуар под руководством В.Ф. Выдрина (январь-май 2010 года). Работа по сбору текстов проводилась с носителем языка пулар фута-джаллон, говор Сану-Лагорд-Тарамбали (аггломерация деревень к северу от Лабе, Республика Гвинея).
Тексты, изначально записанные в формате аудио, были затем расшифрованы с помощью этого же носителя и соответствующим образом обработаны. В 2011 году для обработки собранных текстов пулар была разработана про-грамма-парсер, направленная на морфоглоссирование данных с учётом лингвоспецифики языка. В результате этой работы в 2011 году был создан тестовый вариант корпуса пулар.
Апробация работы. Основные положения диссертации были представлены на XXV Международной конференции по источниковедению и историографии стран Азии и Африки «Востоковедение и африканистика в диалоге цивилизаций» (Санкт-Петербург, 22-24 апреля 2009 г.), на XII Конференции африканистов «Африка в условиях смены парадигмы мирового развития» (Москва, 24-26 мая 2011 г.), а также на XXVI Международной конференции «Модернизации и традиции» (Санкт-Петербург, 20-22 апреля 2011 г.), на Восьмой конференции по типологии и грамматике для молодых исследователей (Санкт-Петербург, ноябрь 2011 г.). Работа прошла обсуждение в отделе африканских языков ФГБУН «Институт языкознания РАН».
Заключение научной работыдиссертация на тему "Принципы глоссирования для корпуса младописьменного языка"
Заключение
В диссертации были рассмотрены проблемы, с которыми пришлось столкнуться при разработке корпуса языка пулар фута-джаллон. Достигнуты следующие результаты:
• разработана система ПО, рассчитанная на использование с языком пулар-фульфульде;
• разработана система и конвенции глоссирования языка пулар фута-джаллон с учётом его лингвоспецифики и типологических особенностей;
• предложен способ транскрибирования устной речи с учётом перспективы последующего глоссирования.
• предложен формат представления глоссированных текстов на языке пулар фута-джаллон;
• исследованы синтаксические явления языка, представляющие трудность для глоссирования, и выработана стратегия их обработки;
• рассмотрены морфологические процессы в языке и предложены способы их адекватного отображения в морфологической разметке;
• определены случаи надклассных местоимений и предложены способы их отображенияы в глоссировании;
• составлен список грамматических категорий языка пулар фута-джаллон и обосновано частичное использование этих категорий в морфологической разметке;
• внесены предложения по технике перевода некоторых видов лексем, в частности, введено понятие квазиперевода;
• выявлены проблемы, не подлежащие сиюминутному решению, но подлежащие рассмотрению в перспективе.
В качестве возможных тем для будущих исследований данной области нам видятся следующие: дальнейшее развитие технической базы для уменьшения человеческого участия и возможности глоссирования больших объёмов текстов; расширение корпуса на другие диалекты пулар-фульфульде; выявление проблем, возникающих при включении в корпус текстов других диалектов и их решение; включение в систему морфологической разметки дополнительных видов информации, таких как перевод на другие языки кроме русского.
Список научной литературыКосогорова, Мария Александровна, диссертация по теме "Прикладная и математическая лингвистика"
1. Африканская сказка I: Материалы к исследованию языка фольклора. М.: Наука, 1984.
2. Африканская сказка Ш: К исследованию языка фольклора. М.: Восточная литература, 2005.
3. Вестерман Д. Множественное число и именные классы в некоторых африканских языках // Африканское языкознание. Сборник статей. Под ред. Д.А. Ольдерогге. М.: Издательство иностранной литературы, 1963. Сс. 54-93
4. Виноградов В.А. Введение: именные категории в языках Африки // Основы африканского языкознания: Именные категории. Под ред. В.А. Виноградова. М.: Аспект пресс, 1997. Сс. 5-23.
5. Виноградов В.А., Коваль А.И., Порхомовский В.Я. Социолингвистическая типология. Издание второе, исправленное и дополненное. М.: Издательство ЖИ, 2007.
6. Выдрин В.Ф. Электронный глоссированный корпус языка бамана: первый этап // Acta Lingüistica Petropolitana. Труды Института лингвистических исследований. СПб.: Наука, 2011.
7. Диалло, Гуро Хамсамба. Парадигматика и функционирование прономинальной системы (на материале фульфульде). Канд. Дисс. М, 1991.
8. Зализняк A.A. Русское именное словоизменение. М.: Языки славянской культуры, 2002.
9. Захаров В.П. Корпусная лингвистика: Учебно-методическое пособие. СПб., 2005.
10. Зубко Г:В. Две инфинитивные формы в языке фула // В научном поиске. Учен. Зап. МГИ-МО. М.: 1968.
11. Зубко Г.В. Фула-русско-французский словарь. М.: Русский язык, 1980.
12. Зубко Г.В. Учебник языка фула: начальный курс. М.: Муравей-гайд, 2000.
13. Кибрик A.A. Анализ дискурса в когнитивной перспективе. Диссертация на соискание учёной степени доктора филологических наук. М.: 2003.
14. Коваль А.И. Морфемика пулар-фульфульде // Основы африканского языкознания: Морфе-мика. Морфонология. Под ред. В.А. Виноградова. М.: Восточная литература, 2000. Сс. 103-290.
15. Коваль А.И. Контрастивность как морфологическая категория пулар-фульфульде. // Основыафриканского языкознания. Глагол. Под ред. В.А. Виноградова и И.Н. Топоровой.
16. М.: Издательская фирма «Восточная литература» РАН, 2003. Сс.357-459.
17. Коваль А.И. «Безаффиксные» имена в ареально разобщённых диалектах пулар-фульфульде
18. Исследования по языкам Африки. Выпуск 2: Африканские языки в социокультур157ном и ареальном аспектах. Под ред. В.А. Виноградова и В.Я. Порхомовского. М.: Институт Языкознания РАН, 2008. Сс. 64-80.
19. Коваль А.И. Согласование в именной группе пулар-фульфульде. // Основы африканского языкознания. Синтаксис именных и глагольных групп. Под ред. В.А. Виноградова. М.: Academia 2010. Сс. 211-384.
20. Коваль А.И., Косогорова М.А. К проблемным вопросам морфоглоссирования текстов пулар-фульфульде//Вопросы филологии. М.: 2012.
21. Козлов С.Я. Фульбе Фута-Джаллона. М.: Наука, 1976.
22. Корпусные исследования по русской грамматике. Ред.: К.Л. Киселева, В.А. Плунгян, Е,В. Рахилина, С.Г. Татевосов. М.: Пробел-2000,2009.
23. Косогорова М.А. Классный циркумфикс в диалектах пулар-фульфульде // Африкнский сборник-2007. СПб.: Кунсткамера, 2007. Сс. 290-305.
24. Косогорова М.А. Анализ именных согласовательных моделей в авторском литературном тексте на фульфульде // Исследования по языкам Африки. Вып. 3. М.: Ин-т Языкознания РАН, 2009а. Сс. 177-191.
25. Косогорова М.А, К проблеме начально-корневых чередований в пулар-фульфульде в диалектологическом аспекте // Африканский сборник-2009. СПб.: Кунсткамера, 20096. Сс. 204-213.
26. Косогорова М.А. Christiane Seydou. L'épopéepeule de Boûbou Ardo Galo: Héros et rebelle. Paris: Éditions Karthala, 2010. (Рецензия). M.: Вопросы Языкознания, 2012.
27. Малые языки и традиции: существование на грани. Вып. 2. Тексты и словарные материалы. Под ред. А.Е. Кибрика. М., 2008.
28. Мейнхоф К. Африканские языки с именными классами и их значение для истории языка // Африканское языкознание. Под ред. Д.А. Ольдерогге. М.:Издательство иностранной литературы, 1963. Сс. 5-14.
29. Мельчук И.А. Курс общей морфологии. М. Вена: Издательская группа «Прогресс», 1997.
30. Ольдерогге Д.А. История изучения африканских языков. М, 1990.
31. Плунгян В.А. Общая морфология. Введение в проблематику. М.: Едиториал УРСС, 2003.
32. Поздняков К.И. Сравнительная грамматика атлантических языков. Именные классы и фоно-морфология. М:. Наука. Издательская фирма «Восточная литература», 1993.
33. Реформатский A.A. Введение в языковедение. М.: Аспект Пресс 1996.
34. Розенталь Д.Э. Справочник по русскому языку: Орфография и пунктуация 2-е изд. , пере-раб. М.: Оникс, 2008.
35. Сепир Э. Избранные труды по языкознанию и культурологии. М.: Прогресс, 1993.158
36. Сологуб О.П. Усвоение иноязычных структурных элементов в русском языке // Наука, университет, 2002. Новосибирск: 2002. Сс. 130-134.
37. Траоре Б.А. Структура и функция причастий как поликатегориального разряда слов. Канд. дисс. М.: Ин-т языкознания АН, 1989.
38. Чейф У. Данное, контрастивность, определенность, подлежащее, топики и точка зрения // Новое в зарубежной лингвистике. Вып. XI. М., 1982.
39. Язык африканского фольклора: Африканская сказка II. М.: Восточная литература, 1997.
40. Aikhenvald A. Classifiers: A Typology of Noun Categorization Devices. Oxford: Oxfofrd University Press, 2003.
41. Arensdorff L. Manuel pratique de langue peulh. Paris: Librairie Orientaliste, 1913/1966.
42. Arnott D.W. The Subjunctive in Fula: a Study of the Relation between Meaning and Syntax // African Language Studies Vol. II. Guthrie M., ed. London: University of London, 1961.
43. Arnott D. W. The nominal and verbal system of Fula. Oxford: Clarendon, 1970.
44. Arnott D.W. Some aspects of the study of Fula dialects // Bulletin of the School of Oriental and African Studies 1,1974.
45. Ba O. Vocabulaire de base : introduction à l'étude du poular du Fouta sénégalais // Bulletin del'Institut Fondamental d'Afrique Noire. 30-3. Dakar: IF AN série В., 1968.
46. Bah El Hadj Thierno Mamadou. Histoire du Fouta Djallon des origines au XXe siecle. Conacry: SAEC, 1998.
47. BarthH. Sammlungung Bearbeitung Central-Afrikanischer Vokabularien. Gotha, 1862-1866.
48. Baumbach J. M. A brief linguistic sketch of Wodaabe Fulfiilde, including consonant alternation. Unpublished Masters thesis. University of Texas at Arlington, 1997.
49. Bettison Jim & Karen. Dictionnaire Pular-Français. 2eédition. Labé: Traducteurs Pionniers de la Bible, 2006.
50. Biber D., Conrad S., Reppen R. Corpus Linguistics: Investigating Language Structure and Use. Cambridge: Cambridge University Press, 1998.
51. Bisang W. Dialectology and typology An integrative perspective // B. Kortmann, éd., Trends in Linguistics: Dialectology meets Typology. New York: Mouton de Gruyter, 2004.
52. Bowern C. Linguistic Fieldwork: a Practical Guide. New York: Palgrave Macmillan, 2008.
53. Bybee J., Perkins R., Pagliuca W. The Evolution of Grammar. Tense, Aspect and Modality in the Languages of the World. Chicago: The University of Chicago, 1994.
54. Chafe W. Givenness, Contrastiveness, Defmiteness, Subjects, Topics, and Point of View// Subject and Topic. Li C.N. (ed.). New York: Academic Press, 1976.
55. Chomsky N. Aspects of the theory of syntax. Cambridge: The MIT Press, (1965).159
56. Corbett G. Agreement: a Partial Specification Based on Slavonic Data // Agreement in Natural Language. Barlow M., Ferguson A. (eds.), Stanford: CSLI, 1984.
57. Corbett G. Gender. New York: Cambridge University Press, 1991.
58. Corbett G. Agreement. New York: Cambridge University Press, 2006.
59. Corbett G. Number. Cambridge: Cambridge university press, 2000.
60. Corbett G. Number of Genders.// Haspelmath M., Dryer M. S., Gil, D., Comrie B. (eds). The World Atlas of Language Structures Online. Munich: Max Planck Digital Library, chapter 30. 2008.Available online at http://wals.info/feature/30.
61. Coulibaly, S. Yamal Fatimata Boobo Lobbo. Dakar: Société Internationale de Linguistique, 1988.
62. Delafosse M. Vocabulaires comparatives de plus de 60 langues ou dialects parlés â la Côte d'Ivoire et dans les regions limitrophes. Paris, 1904.
63. De Wolf P.P. English-Fula Dictionary: A Multidialectal Approach. Berlin: Reimer, 1995.
64. Diallo A. Grammaire descriptive du pular du Fuuta Jaloo (Guinée). Frankfurt am Main: Peter Lang, 2000.
65. Essentials of Language Documentation. Gippert J., Himmelmann N.P., Mosel U. (eds). Berlin: Mouton de Gruyter, 2006.
66. Ethnologue Report for Fula. http://www.ethnologue.com/show family.asp?subid=90740.
67. Evans B. Teaching grammar of Pular. Christian Reformed World Missions, 1996.
68. Faidherbe L. Essai sur la langue peul. Revue de linguistique et de philologie comparée, t.7, Paris: 1875.
69. Fulfulde Language Family Report. http://www.sil.org/SILESR/2003/silesr2003-009.htm.
70. Gaden H. Le Poular. Dialecte peul du Fouta sénégalais. Paris, 1913-1914.
71. Gaden H. Proverbes et maximes Peuls et Toucouleurs traduits, expliqués et annotés. Paris: Institut d'Ethnologie, 1931.
72. Gibert E. Étude de la langue des Poules. Revue de linguistique et de philologie comparée, t.t. 3234, Paris, 1899-1901.
73. Holm J. Pidgins and Creoles: Reference Survey. New York: Cambridge University Press, 1989.
74. Ka F. Problématique de la standardization linguistique: Le cas du pulaar/fulfulde // Cyffer N., ed., Language Standardization in Africa. Hamburg: Helmut Buske Verlag, 1991.
75. Kennedy G. D. An Introduction to Corpus Linguistics. London: Edison Wesley Longman Limited, 1998.
76. Koelle S. W. Polyglotta Africana. London, 1854.
77. Macbrair M. A grammar of the Fulah language with vocabulary. London, 1854.
78. McEnery T., Wilson A. Corpus Linguistics. Edinburgh: Edinburgh University Press, 1997.
79. Miyamoto R. A Note on Some Features of the Sokoto Dialect of Fula // Journal of African and Asian Studies 37, 1989. Pp 15-30.
80. Mukarovsky H. G. Die Gründlagen des Fui und das Mauretanische. Wien: Verlag Herder, 1963.
81. Niang M. Pulaar-English / English-Pulaar Dictionary. New York: Hippocrene books, 1997.
82. Noye D. Cours de foulfouldé, dialecte peul du Diamaré, Nord-Cameroun: grammaire et exercises, textes, lexiques peul-français et français-peul. Paris Maroua (Cameroun): Librairie Orientaliste, 1974.
83. Noye D. Dictionnaire foulfouldé-français, dialecte peul du Diamaré du Nord-Cameroun. Paris: Li-brarie Orientaliste, 1989.
84. Rapport final. Organisation des Nations Unies pour l'Éducation, la Science et la Culture. Réunion d'un Groupe d'experts pour l'Unification des alphabets des langues nationales. Bamako (Mali), 28 Février 5 mars 1966.
85. Seydou C. Dictionnaire Pluridialectal des Racines Verbales du Peul. Paris: Éditions Karthala, 1998.
86. Sinclair J. Corpus Creation // Corpus Linguistics: Readings in a Widening Discipline. Sampson G. & McCarthy D. (eds). New York: Continuum. 2004.
87. Smith R. W. Fulfulde reference grammar. Burkina Faso: SIM, 1971.
88. Sow A.I. La femme, la vache, la foi. Paris: Juillard, 1966.
89. Siennes L. H. A reference grammar of Adamawa Fulfulde. East Lansing: Michigan State University, 1967.
90. Sylla Y. Grammaire moderne du pulaar. Dakar: Les Nouvelles Editions Africaines, 1982.
91. Tautain L. Contribution á l'étude de la langue foule. Revue de linguistique et de philologie comparée, t. 23, Paris, 1980.
92. Tent J., Mugler F. Why a Fiji Corpus? // Corpus Linguistics: Readings in a Widening Discipline.
93. Sampson G. & McCarthy D. (eds). New York: Continuum. 2004. Vanderaa L. Fulfiilde grammar. Mission Protestante au Sahel (CRWM), 1978. Zoubko G. Dictionnairepeul-français. Osaka: National museum of Ethnology, 1996.