автореферат диссертации по филологии, специальность ВАК РФ 10.02.21
диссертация на тему: Лингвистические проблемы организации и ведения автоматического словаря в интегральной информационной системе
Заключение научной работыдиссертация на тему "Лингвистические проблемы организации и ведения автоматического словаря в интегральной информационной системе"
В результате проведенного исследования были решены сле ощие теоретические задачи: Г, Обоснована целесообразность создания автоматического оваря, выполняющего 3 основ1ше функции:
1,Г. Функцию инструмента реализации различных режимов Т' в системе, ориентированной на решение нескольких инфор ционных задач; Г,2, Функцию толкового словаря, в котором фиксируются одства и различия лексических единиц, с помощью их перевод :х эквивалентов и формализованных толкований, и Г,3, Функцию энциклопедического словаря, задающего с •мощью ЭР внеконтекстуальные отношения между- этими едини •ми,
2. Определена структура такого словаря в целом и разра )тана структура различных типов включенных в него словарных юдений. Источником и обоснованием принятых при этом реше ти. послужили следующие пять факторов:
2.1, Специфика информационных задач, решаемых в рам ах ЙИС, в связи с которой в АС: а/ задана словарная информация, необходимая для эревода текстов на наиболее сложный, (высший) уровень Ш, риентированный- на задачу фактографического поиска; б/ из словарной записи выделены более общие уров и представления информации, соответствующие Ш промежуточ ого и низшего уровня, перевод на которые производится' при ешении других задач системы; в/ для отдельных типов лексических единиц, предло- 184 -
[а специальная форма записи их моделей управления^ и введены [таксические ограничения, позволяющие осздцествлять сжатие |дставления текста на ИЯ при условии сохранения смыслового :нства исходного текста,
2.2. Требование гибкости системы АОТ и однородности [ользуемых в ней формальных средств; так, например, для
5дставления в рассматриваемой системе энциклопедических све ши. двух типов - узуальных (тезаурусных) , содержащихся в , и окказиональных, записанных: в специальном фактографичес и массиве, было решено использовать единое формальное сред 30 - энциклопедическую рамку.2.3. Требование компактности записи лексикографичес IE сведений., т,е. минимального дублирования информации в АС» зультатом исследований в этом направлении явилось: а/ Выявление содержательной и функциональной взаи связи модели управления', толкования и тезаурусной; информации построение их: комплексного лексикографического описание; при ом, в частности, структура записи тезаурусной информации рмалъным путем выводится из записи толкования ЛЕ. Цредложен й подход? к описанию широкого крута семантических сведений о позволил впервые в лексикографической практике, связанной: организгацией: словарей для АОТ, дать теоретическое обоснова е и формальное описание процедуры о^ б^ора тезаурусных све ний и их представления в словаре, б/ Построение "грамматического" словаря, предназ ленного для представления' отдельно от АС характеристик ЛЕ, но щих регулярный характер, в целях устранения дублирования инфор- 185 -
щи в AC при сохранении однородности ее записи. В рамках юго словаря задается структура трех типов словар1ШХ ста I - синтаксических, семантических и тезаурусных. Наряду с
1кцией инструмента построения компактной записи сведений
1С/'грамматический" словарь выполняет еще 3 функции, а • обеспечивает формальную перестройку основных сле зных сведений из АС в соответствии с выбранным режимом ализа; при этом в самом "грамматическом" словаре выделя зя некоторый обобщенный уровень представления этих сведе а, позволяющий использовать их при упрощенном анализе тек эв практически любой тематики; • унифицирует процедуру построения АС; • обеспечивает контроль единообразия и непротиворечи зти записи в АС отдельных типов сведений.2.4. Необходимость согласованности всех компонентов стемы ACT, в которую входит данный словарь. В частности, предложенной работе обеспечивается взаимосвязь словаря и стемы амнтагматических отношений Ш , которая прослеживает на примере записи таких типов словарных сведений, как реводной эквивалент ЛЕ и ее модель управления. Формальный ет этой зависимости происходит при перестройке упомянутых сварных сведений! в соответствии с обобщением синтагматичес X отношений в процессе изменения режимов анализа в системе
2.5. Стремление к отражению в словаре парадигматичес й организации лексики, которое проявилось в разграничении значении ЛЕ основного и дополнительного компонента? по- 186 -
едний, задаваемый в явном виде в ассоциативном узле тол вания ЛЕ, определяет семантическую корреляцию этой еди цы на парадигматическом уровне.3. Сформулирован подход к процедуре построения АС, ко рый позволяет после записи в словарные статьи некоторого нимума сведений использовать АС для решения отдельных за ч системы и далее без изменения этих сведений достраивать оварь до полного варианта. В основу методики составления сварных статей, положено требование построения компактной лиси лексикографических сведений путем формального учета ех закономерностей взаимосвязей между различными типами формации (см. п. 2.3) .4. Определена последовательность операций изменения сварной информации в процессе текущего пополнения АС, а кже его совершенствования с учетом необходимости согласо ния этих операций между собой в зависимости от типов сло рных разделов, которые они затрагивают,
5. Разработана структура представления текста на ИЯ, торое ориентировано на решение всех определенных в ИИС формационных задач, а также структуры представлений, пред значенных для каждой из этих задач в отдельности. Сформу рованы принципы выделения в представлениях текстов отдель X информативных фрагментов - от смыслового ядра представ ния, которое переносится в предметный указатель, до целого афа текста, используемого в качестве поискового образа и документальном поиске. Определен метод накопления в :ециальном массиве ( массиве Ф^ отдельных фактографических едений-, переносимых туда из представлений текстов,
Практическим результатом работы явилось:
1. построение фрагмента АС;
2. разработка методики построения АС;
3. формулировка основных принципов, а тшасе отдельных практи ческих рекомендаций, по ведению АС;
4. построение "грамматического" словаря, ориентированного на выбранный для данного типа АС набор элементов описания словарных сведений и одновременно отражающего универсальные свойства этих элементов.5. Экспериментальная проверка достоверности полученных в дио сертации результатов путем ручного и автоматического тестирования АС в различных режимах обработки текстов, "" Приложение I.СТРУКТУРА СЛОВАРНОЙ СТАТЬИ АВТОМАТИЧЕСКОГО СЛОВАРЯ (на примере заполнения словарной статьи ЛЕ la 0. Общие сведения Зона I. Переводной о лексической единице. эквивалент.из она 0-1. Заглавие словарной СЕПЖНТАЦИЯ статьи^ £егм^нтару ^зона 0-2. Каноническая словоформа.сегментировать ];зона 0-3. Сведения о часто те встречаемости.ш П. Морфологические сведения.ISона П-1. Признак части речи.];зона П-2. Тип словоизменения» 130на П-3, Дополнительные морфо логические характерис тики.действит. залог Зона Ш. Синтаксические сведения.Подзона Ш-Г. Модель управления Bj:X. Bg: X. ' В3: на_^ + С в.п. /результат/ Подзона Ш-2. Сведения о расположении актантов.Подзона Ш-3. Сведения о реализации актантов. Зона 1У. Семантические сведения."воздействие "— ф) "человек" "текст" "те^ кст' V "часть " \/ " элемент " Зона У, Тезаурусные сведения.род формализм качество позитивность
0БРАБ0Т1{А РАЗДЕЛИ- ЧЛЕШ^МОСТЬ ПРАВИЛЬНОСТЬ упорядоченность см. об^абота- 190 -