автореферат диссертации по философии, специальность ВАК РФ 09.00.07
диссертация на тему: Логико-семантические средства формализации текста в вопросно-ответной системе
Оглавление научной работы автор диссертации — кандидата философских наук Волченко, Мария Викторовна
Введение
Глава I. Логические проблемы в области разработки языка, близкого.к.естественному, для человеко-машинного. диалога.
1.1. Широта применения логических средств.
1.2. Анализ выражений естественного языка
1.3. Формализованное представление текста
Глава 2. Построенйе формализованного.языка, для. представления текста.
2.1. Границы и тонкости формализации текста.
2.2. Определение логических средств
2.3. Описание прикладного языка.
Глава 3. Построение графовой модели.текста:. семантическая сеть
3.1. Семантическая сеть как формальная семантика.
3.2. Интерпретация прикладного языка
3.3. Графовое представление текста.
Глава 4. Формализация. диалоговых. средств в. прикладном. языке
4.1. Анализ и классификация вопросов. 904.2. Предпосылки вопросов.
4.3. Виды и формы ответов .III
Глава 5. Возможные применения разработанных средств
5.1. Описание логических категорий терминов-констант
5.2. Определение категорий ответов
5.3. Анализ формализованных вопросов
Введение диссертации1984 год, автореферат по философии, Волченко, Мария Викторовна
Научно-технический прогресс обусловил широкое внедрение электронных вычислительных машин в планирование, управление и организацию различных областей человеческой деятельности. Расширение возможностей решения на ЭШ все более сложных и разнообразных задач выдвинуло на первый план проблему доступа к работе на вычислительной машине пользователей, не являющихся специалистами в области программирования. Решение этой проблемы связано с разработкой специальных форм представления вводимой информации (запроса, задачи) и форм получения ответа, т.е. с разработкой специального языка общения с ЭШ. Рассчитанный на широкого пользователя язык должен быть, по возможности, приближен к естественному. В то же время он должен однозначно интерпретироваться при переходе к "внутреннему", машинному языку, т.е. "внешний" язык общения должен иметь модель, позволяющую применить автоматические методы обработки вводимой информации. Следует отметить также факт обратного влияния этой ситуации на внедрение автоматизированных систем. То, что при коммуникации с ЭШ не потребуется специального обучения программированию, - "одно это способно резко увеличить число пользователей,многие из которых не без оснований считают необходимость учить язык программирования серьезным препятствием на пути к вовлечению ЭШ в свою работу" [.3.14; c.300j. Рост числа таких пользователей привел к возникновению ситуации, когда автоматизированная система может быть "оснащена" одновременно двумя различными средствами (языками) , выполняющими различные функции. Одно из этих средств используется разработчиками системы для введения массива информации при создании базы данных и для ее корректировки.
Примером могут служить реляционные базы данных, созданные специально для тех случаев, когда предполагается ввод больших массивов информации Другое из этих средств направлено на обеспечение комфорта пользователей системы, поскольку ". Дальнейший прогресс в области автоматизации интеллектуальной деятельности будет в значительной мере определяться эффективностью реализаций информационных систем широкого профиля, то есть систем, обладающих способностью анализировать поступающий вопрос, определять предметную область, к которой он относится и формулировать релевантный ответ, быть может, в явном виде не содержащийся в памяти системы. Системы, обладающие перечисленными свойствами, получили название вопросно-ответных систем" [^3.20; с.з]. В центре внимания данного диссертационного исследования находятся логические средства и уровни формализации текста (вопроса), данного во внешнем языке общения пользователя с ЭВМ, используемые при переходе к внутреннему, машинному представлению соответствующей предметной области.
Можно выделить два подхода к решению вопроса о формах диалога с ЭВМ без обращения к языку программирования. Первый, более ранний подход состоит во введении формализованных документов,резко ограничивающих набор допустимых терминов естественного языка и исключающих анализ структуры предложений. В ряде случаев заранее предусмотренные тексты заменяются наборами кодов или шифров,предлагаемых, например, в виде рубрикатора. Даются перечни снабженных порядковыми номерами вопросов, на которые система может дать ответ. При подготовке базовой информации для предусмотренных в системе вопросов вводятся перечни возможных ответов. При работе с ЭВМ пользователь ограничен выбором из предложенного ему списка.
Возможность применения другого подхода обусловлена развитием вычислительной техники и программного обеспечения. В частности,это относится к используемым в вопросно-ответных системах программам, анализирующим ("понимающим") естественный язык и к развитию такого способа представления данных, как семантические сети. Таким образом, все больший интерес вызывает то направление развития средств человеко-машинного диалога, которое ставит вопрос о приближении этих средств к естественному языку.
Актуальность темы данной диссертационной работы определяется тем, что используемые в указанной области логические средства явно недостаточны для решения имеющихся здесь серьезных логических проблем. В основе программ, "понимающих" естественный язык, лежит построение модели текста, структура которой определяется способом явного представления семантических связей между отдельными терминами, входящими в состав данного текста. При выборе формализованного языка для описания свойств модели такого рода создатели имеющихся программ используют традиционный способ описания логической структуры предложения в виде формулы языка исчисления предикатов. При этом лингвистические средства анализа текста используются независимо от логических средств его формализации, на которую направлен анализ. В результате по справедливому замечанию крупного специалиста в области человеко-машинного общения Э.В. Попова, при разработке систем с естественным языком (СЕЯ) дело осложняется тем, что разработчики СЕЯ не замечают большинство тонкостей естественного языка, и это приводит к упрощенчеству, за которое приходится дорого расплачиваться при эксплуатации системы. Кроме того, - ". лингвисты описывают ЕЯ не в том ракурсе, который необходим разработчику СЕЯ" |з.24; с.I8]fj.
К этому следует добавить, что без внимания остаются также тонкости логической формализации связного текста, границы использования имеющихся средств и потенциальные возможности их развития специально для решения задач данной области. Следствием этого явилось введение жестких ограничений на словарный состав и форму допустимых в тексте выражений. Ограниченный таким образом язык общения человека с ЭВМ оказывается весьма далеким от естественного.
Отмеченные трудности делают актуальным поиск более эффективных средств логической формализации текста в языке-посреднике представляющем собой промежуточный уровень между языком общения и машинной моделью текста. От этой формализации непосредственно зависит мощность ограничений, налагаемых на язык общения, возможности применения формальных методов для обработки введенной информации, а также однозначность перехода к модели и полнота представления информации, содержащейся во вводимом тексте.
Следует отметить, что вопросно-ответные системы создаются не только в целях комфорта, как "пристройка" к ИПС. Разработка языка общения существенно влияет на организацию базы данных и развитие средств поиска информации, расширяя число допустимых в диалоге типов терминов и выражений. Наконец, анализ и развитие средств перехода от текста к машинному представлению информации представляет особый интерес, поскольку ". едва ли возможно говорить о машинном мышлении, не говоря, в первую очередь, о мышлении человеческом" [4.42; с,з\. Данную область исследовании можно рассматривать, как чрезвычайно интересную динамическую модель фрагмента естественного языка и отраженных в нем процессов мышления. В частности, на этой модели представлены связи логической структуры языка общения со структурой и содержанием базы данных (то есть знаний, памяти системы),а также с процессами поиска, представляющими собой машинное мышление. Таким образом, наряду с чисто практическими задачами данная тема представляет несомненный теоретический интерес с логико-философской точки зрения. В центре внимания - естественный язык, но рассматриваемый не чисто синтаксически, а с точки зрения выделения содержащейся в тексте информации и возможно более полного ее представления в виде, доступном для машинной обработки. Как отмечает Д. А.Поспелов, большой интерес специалистов в области искусственного интеллекта к естественному языку как средству описания действительности и средству общения с ЭВМ определяется основными задачами этой области, являются: "синтаксический анализ текстов на естественном языке, переход от языковых представлений к языку описания знаний, понимание вопросов, формирование ответов, интересующих человека, извлечение знаний из текстов на естественном языке" ^4.17; о.в]. Таким образом, несомненный интерес представляет развитие средств формализации текста и анализ естественных диалоговых средств,что является одним из необходимых условий приближения языка общения к естественному .Логические исследования в данном направлении предполагают решение следующих задач:
- Рассмотрение используемых логических методов и средств, как существующих в рамках предмета логики, так и возникших в данной прикладной области. В связи с этим проводится уточнение задач этой области, требувдих применения дополнительных логических средств, а также разграничение логических и лингвистических средств анализа текста,
- Рассмотрение трех уровней представлений текста в вопросно-\ ответной системе, и описание формализованного языка, являющегося посредником между внешним языком общения.и внутренней (семантической) моделью текста с учетом требований, определяемых этой моделью. Как отмечал Ф.Бэкон, - "Логика изучает процессы понимания и рассуждения." [з.З; c.29lj. Указанные три уровня представляют собой три последовательных логических этапа в процессе "машинного понимания" текста. В связи с этим ставится задача логического описания средств, используемых на третьем этапе, т.е. модели типа семантической сети, удовлетворяющей условию однозначности перехода от языка-посредника к внутреннему представлению.
- Развитие формализованных диалоговых средств на базе применения полученных результатов для анализа вопросов в естественном языке, в частности, для построения подробной классификации вопросов на основании их логической структуры. Наконец, необходимо более широко рассмотреть возможные применения разработанных средств, а также перспективы дальнейших логических исследований в данной области.
Научная новизна диссертации определена включением в круг логических исследований новых проблем, а также характером полученных результатов, состоящих в следующем:
1. Определены и проанализированы задачи логико-семантических исследований в области разработки средств формализации текста в вопросно-ответных системах. В связи с этим рассмотрены ноше аспекты применения логических средств и перспективные направления прикладных логических исследований.
2. На основании проведенного анализа прикладной области выявлены и описаны используемые в ней логические средства. Так, представление текста в виде семантической сети рассмотрено и описано как формальная семантика первопорядкового языка. В этом описании предлагается новое решение вопроса о выборе типов связей между вершинами графа.
3. Уточнение указанных средств позволило разработать для представления текста формализованный язык, в котором предлагается изменение структуры атомарной формулы, состоящее во введении в ее состав отношения принадлежности, как единственной предикатной константы. Показано, что такая структура формулы удобна для обеспечения однозначного перехода к семантической сети, а также для формализации вопросов.
4. Развита подробная классификация вопросов на основании выделения их логической структуры и формализованного представления в разработанном языке. В результате формализации уточнены понятия предпосылки вопроса и области поиска ответа, а также рассмотрены способы сведения вопросов всех типов к стандартному виду.
Практическая ценность диссертации состоит, прежде всего, в направленности исследований на развитие логических средств, используемых в конкретной прикладной области. Изменение структуры атомарной формулы позволило расширить возможности формализованного представления текста и обеспечило однозначный переход от этого представления к графовой модели. В качестве этой модели рассмотрена семантическая сеть, широко используемая в системах автоматического анализа текста. Уточнены логические свойства этого вида представления и показана достаточность введения только трех типов чисто функциональных связей между вершинами графа. Такая структура является универсальной, так как применима к текстам из различных областей знаний, не требуя введения дополнительных типов связей между вершинами. Особое внимание уделено представлению сложных суждений и содержательных связей между суждениями.
Использование разработанных средств формализации позволило построить подробную классификацию вопросов, ориентированную на развитие возможностей их автоматического анализа и поиска ответа. Детализация структуры позволила выделить различные типы формализованных вопросов по месту, занимаемому в атомарной формуле, переменной, связанной вопросным оператором. Рассмотрены средства представления предпосылок формализованных вопросов и определения области поиска ответа. Предложены методы сведения вопросов различных типов к стандартному виду, удобному с точки зрения последующего возможного применения методов автоматического доказательства теорем для поиска ответа.
В сущности, именно логический анализ фрагментов естественного языка должен давать результаты, весьма ценные для развития средств общения с ЭВМ. Как отмечает Э.В. Попов, - ". описание естественного языка (пока никем не выполненное), называемое "семантическим" описанием, ориентировано на то, каким образом осуществляется анализ (=понимание) и синтез (формирование) текстов носителями языка" [3.24; c.I8l] .
Разработка логических средств формализации текста для вопросно-ответных систем представляет несомненный философский интерес в двух аспектах. С одной стороны, важен анализ того фрагмента естественного языка, который непосредственно связан с теорией информации, точнее, с процессами языкового обмена информацией и поиска информации. С другой стороны, интерес вызывает способ представления знаний системы, который можно рассматривать с различных точек зрения: как модель области знаний, как интерпретацию для логического языка, как модель фрагмента действительности и, наконец, как модель фрагмента естественного языка. Таким образом, результаты анализа используемых в данной области средств представления информации дают богатый материал для самых разных теоретических исследований, - логико-философских, психологических, лингвистических.
Наконец, проанализированный материал и полученные результаты могут быть использованы в общем курсе логики для иллюстрации широты ее приложений, а также в спецкурсах по интеррогативной логике и логической семантике, дополняя их прикладной проблематикой.
Методологической основой исследования служит тезис диалектического материализма о неразрывном единстве языка и мышления, о языке как непосредственной действительности мысли [к .Маркс, Ф.Энгельс, соч., изд. 2-е, т.З, c.448j. Логика, как наука о законах и формах мышления, отраженных в языке, находит в данной области широкое применение, предоставляя средства выявления смысловой (понятийной) структуры текста и давая методологию выбора оптимальных ограничений на используемый фрагмент естественного языка. Развитие языка общения с ЭВМ в направлении приближения этого языка к естественному несомненно предполагает самое широкое применение методов логики. При этом недостаточно ограничиться использованием готовых формализованных исчислений. Для решения задач, стоящих в данной прикладной области, требуется привлечение методов содержательного логического анализа понятий, суждений и умозаключений как форм представления информации в естественном языке. Такой анализ является необходимым условием разработки эффективных средств представления информации в формализованном языке, пригодном для автоматической обработки. В данном случае логическая формализация есть метод перехода от естественно-языкового представления к машинному, и основной задачей этого перехода является возможно более полное сохранение информации.
Принятая в данном диссертационном исследовании методология учитывает гносеологическую сущность формализации, состоящую, в частности в том, что "естественный язык -универсальная основа искусственных" Jj3.I0; c.43j. В соответствии с этим построению формализованного представления предшествует анализ выражений естественного языка. Результаты этого анализа определяют направление разработки средств формализации. В свою очередь, такое введение формализованного представления позволяет углубить анализ некоторых фрагментов естественного языка, например, диалоговых средств.
Наряду с логическими в вопросно-ответных системах используются лингвистические методы структурирования текста, которые необходимы для первоначального синтаксического анализа предложений, но недостаточны для выявления их содержания. Учитывая приведенное выше замечание Э.В. Попова, представляется целесообразным четко разграничить лингвистические и логические задачи анализа текста. В связи с этим предлагается рассматривать их, как задачи различных, дополнявдих друг друга этапов перехода от текста к его формализованному представлению. Выделенные таким образом логические аспекты этого перехода, которые ранее специально не рассматривалоись, являются объектом анализа в данной работе.
Круг проблем, связанных с логическими исследованиями в этой области, определяется наличием трех уровней представления информации в вопросно-ответной системе. Этими уровнями являются внешний язык общения, использующий ограниченный фрагмент естественного языка; язык-посредник, дающий "вербально-логическую" форму представления предложений в виде формул прикладного языка и, наконец, внутренний язык, описывающий структуру данных, т.е. введенные в систему знания. При разработке языка-посредника очевидна необходимость учета как человеческой, так и машинной логики представления информации. Поэтому объектом исследования в предлагаемой работе являются как способы представления текста, используемые в вопросно-ответных системах, так и сам текст. Лингвистические методы и средства перехода от предложения к формализованному выражению представляют собой отдельную область исследований, которой посвящено много работ. Поэтому лингвистические задачи специально рассматриваться не будут, равно как и вопросы программного обеспечения. В данной работе рассматриваются текст, данный в языке общения, его формализация в языке-посреднике и его модель, являющаяся аналогом структуры данных. Для их анализа будут привлечены логические методы анализа форм мышления, методы формализации, а также средства ин-террогативной логики и логической семантики.
Заключение научной работыдиссертация на тему "Логико-семантические средства формализации текста в вопросно-ответной системе"
В данном диссертационном исследовании логическая формализа ция рассматривается в трех аспектах. Во-первых, как метод анализа, состоящий в выявлении и строгом описании логических структур вы ражений естественного языка. Во-вторых, как средство, позволяющее на основании выявленных структур отдельных групп выражений уточнять их логические свойства и проводить классификацию. И, наконец, как полученный в результате такого анализа формализованный язык, ори ентированный на машинную интерпретацию. При этом речь идет о форма лизации в конкретной прикладной области - вопросно-ответных систе мах, что потребовало, в первую очередь, провести логический анализ самой этой области. Было установлено, что при разработке вопросно ответных систем логические средства используются широко, но сти хийно, нестрого и, в известнш смысле, "без ведома логики". Упоря дочение этих средств с учетом задач данной области, несомненно имеет практическую пользу, а также представляет теоретический ин терес, как пополнение предмета логики новым материалом.Первое, что было сделано, - это уточнение места и роли мето дов логики. Т.Виноград указывает, что "...попытки запрограммиро вать машины с целью понимания естественного языка прояснили, что именно должна делать семантическая теория и как она должна быть связана с синтаксическими и логическими аспектами языка... Если имеется синтаксический анализатор для грамматики английского язы ка и дедуктивная система на базе знаний о конкретном предмете, роль семантики сводится к тому, чтобы заполнить пространство меж ду ними" [ 3.6; с.57]. На деле имеет место гораздо более сложная ситуация взаимодействия между логическими и лингвистическими сред ствами, с одной стороны, и между различными логическими методами,
используемыми на различных уровнях представления, информации, с другой стороны.Особо следует подчеркнуть роль семантической теории. Она свя зана здесь не только с синтаксическими и логическими аспектами языка (как пишет Т.Виноград), но также с прагматическими и психо логическими. Данная область представляет собой одной из перспек тивных направлений применения и дальнейшего развития семантических методов анализа естественного языка и представления ^аний.Е.Д.Смирнова отмечает, что логическая семантика базируется на тео рии отражения и разрабатывает ее основной принцип, при чем "...дальнейшее развитие логической семантики приводит к необходимости учитывать и более глубокие принципы отражения" [3.28; C.I67J.Шенно с такой точки зрения можно рассматривать язык общения, язык-посредник и семантическую сеть, т.е. три уровня представле ния содержания текста, как модель для анализа возможностей отраже ния информации в различных структурах. При этом следует иметь вви ду, что семантическая сеть - это не только графовый аналог машин ного представления данных, но и модель, используемая в психологии для анализа человеческой ассоциативной памяти. В психологии появи лось целое направление, занимающееся исследованием представления информации у человека. Одной из центральных идей этого направления является сравнительный анализ человеческого и искусственного ин теллекта с целью улучшения понимания человеческого мышления [^ 3.41; т.З, 0.4]. Данная область, несомненно, представляет интерес не только для психологических, но и для логико-семантических исследо ваний.Таким образом, выбор средств формализации текста и представ ление его содержания в виде семантической сети должны основываться на предварительном содержательно-логическом анализе. Этим обус ловлено то, что первая глава диссертации посвящена рассмотрению логических проблем данной области в целом, и, в частности, содер жательному анализу выражений естественного языка. При выборе струк туры логического языка, разработанного и описанного во второй гла ве, учитывались не только требования, ставящиеся задачами формали зации выражений естественного сзыка, но и некоторые идеи програм много обеспечения систем, использующих семантические сети [^ 4.10J.Шенно так появилась идея введения отношения принадлежности в структуру атомарной фориулы.Семантические сети, рассмотренные в третьей главе, появились в психологии и использовались в вопросно-ответных системах совер шенно независимо от логической семантики. В то же время они пред ставляют собой удобную с точки зрения интерпретации модель для прикладного логического языка. Следует отметить, что в ходе иссле дований представление разнообразных содержательных примеров с по мощью семантических сетей позволило существенно уточнить структуру языка Р К и и увеличить его гибкость. Предпринятая попытка рассмот рения графового представления текста как особого варианта формаль ной семантики дала следующие результаты. Во-первых, в предлагаемом варианте семантической сети используется минимальное количество различных типов связей (дуг) при отсутствии ограничений на слож ность представляемых выражений естественного языка«Во-вторых, в ходе интерпретации удалось уточнить, что именно должно считаться аналогом логических констант на уровне графового представления.И, наконец, в логический язык были введены элементы, обеспечиваю щие установление взаимно-однозначного соответствия между логиче ским и графовым представлением текста. Форвиализация вопросов, рассмотренная в четвертой главе, дала средства для детального анализа их логической структуры. На осно вании этого была развита подробная классификация, а также рассмот рены средства "развертывания" неявно содержащейся в вопросе инфор рдации. Ориентация на модель типа семантической сети позволила уточнить понятие предпосылки вопроса и ввести понятие области по иска ответа. Белнап и Стил отмечают, что "...адекватное усовер шенствование эротетической логики...позволит создать и внедрить информационные вопросно-ответные языки и системы, значительно бо лее мощные и полезные, чем тем, что имеются в нашем распоряжении на сегодняшний день" [_3.4; c.I48j. С этой точки зрения язык P R S предоставляет следующие возможности; • формализация вопросов различных типов и сложности в языке первого порядка и подробная классификация формализованных вопро сов на основании их логической структуры; • выделение классов вопросительных слов, представленных в виде операторов, по их функциональной роли в процессе поиска от вета; • определение логических категорий терминов-понятий; • определение логической категории неизвестного в вопросе П типа; • предоставление средств для уточнения взаимосвязей между логическими и грамматическими категорями, что важно для развития средств перехода от текста к его формализованному представлению и обратно; • развитие логических методов, которые MOI^T быть использо ваны в ходе автоматического анализа формализованных вопросов, на пример, сведение различных вопросов к стандартному виду. Логический анализ языка общения, языка-посредника и внутрен него (графового) языка предоставляет интересный материал для срав нения различных способов представления информации, как различных взаимодействующих уровней одного процесса - информационного поис ка. При этом рассматривается зависимость структуры способа пред ставления информации от задач соответствующего уровня, а также от специфических различий между человеческой и машинной логикой.Анализ и формализация вопросительных предложений имеет особый интерес с точки зрения теории познания, поскольку экспликация поня тия вопроса углубляет "представление о том, что делает неточные вопросы неточными и что нужно для их превращения в точные вопросы" [зА; с.2з].В данной прикладной области формализованный вопрос выступает в роли средства, дающего команду на поиск информации, определяще го направление этого поиска и содержащего указания относительно области поиска и формулировки ответа. Особый интерес имеет анализ взаимосвязи вопросов с их предпосылками, поскольку информацию и энтропию можно "...интерпретировать как характеристики соответст венно высказываний и вопросов" [з.19; C.3I9J. Более того, ее мож но рассь5атривать "как некоторую характеристику отношения высказы вания к вопросу" (там же, с.321). В данной диссертации анализиру ется взаимосвязь вопроса с тремя видами утверждений: предпосылка ми, формализованным описанием области поиска ответа и самими отве тами.Такая область, как вопросно-ответные системы, требует тесного взаимодействия теоретических и прикладных логических исследований.При этом встает двоякая проблема, которую необходимо учитывать в процессе разработки средств формализации. С одной стороны это слож- 142 -
нейшая проблема анализа текста, требующая широкого применения ло гико-семантических и лингвистических средств. В этом отношении всегда будут существовать неисследованные аспекты и неиспользован ные возможности анализа, благодаря углублению наших знаний о пси хологии и логике представления знаний, а также благодаря развитию средств моделирования. В настоящее время имеющаяся здесь ситуация определяется тем, что "...единой, законченной теории машинного по нимания естественного языка и методологии разработки естественно языковых систем пока не существует" [з.12; c.I20j. Формализация есть то, что лежит в основе машинного "понимания", и другая сторо на проблемы состоит в необходимости использования по-возможности простых средств для формализации сложных текстов. Дело здесь не только в обеспечении однозначного перехода к машинному представле нию, но и в сждущем обстоятельстве, связанном с созданием инфор мационной базы. Целью создания вопросно-ответных систем является обеспечение коь^орта для пользователя, которому требуется эффектив ный анализ или поиск информации в некоторой обширной области, на пример, медицинской диагностике [2.9; 4-.30j. При этом предполагает ся, что данная область не остается неизменной, а постоянно пополня ется и корректируется. Но это означает, что в некоторых случаях мо жет понадобиться введение или удаление какой-либо прикладной аксио мы, что требует прямого обращения к языку-посреднику. На данном этапе трудно однозначно ответить на вопрос, кто должен четко опре делить, представить во всех деталях и формализовать соотношение между базовыми понятиями, принадлежащими к конкретной области зна ний, - специалист в данной области или специалист по вопросно-от ветным системам. Во всяком случае, второй не будет вникать в тон кости медицинской диагностики. Если же специалист по диагностике
или какой-либо другой представляемой области знаний попытается совершить эту работу, то в ряде случаев ему придется задуматься над уточнением содержания многих терминов, которые раньше каза лись достаточно точными. Во всяком случае, польза от такой попыт ки будет, поскольку "...мы иногда скрываем недостаточность пони мания и логические несообразности, неосознанно используя безмер ную гибкость естественного языка и его неотъемлемую неоднознач ность... Вычислительная машина - безжалостный критик"[_ 3*5;с. 152J.Следовательно, чтобы такая попытка была возможна, не только язык общения, но и до какой-то степени язык-посредник тоже должен быть доступным для понимания его пользователем.Терминологический анализ конкретной области знаний и систе матизация базовой терминологии представляют собой трудоемкую за дачу, от решения которой во многом зависит эффективность информа ционной системы. Одним из шагов этого анализа является определе ние логических категорий терминов-констант, рассмотренное в пятой главе. Особо рассматриваются категории операторов, заменящих вопросительные слова, поскольку однозначная интерпретация вопроса необходима для последующего поиска информации. При этом следует помнить, что языковые выражения "... всегда являются до некоторой степени неопределенными и в каждом отдельном случае могут иметь бесконечно много оттенков смысла" [3.19; с.459]. Формализация текста требует детального логического анализа таких оттенков с целью выбора, строгого определения и фиксации единственного из них. Одним из средств фиксации является установление логической категории термина, определяющее возможные для него связи с други ми терминами-понятиями.Именно таким свойством обладают, в частности, формализован- 144 -
ные в языке 'P'RS вопросы. Таким образом, разработанные в резуль тате логико-семантического анализа средства формализации позволи ли, во-первых, представить и систематизировать разнообразные вида вопросов, и, во-вторых, обеспечили возможность однозначного све дения всех этих вопросов к стандартной форме, для которой могут быть рассмотрены различные алгоритмы информационного поиска. Опи санный в конце пятой главы пример такого сведения вопроса демон стрирует применение разработанных средств анализа и формализации языковых выражений.В заключение следует еще раз подчеркнуть, что такая приклад ная область, как вопросно-ответные системы, включает широкий круг проблем, требующих логического исследования. Данная диссертацион ная работа посвящена одной из них - проблеме фо|»лализации текста.Дальнейшее развитие этой темы возможно в нескольких направлениях, каждое из которых представляет большой интерес с точки зрения разработки новых логических методов и средств и применения уже имещихся. В число указанных направлений входят следующие; • Логико-философское направление предполагает рассмотрение широкого круга теоретических проблем, К ним относятся, например, такие как анализ поиска ответа на вопрос в представленной системе знаний с точки зрения понятий информации и энтропии (см., напри мер £4 . s j ) , рассмотрение языка-посредника и графовой модели как различных уровней отражения информации, содержащейся в тексте.Особый интерес представляет анализ соотношения естественного язы ка и человеческого мышления, с одной стороны, и искусственных языков и "машинного мышления" - с другой. Именно в процессе диало га, как отмечает Ю.А.Шрейдер, - " . . . возможно осуществить преобра зование лексико-семантических связей в языке ЭШ, подсказывая ма- 145 шине смысловые ассоциации, которые возникавэт у человека в процес се диалога"[_2.13; c.V-SJ. Д.А.Поспелов отмечает, что именно в данной области для пополнения хранимых в системе знаний следует использовать специальные логики: временные, пространственные, каузальные, деонтические, эпистемологические и другие \^4.17; c.Tj, В данном диссертационном исследовании была рассмотрена лишь одна из логик такого рода - интеррогативная. Несомненный интерес пред ставляет рассмотрение и других логик (модальных, временных) не как чисто формальных исчислений, а на примере конкретной области знаний. • Логико-лингвистическое направление исследований связано с разработкой конкретных вопросно-ответных систем. Эта разработка требует проведения широкого терминологического анализа различных фрагментов естественного языка, соответствущих представляемым областям знаний. Кроме того, расширение области применения вопрос но-ответных систем, а также развитие программного обеспечения тре буют постоянного развития средств этапа предредактирования. Нако нец, как отмечает Ю.Д.Апресян, - "...поскольку смысл в языке ко дируется не только словами, но и многими другими средствами - аф фиксами, синтаксическими конструкциями, просодикой (ударением и
интонацией), семантика должна заниматься значением всех, а не толь ко словарных единиц"[_4.1; C.4-5J. Несомненно, такое расширенное рассмотрение способов выражения смысла представляет интерес не только для лингвистической семантики, но и для логической. • Логико-психологическое направление исследований состоит в рассмотрении различных моделей представления информации как одно го из методов анализа некоторых аспектов человеческой памяти[_3• 39j, [^4.29J. Это направление дает чрезвычайно интересный материал для
исследований! поскольку "... изучение законов понимания человече ского языка позволяет лучше понять закономерности работы челове ческого мозга" []4.46; C.25J.Такое богатство проблематики обусловлено тем, что объектом исследования является естественный язык, рассматриваемый как средство выражения различных концептуальных систем, представляю щих разнообразные области человеческих знаний.
Список научной литературыВолченко, Мария Викторовна, диссертация по теме "Логика"
1. Произведения классиков марксизма-ленинизма
2. В.И.Ленин. Философские тетради. ПСС, т.29.
3. К.Маркс, Ф.Энгельс. Немецкая идеология. Соч., т.З.
4. Ф.Энгельс. Диалектика природы. К.Маркс, Ф.Энгельс, соч., т. 20.П. Материалы конференций, конгрессов, симпозиумов
5. Кожара В.Л. функции классификаций. Теория классификаций и анализ данных. Материалы всесоюзного совещания. Новосибирск, СО Щ АН СССР, 1982, с. 6-9.
6. Коэн Ф., Милопулос Дж., Борджида А. Некоторые .аспектыпредставления знаний. Труды 1У Meяд.объединенной конференции по искусственному интеллекту, т.2. М., ВИНИТИ, 1975, с.42-62.
7. О негативном выводе (Коллинз А., Уорнок Э., Айелло Н., Миллер М.)- Труды 1У Межд.объединенной конференции по искусственному интеллекту, т.З. М., ВИНИШ, 1975, с.115-128.
8. Падучева Е.В. Об одной проблеме логического анализа естественного языка: сфера действия кванторов. Логический анализ естественных языков. 2-й советско-финский коллоквиум по логике. М., ИФАН, 1979, с. 74-77.
9. Падучева Е.В. О логическом анализе семантики вопроса. -Логический анализ естественного языка. Материалы к УШ Всесоюзной конференции "Логика и методология науки". Паланга, 26-28 сентября 1982 г., Вильнюс: Мокслас, 1982, с. 50-53.
10. Попль Г. Диалоговая модель диагностической логики и ее применение в терапии. Труды 1У Meзд.объединенной конференции по искусственному интеллекту, т.10. М., 1975, с. 47-62.
11. Скрагг Г.В. Программа, отвечающая на вопросы о процессах. Труды 1У Межд.объединенной конференции по искусственному интеллекту, т.6. М., 1975, с. 154-183.
12. Черконе Н., Шуберт Л. К вопросу о семантическом представлении состояний. Труды 1У Межд.объединенной конференции по искусственному интеллекту, т.2. М., 1975, с. I77-I9I.
13. Шрейдер Ю.А. Естественные языки как основа информационных. 1У Всесоюзная конференция: Проблемы развития единой системы научно-технической информации в стране. М., 24-27 сентября 1974 г. М., ВИНИТИ, 1974, с. Ю.
14. Апресян Ю.Д. Лексическая семантика. Синонимические средства языка. М., "Наука", 1976 87 с.
15. Бэкон Ф. Новый Органон. Соч. в 2-х томах, т.2, М., "Мы.сль", 1978, с. 5-214.
16. Бэкон Ф. О достоинстве и приумножении наук. Соч. в 2-х томах, т.1. М., "Мысль", 1978, с. 85-546.
17. Белнап С., Стил Т. Логика вопросов и ответов. М., "Прогресс", 1981, 288 с.
18. Вейценбаум Дж. Возможности вычислительных машин и человеческий разум. От суждений к вычислениям. М., "Радио и связь", 1982, 368 с.
19. Виноград Т. Программа, понимающая естественный язык. М., "Мир", 1976, 294 с.
20. Войшвилло Е.К. Понятие. М., МГУ, 1967, 286 с.
21. Гегель. Энциклопедия философских наук. Т. I. М., "Мысль", 1975, 452 с.
22. Гильберт Д., Аккерман В. Основы теоретической логики. М., Гос.изд. иностр.лит., 1947, 557 с.
23. Гносеологические проблемы формализации. (Горский Д.П., Уваров Л.В., Толкачев А.А.)Минск, "Наука и техника", 1969 , 267 с.Ьел&п.- Heiotetfezf-M^ />/>.Ш. Книги
24. Декарт Р. Правила для руководства ума. Соцэкгиз. М-Л., 1936, 175 с.
25. Диалоговые системы в АСУ. (Брябрин В.М., Любарский Ю.А., Мику Л.И. и др.). М., Энергоиздат, 1983, 206 с.
26. Единая система классификации и кодирования технико-экономической информации. (Лямин Б.Ы., Марков И.П., Саков А.А., Бло-хин Ю.И.). М., Изд-во стандартов, 1979, 224 с.
27. Искусственный интеллект и психология. (Тихомиров О.К., Телегина Э.Д., Бабаева Ю.Д.). М., "Наука", 1976, 343 с.
28. Караулов Ю.Н. Лингвистическое конструирование и тезаурус литературного языка. М., "Наука", 1981, 366 с.
29. Клини С.К. Математическая логика. М., "Мир", 1973,480 с.
30. Кузнецов И.П. Механизмы обработки семантической информации. М., "Наука", 1978, 176 с.
31. Ладенко И.С. Интеллектуальные системы и логика. Новосибирск, "Наука", 1973, 172 с.
32. Ленинская теория отражения. Отражение. Познание. Логика. (АН СССР, Ин-т философии Болг. АН. София, "Наука и искусство", 1973, 526 е.).
33. Методы автоматического поиска доказательств. (Жданов В.Е Короткова М.А., Крысанов А.И., Попов С.В. ИПМ АН СССР. ПрепринтВ 30). М., ИПМ АН СССР, 1977, 46 с.
34. Минский М. Фреймы для представления знаний. М., "Энергия", 1979, 151 с.
35. Myлуд Н. Анализ и смысл. Очерк семантических предпосылок логики и эпистемологии. М., "Прогресс", 1979, 347 с.
36. Падучева Е.В. О семантике синтаксиса. Материалы к трансформационной грамматике русского языка. М., "Наука", 1974, 292 с.
37. Попов Э.В. Общение с ЭШ на естественном языке. М., "Наука", 1982, 360 с.
38. Попов Э.В., Фирдман Г.Р. Алгоритмические основы интеллектуальных роботов и искусственного интеллекта. М., "Наука", 1976,456с.
39. Рафаэл Б. Думающий компьютер. М., "Мир", 1979, 408 с.
40. Слэйгл Д. Искусственный интеллект. М., "Мир", 1973, 320 с.
41. Смирнова Е.Д. Формализованные языки и проблемы логической семантики. М., МГУ, 1982, 182 с.
42. Такеути Г. Теория доказательств. М., "Мир", 1978,412 с.
43. Уинстон П. Искусственный интеллект. М., "Мир", 1980, 520 с.
44. Аль-Фараби. 0 разуме и науке. 0 классификации наук. Алма-Ата, "Наука", 1975, 113 с.
45. Френкель А.А., Бар-Хиллел И. Основания теории множеств. М., "Мир", 1966, 555 с.
46. Хант Э. Искусственный интеллект. М., "Мир", 1978, 558 с,
47. Хинтикка Я. Логико-эпистемологические исследования. М., "Прогресс", 1980, 448 с.
48. Чейф У.Л. Значение и структура языка. М., "Прогресс", 1975,432с.
49. Черч А. Введение в математическую логику, т.1. М., "Иностранная литература", I960, 484 с.
50. Шенк Р. Концептуальное представление информации. М., "Энергия", 1981, 361 с.
51. Jjjdui.ieidit'x. К. Tka^matic fo^Lc. Smtkese tjffca-^j V.62, WMSzatD-Boston, PW7 ШЬ,
52. Jino/ezson /j, # 7%? azc£i&stwce ofcognition. — )£orwl(yi) ftaziSatd unciX pzew^ d9<?3
53. J^n^zson &оикг 6т. tt. tfuman asSoUatizxe. memo^ WasAiiyton^ j//msto.4973- 52ktft,
54. Tfa -Аап/^оеЛ cf az&yi'ctae 2cd~3. ~Cb&foitua, Wfaufean
55. Няъг<гЯ & &>/n/nu/iica.tcon: a fopicttf modeCamfriofye (Mow.)J MIT 4363, <fd£p.
56. R. Z teazU fiZ^&a i J(d>2ofic2иусA poclstoiu) WoctszacOXj'PW^ /$¥23.44. 7 aut&'/ie of Sptcaf -£Аеогиof:рйегйЪня 43<PO- 443ft,
57. JlSzsnan &A Щемогу Mrf ctzZ&v&b*. JJ/i chPzo-clccctCon. to Aumar? mfema&bn Jbwcession-Mfy346. fffyecdt BordocdsJU tiaf g^L&i MO&mjl-tyczny с fcobU mnogo/Ы.- Ufozszaufy <f$63 JOSs.347. (£ut*e ШИ snatesbatfifcz/za ?WM} ЛЯП ~ 332*.1У.Статьи
58. Блау У. Трехзначная логика языка. Общественные науки за рубежом, серия 6: Языкознание, ЕЕ ИНИОН, 1976, № 4, с. 104-107.
59. Борщев В.Б. Банки и базы данных. "Природа", 1982, № 3, с. 64-75.
60. Брябрин В.М. Ф-язык формализм для представления знаний в интеллектуальной системе. - Прикладная информатика, вып.1, М., "Финансы и статистика", 1981, с. 73-103.
61. Брябрин В.М., Сенин В.Г. Анализ естественного языка в ограниченном контексте. Вопросы кибернетики, вып. 61: Проблемы искусственного интеллекта. М., "Сов.радио", 1980, с. III-II7.
62. Войшвилло Е.К. 0 возможных направлениях приближения формализованных языков к естественным. Логические и методологические проблемы анализа языка. Вильнюс, ВГУ, 1976, с. 50-53.
63. Войшвилло Е.К. Попытка семантической интерпретации статистических понятий информации и энтропии. Кибернетику - на службу коммунизму, т.3. М-Л., "Энергия", 1966, с. 275-293.
64. Войшвилло Е.К., Петров Ю.А. Язык и логика вопросов. -Логика и методология научного познания. М., МГУ,1974, с.147-158.
65. Волченко М.В. Вопросно-ответная система: представление информации, поиск ответа. Проблемы бионики, вып.23, Харьков, "Вища школа", 1979, с. 39-46.
66. Гладкий А.В. Некоторые соображения о взаимоотношении между естественным языком и языком математической логики. Семиотика и информатика, вып.12. М., ШНИ1И, 1979, с.182-184.
67. Гладкий А.В. 0 значении союза ЕСЛИ. Семиотика и информатика, вып.18. М., ШНИТИ, 1982, с. 43-45.
68. Грин К. Доказательство теорем с использованием правила резолюции как основа для построения вопросно-ответной системы.