автореферат диссертации по филологии, специальность ВАК РФ 10.02.21
диссертация на тему:
Семантико-синтаксические аспекты порождения простых предложений английского научно-технического текста

  • Год: 1984
  • Автор научной работы: Карпилович, Татьяна Павловна
  • Ученая cтепень: кандидата филологических наук
  • Место защиты диссертации: Минск
  • Код cпециальности ВАК: 10.02.21
Диссертация по филологии на тему 'Семантико-синтаксические аспекты порождения простых предложений английского научно-технического текста'

Оглавление научной работы автор диссертации — кандидата филологических наук Карпилович, Татьяна Павловна

ПРЕДИСЛОВИЕ

ВВЕДЕНИЕ

ГЛАВА I. СТРУКТУРНЫЙ И СЕМАНТИЧЕСКИЙ АНАЛИЗ ПРОСТЫХ

ПРЕДЛОЖЕНИЙ АНГЛИЙСКОГО ОПИСАТЕЛЬНОГО НАУЧНО-ТЕХНИЧЕСКОГО ТЕКСТА.

1.1. Выявление структурных схем простых предложений английского описательного научно-технического текста.

1.2. Установление семантической типологии анализируемых предложений

Выводы по первой главе

ГЛАВА П. УСТАНОВЛЕНИЕ СИНОНИМИЧЕСКИХ РЯДОВ СТРУКТУРНО-СЕМАНТИЧЕСКИХ МОДЕЛЕЙ, РЕАЛИЗУЮЩИХ ТИПОВЫЕ ЗНАЧЕНИЯ ПРЕДЛОЖЕНИЙ.

2.1. О понятии "структурно-семантическая модель" предложения

2.2. Синонимические ряды структурно-семантических моделей предложений, описывающих структуру предмета.

2.3. Синонимические ряды структурно-семантических моделей предложений, сообщающих о функции предмета.

2.4. Синонимические ряды структурно-семантических моделей квалификативных предложений

2.5. Синонимические ряды структурно-семантических моделей квантитативных предложений

2.6. Синонимические ряды структурно-семантических моделей предложений, сообщающих о родо-видовых отношениях.

Выводы по второй главе

ГЛАБА III. ФОРМАЛИЗАЦИЯ ПРОЦЕССА СЕМАНТИКО-СИНТАКСИЧЕСКОГО

ПОРОЗЭДЕНИЯ ПРЕДЛОЖЕНИЯ

3.1. Проблема формального представления энциклопедических знаний

3.2. Классификация признаков для энциклопедического описания заглавных лексических единиц автоматического словаря.

3.3. Алгоритм- порождения простого предложения.

3.4. Проверка работы алгоритма порождения на ЭВМ . 170 Выводы по третьей главе

ЗАКЛШЕНИЕ.

СОКРАЩЕНИЯ.

 

Введение диссертации1984 год, автореферат по филологии, Карпилович, Татьяна Павловна

Диссертация посвящена рассмотрению семантико-синтаксичес-ких аспектов построения простых предложений английского описательного научно-технического текста» Цель исследования -создание на базе конкретных данных, полученных в результате лингвистического анализа, действующей модели порождения простых предложений.

Актуальность темы исследования обусловлена теоретическими и практическими соображениями» В теоретическом плане необходимость изучения закономерностей порождения предложения определяется первостепенной важностью, которую приобрели в последнее время в языкознании вопросы, связанные с использованием строевой системы языка в его основной функции - передаче информации в процессе коммуникации, В практическом плане актуальность исследования определяется потребностями разработки действующих моделей анализа и синтеза речевых единиц как основы лингвистического обеспечения автоматизированных систем, работающих с естественным языком.

На защиту выносятся следующие теоретические положения диссертации:

1. При порождении простых предложений в описательных научно-технических текстах в качестве установки на смысл будущего предложения может выступать одно из типовых значений предложений - сообщений о структурном составе предмета, его функциях, областях применения, свойствах структуры и функционирования, количественных характеристиках, родо-видовых связях с другими предметами.

2. При порождении предложения в качестве конкретной про граммы для выбора слов служит структурно-семантическая модель, ориентированная как на структуру описываемой ситуации, так и на синтаксическую форму будущего предложения. Это означает, что структурно-семантическая модель содержит указания о выборе всех слов предложения (в том числе связок, предлогов, союзов), а не только слов (словосочетаний), имеющих корреляты в ситуации в виде предметов и их признаков.

3. Лингвистическими знаниями, необходимыми для адекватного выбора структурно-семантической модели будущего предложения, являются два вида знаний: а) знания набора моделей, которые могут лежать в основе предложений, описывающих ту или иную типовую ситуацию действительности; б) знания количества и состава синонимических рядов, образуемых данным набором в зависимости от грамматических и семантических характеристик лексем, которые должны занять при порождении предложений стержневые позиции моделей.

Энциклопедические знания, необходимые для порождения предложений, описывающих ограниченную предметную область "Вычислительная техника", используются на этапе лексического заполнения структурно-семантической модели и представляют собой знания конкретных предметов, их свойств, отношений и ролей в типовых ситуациях действительности.

5. Синонимический ряд равновероятных моделей устанавливается детерминистским путем на основе знаний ограничений грамматического и семантического характера на вхождение моделей в синонимические ряды. Действиям случайных процессов подчинен выбор одной из синонимичных моделей.

6. Процесс лексикализации структурно-семантической модели детерминирован грамматическими и семантическими характеристиками компонентов модели, а также знаниями конкретных предметов и отношений между ними в описываемой ситуации. Случайные процессы в ходе лексического заполнения действуют при выборе равновероятных синонимов и слов, способных взаимозаменяться без изменения смысла предложения.

Научная новизна исследования заключается в том, что впервые разработано единое формальное представление синтаксической и семантической структур предложения - структурно-семантическая модель. Произведено распределение структурно-семантических моделей в синонимические ряды в соответствии с типовыми значениями простых предложений в английских описательных текстах по вычислительной технике. Разработан способ синтаксического развертывания и лексического наполнения моделей при построении предложений с заданным смыслом. Создан алгоритм порождения простых предложений, который учитывает действие детерминированных и случайных факторов в процессе порождения и конкретизирует степень использования в нем лингвистических и энциклопедических знаний.

Практическая значимость проведенного исследования состоит в возможности применения созданной порождающей модели в качестве одного из блоков автоматизированных систем, работающих с естественным языком. В обучающих лингвистических автоматах созданная модель может быть использована для построения всех предложений с заданным смыслом, служащими этало- . нами при оценке предложения, которое строится обучаемым. Выделенные типовые значения предложений могут быть положены в основу построения стандартизированного реферата описательных текстов по вычислительной технике. Поэтому данный алгоритм может представлять блок синтеза предложений с определенными типовыми значениями в системе автоматического реферирования. В системе информационного поиска, работающей в диалоговом режиме, созданная модель может быть использована в качестве блока, генерирующего ответы на запросы пользователя. Полученные данные о типовых значениях предложений и формальных правилах их структурной и лексической реализации могут найти применение на этапе синтеза английского предложения в системе машинного перевода с различных языков на английский язык. Предлагаемый алгоритм может быть использован для автоматического синтеза текстов-описаний на технические устройства. Кроме того, разработанный алгоритм, в котором процесс порождения представлен в виде конкретной последовательности правил, может быть использован для оптимизации преподавания английского языка в специальных учебных заведениях.

Результаты проведенного исследования, в частности методика построения структурно-семантических моделей предложений, уже использованы при разработке лингвистического обеспечения для микрокомпьютера-переводчика, создаваемого совместно Минским госпединститутом иностранных языков и Минским производственным объединением "Интеграл".

Структура работы. Диссертация состоит из предисловия, введения, трех глав, заключения и пяти приложений. Во введении на основе обобщения существующих теоретических исследований выдвигается гипотеза о возможном процессе порождения предложения, в соответствии с которой формулируются задачи исследования. В первой главе устанавливается перечень структурных схем, по которым строятся простые предложения в английском описатель-г ном научно-техническом тексте, и выделяются типовые значения предложений. Во второй главе устанавливаются наборы структурно-семантических моделей, реализующих типовые значения предложений, и условия выбора моделей из синонимических рядов, В третьей главе определяется способ представления и таксономия энциклопедических знаний, разрабатывается алгоритм порождения предложений с выделенными типовыми значениями, приводится описание реализации алгоритма на ЭВМ и анализ полученных результатов, В заключении проводится конкретизация и уточнение выдвинутой теоретической гипотезы о процессе порождения в соответствии с принципами функционирования созданного алгоритма, намечаются пути его дальнейшего развития. В приложениях дан массив структурно-семантических моделей, фрагменты автоматического словаря, программы порождения предложений и результатов ее работы.

При проведении исследования используются методы моделирования, трансформации, перифразирования, логический метод, элементы компонентного, контекстуального и статистического анализа.

Апробация работы проводилась на Международном семинаре по машинному переводу (Москва, 1979 г.), на Всесоюзных симпозиумах по лингвистическим проблемам искусственного интеллекта (Ленинград, 1979, 1984 г.г.), на Всесоюзной конференции "Семантика естественных и искусственных языков в специализированных системах" (Ленинград, 1979 г.), на Всесоюзной конференции "Переработка текста методами инженерной лингвистики" (Минск, 1982 г.), в школе-семинаре по прикладной и инженерной лингвистике (Махачкала, 1978 г.), во Всероссийской третьей школе-семинаре "Обучающие лингвистические машины и оптимизация обучения языкам" (Махачкала, 1981 г.), на семинаре "Статистическая оптимизация преподавания языков и инженерная лингвистика" (Чимкент, 1980 г.), на итоговых конференциях Минского госпединститута иностранных языков (1977-1984 г.г.).

ВВЕДЕНИЕ

Как показывают результаты функционирования автоматизированных систем, использующих естественный язык (ЕЯ) (см., например: Пиотровский 1975; Кузнецов 1976j Брябрин 1978; Бектаев и др. 1981; Попов 1982; Марчук 1983; Нелюбин 1983; Winograd 1972; Schank et al. 1975; Wilts 1975; Raphael 1976; Petrick 1976), их эффективность во многом зависит от того, насколько удачно построена функциональная модель того фрагмента языка, на котором работает система. Трудности создания высокоэффективных лингвистических автоматов объясняются, с одной стороны, несовершенством наших знаний о механизмах функционирования языка, а с другой - противоречием мезду ЕЯ, представляющим собой нечеткие лингвистические объекты, и языком машины, оперирующей четкими множествами. Однако это не означает, что работы по созданию автоматизированных систем обработки текстов следует отодвинуть на неопределенный срок. Имея в виду важность социального заказа на построение автоматизированных систем управления, машинного перевода (МП), информационно-поисковых систем, а также на разработку лингвистических аспектов искусственного интеллекта, машинное моделирование лингвистических процессов необходимо всячески развивать на основе имеющихся теоретических разработок"1* и существующей технической базы (Пиотровский 1979).

В последнее время в лингвистике все чаще высказывается точка зрения, согласно которой основной единицей языка следует считать предложение (Звегинцев 1973, с.14; Колшанский 1980, с.8; Степанов 1981, с.9), так как именно с помощью предложения происходит обще

I Об использовании достижений теоретической лингвистики для нувд автоматической обработки текстов см.: Богданов и др. 1983. ние в человеческом обществе и осуществляется передача информации. Важно подчеркнуть, что этим далеко не исчерпываются функции предложения. Предложение выражает суждение, определенным образом структурирует действительность, служит конкретным целям в речевом акте, обнаруживает отношение к сообщаемому и к тому, кому адресуется предложение, учитывает условия, в которых осуществляется речевой акт (Звегинцев 1980, с.38-39). Все это дает основание утверждать, что именно с помощью предложения человек ориентируется в окружающем мире, в истинности или ложности его суждений, оценок. Не случайно поэтому в автоматизированных системах, использующих ЕЯ, главное внимание в последнее время уделяется моделированию процессов анализа и синтеза предложений и целых текстов.

Если созданию действующих моделей анализа предложений и текста посвящены многочисленные отечественные и зарубежные исследования (обзоры работ см.: Перцова 1976; Гиндин и Леонтьева 1978; Перцова 1980), то проблемы синтеза специально рассматриваются в последнее время лишь в отдельных работах (см., например: Сгалл и др. 1976; Мартемьянов 1977; Попов 1982; Rumelhart 1975; Goldman 1975; Chafe 1975; Machová and Panevová 1975). Объясняется это тем, что ключевой проблемой при автоматической переработке текста считается его понимание, связанное с анализом. Однако не менее важное значение для успешной разработки таких систем имеет и исследование процессов синтеза, в частности синтеза предложений (ср.: Winograd 1976; Гиндин и Леонтьева 1978, с.13). Так, машинное построение реферата или аннотации предполагает не простой вывод отдельных предложений исходного документа, а построение цепочки новых предложений, отражающих в сжатой форме содержание документа. В МП предложение выходного языка должно быть построено в соответствии с правилами этого языка. В диалоговых человеко-машинных системах одним из этапов является синтез автоматом ответа на ЕЯ, Синтезирующие модели являются базой, на которой работают обучающие и экзаменующие автоматы. Обучение машины построению предложений диктуется также необходимостью автоматизации составления технической документации (сводок, ведомостей, отчетов, описаний на технические изделия), которой свойственна априорная формализованность*.

Наряду с их чисто практической ценностью, действующие синтезирующие модели способствуют объяснению механизмов речемысли-тельной деятельности человека, более глубокому осознанию того процесса, как мысль реализуется в предложении языка» Выявление закономерностей процесса построения предложения и связного текста является одной из актуальных задач лингвистики эпохи научно-технической революции, для которой характерен синтезирующий, созидательный подход к языку (Супрун 1978, с,118; Адмони 1979, с.9; Колшанский 1980, с.142 и сл.). Сущность такого подхода заключается в рассмотрении функционирования языка с учетом факторов его взаимодействия с мышлением и реальной действительностью в процессе организации речевых сообщений (Уфимцева 1980, с.18), Применительно к исследованию процесса порождения предложения такой целостный подход предполагает исследование того, как система языковых единиц (структурных схем предложений и слов-лексем) используется для выражения определенной мысли о некоторой ситуации реального или воображаемого мира.

I Из устного выступления члена-корреспондента АН СССР А.П.Ершова на Совещании по машинному фонду русского языка. МГУ, 21 февраля 1983 года.

Вскрытие механизма порождения предложения требует решения таких конкретных проблем, как вопрос о сущности и номенклатуре структурных моделей предложений, определение смысла предложения и способов его структурирования, соотношение содержательной (смысловой) и формальной (структурной) сторон предложения, проблема синонимии предложений. По данным вопросам в языкознании накоплен значительный теоретический и практический опыт, однако многие из них еще далеки от окончательного решения,

В русле вышеизложенных проблем и выполнено настоящее исследование, посвященное изучению семантико-синтаксических аспектов порождения-1- простого предложения. Цель исследования - построение на базе данных, полученных в результате лингвистического анали-р за , действующей модели порождения предложения. Под "действующей моделью" понимается воспроизводящая инженерно-лингвистическая модель (ВИЖ), представляющая собой искусственно созданную формальную систему, которая не только имитирует структуру или функционирование лингвистического объекта, но и позволяет хотя бы частично воспроизводить его (Пиотровский 1979, с.8). ВИЛМ строится по четырехчленной схеме: лингвистический объект —гипотеза аналог лингвистического объекта —инженерное воспроизведение объекта. Степень соответствия мевду лингвистическим объектом и.результатами его инженерного воспроизведения

1 Термин "порождение" используется в настоящем исследовании в значении "синтез", "производство", "построение", а не в абстрактном математическом значении процедуры исчисления членов некоторого множества (ср. определение порождающей грамматики у Хомского: Хомский 1965, с.467).

2 Порождение совокупностей объектов по признакам анализа называется "синтезом через анализ" (Николаева 1964, с.6), позволяет оценить объяснительную силу выдвинутой лингвистической гипотезы.

Осознавая всю сложность поставленной задачи, мы ограничиваем материал исследования в следующих двух направлениях:

1) исследование проводится на материале 10000 простых предложений, выбранных из английских текстов по вычислительной технике, Источниками анализируемых предложений служат статьи, помещенные в американских периодических изданиях Computer Design, Electronic Design, IEEE Transасtions on Computers, Datamation;

2) из текстов, принадлежащих к двум функционально-смысловым типам речи (описание, рассуждение), для анализа были отобраны описательные тексты, в которых даются различные характеристики конкретным вычислительным устройствам. Описание - разновидность изложения, представляющая собой распространенную и систематизированную характеристику объекта в его существенных признаках (Кожина 1972, с.34). Типизированность содержания описательного текста, а также стандартность изложения как характерная черта научного стиля в целом позволяют предположить возможность исчисления конечным списком семантических и структурных типов предложений в таком тексте.

Принимая во внимание тот факт, что в настоящее время отсутствует адекватная лингвистическая теория порождения предложения, в данном исследовании применяется дедуктивно-индуктивный подход к построению ВИЛМ порождения. Он заключается в выдвижении теоретической гипотезы о возможном процессе порождения предложения, лингвистическом анализе представительного корпуса предложений, учитывая положения гипотезы, и построении на основе конкретных лингвистических данных действующей модели порождения, которая является средством проверки, уточнения и коррекции выдвинутой гипотезы. Для того чтобы сформулировать положения гипотезы, необходимо рассмотреть существующие машинные модели порождения предложения и обобщить имеющиеся теоретические исследования по данному вопросу.

В зависимости от того, какая сторона предложения признается главной, исходной - структурная или смысловая, можно выделить две группы алгоритмов порождения предложения*:

1) алгоритмы, базирующиеся на синтаксических теориях (Yngve 1962; Арсентьева 1965; Sakai and Nagao 1965; Friedman 1969);

2) алгоритмы, основанные на семантических и семантико-синтаксических теориях (Пшеничная и Скороходько 1963; Simmons and

Slocum 1972; Goldman 1975; Попов 1982). о

В алгоритмах первой группьг используются порождающие модели грамматики непосредственно составляющих (Yngve I960; Хомский 1961) и трансформационно-генеративной грамматики (Chomsky 1965). В лингвистической литературе подробно рассмотрены достоинства и недостатки данных теорий, а также основанных на них машинных по

1 В настоящем исследовании не рассматриваются алгоритмы синтеза в современных действующих системах МП, так как в большинстве систем главное внимание уделяется анализу, а синтез сводится к линеаризации синтаксической структуры, отдельным синтаксическим трансформациям и синтезу выходных словоформ (см.: Синтаксический компонент 1981; Марчук 1983).

2 К данной группе алгоритмов относится также система синтеза, разрабатываемая в ВЦП под руководством Ю.С.Мартемьянова (Мар-темьянов 1977). Система ориентирована на построение текста средствами трансформационно-порождающей грамматики. Однако об эффективности данной системы трудно судить, так как она не прошла стадию машинной реализации. рождающих моделей (см*, например: Апресян 1966; Леонтьев 1969; Бархударов 1976; Слобин и Грин 1976; Кривоносов 1977; Кубрякова 1980; lirons 1968; Jàcobsen 1978). Отметим лишь, что главным недостатком соответствующих алгоритмов, на наш взгляд, является разрыв структурного и содержательного аспектов процесса порождения. Этот разрыв проявляется в отсутствии в модели порождения звена замысла, т.е. той общей мысли, которая должна быть выражена в предложении и которая определяет выбор синтаксических структур и слов. Игнорированием общего смысла предложения, а также преувеличением роли случайности в процессе выбора конструкций и слов можно объяснить большое количество неосмысленных предложений, полученных в результате работы алгоритмов. Вместе с тем, для разрабатываемой в настоящем исследовании действующей модели порождения представляется важным положение трансформационно-ге-неративной грамматики о наличии синонимических конструкций в языке, а также необходимость учета случайных факторов в процессе порождения предложения.

Алгоритм Л.Э.Пшеничной и Э.Ф.Скороходько был одним из пер-, вых алгоритмов порождения предложений, базирующихся на семантической теории, а именно на теории компонентной организации слов. Б основу алгоритма положена идея о наличии в значениях слов семантических признаков (названных авторами "разрешающими"), позволяющих словам образовывать осмысленные сочетания. На вход алгоритма поступает текст, состоящий из предложений простой структуры: подлежащее + сказуемое + дополнение, ЭВМ, анализируя предложения, строит их семантические модели. Так, путем анализа предложений, отличающихся только третьими членами, "Вода льется из ведра", "Вода льется из бочки", "Вода льется из графина" строится семантическая модель "Вода льется из (сосуда)", где "сосуд" разрешающий признак, обнаруживаемый в значениях слов "бочка", "ведро", "графин". Таким же образом строятся семантические модели относительно подлежащего и сказуемого. Сам процесс порождения предложения заключается в замене разрешающих признаков семантической модели словами, в состав значений которых входит данный разрешающий признак. Например, для модели "(человек) посадил (дерево)" были синтезированы предложения "Учитель посадил акацию", "Школьник посадил каштан", "Пионер посадил грушу" и т.д.

Мы придерживаемся точки зрения, согласно которой порядок следования слов в предложении определяется не только лингвистическими факторами (синтаксическими правилами и лексической совместимостью слов), но и экстралингвистическими - потребностями выражения некоторой мысли и отображения ситуации действительности (ср.: Солнцев 1977, с.284 и сл.). Представление смысла предложения с помощью общих семантических компонентов, имеющихся в значениях слов, потребовало бы чрезвычайно разработанной и дифференцированной сети семантических признаков (Звегинцев 1976, с.73-74; Попов 1982, с.37). Метод компонентного анализа может быть использован, на наш взгляд, в качестве вспомогательного метода при разработке модели порождения предложения (см. гл.2).

На идеи представителей порождающей семантики (Lakoff 1969) опирались в разработке своей экспериментальной системы Р.Симмонс и Дж.Слокэм (Simmons and Slocum 1972). Б отличие от трансформа-ционно-генеративной грамматики, ответвлением которой является порождающая семантика, в последней роль активного творческого элемента принадлежит не синтаксису, а семантике. Соответственно этому, базовый компонент в модели порождающей семантики представляет собой правила образования семантических представлений (семантико-синтаксических структур), которые затем при помощи трансформаций превращаются в поверхностные структуры реальных предложений.

В системе Р.Симмонса и Дж.Слокэма эти идеи воплощаются следующим образом. Для изображения семантической структуры авторы используют семантическую сеть, представляющую собой ориентированный граф, узлы которого обозначены понятиями, а дуги именуются отношениями. Отношения связывают глаголы с их именными аргументами подобно филлморовским падежам (Fillmore 1969), существительные с их модификаторами, предлоги и союзы с их аргументами. Каждое понятие семантической сети соотносится с адресом в словаре, где. содержится грамматическая информация о слове. Для получения грамматически правильных предложений из семантических сетей используется грамматика В.Вудса (Woods 1970), состоящая из набора синтаксических трансформаций и условий, определяющих порядок их применения. Соответствие мевду семантической и грамматической сетью устанавливается за счет того, что дуги графа в грамматике обязательно являются именами отношений в семантической сети. Порождение предложения заключается в последовательном изменении структуры семантической сети в результате применения правил переписывания в порядке, заданном грамматикой.

Поскольку основной задачей авторов была разработка структуры семантической сети и правил оперирования ею в целях порождения, система была использована для построения всего лишь трех связанных между собой предложений. Р.Симмонс и Дж.Слокэм справедливо отмечают, что в их работе остались неисследованными многие аспекты процесса порождения предложения. Наиболее важным из них является аспект планирования предложения, его тематической организации, а именно: каким образом происходит выбор нужного участка сети для порождения данного предложения (Simmons and

Slocum 1972, p.904). Однако, несмотря на экспериментальный характер, рассматриваемая система является важной вехой на пути разработки действующих моделей порождения предложения. Ее главная ценность состоит в приспособлении структуры семантической сети для представления смысла предложений в терминах семантико-синтаксических категорий, признанных в настоящее время наиболее адекватным средством формализации смысла предложения.

Следующий алгоритм порождения (Goldman 1975) является составной частью системы MARGIE (Schank et al. 1975), которая предназначена для перифразирования английских предложений и построения умозаключений. Разработчики данной системы опираются на теорию концептуальной зависимости Р.Шенка (Schank 1972), которая рассматривается автором как модель понимания текстов на естественных языках. При этом под пониманием имеется в виду не только языковое понимание, но и извлечение из текста логических следствий, раскрытие мотивов и намерений говорящего (пишущего) и принятие решений относительно ответного поведения.

Система MARGIE состоит из трех частей: анализатора, программы памяти и логического вывода и генератора. Первые две части системы путем лингвистического и логического анализа введенного предложения строят его концептуальное (=семантическое) представление. Зто своеобразный граф, вершины которого помечены символами понятий, а дуги изображают отношения между ними - "концептуальные зависимости". Содержание большинства понятий задается в концептуальном представлении в виде значений английских слов и изображается означающими этих слов. Однако для глаголов . выделен ряд элементарных понятий, не покрываемых английскими словами.

Перевод с языка концептуального представления на ЕЯ производит третья часть системы - Генератор, осуществляющий синтез выходных фраз двумя этапами: семантическим и синтаксическим. Семантический синтез выполняется программой babel, подбирающей к концептуальному представлению английские слова и связывающие их синтаксические отношения. Главный компонент программы babel - совокупность семантических правил для выбора глагольной лексемы. Левая часть каждого правила представляет собой набор условий, правая часть - указатель слова в словаре. Глаголы выбираются в результате проверки условий трех типов: наличия определенных авойств у объектов концептуального представления, наличия определенных семантических отношений между объектами, присутствия определенных внеязыковых сведений в памяти системы. Если условие в правиле выполняется, то с помощью указателя в правой части правила происходит обращение к словарю. Единица словаря состоит из двух основных компонентов: слова (слов), выражающего концептуальное понятие, и набора рамок. Каждая рамка включает три типа данных: синтаксическое отношение, в которое может вступать данная лексема в синтаксических сетях; отношение в концептуальном представлении; информацию для введения предлогов в синтаксические сети.

Используя информацию рамок словаря в качестве основы, программа babel строит синтаксическую сеть исходного концептуального представления. Эта сеть по структуре идентична сети Р.Сим-монса, но в отличие от последней, дуги в ней обозначают не семантические, а синтаксические отношения. Для получения нескольких перифраз из синтаксической сети программа использует два средства. Во-первых, узлам синтаксической сети могут соответствовать несколько единиц словаря. Каждая из них служит источником для порождения отдельной сети, дающей конкретную перифразу.

Во-вторых, в правой части семантического правила, кроме списка указателей словаря, может стоять указатель возврата к некоторому узлу синтаксической сети.

Переход от синтаксической сети к конкретной фразе осуществляется с помощью программы Р.Симмонса и Дж.Слокэма. Этот этап наименее разработан в системе, ибо, как отмечают авторы, им достаточно, чтобы синтаксические отношения описывали поверхностную структуру, и не обязательно, чтобы они имели какое-либо отношение к концептуальному представлению. Поэтому на выходе системы допускаются стилистически и даже грамматически неудачные выражения. Однако в целом система liargie, и в частности ее компонент Генератор, представляет собой большой шаг вперед по сравнению с ранее созданным системами» Прежде всего ценным положением для построения моделей речи является основная установка Р.Шенка: "Говорящие никогда не занимаются ни случайным порождением предложений, ни приписыванием им синтаксических структур. . языком пользуются для того, чтобы передавать идеи, мнения и т.п." (Schank 1972, р. 627). Достоинством системы margie является представление смысла в терминах минимальных смысловых единиц, учет внеязыковых знаний. Более разработана в ней, по сравнению с предыдущими системами, проблема выбора слов: слова выбираются с учетом семантических характеристик и внеязыковых сведений в соответствии с потребностью построения предложения с определенным содержанием.

К основным недостаткам порождающей модели, основанной на теории концептуальной зависимости, можно отнести следующие: I) недостаточная разработанность синтаксического компонента модели. В частности, можно считать, что одной из причин порождения стилистически и грамматически неудачных выражений является неисследованность объективно существующих в языке синонимических конструкций; 2) нечеткое выделение языковых знаний и знаний об окружающем мире. Не определены типы необходимых экстралингвистических знаний, и не установлена их взаимосвязь с языковыми средствами. Представление модели окружающего мира в виде совокупности утверждений, не образующих законченную модель некоторой предметной области, является одной из причин того, что система МАИагЕ без полной перестройки не может использоваться в реальных задачах (Попов 1982, с.110).

Для русского языка наиболее разработанным алгоритмом в теоретическом и практическом отношении является алгоритм синтеза предложений, представляющий часть промышленной вопросно-ответной системы ПОЭТ (Попов и Родионов 1978; Попов 1982). Теоретической основой алгоритма синтеза служит соответствующий этап модели "Смысл - Текст" (Апресян и др. 1978; Жолковский 1974).

Достоинством системы ПОЭТ по сравнению с системой Р.Шенка является четкое разделение лингвистических и энциклопедических знаний. Лингвистические знания хранятся в словаре, в котором каждая единица снабжена морфологической, синтаксической и семантической информацией. Особенностью словаря является выделение двух видов синтактико-семантических зон: для события и для понятия. Зона события содержит модель управления, синтаксические и семантические запреты к модели управления и лексические функции. Зона для понятия включает поле предлогов и лексические функции.

Энциклопедические знания в системе представлены с помощью семантической сети, состоящей из абстрактной и конкретной сети. Абстрактная сеть содержит информацию о предметной области, выра-женную через общие (родовые) понятия, события и характеристики. Конкретная сеть описывает объекты, являющиеся реальным наполнением абстрактных положений.

Этап синтеза в системе ПОЭТ состоит из синтаксического и морфологического синтеза. Задачей алгоритма синтеза является перевод смысла некоторого высказывания, полученного на этапе формирования ответа, в предложение ограниченного русского языка. Ограничения касаются предметной области - обрабатываются тексты экономической прозы, а также грамматики - в частности, ответом может быть только простое предложение или сложноподчиненное предложение одного типа, в предложении отсутствуют причастные и деепричастные обороты и т.д. Синтез предложения включает следующие конкретные этапы: I) построение дерева зависимостей предложения; 2) определение морфологической информации для лексем, стоящих в вершинах дерева зависимостей; 3) определение порядка слов в предложении; 4) построение конкретных словоформ предложения.

Рассмотренные семантико-ориентированные алгоритмы порождения предложений и их в целом положительные результаты показывают, что единственно верный путь в разработке адекватной модели порождения - это путь, в котором в качестве исходного момента выступает смысл, содержание предложения. Этот путь соответствует основному назначению языка - передаче мысли в процессе коммуникации. Результаты наиболее продвинутых алгоритмов подчеркивают не менее важную роль синтаксических явлений в процессе порождения предложения, а также необходимость учета, наряду с лингвистическими знаниями, знаний об окружающем мире.

Остановимся подробнее на теоретических положениях, которыми мы руководствовались в процессе разработки действующей модели порождения предложений английского научно-технического текста. Исходным положением в настоящем исследовании является признание двойственной природы предложения, его принадлежности одновременно языку - как виртуальной единицы (определенной модели или формулы строения) и речи - как актуальной единицы, возникающей на основе реализации модели в процессе речевого общения (предложение-высказывание"'") (Москальская 1981, с.20).

Как само предложение, так и его структурная модель имеют знаковый характер, обладая планом выражения и планом содержания. Б плане содержания предложения, аналогично слову, "выделяются две семантические сферы: с одной стороны, экстенсионал, денотат, или референт, как обозначение факта действительности; с другой стороны, интенсионал, сигнификат, или смысл, как некая мысль об этом факте" (Степанов 1981,с.П). Языковеды более или менее едины в том, что денотатами предложений являются ситуации объективной действительности. Однако при этом понятию ситуации разными авторами придается разный смысл - его относят и к действительности, и к языку, и к мышлению, т.е. ситуация помещается в вершине любого угла семантического треугольника (обзор различных точек зрения см.: Арутюнова 1976, с.6-8). Наиболее последовательной, на наш взгляд, является точка зрения на ситуацию как на фрагмент, отрезок реального (а вслед за этим по аналогии и воображаемого) мира (Гак 1973, с.359; Сусов 19806, с.20). Ситуация в таком случае определяется как сложный денотат (или референт), состоящий из взаимосвязанных между собой элементов, одни из которых представляют предметы в собственном смысле слова, а другие - признаки предметов, т.е. присущие им свойства или связывающие

I В дальнейшем изложении мы будем преимущественно использовать термин "предложение" в значении актуализованной единицы речи и термины "структурная модель", "структурная схема" или "конструкция", имея в виду предложение как виртуальную единицу. их отношения (Сусов 1980а, с.20). При этом мы придерживаемся точки зрения, согласно которой отнесенность к элементам ситуа-. ции (т.е. референция) характеризует не только предметные или актантные позиции в предложении, но и признаковые позиции (Сусов 19806, с.20-21; ср. также: Маслов 1975, С.Ы2-ПЗ).

Сигнификатом предложения является "психическое содержание, включающее в себя и образ внешней денотируемой ситуации и весь комплекс характеристик, оценок и целеустановок, посредством которых говорящий соотносит денотируемую ситуацию с контекстом данного коммуникативного акта" (Сусов 1980а, с.5). Ядром сигнификата предложения является отражение референтной ситуации, а именно состава образующих ее элементов и связей между ними, их ролей относительно друг друга и относительно ситуации в целом (Гак 1972, с.15; Сусов 1980а, с.10). Прагматические отношения, ориентированные на отражение структуры коммуникативного акта, связей между его компонентами, добавляются к денотативным (собственно семантическим) отношениям, надстраиваются над ними, вступают с ними во взаимодействие (Сусов 1980а, с.12).

Хотя всякая новая мысль для своего выражения требует нового предложения, последнее не целиком является новым. Всякое новое предложение строится по готовой, имеющейся в языке структурной схеме (Арутюнова 1972, с.290; Солнцев 1977, с.295; Гак 1977а, с.259; Норман 1978, с.9; Иванова и др. 1981, с.211; Кокорина 1982, с.10). В понимании структурной схемы предложения среди лингвистов нет единства (подробнее об этом см. §1 гл.1). В последнее время все более распространенной становится точка зрения, согласно которой структурная схема предложения, представляющая его грамматический минимум, совпадает по объему с пропозитивной номинацией, т.е. номинацией события, факта действительности

Арутюнова 1972, с.318). Этой точки зрения мы и будем придерживаться в дальнейшем.

На уровне языка предложение в своей модели имеет сигнификатом определенный класс ситуаций, который формируется в человеческом сознании путем обобщения множества однотипных индивидуальных ситуаций (Гак 1977а, с.258). Этот класс ситуаций в разных работах получает разное наименование: глубинная или семантическая структура (Гак 1969; Чейф 1975), логико-грамматический тип (Адмони 1973), типовое значение предложения (Золотова 1973), предикатное выражение (Богданов 1977), семантическая модель (Москальская 1981). В определении указанных понятий существуют различия, отражающиеся на принципах семантической классификации предложений (подробнее об этом см. §2 гл. I). Однако главным для нас при обобщении современных представлений о процессе порождения предложения является признание возможности выделения некоторого типизированного смысла предложения, который мог бы служить опорой при порождении предложений с конкретным содержанием.

В силу асимметрии языкового знака большая часть структурных схем служит для выражения не одного, а нескольких типовых значений, и вместе с тем любое типовое значение может быть передано с помощью ряда конструкций (Золотова 1973, с.25-26; Гак 19776, с.7 и сл.; Москальская 1981, с.40-42; Цейтлин 1979; Кокорина 1982). Для каждого типового значения существует наиболее типичная модель (Москальская 1981, с.41), которая часто называется основной или доминантной. По отношению к основной конструкции все остальные модели в пределах одного и того же типового значения являются неосновными, образуя синонимический ряд, возглавляемый основной моделью (Золотова 1978, с.52).

Признавая наличие синонимических структурных схем в языке, исследователи указывают на различия в оттенках их значения (Золо-това 1973, с.233,237 и сл.; Цейтлин 1979, с*84 и сл.; Гак 19776, с.50). Эти оттенки значения выступают на первый план, если акцентируется экспрессивно-поэтическая функция языка. Если же реализуется прагматически-коммуникативный аспект языка, т.е. возможность автоматического использования человеком привычных моделей для выражения любых содержаний, то необходимо признать тождественность структурных моделей в синонимическом ряду (Гак 19776, с.50).

Каким же образом происходит при этом порождение предложения? Рассмотрим чисто лингвистические аспекты этого процесса, не учитывая его психофизиологическую сторону, как нерелевантную для нас. Вслед за В.Г.Гаком (Гак 1977а, с.259), мы предполагаем, что для выражения определенной мысли говорящий (пишущий) прежде всего подводит конкретную описываемую ситуацию под определенный класс ситуаций. Затем, в соответствии с этим классом (или типовым значением предложения), выбирается одна из известных говорящему (пишущему) структурных схем, которые регулярно используются в языке для описания данного типового значения. Такого взгляда, что выбор синтаксической конструкции предшествует выбору слов, наряду с В.Г.Гаком, придерживаются и другие языковеды (см., например: Арутюнова 1972, с.2905 Солнцев 1977, с.311-312; Норман 1978, с.40). Психолингвистические исследования также подтверждают глобальное появление в сознании говорящего общей структуры предложения, к которой подбираются слова (Жинкин 1958, с.361; Миллер 1963, с.357; Лурия 1975, с.67 и сл.; ср. также: Леонтьев 1969, с.158 и сл.; Селиверстова 1976, с.121-122). Однако в реальном процессе речеобразования выбор конструкции и выбор слов взаимообусловлены: выбор слова невозможен безотносительно к конструкции, задающей его синтаксические характеристики (принадлежность к той или другой части речи), но и выбор конструкции неосуществим без предварительной фиксации лексических элементов (Арутюнова 1972, с.290). Результаты исследований по синонимии в русском языке (Золотова 1973; Цейтлин 1979) показывают, что на выбор структурной модели из синонимического ряда оказывает влияние словообразовательный фактор, а именно наличие/отсутствие в языке лексемы необходимого морфологического класса, способной заполнить синтаксическую позицию соответствующей конструкции. Ср.: "Он лгун" - "Он лживый", но "Он врун" - .♦.? (Цейтлин 1979, с.82). Г.А.Золотова указывает также на ряд факторов семантического характера, обусловливающих состав синонимического набора моделей (Золотова 1973, с.234). Однако эти факторы в лингвистике еще в должной мере не изучены.

Как отмечает С.Д.Кацнельсон, операции, совершаемые механизмами речи в процессе ее порождения, не могут носить во всех случаях абсолютно "жесткий" характер, они необходимо перемежаются с вероятностными операциями (Кацнельсон 1972, с.121). Б.Г.Гак указывает на проявление случайности в выборе номинанта (т.е. формы обозначения) ситуации (Гак 1973, с.368)« Поэтому можно предполагать, что при выборе структурной модели из синонимического ряда, наряду с детерминированными, действуют и случайные процессы (ср.: Кокорина 1982, с.18).

После выбора адекватной структурной схемы происходит ее наполнение конкретными словами, в результате которого осуществляется процесс актуализации - превращение предложения-модели в предложение-высказывание. При этом, если слова заполняют только позиции структурной схемы, то образуется так называемое элементарное предложение (Адмони 1973, с.18-19), которое осуществляет номинацию ситуации. Однако при речевой реализации структурной схемы обычно происходит "обрастание" ее компонентов различными распространителями - определениями и обстоятельствами, семантически не связанными со сказуемым и определяющими все предложение в целом (Шведова 1964; ср. также: Норман 1978, с.42; Колшанский 1983, с.50). Вступая в синтагматические отношения с моделеобра-зующими членами предложения, а также между собой, определения и обстоятельства образуют свернутые пропозитивные номинации, за счет которых часто до весьма значительных размеров разрастается объем информации, заключенной в одном предложении (Москальекая 1981, с.135).

Опираясь на работы Н.Д.Арутюновой (Арутюнова 1972, с.290-318), В.М.Солнцева (Солнцев 1976, с.118-124; 1977, с.298-314) и Г.А.Золотовой (Золотова 1982, с.44-47), мы полагаем, что выбор слов в процессе лексического заполнения структурной схемы осуществляется в соответствии со следующими факторами: а) грамматическими характеристиками, обусловленными выбранной структурной моделью (т.е. выбирается слово необходимой части речи); б) значением лексико-грамматического подкласса (одушевленность/неодушевленность, переходность/непереходность, конкретность/абстрактность и т.п.), которое должно способствовать формированию функционального значения (субъекта, объекта, адресата, средства действия и т.д.), отражающего в обобщенном виде соответствующий компонент описываемой ситуации действительности; в) индивидуальным. лексическим значением слова, которое позволяет описать конкретную ситуацию, т.е. правильно поименовать ее компоненты -предметы и их признаки.

Указанные факторы носят детерминистский характер. Вместе с тем можно предполагать, что в лексическом заполнении структурной модели имеют место и случайные процессы. По-видимому, это касается лексических синонимов, способных заменять друг друга в определенных контекстах без различия для смысла предложения (ср.: Апресян 1957, с.88; Уфимцева 1967, с.38; Бережан 1967, с.52; Lyons 1968, р.452; Супрун 1973, с.163 и сл.; Вилюман 1980, с.28).

Процесс лексического заполнения структурной модели предполагает знание говорящим (пишущим) слов данного языка, т.е. наличие в его сознании определенным образом организованного словаря. Опыт функционирования автоматизированных систем, работающих с ЕЯ (в частности- рассмотренных выше систем margie и ПОЭТ), показывает, что при их разработке необходимо учитывать тот факт, что для порождения (как и для понимания) предложений требуются не только языковые знания, но и знания того фрагмента действительности, о котором идет речь, т.е# энциклопедические знания (см. также: Лейкина 1974; Winograd 1972; Сильдмяэ 1980а и др.). Это диктует необходимость решения вопроса о таксономии и способе представления энциклопедических знаний. Поскольку знания о мире получают материальное воплощение в виде слов естественного языка, то, по нашему мнению, вопросы представления энциклопедических знаний и вопрос организации словаря должны решаться вместе (подробно об этом см. §1,2 гл. 3).

Наряду с лексическим наполнением, актуализирующий аспект предложения формирует также модально-временная соотнесенность с действительностью, интонация, коммуникативная установка говорящего (пишущего), актуальное членение. Вопросы временной соотнесенности, интонации, а также реализации коммуникативной установки не рассматриваются в настоящем исследовании в силу следующих причин: I) анализируемые предложения строятся на основе глаголов, имеющих форму настоящего времени; 2) материалом исследования являются письменные тексты; 3) анализируемые предложения представляют собой сообщения, а не побуждения или вопросы. Что касается актуального членения, то мы придерживаемся точки зрения тех лингвистов, которые считают его одним из важных компонентов смысловой структуры предложения (см., например: Ни-ЬсМпБ 1971, р.12-14; Арутюнова 1976, с.292 и сл.; Москальская 1981, с.143 и сл.)» Решающим основанием для этого является тот факт, что это членение отражает не только коммуникативную природу предложения, но также познавательную установку мыслящего и говорящего субъекта.

Модальность предложения очень часто эксплицируется включением в предложение модальных слов или эквивалентных им словосочетаний, вступающих в синтагматические отношения с отдельными членами предложения. Такие компоненты не входят в структурную схему предложения и выступают в качестве модального оператора, определяющего модальный ключ всего предложения-высказывания (Арутюнова 1972, с.318; Москальская 1981, с.136).

Описанные выше лингвистические аспекты процесса порождения предложения позволяют нам сформулировать основные положения теоретической гипотезы, на базе которой в настоящем исследовании разрабатывается действующая модель порождения предложений английского описательного научно-технического текста:

1. Большинство предложений анализируемого нами научно-технического текста строятся по готовым, имеющимся в языке структурным схемам (моделям).

2. Всякое предложение имеет некоторый типизированный смысл типовое значение), представляющий собой класс ситуаций действительности.

3. Для выражения большинства типовых значений предложений в языке имеется несколько структурных схем, образующих синонимический ряд.

Состав синонимического ряда моделей, используемых для построения предложений с тем или иным типовым значением, обусловлен грамматическими и семантическими характеристиками лексем, способных занять стержневые позиции структурных моделей.

5. При выборе структурной схемы из ряда возможных моделей действуют детерминистские и случайные факторы.

6. Лексическое заполнение структурной модели осуществляется на основе четырех факторов детерминистского характера: а) грамматических характеристик; б) лексико-грамматических подклассов; в) лексических значений слов; г) знаний компонентов описываемой ситуации действительности и отношений мезду ними (энциклопедических знаний).

7. Действие случайных процессов на этапе лексического заполнения синтаксической конструкции ограничено выбором из группы лексических синонимов при условии отсутствия жестких критериев для выбора того или иного синонима»

Учитывая указанные положения теоретической гипотезы, а также основные этапы построения ВИЛМ, в настоящем исследовании ставятся следующие конкретные задачи:

1) определить перечень структурных схем, по которым строятся простые предложения английских описательных текстов по вычислительной технике;

2) установить типовые значения анализируемых предложений;

3) выявить синонимические ряды структурных моделей, регулярно используемых в рассматриваемом подъязыке для построения предложений с каждым из установленных типовых значений;

4) определить грамматические и семантические факторы, влияющие на состав синонимического ряда моделей для каждого из выделенных типовых значений;

5) установить формальные правила лексического заполнения структурных моделей при порождении предложений с каждым из выделенных типовых значений;

6) установить соотношение детерминированных и случайных процессов, действующих при выборе синтаксической конструкции предложения и на этапе ее лексического заполнения;

7) определить типы энциклопедических знаний, необходимых при порождении предложений с выделенными типовыми значениями;

8) разработать оптимальный способ представления лингвистических и энциклопедических знаний, необходимых для порождения предложений английского описательного научно-технического текста;

9) создать модель порождения предложения в виде машинного алгоритма;

10) реализовать алгоритм порождения в виде программы для

ЭВМ.

 

Заключение научной работыдиссертация на тему "Семантико-синтаксические аспекты порождения простых предложений английского научно-технического текста"

Выводы по Ш главе

1. Анализ закономерностей лексического заполнения построенных моделей при порождении предложений с выделенными типовыми значениями показал, что для выбора слов, замещающих определенные позиции моделей, необходимы знания не только лексических значений слов, но и знания участников описываемой в предложении ситуации, их свойств и отношений (энциклопедические знания). Признание того факта, что энциклопедические знания объективируются с помощью слов естественного языка, а также соображения простоты и компактности обусловили выбор такой организации словаря, которая позволяет фиксировать как энциклопедические, так и лингвистические знания (знания слов и их грамматических характеристик).

2. Структура разработанного словаря коррелирует со структурой смысла анализируемых предложений. Каждое из выделенных типовых значений указывает на один из аспектов, по которым должно быть охарактеризовано то или иное вычислительное устройство или его блок, представляющие основные объекты описания в рассматриваемых текстах. Это нашло отражение в делении словаря на две части: массива заглавных ЛЕ (названий вычислительных устройств и их блоков) и массива признаковых ЛЕ. Признаковые ЛЕ являются значениями тех семантико-синтаксических функций в структурно-семантических моделях, для лексического замещения которых требуются энциклопедические знания.

3. Выбранный способ представления знаний дает возможность фиксировать энциклопедические знания, необходимые для порождения предложений, представленных в анализируемом материале в свернутом виде. Такая возможность определяется тем, что большинство свернутых пропозитивных номинаций при развертывании дает элементарные предложения, совпадающие по семантике с выделенными типовыми значениями предложений.

Наличие свернутых пропозитивных номинаций, значение которых при развертывании отличается от выделенных семантических типов, а также отсутствие в массиве заглавных единиц названий предметов, которые характеризуются в свернутых номинациях, потребовало выделения энциклопедических признаков, присущих распространителям компонентов структурно-семантических моделей, Се-мантико-синтаксический анализ определений к компонентам структурно-семантических моделей позволил выделить наиболее характерные энциклопедические признаки, знание значений которых обеспечивает выбор необходимых ЛЕ.

5, Таксономия энциклопедических признаков, построенная с привлечением методов синтаксической семантики и представленная в ее категориях, имеет синтагматический характер, так как она, наряду с необходимыми лингвистическими знаниями, обеспечивает последовательное, линейное расположение слов, заполняющих позиции структурно-семантической модели при порождении предложения с определенным значением.

6. На основе наборов структурно-семантических моделей и автоматического словаря с учетом ограничений на выбор моделей и слов разработан алгоритм порождения простого предложения. Наборы структурно-семантических моделей и автоматический словарь хранят в формализованном виде лингвистические и энциклопедические знания, необходимые для порождения предложений. Лингвистические знания отражены в наборах структурно-семантических моделей и в автоматическом словаре в виде словников заглавных и признаковых ЛЕ и грамматических характеристик, приписанных каждой ЛЕ. Энциклопедические знания зафиксированы в словаре в виде связей между заглавными и признаковыми ЛЕ.

7. Выбор структурно-семантической модели из набора возможных моделей осуществляется в результате прохождения фильтров грамматических и семантических ограничений, накладываемых на состав синонимического ряда моделей. Ограничения грамматического характера проверяются путем анализа грамматических характеристик признаковых ЛЕ в автоматическом словаре. Семантические ограничения устанавливаются по наличию соответствующих указаний в словарных статьях заглавных ЛЕ. После прохождения фильтров ограничений и формирования синонимического ряда равновероятных моделей одна из них выбирается случайным образом.

8. Этап лексического заполнения выбранной модели заключается в последовательном выделении правил лексического заполнения из структурно-семантической модели и замещении элементов структурной модели их лексическими соответствиями, которые извлекаются из автоматического словаря. По способу поиска необходимой ЛЕ выделяются два основных типа правил лексического заполнения: правила, обеспечивающие выбор лексических констант, и правила, обеспечивающие выбор ЛЕ в зависимости от энциклопедических знаний. Выбор лексических констант, представленных группой ЛЕ, осуществляется случайным образом после прохождения фильтров ограничений, связанных с индивидуальной семантикой констант и их семантической сочетаемостью. Выбор ЛЕ, распространяющих компоненты структурно-семантической модели, зависит от наличия соответствующих энциклопедических признаков в автоматическом словаре, что, в свою очередь, обусловлено наличием соответствующих связей в объективной действительности,

9. Разработанная порождающая модель функционирует на основе детерминированных и случайных правил при главенствующей роли правил первого типа. Наборы равновероятных моделей и лексических констант устанавливаются детерминистским путем. Выбор конкретной модели из набора синонимичных моделей и константы из группы взаимозаменяемых лексем подчинен действиям случайных процессов.

10. Анализ предложений, синтезированных ЭВМ, выявил грамматическую, семантическую и стилистическую правильность большинства предложений, подтвердив тем самым корректность разработанной воспроизводящей инженерно-лингвистической модели порождения предложения.

- 183 -ЗАКЛШЕНИЕ

Отсутствие адекватной теории порождения предложения обусловило использование дедуктивно-индуктивного метода при разработке действующей модели порождения предложений в настоящем исследовании, Задачи лингвистического анализа, направленного на получение конкретных данных для модели порождения, были определены в результате обобщения современных представлений советских языковедов о возможном процессе порождения предложения. Б соответствии с поставленными задачами, вытекающими из основных положений теоретической гипотезы, установлены типы необходимых для порождения предложения языковых и неязыковых знаний, формализованные в виде массива структурно-семантических моделей и автоматического словаря. На их основе разработан алгоритм, осуществляющий синтез предложения путем лексического заполнения структурно-семантической модели в соответствии с потребностью описать ту или иную типовую ситуацию предметной области "Вычислительная техника".

Результаты проведенного эксперимента по синтезу предложений на ЭВМ подтвердили правильность выдвинутой теоретической гипотезы о возможном процессе порождения предложения. Вместе с тем они позволяют конкретизировать и уточнить ряд ее положений в соответствии с принципами функционирования алгоритма. Согласно принятой гипотезе, потребность описать некоторую типовую ситуацию является направляющим моментом при порождении предложения. В качестве такой установки на смысл будущего предложения в созданной модели может выступать одно из 18 типовых значений предложений, указывающих на различные аспекты, по которым характеризуются вычислительные устройства - объекты описания в рассматриваемых текстах. Представление обобщенного смысла предложения в виде одного из типовых значений может указывать на необходимость сообщить об отношениях, раскрывающих структуру предмета, его функции, свойства структуры и функционирования, количественные характеристики, родо-видовые связи с другими предметами.

Б соответствии с теоретической гипотезой, процесс порождения направляется, с одной стороны, потребностью описать некоторую типовую ситуацию, а с другой стороны, - структурной схемой, которая выступает в качестве программы построения предложения. Функционирование созданного алгоритма показывает, что структурная схема может служить такой программой в том случае, если она содержит не только указания о грамматических характеристиках слов, которые могут замещать ту или иную позицию структурной схемы, но и указания на те роли, которые выполняют в типовой ситуации предметы, а также их свойства и существующие между ними отношения. В разработанном алгоритме в функции такой программы выступает структурно-семантическая модель предложения, в которой для каждого компонента структурной формулы указано правило его лексического заполнения. Приписывание семантических показателей каждому элементу структурной формулы определяется предположением об одновременном формировании глубинной и поверхностной структур предложения в процессе его порождения.

Проведенный лингвистический анализ и функционирование воспроизводящей инженерно-лингвистической модели подтвердили также положение теоретической гипотезы о том, что для построения предложения с тем или иным типовым значением может использоваться несколько структурно-семантических моделей. Наборы структурно-семантических моделей, реализующих большинство типовых значений, образуют синонимические ряды при соблюдении ряда условий. Исключение составляют наборы моделей, лежащие в основе предлонений всех разновидностей типового значения "описание структуры предмета", которые являются абсолютными синонимами. Условия, влияющие на состав синонимического ряда моделей, связаны в большинстве случаев с грамматическими характеристиками лексем, которые должны занять стержневые позиции моделей при их реализации в речи, К таким характеристикам относятся деривационные возможности лексем, наличие управления, позиционные способности, принадлежность к определенному грамматическому и лексико-граммати-ческому классу. Семантические факторы менее разнообразны и имеют более узкую сферу действия, оказывая влияние на состав синонимических рядов моделей, реализующих лишь отдельные типовые значения предложений. Семантическими факторами являются соотносительность по значению однокорневых лексем и семантические функции компонентов модели, соответствующие ролям предметов в описываемой ситуации.

Функционирование созданного алгоритма позволяет конкретизировать также сферу действия и типы энциклопедических знаний, необходимых для порождения предложения. Энциклопедические знания используются на этапе лексического заполнения структурно-семантической модели и обусловливают выбор слов к таким компонентам моделей, которые имеют корреляты в описываемой ситуации в виде предметов, их свойств и отношений.

Разработанный алгоритм устанавливает конкретное соотношение детерминированных и случайных процессов, действующих как при выборе структурно-семантической модели предложения, так и при выборе заполняющих ее лексических единиц. Ведущая роль на каждом этапе принадлежит детерминированным процессам. На этапе определения модели предложения с их помощью устанавливается набор равновероятных синонимичных моделей. Выбор же конкретной модели из набора синонимичных подчинен действиям случайных процессов. Ход лексического заполнения модели детерминирован правилами, обеспечивающими соответствие выбираемых ЛЕ заданному смыслу предложения и грамматическому классу компонента модели. Случайные процессы в ходе лексического заполнения действуют при выборе лексических синонимов и слов, способных взаимозаменяться без существенного изменения смысла предложения.

Созданный алгоритм ориентирован на порождение простых предложений в ограниченной предметной области. Однако ряд его аспектов, как нам представляется, имеет более широкое значение и может также послужить основой для алгоритмизации процесса порождения сложного предложения, поскольку последнее сохраняет при весьма усложненной и своеобразной структуре все основные формальные и функциональные характеристики предложения как такового. Основные принципы и этапы работы данного алгоритма будут сохранять свою силу и при моделировании текстов, относящихся к другим областям науки и техники, которые отличаются типизированностью содержания и языковых средств его выражения.

Предложенная порождающая модель не претендует на универсальность и окончательность. Это модель функционирования отдельного фрагмента языка, действующая в определенной предметной области. Дальнейшее развитие модели может идти по линии ее приспособления для синтеза предложений с другими типовыми значениями (например, предложений, сообщающих о различных зависимостях между предметами и явлениями), синтеза сложного предложения и связного текста, а также по линии модификации модели для работы в других предметных областях.

- 187 -СОКРАЩЕНИЯ

ВИЛМ - воспроизводящая инженерно-лингвистическая модель

ЕЯ - естественный язык

ЙПТ - информационно-поисковый тезаурус

ЛЕ - лексическая единица

МП - машинный перевод

ССМ - структурно-семантическая модель

ЭП - энциклопедический признак

 

Список научной литературыКарпилович, Татьяна Павловна, диссертация по теме "Прикладная и математическая лингвистика"

1. Алисова Т.Б. Очерки синтаксиса современного итальянского языка (семантическая и грамматическая структура простого предложения). М.:Изд-во МГУ, 1971. - 293 с.

2. Апресян Ю.Д. Проблема синонима. Вопросы языкознания, 1957, № 6, с. 84-88.

3. Апресян Ю.Д. Опыт описания значений глаголов по их синтаксическим признакам (типам управления). Вопросы языкознания, 1965, № 5, с. 51-66.

4. Апресян Ю.Д. Идеи и методы современной структурной лингвистики. М.:Просвещение, 1966. - 302 с.

5. Апресян Ю.Д. Экспериментальное исследование семантики русского глагола. М.:Наука, 1967. - 251 с.

6. Апресян Ю.Д. Лексическая семантика. Синонимические средства языка. М.:Наука, 1974. - 367 с.

7. Апресян Ю.Д., Богуславский И.М., Иомдин Л.Л., Крысин Л.П., Лазур-ский A.B., Перцов Н.В., Санников В.З. Лингвистическое1. Адмони Адмони1. Адмони1. Адмониобеспечение в системе автоматического перевода третьего поколения. М.гВИНИТИ, 1978. - 47 с.

8. Арзикулов Х.А., Пиотровский Р.Г., Попеску А.Н., Хакинская М.С.

9. Автоматизированная система тезаурусного аннотирования научно-технического документа. Научно-техническая информация, серия 2, 1978, № 12, с. 12-20.

10. Арнольд И.В. Стилистика современного английского языка. Л.:

11. Просвещение, Ленингр.отд-ние, 1973. 303 с.

12. Арсентьева Н.Г. О двух способах порождения предложений русскогоязыка. В кн.: Проблемы кибернетики, вып. 14. М., 1965, с. 189-218.

13. Арутюнова Н.Д. Синтаксис. В кн.: Общее языкознание. Внутренняя структура. M.sНаука, 1972, с. 259-344.

14. Арутюнова Н.Д. Предложение и его смысл. М.:Наука, 1976.- 383 с.

15. Арутюнова Н.Д. К проблеме функциональных типов лексическогозначения. В кн.: Аспекты семантических исследований. - М.:Наука, 1980, с. 156-249.

16. Бархударов Л.С. Структура простого предложения в современноманглийском языке. М.:Высшая школа, 1966.- 200 с.

17. Бархударов Л.С. Истоки, принципы и методология порождающейграмматики. В кн.: Проблемы порождающей грамматики и семантики. М.:ИНИ0Н АН СССР, 1976, с. 5-32.

18. Богданов В.В. О конститутивной единице смысла предложения.

19. Бойцова Н.И. Функционально-семантический анализ атрибутивных словосочетаний типа A+N (person) на материале современного английского языка:Автореф.дис. . канд. филол.наук. Л., 1977. - 20 с.

20. Брябрин В.М., Сенин Г.В. Руководство к системе ДИЛОС-БЭСМ-6. -М.:БЦ АН СССР, 1977. -46 с.

21. Брябрин В.М. Структурные описания как основа семантической интерпретации естественно-языковых текстов. В кн.: Взаимодействие с ЭВМ на естественном языке. - Новосибирск: ВЦ СО АН СССР, 1978, с. I66-I8I.

22. Буторов В.Д. Семантика "служебных элементов" в структуре предложения. В кн.: Лингвистические проблемы функционального моделирования речевой деятельности. Вып. II. Л.:Изд-во Ленингр.ун-та, 1974, с. 3-12.

23. Вилюман В.Г. Английская синонимика (Введение в теорию синонимии и методику изучения синонимов). М.:Высшая школа,1980. 127 с.

24. Власова D.H. Синонимия синтаксических конструкций в современном английском языке. Ростов н/Д:Изд-во Рост.ун-та,1981. 159 с.

25. Вольфенгаген В.Э., Воскресенская О.В., Горбанев Ю.Г. Система представления знаний с использованием семантических сетей. В сб.: Вопросы кибернетики, вып. 55, М., 1979, с. 49-69.

26. Гак В.Г. К проблеме синтаксической семантики (семантическая интерпретация "глубинных" и "поверхностных" структур). В кн.: Инвариантные синтаксические значения и структура предложения. М.:Наука, 196,9, с. 77-85.

27. Гак В.Г. К проблеме соотношения языка и действительности.

28. Вопросы языкознания, 1972, № 5, с. 12-22,

29. Гак В.Г. Высказывание и ситуация, В кн.: Проблемы структурной лингвистики 1972. - М.:Наука, 1973, с. 349-372.

30. Гак В.Г. К типологии лингвистических номинаций. В кн.: Языковая номинация (Общие вопросы). М.:Наука, 1977а, с. 230293 .

31. Гак В.Г. О семантическом инварианте и синонимии предложения. -Сб.научных трудов МГПИИЯ им. М.Тореза. М., вып. 112, 19776, с. 42-50.

32. Гафт Р.И., Диненберг Ф.Г. Структурное описание конструкций, образованных качественными прилагательными, Новосибирск: ВЦ СО АН СССР, 1981. - 30 с.

33. Генюшене Э.Ш. К вопросу о включении пассивных конструкций втекст в русском языке. В кн.: Лингвистика текста. Материалы научной конференции, ч. I. М.:МГПИИЯ им. М.Тореза, 1974, с. 78-84.

34. Герд A.C. Ассоциативные отношения в информационно-поисковом тезаурусе и пути их выделения. Научно-техническая информация, серия 2, 1980, № 5, с. 14-16.

35. Гинзбург Е.А., Крейдлин Г.Е. Родо-видовые отношения в языке (таксономические операторы). Научно-техническая информация, серия 2, 1982, № 8, с. 24-31.

36. Гречко В.К. Модели предложений статического класса в научном стиле (на материале немецкого языка). В кн.: Стильнаучной речи. М.:Наука, 1978, с. 212-231.

37. Давтян А.Г., Смирнова Г.М. Способы выражения параметрального отношения в английских научно-технических текстах. -Б кн.: Лингвистические проблемы функционального моделирования речевой деятельности. Бып. IУ. Л.:Изд-во ЛГУ, 1979, с. 96-101.

38. Долинина И.Б. Валентностные категории английского глагола:Автореф. дис. . докт.филол.наук. Л., 1982. - 36 с.

39. Жинкин Н.И. Механизмы речи. М.:Изд-во АПН РСФСР, 1958. - 370с.

40. Жолковский А.К. Модель "Смысл-Текст". В кн.: Энциклопедия кибернетики. Том 2. Киев:Укр.Сов.энциклопедия, 1974, с. 46-48.

41. Загорулько Ю.А. Экспериментальная база данных для работы с семантическими сетями. В кн.: Прикладные и экспериментальные лингвистические процессоры. Новосибирск: ВЦ СО АН СССР, 1982, с. II0-I24.

42. Звегинцев Б.А. Язык и лингвистическая теория. М.:Изд-во МГУ, 1973. - 246 с.

43. Звегинцев В.А. Предложение и его отношение к языку и речи. M.s Изд-во МГУ, 1976. - 306 с.

44. Звегинцев В.А. К стратегии построения систем класса "искусственный интеллект". В кн.: Учен.зап.Тарт.гос.ун-та. Вып. 551. Логико-семантические вопросы искусственного интеллекта. Труды по искусственному интеллекту. Ш. Тарту, 1980, с. 28-41.

45. Золотова Г.А. Очерк функционального синтаксиса русского языка. М.:Наука, 1973. - 350 с.

46. Золотова Г.А. О синтаксических свойствах имен качества. В кн.: Синтаксис и стилистика. М.:Наука, 1976, с. I30-I8I.- 194

47. Золотова Г.А. К типологии простого предложения. Вопросы языкознания, 1978, № 3, с. 49-61.

48. Золотова Г.А. Коммуникативные аспекты русского синтаксиса. М.: Наука, 1982. - 362 с.

49. Зубов A.B. Обработка на ЕС ЭВМ текстов естественных языков. -Минск:Вышэйшая школа, 1977. 173 с.

50. Зубов A.B. Программирование лингвистических задач на языке ПЛ/1. Минск:МГПИИЯ, 1978. - 120 с.

51. Зубов A.B. О вероятностно-алгоритмическом подходе к порождению текста. В кн.: Экспериментальная фонетика и прикладная лингвистика. Минск:МГПИИЯ, 1980, с.178-183.

52. Иванова И.П., Бурлакова В.В., Почепцов Г.Г. Теоретическая грамматика современного английского языка. М.:Высшая школа, 1981. - 285 с.

53. Каменская О.Л. Об одном принципе составления двуязычных словарей.- В кн.: Перевод научно-технической литературы. Материалы семинаров ВЦП. М.:ВЦП,1976, с.126-140.1. Ильин Г.М.1. Ильина И.Г.

54. Кацнельсон С. Д. Типология языка и речевое мышление, Л,:Наука,

55. Ленингр.отд-ние, 1972. 216 с.

56. Кириченко Н.П. Включение один из видов связи объектов в текстепредикат "включение"). В кн.: Информационные вопросы семиотики, лингвистики и автоматического перевода. М., 1971, вып. 2, с. 25-31.

57. Клыков Ю.И., Горьков Л.Н. Банки данных для принятия решений.

58. Контекстная семантика. М.:Наука, 1980. - 149 с. О языковом механизме порождения текста. - Вопросы языкознания, 1983, № 3, с. 44-51.

59. Котов Р.Г., Якушин Б.В. Языки информационных систем. М.:Наука,1979. 304 с.

60. Кривоносов А.Т. Открывает ли "трансформационная грамматика" новые горизонты в лингвистике? Вопросы языкознания, 1977, № 6, с. 59-70.

61. Кубрякова Е.С. Динамическое представление синхронной системы1. Кожина М.Н.1. Кокорина С.И.1. Кокун Л.М.1. Колшанский Г.В,

62. Колшанский Г.В. Колшанский Г.В.языка. В кн.: Гипотеза в современной лингвистике. М.:Наука, 1980, с. 217-261.

63. Кузин Л.Т. Проблемы информационно-программного обеспечения системы искусственного интеллекта. В кн.: Информационно-программное обеспечение систем искусственного интеллекта: Материалы семинара. М.:МДНТП, 1978, с. 3-8.

64. Кузин Л.Т. Особенности систем представления знаний. В кн.:

65. Представление знаний в системах искусственного интеллекта: Материалы семинара. М.гМДНТП, 1980, с. 3-7.

66. Кузнецов И.П. Кибернетические диалоговые системы. М.:Наука, 1976. - 299 с.

67. Лаптева O.A. О некоторых синтаксических тенденциях в стиле современной научной прозы (по материалам редакторской правки). В кн.: Развитие синтаксиса современного русского языка. М.:Наука, 1966, с. 186-223.

68. Лейкина Б.М. К проблеме взаимодействия языковых и неязыковыхзнаний при осмыслении речи. В кн.: Лингвистические проблемы функционального моделирования речевой деятельности. Вып. 2. Мзд-во ЛГУ, 1974, с. 97-109.

69. Леонтьев A.A. Психолингвистические единицы и порождение речевого высказывания. М.:Наука, 1969. - 307 с.

70. Леонтьев А.Н. Общее понятие о деятельности. В кн.: Основы теории речевой деятельности. М.:Наука, 1974, с. 5-20.

71. Леонтьева H.H., Волковыская Е.В., Копылова О.В., Молчанова Т.В., Штернова O.A. Словарь энциклопедических функций и его роль в автоматическом индексировании. Научно-техническая информация, серия 2, 1978, № 7, с. 23-29.

72. Ломтев Т.П. Принципы построения формулы предложения. Филологические науки, 1969, № 5, с. 56-68.

73. Лурия А.Р., Виноградова О.С. Объективное исследование динамики семантических систем, В кн.: Семантическая структура слова. М.:Наука, 1971, с. 27-63.

74. Лурия А.Р. Основные проблемы нейролингвистики. М.:йзд-во МГУ, 1975. - 253 с.

75. Лущихина Й.М. О роли некоторых грамматических трансформаций при различных условиях речевого общения. В кн.: Материалы второго симпозиума по психолингвистике. М.: Наука, 1968, с. 9-13.

76. Мартемьянов Ю.С. Синтез: трансформирование глубинной структуры в поверхностную. В кн.: Современное состояние теории и практики машинного перевода и автоматизации информационных процессов. М.:ВЦП, 1977, с. 24-36.

77. Марчук Ю.Н. Проблемы машинного перевода. М.:Наука, 1983. -233 с.

78. Маслов Ю.С. Введение в языкознание. М.:Высшая школа, 1975. - 327 с.

79. Маслов Б.А. Проблемы лингвистического анализа связного текста (надфразовый уровень). Таллин:ТПЙ, 1975. - 104 с.

80. Матвеева H.H. Об исходных ядерных типах предложений. В кн.: Вопросы металингвистики. Л.:Изд-во ЛГУ, 1973, с. II0-II8.

81. Микулич Л.И., Червоненкис А#Я. Специализированная диалоговаясистема. В кн.: Вопросы разработки прикладных систем. Новосибирск:БЦ СО АН СССР, 1979, с. III-I29.

82. Миллер Д.А. Речь и язык. Б кн.: Экспериментальная психология.

83. Т.2. М.:Изд-во иностр.лит-ры, 1963, с. 348-374.

84. Минский М. Фреймы для представления знаний. Пер. с англ. М.: Энергия, 1979. - 151 с.

85. Митрофанова О.Д. Язык научно-технической литературы. М.:Изд-во МГУ, 1973. - 147 с.

86. Москальская О.И. Вопросы синтаксической семантики. Вопросы языкознания, 1977, № 2, с. 45-56.

87. Москальская О.И. Проблемы системного описания синтаксиса. М.: Высшая школа, 1981. - 175 с.

88. Мухин A.M. Синтаксемный анализ и проблема уровней языка. Л.: Наука, Ленингр.отд-ние, 1980. - 303 с.

89. Налимов Б.В. Вероятностная модель языка. М.:Наука, 1974. - 272с.

90. Нелюбин Л.Л. Перевод и прикладная лингвистика. М.:Высшая школа, 1983. - 207 с.

91. Николаева Т.М. О возможности "синтеза через анализ" (к вопросу о минимальности описания), В кн.: Программа и тезисы докладов в летней школе по вторичным моделирующим системам. 19-29 августа 1964 г., Тарту, 1964.

92. Норман Б.Ю. Синтаксис речевой деятельности. Минск:Вышэйшая школа, 1978. - 151 с.

93. Озолинь М.Э. Способ представления знаний в автоматизированной обучающей системе. Учен.зап.Тарт.гос.ун-та. 'Вып. 594. Диалоговые системы и представление знаний. Труды по искусственному интеллекту. 17, 1981, с. 89-101.

94. Откупщикова М.И., Кремнева Н.Д., Невлева Т.Н., Никитина Т.Н.

95. Представление языковых данных в одной системе искусственного интеллекта. В кн.: Лингвистические проблемы функционального моделирования речевой деятельности. Л.:Изд-во ЛГУ, 1979, вып. 1У, с. 3-23.

96. Павлова К.Г. Явления свертывания в синтаксисе простого предложения (на материале научно-технической прозы современного немецкого языка):Авторефер.дис. . канд.филол. наук. М., 1969. - 20 с.

97. Перцова H.H. Проблемы глубинной семантики. Матер, к библиографическому справочнику. Ч. I, 2. 1976. Изд-во ИРЯ АН . СССР. Проблемная группа по экспериментальной и прикладной лингвистике. Предварит, публ.,вып. 87, 88.

98. Перцова H.H. О системах понимания текста на естественном языке: (Соврем, зарубеж. работы). Новосибирск:ВЦ СО СССР, 1980. - 46 с.

99. Пиотровский Р.Г. Текст, машина, человек. Л.:Наука, Ленингр. отд-ние, 1975. - 327 с.

100. Пиотровский Р.Г. Инженерная лингвистика и теория языка. Л.: Наз'ка, Ленингр.отд-ние, 1979. - 101 с.

101. Подольская Л.И. Семантико-синтаксические свойства глаголов обладания и приобретения в современном английском языке: Автореф.дис. . канд.филол.наук. Калинин, 1980. - 16 с.

102. Полуян И.В. Каузальная модель простого предложения современного английского языка:Автореф.дис. . канд.филол.наук. М., 1982. - 23 с.

103. Попов Э.В. Общение с ЭВМ на естественном языке. М.:Наука, 1982. - 360 с.

104. Попов Э.В., Родионов Е.В. Алгоритм синтеза предложений ограниченного русского языка из семантической сети. Известия АН СССР. Техническая кибернетика, 1978, № б, с. 44-51.

105. Попов Э.Б., Фирдман Г.Р. Алгоритмические основы интеллектуальных роботов и искусственного интеллекта. М.:Наука, 1976. - 455 с.

106. Порман Н.Р. Грамматическая семантика глагола в современном английском языке:Автореф.дис. . канд.филол.наук. -М., 1978. 16 с.

107. Поспелов Д.А. Профессионально и проблемно-ориентированные интеллектуальные системы. Вопросы философии, 1979, № 2, с. 57-59.

108. Почепцов Г.Г. О принципах синтагматической классификации глаголов (на материале глагольной системы современного английского языка). Филологические науки, 1969, № 3, с. 65-76.

109. Почепцов Г.Г. Конструктивный анализ структуры предложения. Киев: Вища школа, 1971. - 191 с.

110. Почепцов Г.Г. Типы ограничений сочетаемости слов. В кн.: Значение и смысл речевых образований. Калинин:КГУ, 1979, с. 60-70.

111. Преображенский А.Б., Хорошевский В.Ф. Система разбора ограниченных естественных языков. В кн.: Человеко-машинные системы: Материалы семинара. М.:МДНТП, 1977, с. 50-57.

112. Пшеничная Л.Э., Скороходько Э.Ф. Синтез осмысленных предложений на ЭЦВМ. В кн.: Проблемы кибернетики, вып. 10. М., 1963, с. 261-273.

113. Ревзин И.И. Логико-грамматический тип предложений тождества. -В кн.: Теоретические проблемы синтаксиса современных индоевропейских языков. Л.:Наука, Ленингр.отд-ние, 1975, с. 47-55.

114. Рейман Е.А. Единство содержательного и формального в английском предложении (художественный и научный стиль речи). -В кн.: Лингвостилистические исследования научной речи. М.:Наука, 1979, с. 123-152.

115. Рубаыкин В.Ш. Признак и значение. Научно-техническая информация, серия 2, 1976, № 3, с. 3-Ю.

116. Русская грамматика. Т. 2. Синтаксис. М.:Наука, 1980. - 709 с.

117. Сгалл П., Паневова Я., Бенешова Е. Тектограмматический уровень порождающего описания языка. Научно-техническая информация, серия 2, 1976, № 4, с. 18-29.

118. Значение, смысл и мысль. Учен.зап.Тарт.гос.ун-та, вып. 551. Логико-семантические вопросы искусственного интеллекта. Труды по искусственному интеллекту. Ш. Тарту, 19806, с. .121-128.

119. О когитологии. Учен.зап.Тарт.гос.ун-та, вып. 594. Диалоговые системы и представление знаний. Труды по искусственному интеллекту. 1У. Тарту, 1981, с. 126133.

120. Сильницкий Г.Г. Семантические типы ситуаций и классы глаголов.- В кн.: Проблемы структурной лингвистики. 1972. М.: Наука, 1973, с. 373-391.1. Сильдмяэ И.1. Сильдмяэ И.1. Сильдмяэ И.

121. Синтаксический компонент в системах машинного перевода: обзорная информация. /Леонтьева H.H., Шаляпина З.М., ' Ловцкий Е.Е. и др. М.:ВЦП, 1981. - 130 с.

122. Скороходько Э.Ф. Семантические связи в лексике и текстах. Вопросы информационной теории и практики. М.: ВИНИТИ, 1974а, № 23, с. б-Иб.

123. Скороходько Э.Ф. Лингвистические проблемы обработки текстов вавтоматизированных информационно-поисковых системах. Вопросы информационной теории и практики. М.:ВИНИТИ, 19746, К 25, с. 5-120.

124. Слобин Д., Грин Дк. Психолингвистика. М.:Прогресс, 1976.- 350 с.

125. Имена, предикаты, предложения. М.:Наука, 1981.- 360 с.

126. Структурный синтаксис английского языка. Л.:Изд-во ЛГУ, 1972.- 176 с.

127. Супрун A.B. Грамматика и семантика простого предложения. М.:1. Наука, 1977. 262 с.

128. Супрун А.Е. Лексика и вероятностный характер языка. В кн.:

129. Проблемы лексикологии. Минск:Изд-во БГУ, 1973, с. 160-170.1. Смирнова П.Н.1. Солнцев В.М.

130. Солнцев В.М. Степанов Ю.С.

131. Супрун А.Е. Лекции по языкознанию. Минск:Изд-во БГУ, 1978, - 176 с.

132. Сусов И.П. Семантика и прагматика предложения. Калинин:КГУ, 1980а. - 51 с.

133. Сусов И.П. Предложение и действительность. В кн.: Коммуникативно-прагматические и семантические функции речевых единств. - Калинин:КГУ, 19806, с. 11-25.

134. Троянская Е.С. К вопросу о технико-стилистических приемах в научной речи. В кн.: Язык научной литературы. М.: Наука, 1975, с. 27-86.

135. Троянская Е.С. Лингвостилистическое исследование немецкой научной литературы. М.:Наука, 1982. - 312 с.

136. Уинстон П. Искусственный интеллект. М.:Мир, 1980. - 519 с.

137. Уфимцева A.A. Некоторые вопросы синонимии. В кн.: Лексическаясинонимия. М.:Наука, 1967, с. 26-38. t

138. Уфимцева A.A. Типы словесных знаков. М.:Наука, 1974. - 206 с.

139. Уфимцева A.A. Семантика слова. В кн.: Аспекты семантических исследований. М.:Наука, 1980, с. 5-80.

140. Филимонова O.E. Стативная синтаксема в английском предложении (на материале сочетаний связочного глагола со словами категории состояния, прилагательными и предлож-но-именннми группами):Автореф.дис. . канд.филол. наук. Л., 1978. - 24 с.

141. Хендрикс Г. О расширении применяемости семантических сетей введением разбиений. В кн.: Труды 1У Международной объединенной конференции по искусственному интеллекту-. Т. I. М.:Изд-во АН СССР, 1975, с. I.I90-I.206.

142. Холодович A.A. Опыт теории подклассов слов. Вопросы языкознания, I960, № I, с. 32-43.

143. Хомский Н. Три модели описания языка, В кн.: Кибернетический сборник. № 2. М., 1961, с. 237-266.

144. Хомский Н. Логические основы лингвистической теории. В кн.: Новое в лингвистике. Вып. 1У, М.:Прогресс, 1965, с. 465-576.

145. Храковский B.C. Роль грамматического залога в организации абзаца. В кн.: Лингвистика текста. Материалы научной конференции. Ч. П. М.:МГПИИЯ им. М.Тореза, 1974, с. 130-133.

146. Цейтлин С.Н. Синтаксические модели со значением психологического состояния и их синонимика. В кн.: Синтаксис и стилистика. М.:Наука, 1976, с. I6I-I8I.

147. Цейтлин С.Н. Система синтаксических синонимов. В кн.: Структура предложения и словосочетания в индоевропейских языках. Л.:Наука, Ленингр.отд-ние, 1979, с. 77-87.

148. Чейф У. Значение и структура языка. М.:Прогресс, 1975. - 432 с.

149. Черемисина М.И. Сравнительные конструкции русского языка. Новосибирск: Наука, Сиб.отд-ние, 1976. - 270 с.

150. Черный А.И. Введение в теорию информационного поиска. М.:Наука, 1975. - 240 с.

151. Шведова Ю.Н. Детерминирующий объект и детерминирующее обстоятельство. Вопросы языкознания, 1964, № 6, с. 77-83.

152. Шенк Р., Абельсон Р. Сценарии, планы и знание. В кн.: Труды 1У Международной объединенной конференции по искусственному интеллекту. Т. 6. М.:Изд. АН СССР, 1975, с. 6.208-6.220.

153. Шеннон Р. Имитационное моделирование систем искусство и наука: пер. с англ. - М.:Мир, 1978. - 418 с.

154. Шмелев Д.Н. Синтаксическая членимость высказывания в современном русском языке, М,:Наука, 1976, - 150 с,

155. Шингарева Е.А, Опыт использования фреймов для распознаваниясмыслового образа текста, Научно-техническая информация, серия 2, 1978, № 10, с. 20-28.

156. Шуберт Л.К, Расширение выразительной мощности семантическихсетей. В кн.: Труды 1У Мевдународной объединенной конференции по искусственному интеллекту. Т. 2. М.: Изд. АН СССР, 1975, с. 2.2II-2.225.

157. Bobrov D.G., Winograd Т. Experience with. KRL-O. One cycle of a knowledge representation language. In: International Joint Conference on Artificial Intelligence, 5th. - Cambridge (Mass.), 1977, p. 213-222.

158. Byrne D. Teaching the passive. English Language Teaching, v. 20, 1966, Ho.2, p. 127-130.

159. Chafe W. Some thoughts on schemata. In: Theoretical issues in natural language processing. - Cambridge (Mass.), 1975, P. 89-91.

160. Charniak E. Organization and inference in a frame-like systemof common sense knowledge. In: Theoretical issues in natural language processing. - Cambridge (Mass.), 1975, P. 42-51.

161. Chomsky N. Aspects of the theory of syntax. Cambridge (Mass.): M.I.T. Press, 1965. - 251 p.

162. Clark H.H. Some structural properties of simple active andpassive sentences. Journal of Verbal Learning and Verbal Behavior, 1965, v. No.4, p. 365-370.

163. Cullingford R.E. Controlling inference in story understanding.- Ins International Joint Conference on Artificial1.telligence, 5th. Cambridge (Mass.), 1977» p. 17.

164. Fillmore Ch.J. Types of lexical information. Ins Studies in

165. Syntax and Semantics. Ed. by F.Kiefer, Dordrecht, 1969, p. 109-137.

166. Directed random generation of sentences. Communications of the ACM, 1969, v. 12, No.I, p. 40-46. The structure of English. - N.Y.:Harcourt, Brace and World, 1952. - 304 p.

167. Sentence paraphrasing from a conceptual base. -Communications of the ACM, 1975, v. 18, No.2, p. 96-106.

168. Co-occurence and transformation in linguistic structure. Language, 1957, v. 33, No.3, p. 283-340.

169. A transformational syntax. N.Y.iBonald Press, 1967. - 315 p.

170. A Course in modern linguistics. N.Y.:MacMillan, 1958. - 621 p.

171. Hook J., Mathews E. Modern American grammar and usage. N.Y.:

172. Ronald Press, 1956. 475 p.

173. Hornby A.S. A guide to patterns and usage of English. l.:

174. Oxford univ.press, 1962. 261 p.

175. Hutchins W.J. The Generation of syntactic structures from asemantic base. L., I97I* - 197 p.

176. Jacobsen B. Transformational generative grammar. An introductory survey of its genesis and development. Amsterdam, etc.:North-Holland, 1978. - 525 p.

177. Johnson M.G. Syntactic position and rated meaning. Journal1. Friedman J.1. Fries Ch.1. Goldman N.1. Harris Z.S.1. Hathaway B.1. Hockett Ch.F.of "Verbal Learning and Verbal Behavior, 1967» v. 6, No.2, p. 240-246.

178. Machova S., Panevova J. Автоматическое синтезирование чешских предложений. В кн.: Проблемы создания и развития Международной системы научной и технической информации. Вып. 2. - М.:МЦНТИ, с. 6-14.

179. McSkimin J.Ж., Minsky J. The use of a semantic network in a deductive question-answering system. In: International Joint Conference on Artificial Intelligence, 5th. - Cambridge (Mass.), 1977, p. 50-58.

180. Menzel P. Semantics and syntax in complementation. The Hague, Paris:Mouton, 1975. - 213 p.

181. Perrault С.E., Cohen P.R. Overview of planning speech acts.1.: International Joint Conference on Artificial «1.telligence, 5th. Cambridge (Mass.), 1977, P. И9.

182. Petrick S.R. On natural language based computer systems. -IBM Journal of Research and Development, July, 1976, p. 314-325.

183. Quillian M.R. Semantic memory, In: Semantic Information Processing. Ed. by M.Minsky. Cambridge (Mass.): M.I.T.Press, 1968, p. 227-270.

184. Raphael B. The handling of natural language by a computer.- Computers and People, 1976, N0.9, p. 7-18; No.10, p. 16-21.

185. Rieger Ch., Grinberg M. The declarative representation and procedural simulation of causality in physical mechanisms. In: International Joint Conference on Artificial Intelligence, 5th. - Cambridge (Mass.), 1977, P. 250-256.

186. Roberts P. Understanding English. N.Y.:Harcourt, Brace and World, 1958. - 508 p.

187. Rumelhart D. Notes on a schema for stories. In: Representation and Understanding: studies in cognitive science. - N.Y.:Academic Press, 1975, p. 211-236.

188. Sakai T., Nagao M. Sentence generation by semantic concordance.- In: Int.Conf. on Comput.Linguist., 1965 (mul-tilithed). N.Y. 22 p.

189. Simmons R., Slocum J. Generating English, discourse from semantic networks. Communications of the ACM, 1972, v. 15, No.10, p. 891-905. Tesnière L. Eléments de syntaxe structurale. - Paris, 1959« - 672 p.

190. Whitehall H. Structural essentials of English. N.Y.îHarcourt,

191. Yngve V.H. Random generation of English, sentences. Proc.1961. Intern.Conf. on Machine Trans, of Lang, and Applied Lang. Analysis. Teddington. H.M.S.O. L.,1962, p. 66-80.

192. ИСПОЛЬЗУЕМЫЕ СЛОВАРИ И ИСТОЧНИКИ АНАЛИЗИРУЕМОГО1. МАТЕРИАЛА1 .

193. Англо-русский политехнический словарь. М.:Русский язык, 1979.- 687 с. (АРП).

194. Англо-русский словарь по вычислительной технике. М.¡Русскийязык, 1974. 535 с. (АРВ). Англо-русский толковый словарь по вычислительной технике. - Рига:

195. Urdang L. The Basic Book of Synonyms and Antonyms. N.Y.sNew

196. American Library. 374 p. (BS). Webster's Third New International Dictionary of the English1.nguage. L.:G.Bell & Sons, 1961. - 2662 p. (WD). Computer Design. 1972, Nos. 3,4,8; 1973, Nos. 6,7,II; 1974,

197. Nos. 2,5,8,9,11; 1975, Nos. 1,2-7,9,11; 1976, Nos. I, 3,4,5; 1977, Nos. 3,4,5,6,8-11; 1978, Nos. 1,3,5-8; 1979, Nos. 2-4, 7-10; 1980, Nos. 1,2,6,9,11,12;1981, Nos. 2,4,5,9,10; 1982, Nos. 3,5» (OD). Datamation, 1964, No.4 (D).

198. Electronic Design, 1973, No.18; 1975, No.I; 1976, Nos. 10,12, 15; 1977, No.I; 1978, Nos. 2-4,6,11-13,18,21,23,24; 1979, Nos. 2,6,7,10,13,14,16,21,22; 1980, Nos. 6,10, 12,20,22 (ED). IEEE Transactions on Computers, 1979, No.6; 1980, No.9;1982, No.5 (TC).