автореферат диссертации по филологии, специальность ВАК РФ 10.02.19
диссертация на тему:
Проблема формализации лингвистических знаний

  • Год: 2004
  • Автор научной работы: Анненкова, Елена Алексеевна
  • Ученая cтепень: кандидата филологических наук
  • Место защиты диссертации: Ростов-на-Дону
  • Код cпециальности ВАК: 10.02.19
450 руб.
Диссертация по филологии на тему 'Проблема формализации лингвистических знаний'

Полный текст автореферата диссертации по теме "Проблема формализации лингвистических знаний"

На правах рукописи

Анненкова Елена Алексеевна Проблема

формализации лингвистических знаний (на материале пунктуации русского языка)

Специальность 10. 02. 19-Теория языка

Автореферат диссертации на соискание ученой степени кандидата филологических наук

Ростов-на-Дону - 2004

Диссертация выполнена на кафедре русского языка и теории языка Ростовского государственного педагогического университета

Научный руководитель -

Официальные оппоненты

доктор филологических наук, профессор Меликян В.Ю.

- доктор филологических наук, профессор Алефиренко Н.Ф.

кандидат филологических наук, , доцент Остри кова Г. Н.

Ведущая организация - Московский государственный

педагогический университет

Защита состоится 2 апреля 2004 г. в 14 часов на заседании Диссертационного совета Д. 212.206.01 по присуждению ученой степени кандидата филологических наук при Ростовском государственном педагогическом университете по адресу: 344082, г. Ростов-на-Дону, ул. Большая Садовая, 33, ауд. 202.

С диссертацией можно ознакомиться в научной библиотеке РГПУ по адресу: ул. Б. Садовая, 33.

Автореферат разослан 1 марта 2004 г.

Ученый секретарь

Диссертационного совета кандидат филологических наук

доцент Григорьева Н. О.

Диссертация посвящена анализу проблемы формализации лингвистических знаний (на материале пунктуации русского языка) и автоматизации процесса постановки тире в простом предложении между главными членами перед словом «это» (и его эквивалентами).

Актуальность исследования. Проблема формализации лингвистических знаний на современном этапе развития языкознания является чрезвычайно актуальной. Это связано, во-первых, с тем, что информатизация мыслительной деятельности человека требует использования метода формализации как одного из методов научного познания и программирования различных типов языковых данных.

Во-вторых, продолжающаяся работа по созданию Машинного фонда русского языка нуждается в разработке формализованного словаря русского языка и формальной1 грамматики, сравнимой по полноте с Академической грамматикой русского языка. Все это подчинено цели комплексной автоматизации лингвистических знаний и прикладных разработок в области языкознания, более полному и глубокому познанию природы языка в целом.

В-третьих, образованному фонду лингвистических алгоритмов и программ необходимы новые и усовершенствованные материалы (текстовые редакторы, автокорректоры, программы издательской подготовки, анализа и синтеза русской речи) для автоматизации разного рода работ. Поиски новых методов предупреждения и обнаружения ошибок и реализация этих методов на основе электронной техники еще не вышли из стадии научно-исследовательских разработок и экспериментов.

В-четвертых, вопрос о возможностях и границах формализации в научном познании и лингвистке в том числе, о критериях формализуемого и неформализуемого остается спорным.

Научный интерес к проблеме формализации лингвистических знаний на материале русской пунктуации вызван и тем фактом, что отсутствуют работы в области пунктуации, посвященные данной проблеме, несмотря на то, что опыт формализации различных типов языковых данных, как показало исследование специальной литературы по этому вопросу, есть. Пунктуационная система, как считает Б.С. Шварцкопф, по своим основополагающим свойствам аналогична любой языковой системе (или подсистеме). При этом между естественными собственно языковыми системами, естественность которых представляется аксиоматичной, и пунктуационной системой отсутствуют существенные различия. Это позволяет предположить возможность формализации и в пунктуации.

На современном этапе научного развития формализация - это прежде всего автоматизация или путь к

придала такое огромное значение научным и философским вопросам формализации, по-новому поставила вопрос о значении научной строгости.

При изучении проблемы формализации лингвистических знаний применительно к пунктуации выяснилось, что функции и правила употребления знаков препинания, привлекали, особое внимание исследователей на первом этапе работы над проблемой автоматизации перевода. Позднее интерес к этому вопросу уменьшился и уступил место «центральным» вопросам синтаксиса. Таким образом, пунктуация в прикладном аспекте оказывается в числе наименее изученных вопросов.

Всестороннее рассмотрение данной проблемы приводит к обнаружению того, что многие задачи, связанные с автоматизацией лингвистических знаний, еще не решены. Их решением занимается структурная, математическая, компьютерная и прикладная лингвистика, использующая, методы формального анализа. Именно здесь формализация, ее принципы, приемы, способы играют важную роль по выявлению, представлению и уточнению содержания изучаемого явления через рассмотрение и фиксацию его формы и оперирование ею.

Главной чертой языкознания 2-й половины XX века, как утверждает Ю.С. Степанов (1975, 34), является то, что лингвистические исследования имеют формальный характер. К проблеме формализации и формальным исследованиям в своих работах обращаются такие ученые, как Ю.Д. Апресян, А.В. Гладкий, В.А. Звегинцев, Ю.К. Лекомцев, Ю.Н. Марчук, И.А. Мельчук, Л.Л. Нелюбин, А.И. Новиков, Р.Г. Пиотровский, И.И. Ревзин, Ю.А. Шрейдер и др. Анализ фундаментальных работ этих авторитетных ученых дает наиболее полное представление о формализации и ее роли в языкознании.

Таким образом, актуальность диссертационного исследования состоит в том, что в нем в теоретическом и прикладном аспектах дается анализ проблемы формализации лингвистических знаний на материале пунктуационной системы русского языка. В центре внимания диссертации - проблема формализации, в частности, формализации структуры простого предложения с тире между главными членами перед словом «это» (и его эквивалентами) и автоматизации процесса постановки тире в предложении данного типа.

Объектом исследования диссертационной работы является пунктограмма тире в простом предложении между главными членами перед словом «это» (и его эквивалентами).

Предмет исследования - формализация и автоматизация процесса постановки тире в рамках объекта исследования.

Цель диссертационной работы - исследование проблемы формализации и автоматизации процесса постановки тире в простом

предложении между главными членами перед словом «это» (и его эквивалентами).

В соответствии с поставленной целью реализуются следующие частные задачи:

1. Изучение процесса формализации синтаксического уровня языка и возможности применения методов его формализации в системе пунктуации.

2. Обоснование возможности формализации и автоматизации процесса постановки тире в простом предложении между главными членами перед словом «это» (и его эквивалентами).

3. Выделение инвариантных структурных схем простого предложения со словом «это» (и его эквивалентами) между главными членами.

4. Построение математической модели структуры простого предложения с формантом «это» (и его эквивалентами) между главными членами.

5. Составление общего лингвистического алгоритма «Тире в простом предложении между главными членами перед словом «это» (и его эквивалентами)» и вспомогательных алгоритмов, детализирующих общий алгоритм, по структурным схемам простого предложения (Общий и частные алгоритмы ориентированы на электронно-вычислительную машину).

Реализация цели и задач исследования опирается на общую философскую, общенаучную и частную методологию. В работе используются диалектический метод, метод восхождения от абстрактного к конкретному, системный подход. Приемами исследования являются анализ и синтез, абстрагирование и идеализация, индукция, дедукция и аналогия. К методам и приемам лингвистического исследования материала относятся как традиционные методы, так и методы и приемы прикладной лингвистики. Использовались лингвистический метод описания с такими приемами, как наблюдение, сопоставление, обобщение, классификация, а также структурные и конструктивные методы. В работе находят применение теоретические методы исследования - формализация и аксиоматический метод с приемами алгоритмизации и алгоритмического описания, гипотетико-дедуктивный метод и моделирование, в частности, графическое, логико-математическое и интуитивно-математическое моделирование, метод математической гипотезы, алгебраический метод- и эмпирические методы - мысленный эксперимент, метод теории автоматов, связанный с экспериментами. Кроме того, используется метод пошаговой детализации, принятый в информатике.

Материалом, на котором выполнено исследование, послужили структурные схемы двусоставных предложений Ш словом «это» (и его эквивалентами) между главными членами при отсутствии глагольной связки (в количестве 9 как основных, инвариантных, производных для составления алгоритмов), представленные в «Грамматике современного русского литературного языка» (1970), «Русской грамматике» (Т.II, 1980)*, исследованиях Н.Ю. Шведовой (1967, 18-20). Материалом исследования явились также примеры из текстов художественных произведений и периодической печати, иллюстрирующие данные структурные схемы. Картотека составляет более 2 тысяч примеров.

Научная новизна предлагаемой диссертации состоит в том, что пунктуация и проблема употребления тире в простом предложении между главными членами при отсутствии связки перед словом «это» (и его эквивалентами) впервые исследуется в аспекте формализации и прикладном аспекте, что позволяет определить возможность автоматизации процесса постановки тире в указанном случае.

Теоретическая значимость, работы состоит в том, что исследование проблемы формализации лингвистических знаний (на материале русской пунктуации) расширяет представление о методе формализации в языкознании, определяет возможность формализации пунктуационной системы языка, показывает логику и динамичность абстрактных языковых явлений, подтверждает тезис об однородности системы языка и системы программирования. Данное исследование является некоторым вкладом в теорию автоматической обработки текста, способствует дальнейшему продуктивному исследованию указанной проблемы.

Практическая ценность работы заключается в том, что исследование способствует пополнению созданного фонда лингвистических алгоритмов и программ по решению проблемы автоматизации данной пунктуационной нормы для текстовых редакторов, автокорректоров, программ издательской подготовки, одним из назначений которых является грамотная правка текста, находящегося в памяти ЭВМ. Кроме того, полученные результаты исследования могут послужить основой к составлению компьютерной программы по автоматизации процесса постановки тире в указанном случае, могут быть полезными при последующем изучении данной проблемы, при создании руководства, призванного усовершенствовать владение этим пунктуационным правилом. Также материалы работы могут быть использованы в школьной и вузовской практике преподавания русского языка, для создания обучающей компьютерной программы.

«Далее в работе Г - 70, Г - 80 (Т11)

На защиту выносятся следующие положения:

1. Проведенное исследование показало, что метод формализации применим к синтаксическому уровню языка. Формальное представление синтаксического уровня способствует формализации пунктуационной системы языка. Для описания структуры системы знаков препинания могут быть использованы формальные способы порождающей грамматики.

2. Пунктуационную систему можно подвергнуть формализации. Формализация пунктуации основывается на структурно-синтаксическом (формально-грамматическом) принципе. Формализуется, в частности, случай постановки тире в простом предложении между главными членами перед словом «это» (и его эквивалентами). Здесь в большей степени выделяется формализуемая часть и - в меньшей -неформализуемыи остаток. Этот определенный неформализуемый участок языка представляет собой закономерное явление, своего рода универсальный закон, распространяющийся как на систему естественного языка, так и на научное знание в целом.

3. Автоматизации процесса постановки тире в простом предложении между главными членами перед словом «это» (и его эквивалентами) способствует формализация структуры простого предложения с данной пунктуационной нормой, выделение структурных схем и их вариантов для предложений соответствующего типа.

4. Для решения задачи автоматизации указанного процесса возможно построение математической модели, представляющей структуру простого предложения с тире между главными членами перед формантом «это» (и его эквивалентами).

5. Автоматизация этого пунктуационного правила предполагает составление общего лингвистического алгоритма и вспомогательных алгоритмов, детализирующих общий алгоритм, по выделенным структурным схемам и их вариантам. Алгоритмы должны иметь определенную специфику - ориентацию на электронно-вычислительную машину.

Апробация работы. Результаты работы над диссертацией обсуждались на заседании кафедры русского языка и теории языка РГПУ, основные положения были представлены в докладах на конференциях в РГПУ (2001,2002) и отражены в 4 публикациях.

Структура диссертации. Диссертация состоит из Введения, трех глав, Заключения, Приложения, включающего общий алгоритм «Тире в простом предложении между главными членами перед словом «это» (и его эквивалентами)», списка источников лингвистического материала и списка литературы.

Основное содержание работы

Во «Введении» дается обоснование актуальности темы, определяются цель, задачи, методы исследования и т.п.

Первая глава диссертации «Формализация как метод теоретического исследования в языкознании» состоит из 6 параграфов.

В первом параграфе краткий обзор справочной и специальной литературы по понятию «формализация» дает представление о том, что в науке проблема формализации рассматривается с философской, логической, математической и кибернетической точек зрения. Формхлизация как уточнение содержания, производящееся посредством выявления его формы, и представление некоторого процесса, на основе которого можно строить математическое описание, используется и в языкознании. В настоящее время общепринято употребление термина «формализованный» вместо термина «формальный» в тех случаях, когда при решении задач приходится сочетать формальные и неформальные отображения. В лингвистике понятие «формальный» означает «исходящий из формы, основывающийся на особенностях выражения, служащий формой; связанный с выражением грамматического значения, относящийся к форме слов, а также употребляется как эквивалент «формализованного» или «эксплицитного», в противоположность «неформальному» или «интуитивному». Под формальным описанием языка подразумевается также набор правил, допускающий их механическое применение, не требующее «понимания».

Обязательным условием применения методов кибернетики в той или иной области познания является предварительная формализация подлежащих изучению закономерностей в виде (более или менее развитой) знаковой системы.

Рассмотрение системы понятий помогает установить, что формализация является основой для процессов алгоритмизации, программирования и компьютеризации языкового материала.

Во втором параграфе речь идет о значении формализации в лингвистических исследованиях, представлен теоретический материал по проблеме формализации в отечественном и зарубежном языкознании и различные точки зрения на возможность формализации в лингвистике. Уже в 1894 году Ф. де Соссюр пришел к мысли, что фундаментальные отношения между единицами языка могут регулярно выражаться с помощью математических формул. В языкознании сформировались два противоположных подхода к исследуемой проблеме. Одни ученые не признают возможность формализации языковых описаний. Согласно А.Тарскому, язык нельзя относить к классу формализованных систем (Пазухин, 1977, 144). Другие ученые

придерживаются иной точки зрения. Ю.С.Степанов, например, сведение существующих языковых описаний к схематической и экономной форме объясняет «возникновением формализации в недрах традиции» (Степанов, 1975, 34). Автор работы разделяет компромиссную позицию Р.В.Пазухина, которая состоит в том, что формализация возможна в том случае, если она применяется в прикладных формальных описаниях языковых фактов, употребляющихся с учетом их неполной адекватности для достижения ограниченных практических целей. На основании этого вполне закономерно говорить о возможности формализации пунктуационной системы языка и, в частности, структурной организации простого предложения со словом «это» между главными членами и тире перед ним, благодаря которой возможна автоматизация данной пунктуационной нормы. Необходимо считаться с тем; что полностью формализованными могут быть лишь те содержательные области, которые являются элементарными с точки зрения их логической структуры и что формализация в большей степени возможна там, где выражаемое содержание четко очерчено тематически и характеризуется определенной стандартизированностью.

Формализация лингвистического знания как метод описания и изучения языка является в значительной части логическим следствием тех результатов, к которым пришла структурная лингвистика. Структурное описание является высшей степенью формализации.

При грамматическом эксперименте различают такие уровни формализации, как иллюстративный, операционный, уровень первичной математизации лингвистических закономерностей, уровень лингво-математических инструменталий, уровень лингво-математического взаимодействия, уровень отвлеченных математических моделей языка. Перечисленные уровни представляют иерархию формализации грамматического материала при всех возможных ручных и машинных грамматических экспериментах. Некоторые из этих уровней представлены в практической части работы. Кроме того, существует идея постепенной формализации задачи, основные положения которой нашли отражение в практической части работы, в частности, при построении математической модели простого предложения с тире между главными членами перед словом «это».

Различают методы формализованного представления систем -логические, лингвистические, семиотические, графические методы - и методы постепенной формализации задачи - структурно-лингвистическое и имитационное, динамическое моделирование, которое опирается на структурные представления и средства математической лингвистики, Приемами формализации, которые используются в работе для достижения цели и задач, являются алгоритмизация, графическое исчисление.

В третьем и четвертом параграфах речь идет о тесной связи, формализации, моделирования как метода изучения реального объекта или явления, основанного на изучении свойств модели этого объекта или явления, и способа представления знаний и алгоритмизации Модель представляет собой обобщенную и формализованную структуру или процесс тех или иных фактов языка Так как лингвистические модели формализуют язык как структуру, это дает основание для распространения на языкознание математических теорий и приемов исследования. При изучении объекта, явления или процесса сначала строится его описательная модель, затем она формализуется, т.е выражается, например, с помощью математических формул или геометрических объектов. Любая модель должна быть представлена в виде алгоритма, который позволяет формализовать выполнение информационного процесса. К способам алгоритмического описания, которые не предполагают обязательной логической формализации, относятся словесное описание, символическое описание, граф-схемы, блок-схемы.

Установлено, что формализация, математическое моделирование и алгоритмизация необходимы для процесса автоматизации языковых явлений.

К этапам решения задачи на ЭВМ относятся:

1. Содержательная постановка задачи;

2 Математическая постановка задачи;

3. Формализация задачи (выбор метода решения);

4. Составление алгоритма решения задачи;

5.Составление программы на языке программирования;

6. Отладка программы на ЭВМ - выявление и исправление в ней

ошибок;

7. Рабочий счет (решение задачи с рабочими данными на ЭВМ) и

анализ результатов;

8.Составление инструкции к программе.

Первые четыре этапа решения задачи характерны для практической части данной работы.

В пятом параграфе освещаются новые тенденции формализации с точки зрения процесса автоматизации лингвистических знаний В настоящее время интерес к методу формализации в лингвистике обусловлен прежде всего процессом автоматизации языковых явлений, поскольку формализация обеспечивает автоматическую обработку текста. Новым способом формализации является поэтому компьютерная формализация как основа всего компьютерного моделирования. Методы прикладной лингвистики основываются на формализации задач и материала лингвистических знаний

Так, прикладные системы и теория автоматической обработки текста развиваются в издательском деле. Автоматизированные системы здесь возможны благодаря использованию компьютеров, которые по заданным алгоритмам обрабатывают текстовую информацию. Ни одна из существующих издательских систем, как выяснилось, не может решить широкий круг проблем, в том числе и проблему автоматической проверки употребления тире в простом предложении между главными членами перед словом «это» (и его эквивалентами) Поэтому автоматизированные редакционно-издательские системы нацелены на развитие и являются открытыми. Легче всего автоматизировать в обработке текста то, что легче всего формализовать, для чего легче всего можно найти формальные признаки. На основе этого создаются алгоритмы и программы анализа текста и его единиц.

Методы решения прикладных задач основаны на хорошо формализованных алгоритмах, полученных в результате построения математических моделей предметных областей. Для решения плохо формализуемых задач применяют экспертные системы. Формализация здесь является обязательным условием.

В шестом параграфе речь идет о формализации синтаксического уровня языка и возможности применения ее методов и способов в системе пунктуации. Для разработки автоматизированных систем общения и для кибернетических задач, связанных с переработкой информации на естественном языке, первостепенную важность представляют способы описания синтаксической структуры предложения. Рабочие методы и приемы формализации, графические способы изображения синтаксических структур - схемы, графы, деревья подчинения и составляющих, методы синтаксического анализа -методы непосредственных составляющих и синтаксических групп, модель системы компонент - позволяют формализовать синтаксическую информацию для представления ее в системах автоматического анализа, способствуют формализации структуры простого предложения со словом « это» между главными членами и тире перед ним.

Существуют три критерия, которыми принято руководствоваться при изображении синтаксических структур:

1) вопрос о минимальной и максимальной синтаксических единицах;

2) трактовка понятия «синтаксическая связь» и вопрос о характере связей между минимальными единицами внутри максимальной;

3) вопрос об иерархии и структурной организации минимальных единиц в максимальной.

Оказывается, что поиски чисто формальных правил - алгоритмов -синтаксического анализа для структур любой степени сложности показали невыполнимость этой задачи

Для автоматизации процесса постановки тире в простом предложении перед словом «это» между главными членами важно, что морфологический анализ (обработка словоформ вне связи с контекстом) может осуществлять обработку словоформ, до окончания ввода всего предложения, т.е. возможно совместить ввод предложения и его обработку.

Формализация языкового материала и формальное представление синтаксического уровня языка способствуют процессу автоматизации системы пунктуации, делают возможным создание алгоритмов автоматической постановки знаков препинания в печатном тексте. Это предполагает построение соответствующих процедур синтаксического анализа. Также необходимо дать систему правил, по которым машина сможет проанализировать предложение, т.е. выделить те единицы, на которые оно разлагается, установить значение каждой единицы и выделить отношения между единицами. Выделены способы установления формальных признаков для автоматической постановки знаков препинания:

а) выделение позиций в предложении, наиболее характерных для Данной единицы;

б) установление окружения данной единицы;

в) списки слов, требующих определенной формы других слов (например, списки семантических классов, являющихся показателями для определения зависимого от предлога слова);

г) размеры анализируемой конструкции (например, размеры зоны связей слова в предложении).

Во второй главе «Формализация постановки тире в пунктуационной системе языка» рассматривается проблема формализации пунктуационной системы языка на примере употребления тире в простом предложении между главными членами перед словом «это» (и его эквивалентами) и автоматизации данной пунктуационной нормы.

В первом параграфе обосновывается возможность формализации пунктуации, по аналогии с формализацией морфологии, синтаксиса и других типов лингвистических знаний. Пунктуационная же система аналогична языковой системе (или подсистеме).

Для формализации и автоматизации процесса постановки знаков препинания необходим учет структурного принципа пунктуации, так как машина может работать только на основе заданных в программе формальных признаков предложения. При построении моделей

предложения для компьютерных алгоритмов требуется учитывать строение синтаксических единиц, элементы их структурных схем, способы выражения строевых элементов предложения. В автоматизации процесса постановки тире в простом предложении между главными членами перед словом «это» учитывается синтаксическая специфика подлежащего и сказуемого и различные способы их морфологического выражения.

Для процесса автоматической постановки, тире в указанном случае исследованы основные значения тире, функции тире и употребление предложений со словом, «это» и тире перед ним (номинативные предложения, сегментированные конструкции).

Во втором параграфе речь идет о том, что для автоматизации процесса постановки тире в простом предложении между главными членами перед словом «это» необходимы формализация - и моделирование предложений данного типа.

Модель предложения представляет многообразие конкретного предложения естественного языка в виде конечного списка синтаксических структур или конечного множества одноуровневых единиц синтаксической системы языка. Моделью предложения является его предикативная основа, формой - минимальная структурная схема. В структуру предложения включаются компоненты, распространяющие и осложняющие предикативную основу. Прием моделирования структуры простого предложения - замена последовательности слов предложения последовательностью символов и классификация полученных цепочек. Для моделирования предложения каждый элемент способствует семантической интерпретации предложения. Поэтому в настоящем исследовании модель предложения - это не только его предикативная основа, структурная схема, но и предикативная основа с информативными распространителями- факультативными членами.

В третьем параграфе речь идет о том, что основой для разработки алгоритма автоматизации процесса постановки тире перед словом «это» в простом предложении с отсутствующей глагольной связкой могут послужить 9 структурных схем двусоставных предложений, представленных в Г-70, Г-80 (Т.Н). В эти структурные схемы - синтаксические образцы, по которым могут быть построены элементарные предложения - входят связка «это» (служебная словоформа, функция которой - дополнительное указание на синтаксическое отношения между компонентами предложения) или связочные образования (эквиваленты «это»): это (и) значит, это (и) означает, это (и) называется, это (и) есть, это то же самое что, это как, это все равно как, это все равно что. Из выделенных основных инвариантных структурных схем, таких, как

Inf - N,; N, - Adv-o; N, - Adv (N2_6) (Inf- Adv-o (N2.6)); Inf- Adv (N2.6);

Inf сор Ini; Praed Inf, достаточных для независимого функционирования образованных на их основе высказываний, «выводятся» их структурные варианты. Добавляются к основным схемам те, в которых в качестве одного из главных членов' (или. обоих) предложения выступают числительное, субстантивированное прилагательное, причастная форма на -но (-то), а также сочетание это когда, употребляющееся при сказуемом, выраженным» целым предложением. Всего получено 25 структурных! схем простого предложения со словом «это» (и его эквивалентами), пригодных для построения алгоритма автоматизации данного процесса.

Построение структурных формул предложений на уровне классов слов и членов предложений, определение семантических формул предложений должно входить в комплекс программ Машинного фонда русского языка.

инвариантным и вариантным структурным схемам можно отнести следующие:

1. Г^-этоГ^;

Красноречие - это камень преткновения для парижанина (Ф. Достоевский. Дневник писателя).

2. Num, (N2) - это Num,:

Четверть наследства - это одиннадцать миллиардов бельгийских франков, пятилетний доход всего Бельгийского королевства! (Б. Якунин. Левиафан).

3. Num, (N2)-3toN,:

Четыре человека - это только личный сыск (А. Маринина. Когда боги смеются).

4. Nj - это Numj (N2):

Квадрат, восьмидесяти - это шесть тысяч четыреста (Б. Акунин. Левиафан).

5. N, - это N2_6:

Самая интересная книга - это о космосе.

6. Ni - это Adv-o (N2_6):

Сильный мороз - это под сорок.

7. Nj - это Adv-o:

Мечта - это хорошо (С. Алексеев. Сокровища Валькирии).

Мне всегда, напротив, казалось, что величайшее счастье - это знать по крайней мере, отчего несчастлив (Ф. Достоевский. Дневник писателя).

9. N| - это когда Р (Р- предложение) (к схеме N, - это N,)-

Самая поздняя осень - это когда от мороза рябина сморщится и станет, как говорят, «сладкой» (М. Пришвин).

10.Adjj -3toNj:

Нам чужда протестантская этика, которая учит тому, что богатый - это избранник Бога (Из газ. «Аргументы и факты»), И. N, - это Adjj:

Ведь тюремный роман - это еще не самое сложное (Из газ. «Аргументы и факты»),

12. Adjj - это Adj,:

А еще одно подтверждение того, что все новое - это хорошо забытое старое, - возвращение в моду одежды с двубортной застежкой (из газ «Аргументы и факты»),

13. Adj| - это когда Р:

Страховой - это когда каждый сам покупает себе полис (Из газ. «Аргументы и факты»),

14. Adj, - это Inf:

Самое сложное - это любить изо дня в день (Из газ. «Аргументы и факты»),

15. Adj, - это Adv-o:

Черный традиционно считается цветом траура, видимо отсюда и пошло, что черный -это плохо (Из газ. «Аргументы и факты»),

16. Inf-это Inf:

Читать - это не только узнавать факты (К. Федин).

17. Inf-это Nj:

В нашем государстве сейчас пожар, а как известно, тащить что-либо у погорельцев - это великий грех (С. Алексеев. Сокровища Валькирии).

18. Inf-это Adv-o:

Быть первым, вне опыта - это так ответственно (Е. Маркова.

Актриса).

19. Inf-это Adj,:

Научиться самостоятельности, ответственности за собственную жизнь- это самое главное (Из газ. «Аргументы и факты»),

20. Inf-это

Жаловаться - это не в моем характере.

21. Inf-это Part-но (-то) (к схеме Praed Inf):

Отступать - это невозможно.

22. Р-это Adv-o:

«Человек человеку друг» - это прекрасно.

23. Pron (Adv) P —это Nj (ксхеме N( - это N():

Когда он спит - это загадка.

Какое я получил письмо - это секрет.

24. N,- это Part-но (-то):

Королевская рота - это понятно (Из газ. «Аргументы и

факты»),

25. Inf- это Vf3s ( к схеме Vf3s Inf):

Учиться - это всегда пригодится.

Установление уровня синтаксической единицы, ее анализ, выделение признаков в качестве условий пунктуационной нормы позволяет проанализировать существующие пунктуационные правила постановки тире в предложениях между главными членами. Постановка тире здесь определяется формально-грамматическим принципом системы пунктуации.

В третьей главе «Автоматизация постановки тире в простом предложении между главными членами перед словом' «это» (и его эквивалентами)» определяются пути решения задачи автоматизации процесса постановки тире в простом предложении между главными членами перед словом «это» (и его эквивалентами).

В первом параграфе описывается решение задачи автоматизации данного процесса. Справочные материалы рассматривают самые основные и широко встречающиеся случаи употребления тире между подлежащим и сказуемым и практически не учитывают тонкостей, приведенных в Г-70 и Г-80 (T.II). Именно поэтому при построении моделей предложений и алгоритма для автоматизации процесса постановки тире перед словом «это» в указанном случае целесообразно опираться на эти фундаментальные работы.

В работе при построении лингвистического алгоритма постановки тире между подлежащим и сказуемым перед словом «это» (алгоритма, ориентированного на ЭВМ) используется принятый в информатике метод пошаговой детализации. Общая его идея -разложение процесса на отдельные действия, а соответствующих программ на отдельные инструкции.

Решение задачи автоматизации процесса постановки тире в указанном случае включает в настоящем исследовании следующие этапы:

Г. Построение описательной информационной модели объекта или процесса - структурные схемы предложений со словом «это» и тире перед ним.

2. Формализация описательной информационной модели -построение математической модели структуры простого предложения с

формантом «это» между главными членами в форме схемы алгоритма (блок-схемы общего илюритма) и вспомогательных алгоритмов, детализирующих общий алгоритм, по принципу разветвляющегося алгоритма.

3. Отладка алгоритма вручную с использованием примеров, иллюстрирующих структурные схемы предложений.

4. Анализ полученных результатов, корректировка исследуемой модели.

К описанию метода решения задачи относятся:

1. Задание исходных величин задачи: Nj; Numj; Adj|j Inf; Adv-o; N2_6; Part-но, -то; слов когда; (и) значит; как; одно из; то, что; (и) есть.

2. Разбиение процесса решения задачи на такие этапы, которые известны исполнителю, которые он может выполнить однозначно, без пояснений-этапы алгоритма.

3. Указание порядка выполнения этапов - номера шагов алгоритма.

4. Указание признака окончания процесса решения задачи - вывод предложения с тире или без него.

5. Указание во всех случаях того, что является результатом решения задачи - постановка тире (машиной) или его отсутствие, подчеркивание слова «это», обращение к справке для некоторых случаев.

Для формализации некоторых лингвистических суждений необходимы математические отношения равенства, подобия и эквивалентности, упорядочения объектов, входящих в некоторое множество для построения математических моделей в отвлечении от свойств конкретных языковых единиц. Для постановки задачи на ЭВМ и ее решения стратегия решения включает аналитическую задачу -формализацию интуитивных понятий и анализ их путем изучения получающихся математических структур.

Разработанная нами математическая модель структуры простого предложения с тире между главными членами перед формантом «это» отвечает этим требованиям.

Во втором параграфе рассматриваются вопросы построения лингвистического алгоритма «Тире в простом предложении между главными членами перед словом «это» (и его эквивалентами)», ориентированного на ЭВМ. При составлении алгоритма для правила постановки тире в предложении между подлежащим и сказуемым перед словом «это» необходимо установить «логически обусловленную последовательность операций для выяснения тех условий и предпосылок», которые определяют образование конструкций и постановку тире (Малащенко, 1966, 24). Алгоритм правила - это логически обусловленная последовательность умственных действий,

предписываемая для выяснения условий возможности - невозможности образования или изменения слов, конструкций, а также их употребления в речи. Алгоритм может быть представлен в виде матрицы, инструкции или серии альтернативных вопросов и ответов па них (так называемые альтернативные алгоритмы, схема которых представляет собой форму «дерева») (Малащенко, 2001, 110).

В самом правиле (и его «подпунктах») постановки тире между подлежащим и сказуемым «заложена идея возможности распознавания явления путем выполнения ряда действий, призванных дать ответ о наличии или отсутствии указанных признаков». Система необходимых и достаточных признаков является основой для составления алгоритма распознавания изучаемых фактов. Такой алгоритм имеет форму «дерева» и представляет собой чередование заданий-вопросов с утвердительными «да» или отрицательными «нет» ответами на них. После каждого ответа следует либо вывод о сущности какого-то факта или практическая рекомендация, если признаки явления, условия его функционирования исчерпаны; либо следующее задание - поиск или вопрос, если необходимые признаки явлении не исчерпаны. Этим обусловлено и обязательное требование к алгоритму, суть которого в том, что каждая его ветвь должна заканчиваться выводом. Каждый вопрос обязательно направлен на признак, отсутствие или наличие которого в данном явлении должно быть установлено Поэтому вопрос всегда носит альтернативный характер.

Вопрос о детальности описания алгоритма решается в несколько ступеней. Во-первых, выделяются только наиболее важные (с точки зрения структуры алгоритма) этапы с указанием их содержания в общей форме и устанавливаются наиболее существенные связи между ними. Для этого выделяются этапы более крупные, чтобы можно было легко и в наглядной форме отразить общую структуру алгоритма. Во-вторых, производится ее дальнейшая детализация, путем разбиения крупных этапов на более мелкие и установления соответствующих связей между выделенными этапами. Это разбиение доводится до нужной степени детализации.

В этой части диссертации освещаются вопросы учета и других признаков, кроме установления строевых элементов схемы предложения и способов их выражения, для определения условий употребления тире. Важно не только то, чем выражены главные члены, но и их составы - распространенные или нераспространенные, лексико-синтаксические компоненты, оказавшиеся между подлежащим и сказуемым. Необходимо обратить внимание на контактное расположение (сочетаемость) - соположение языковых единиц (подлежащее и сказуемое находятся рядом, например: Смех - это человеколюбие (А. Толстой)), дистантную сочетаемость - соположение

языковых единиц на расстоянии (подлежащее и сказуемое разделены второстепенными членами предложения, например: Способ < воздействия киноискусства >. < его > орудие - это < очишенный до абстрактной идеальности общечеловеческий > жест. (А. Толстой). Такие члены предложения назовем, по О.И. Москальской, факультативными (1981,28). В предложении Храбрость - это <до конца осознанная > ответственность факультативными членами предложения будут считаться слова «до конца осознанная», грамматическое значение которых при разборе предложения по членам предложения устанавливается для «выявления» у слов именного класса формы именительного падежа.

При необходимости требуется учитывать и тип предложения -сложное или простое, поскольку простое предложение с тире между главными членами перед словом «это» может входить в состав сложного предложения (Какие соображения удерживают меня на той позиции, (что ликвидация (N1) простейшего зла - это не эпопея (N1))? (А.Толстой)) или «разрываться» еще одним простым предложением ((Каждая книга(Ы[) писателя, (если она написана кровью сердца), - это

воплотение(^) самых заветных его дум) (Гладкий).

Необходимость определения типа предложения вызывается, в основном, «совпадающими» случаями, когда условия постановки тире, заданные в алгоритме, могут совпасть с условиями «отрицательности» тире перед словом «это». Например: Последнее, (что я должен сделать (Inf). это еще раз рассказать (Inf) тебе о расстановке сил в Москве (Э.Успенский) (Inf - это Inf); Может ли русский писатель-эмигрант работать и просто существовать (Inf). это вопрос (N1)

выдуманный, а вовсе не принципиальный (В.Пьецух) (Inf - это N1). Примеры показывают знаковую позицию для тире, если признаки (условия) постановки тире будет определять машина, а не человек.

Прежде чем производить поиск необходимых слов, требуется также установить пределы, в которых он должен производиться. Показателями границ простого предложения являются союзы. Для алгоритма употребления тире в указанном случае это будут подчинительные союзы и союзные слова (что, который, где, потому что, когда, ли и др.), а также сочинительные союзы (а. и, но), являющиеся показателями того отрезка, в котором может находиться или отсутствовать слово «это». Например: Мерно, изредка озаряя из выхлопов землю, ползли они в разных его концах, и уже было видно, (что огоньки (N1pl) - это знакомые ему летучие мыши(^р!)), которыми

отмечены обочины (В.Лидин).

Фулькрумы - это определенные ключевые элементы предложения, то есть единицы, от которых начинаются поисковые операции, выполняемые алгоритмом (для данного алгоритма таким фулькрумом будет являться слово «это»). Обрабатывая фразу, алгоритм анализа не просто последовательно переходит от одного слова к другому, а как бы перепрыгивает от фулькрума к фулькруму (следующими фулькрумами, например, будут считаться словоформы в позиции слева - Nj, NuiTlj, Adj|, Inf или определенные факультативные члены между ними).

Решение задачи может проходить с использованием метода циклических прогонов. Это такая обработка текста, при которой алгоритм проходит по фразе не один, а несколько раз. Каждый такой «прогон» рассчитан на обнаружение определенного круга грамматических явлений, существенных для выявления синтаксической структуры фразы. Следовательно, для каждого прогона задаётся свой собственный набор фулькрумов и поисковых операций. Последовательность прогонов соответствует тому порядку, в котором происходит выявление синтаксической структуры: сначала выделяются группы членов предложения, затем устанавливаются отношения между этими группами и определяется синтаксическая структура предложения в целом.

Кроме того, при разработке алгоритма вопрос встал и о «синтаксической громоздкости» фразы (Севбо, 1981, 84), которая усложняет выбор тире машиной. Под «громоздкостью» предложения понимают такую линейную структуру грамматически правильного предложения, построенного без нарушений правил порядка слов данного языка, которая трудна для восприятия и делает данное предложение по терминологии Хомского «unacceptable» (Долинина, 1969, $6). Основным типом усложнения может быть введение одного (или нескольких) придаточного предложения или глагольного оборота. Появление громоздкости связано с усложнением групп приядерных членов предложения. Усложнение группы в любой неконечной позиции всегда приводит к увеличению глубины предложения (фразы). Глубина фразы связана с гипотезой В. Ингве о «глубине языка» (Долинина, 1969, 86; Ревзин, 1962, 140 и др.) и с давно известным в психологии фактом, что объем оперативной, т.е. непосредственной, памяти человека ограничен числом 7±2.

Анализ примеров предложений с тире между подлежащим и сказуемым перед словом «это» показал, что в предложениях, содержащих количество словоформ, равное числу 7±2, «совпадающих» случаев практически нет. Например: КаЕшШ^лото - это дремлющий во мне потенциалр(^) (А. Толстой). Это можно отнести и к тем «отрезкам»,

простим предложениям, входящим в состав сложного: Моя жена уверено, / что супружеские обязанности^) - ло прежде всего трезвость(М1) (С.Довлатов). При этом в подсчет не должны входить союзы, частицы и предлоги, а также слово «это».

Формализация предложения, учитывающая глубину предложения, нашла отражение в представленном нами алгоритме процесса постановки тире в предложении между главными членами перед словом «это».

Анализ предложений, в структуру которых входит слово «это», показал, что для автоматизации процесса постановки тире в предложении между главными членами перед словом «это» существует ряд определенных ограничений - исключений. Это отражено в структуре алгоритма.

На основе некоторых комбинаций языковых единиц, как, например, N( (Numj, Adjj, Inf)... - это одно (другое); ... то, что..., - это:..; ...одно (один, одна) из...- это; Nj (Numj, Adj(, Inf) - это самое (главное, важное, единственное); единственное, что..., - это...(то, что...);... - это то, что, проблему постановки тире перед словом «это» возможно решить практически безошибочно. Обеспечивается это тем, что в таких языковых комбинациях присутствуют регулярные формальные показатели - указанные слова. Это же можно отнести и к случаю употребления тире в предложении со словами это (и) есть; это как (раз); это одно (одна, один, одни) из... ; это когда; это (и) значит; это то, что. Эти случаи представлены в определенных алгоритмах работы.

Для апробирования компьютерной программы по автоматизации данной проблемы основная трудность - отсутствие специального автоматического словаря, распознающего части речи и словоизменение.

В третьем параграфе представлены инвариантные и вариантные структурные схемы простых предложений как основа алгоритмизации процесса постановки тире, алгоритмы для автоматизации 'данного процесса и даны комментарии к алгоритмам. В процессе работы над проблемой автоматической постановки тире в простом предложении (и если оно входит в состав сложного предложения) между главными членами перед словом «это» (и его эквивалентами) при отсутствии глагольной связки выяснилось, что практически полностью формализованными для автоматизации этой пунктуационной нормы могут быть только те предложения, которые имеют простую логическую структуру и в которых отсутствуют или присутствуют в строго ограниченном количестве факультативные (второстепенные) члены предложения, разделяющие подлежащее и сказуемое.

В работе представлены инварианты («чистые» структурные схемы), взятые из Г-70, Г-80 (T.II), и варианты структурных схем,

выведенные из инвариантов, для предложений подобного типа Вариантные структурные схемы отражают как контактное расположение главных членов, так и их дистантную сочетаемость.

Анализ примеров показал, что в простых предложениях с тире между главными членами перед словом «это» (и его эквивалентами) (при их вхождении в состав сложных предложений) с общим числом слов, не считая служебных, 7±2 могут быть определенные факультативные члены, кроме главных членов предложения. Информация о конкретных факультативных членах предложения, не только разделяющих главные члены, но и «до» и «после» тех компонентов, которые выступают в качестве условий пунктуационной нормы, указанная в компьютерной программе, может помочь избежать так называемых случаев «совпадения». Например: Через неделю целая пачка (N1) <писем подтвердила (Vfinit) > это предположение (N1)

(В.Песков. Таежный тупик). Наличие глагола в спрягаемой форме после N1 и до слова «это» - указательного местоимения - отменяет для компьютера постановку тире.

Методом пошаговой детализации общий лингвистический алгоритм был разбит на вспомогательные алгоритмы в количестве 21. Основой для построения таких алгоритмов послужили выделенные структурные схемы предложений указанного типа. Алгоритмы имеют названия струкщяшшс схем: 1) N, - это N,, 2) N, - это 3) N, - это Adv-o, 4) Nj - это Inf, 5) N, - это когда P [как N,, Adj,; одно из N2_6, Adj2_6; (и) есть, (и) значит Nj( Adj,, Inf), 6) N, - это Part-но, 7) N, - это то, что, 8) N, - это Adj,, 9) Inf - это ((и) значит; (и) есть) Inf [одно из N2.6, Adj^; как N,, Adj,, Inf], 10) Inf- это Adv-o, 11) Inf- это N2.6, 12) Inf - это N,, 13) Inf - это Part-но, 14) Inf - это Adj,, 15) Inf - это то, что, 16) Adj, - это N,, 17) Adj, - это N2.6, 18) Adj, - это Inf, 19) Adj, - это когда P [как N,, Adj,; одно из N2.6, Adj2.6; (и) есть, (и) значит N,, Adj,, Inf; то, что], 20) Adj, - это Adv-o (Part-но), 21) Adj, - это Adj,. Определены основные шаги алгоритмов. Одной из основных трудностей процесса автоматизации является омонимия связочного «это» и указательного местоимения «это», которая в некоторых случаях может сниматься указанием на род одного из компонентов структурной схемы.

На основе третьей главы можно сделать следующие выводы:

1. При построении моделей предложения для компьютерных алгоритмов требуется опираться на строение синтаксических единиц, элементы их структурных схем, способы выражения строевых элементов предложения. В автоматизации процесса постановки тире в

простом предложении учитывается синтаксическая специфика главных членов и различные способы их выражения.

2. Для автоматизации процесса постановки тире в простом предложении между главными членами перед словом «это» (и его эквивалентами) необходимы формализация и моделирование предложений данного типа в целях алгоритмизации этой пунктуационной нормы. Формализацией при этом является выделение структурных схем простого предложения (инвариантных в количестве 9 и вариантных) и построение математической модели. Во все структурные схемы входят связка «это» или связочные образования (эквиваленты «это»). Практически полностью формализованными предложениями могут быть для автоматизации те, которые имеют в своем составе не больше 5 словоформ от общего числа 7±2, по гипотезе В. Ингве, не считая слова «это» (и его эквивалентов), предлогов, союзов, частиц. В случае постановки тире в простом предложении между главными членами перед словом «это» (и его эквивалентами) выделяется в большей части формализуемая часть и - в меньшей -неформализуемый остаток, который представляет собой закономерное явление, распространяющееся как на систему естественного языка, так и на научное знание в целом.

3. Процесс автоматизации тире обеспечивается построением общего лингвистического алгоритма исследовательского прототипа, ориентированного на ЭВМ, и вспомогательных алгоритмов, детализирующих общий, в количестве 21, построенных на основе инвариантных и вариантных структурных схем. Определены основные шаги алгоритмов, «совпадающие» случаи - случаи исключения, т.е. отсутствие знака при всех «компьютерных» условиях его постановки. Решение задачи автоматизации данного процесса также обеспечивается построением математической модели структуры простого предложения с формантом «это» (и его эквивалентами).

В заключении делаются выводы обобщающего характера.

Формализация как метод и способ представления содержательной стороны объекта посредством фиксации его формы и оперирование нею с помощью языка специальных символов позволяет четко выделить главные черты при изучении объекта. Формализация является основой алгоритмизации, моделирования, компьютеризации языкового материала; обеспечивает процесс автоматической обработки текста, в которой автоматизируется то, что формализовано, для чего указаны формальные признаки. Для процесса автоматизации переработки материала на естественном языке необходимо моделирование языковых структур. Любая лингвистическая модель предполагает построение алгоритма, который формализует выполнение языкового процесса.

Формальное представление синтаксического уровня языка способствует процессу автоматизации системы пунктуации, делает возможным построение алгоритмов и программ автоматической постановки знаков препинания. В работе выделены соответствующие способы установления формальных признаков для процесса автоматизации знаков препинания. Исследование теоретического материала по синтаксису простого и сложного предложений, анализ фактического материала и отладка алгоритма вручную определили перспективу дальнейшего изучения данной проблемы.

Основные положения диссертации отражены в следующих публикациях:

1. К вопросу о компьютеризации лингвистических знаний на примере компьютерного обучения русскому языку в средней общеобразовательной школе // Актуальные проблемы филологии и методики преподавания. Межвуз. сб-к науч. тр. 4.2. Ростов н/Д: Изд-во РГПУ, 200 КС. 170-175.

2. Формализация и ее роль в языковых процессах // Сб-к научных работ аспирантов и молодых преподавателей. Ростов н/Д: Изд-во РГПУ, 2001. Ч. 2: Филология. С. 42-46.

3. О возможности формализации синтаксиса и пунктуации в автоматизированных системах общения // Единицы языка: функционально-коммуникативный аспект. Материалы межвузовской конференции. Ч. 1. Ростов н/Д: Изд-во РГПУ, 2001. С. 90-94.

4. Вопросы лингвистического обеспечения программирования и автоматизации некоторых процессов в редакционно-издательской деятельности // Известия Юж. отд. РАО и РГПУ. Вып. 4. Ростов н/Д: Изд-во РГПУ, 2003. С. 176-182.

Подписано в печать Формат 60х84/16. Бумага офсетная. Печать офсетная. Ооьсм 4,0 ф. п. л. Т1 граэ ю■ Заказ № /¿-<0/ РГПУ. 344082. г. Ростов-на-Дону, ул. Б. Садовая, 33

1

I,

11

«в - б 39 О

 

Оглавление научной работы автор диссертации — кандидата филологических наук Анненкова, Елена Алексеевна

Введение.

Глава 1. Формализация как метод теоретического исследования в языкознании.

§ 1. Понятие формализации в лингвистике и научном познании.

§ 2. Формализация в отечественном и зарубежном языкознании.

§ 3. Формализация и моделирование лингвистических процессов.

§ 4. Формализация и алгоритмизация лингвистических процессов.

§ 5. Новые тенденции формализации с точки зрения процесса автоматизации лингвистических знаний.

§ 6. Формализация синтаксического уровня языка и ее применение в системе пунктуации.

Выводы.

Глава 2. Формализация постановки тире в пунктуационной системе языка.

§ 1. Формализация постановки тире в предложении со словом это».

§ 2. Моделирование простого предложения и автоматизация его структурной организации.

§ 3. Структура простого предложения с формантом «это» (и его эквивалентами) между главными членами.

Выводы.

Глава 3. Автоматизация процесса постановки тире в простом предложении между главными членами перед словом «это» (и его эквивалентами).

§ 1. Решение задачи автоматизации процесса постановки тире в простом предложении между главными членами перед словом «это» (и его эквивалентами).

5Р § 2. Вопросы построения лингвистического алгоритма «Тире в простом предложении между главными членами перед словом «это» (и его эквивалентами)», ориентированного на ЭВМ.

§ 3. Автоматизация процесса постановки тире в простом предложении между главными членами перед словом «это» (и его эквивалентами).

3.1. Инвариантные и вариантные структурные схемы простых предложений как основа алгоритмизации процесса постановки

4 тире

3.2. Алгоритмы для автоматизации процесса постановки тире.

Алгоритм № 1 Ni - это Ni.

Алгоритм № 2 N1 - это N2-6.

Алгоритм № 3 Ni - это Adv-o.

Алгоритм № 4 Ni - это Inf.

Алгоритм № 5 Ni - это когда Р [как,№, Adji; одно из; (и) есть, и) значит Ni, Adji, Inf]. щ Алгоритм № 6 Ni — это Part-но.

Алгоритм № 7 Ni - это то, что.

Алгоритм № 8, Ni - это Adj i.

Алгоритм № 9 Inf - это ((и) значит, (и) есть) Inf [одно из N2-6,

Adj2-6; KaKNi, Adji, Inf].

Алгоритм № 10 Inf - это Adv-o.

Алгоритм № 11 Inf - это N2-6. > Алгоритм № 12 Inf - это Ni.

Алгоритм № 13 Inf - это Part-но.

Алгоритм № 14 Inf - это Adj l.

Алгоритм № 15 Inf — это то, что.

Алгоритм № 16 Adj i - это Ni.

Алгоритм № 17 Adj i - это N2-6.

Алгоритм № 18 Adj i - это Inf.

Алгоритм № 19 Adj i - это когда Р[как Ni, Adj i ;одно из N2-6, Adj2-6; и)есть (и) значит N1, Adji, Inf; то, что].

Алгоритм № 20 Ас^ 1 - это А(1у-о (РаЛ-но).

Алгоритм № 21 Аф 1 - это Аф 1.

3.3. Комментарии к алгоритмам.

Выводы.

 

Введение диссертации2004 год, автореферат по филологии, Анненкова, Елена Алексеевна

Проблема формализации лингвистических знаний на современном этапе развития языкознания является чрезвычайно актуальной. Это связано, во-первых, с тем, что информатизация мыслительной деятельности человека требует использования метода формализации как одного из методов научного познания и программирования различных типов языковых данных.

Во-вторых, продолжающаяся работа по созданию Машинного фонда русского языка, по словам А.П. Ершова, нуждается в разработке формализованного словаря русского языка и формальной грамматики, сравнимой по полноте с Академической грамматикой русского языка. Все это подчинено цели комплексной автоматизации лингвистических знаний и прикладных разработок в области языкознания, более полному и глубокому познанию природы языка в целом (Андрющенко, 1985, 54; Ершов, 1985, 51).

В-третьих, образованному фонду лингвистических алгоритмов и программ необходимы новые и усовершенствованные материалы (текстовые редакторы, автокорректоры, программы издательской подготовки, анализа и синтеза русской речи) для автоматизации разного рода работ. Поиски новых методов предупреждения и обнаружения ошибок и реализация этих методов на основе электронной техники еще не вышли из стадии научно-исследовательских разработок и экспериментов (Васильев, 1981,91).

В-четвертых, вопрос о возможностях и границах формализации в научном познании и лингвистке в том числе, о критериях формализуемого и неформализуемого остается спорным.

Научный интерес к проблеме формализации лингвистических знаний (на материале русской пунктуации) вызван и тем фактом, что отсутствуют работы в области пунктуации, посвященные данной проблеме, несмотря на то, что опыт формализации различных типов языковых данных, как показало исследование специальной литературы по этому вопросу, есть. Пунктуационная система, как считает Б.С. Шварцкопф (Ширяев, 1991, 148149), по своим основополагающим свойствам аналогична любой языковой системе (или подсистеме). При этом между естественными собственно языковыми системами, естественность которых представляется аксиоматичной, и пунктуационной системой отсутствуют существенные различия. Это позволяет предположить возможность формализации и в пунктуации.

На современном этапе научного развития формализация — это прежде всего автоматизация или путь к автоматизации. Именно кибернетика придала такое огромное значение научным и философским вопросам формализации, по-новому поставила вопрос о значении научной строгости.

При изучении проблемы формализации лингвистических знаний применительно к пунктуации выяснилось, что функции и правила употребления знаков препинания привлекали особое внимание исследователей на первом этапе работы над проблемой автоматизации перевода. Позднее интерес к этому вопросу уменьшился и уступил место «центральным» вопросам синтаксиса (Арапов, 1967, 52). Таким образом, пунктуация в прикладном аспекте, как мы установили, оказалась в числе наименее изученных вопросов.

Всестороннее рассмотрение данной проблемы приводит к обнаружению того, что многие задачи, связанные с автоматизацией лингвистических знаний, еще не решены (Герд, 1986, 92-93). Их решением занимается структурная, математическая, компьютерная и прикладная лингвистика, использующая методы формального анализа. Именно здесь формализация, ее принципы, приемы, способы играют важную роль по выявлению, представлению и уточнению содержания изучаемого явления через рассмотрение и фиксацию его формы и оперирование с нею.

Разработка формального аппарата для описания строения естественного языка, начавшаяся в 50-х годах XX века, основана на восходящем к Ф.де Соссюру представлению о языке как механизме, функционирование которого проявляется в речевой деятельности его носителей; ее результатом являются «правильные тексты» — последовательности речевых единиц, подчиняющиеся определенным закономерностям, многие из которых допускают математическое описание (Лингвистический энциклопедический словарь, 1990, 287).

Главной чертой языкознания 2-й половины XX века, как утверждает Ю.С. Степанов (1975, 34), является то, что лингвистические исследования имеют формальный характер. К проблеме формализации и формальным исследованиям в своих работах обращаются такие ученые, как Ю.Д. Апресян, A.B. Гладкий, В.А. Звегинцев, Ю.К. Лекомцев, Ю.Н. Марчук, И.А. Мельчук, Л.Л. Нелюбин, А.И. Новиков, Р.Г. Пиотровский, И.И. Ревзин, Ю.А. Шрейдер и др. Анализ фундаментальных работ этих авторитетных ученых дает наиболее полное представление о формализации и ее роли в языкознании.

Таким образом, актуальность диссертационного исследования состоит в том, что в нем в теоретическом и прикладном аспектах дается анализ проблемы формализации лингвистических знаний на материале пунктуационной системы русского языка. Это обусловило. выбор соответствующей темы диссертации, в центре внимания которой - проблема формализации и, в частности, формализации структуры простого предложения с тире между главными членами перед словом «это» (и его эквивалентами).

Объектом исследования данной работы является пунктограмма тире в простом предложении между главными членами перед словом «это» (и его эквивалентами).

Предмет исследования — формализация и автоматизация процесса постановки тире в рамках объекта исследования.

Цель диссертационной работы — исследование проблемы формализации и автоматизации процесса постановки тире в простом предложении между главными членами перед словом «это» (и его эквивалентами).

В соответствии с поставленной целью реализуются следующие частные задачи:

Изучение процесса формализации синтаксического уровня языка и возможности применения методов его формализации в системе пунктуации.

2. Обоснование возможности формализации и автоматизации процесса постановки тире в простом предложении между главными членами перед словом «это» (и его эквивалентами).

3.Выделение инвариантных структурных схем простого предложения со словом «это» (и его эквивалентами) между главными членами.

4. Построение математической модели; структуры простого предложения с формантом «это» (и его эквивалентами) между главными членами.

5.Составление общего лингвистического алгоритма «Тире в простом предложении между главными членами перед словом «это» (и его эквивалентами)» и вспомогательных алгоритмов, детализирующих общий алгоритм, по структурным схемам простого предложения (Общий и частные алгоритмы ориентированы на электронно-вычислительную машину).

Реализация цели и задач исследования опирается на общую философскую, общенаучную и частную методологию. В работе используются диалектический метод, метод восхождения от абстрактного к конкретному, системный подход. Приемами исследования являются анализ и синтез, абстрагирование и идеализация, индукция, дедукция и аналогия. К методам и приемам лингвистического исследования материала относятся как традиционные методы, так и методы и приемы прикладной лингвистики. Использовались лингвистический метод описания с такими приемами, как наблюдение, сопоставление, обобщение, классификация, а также структурные и конструктивные методы. В работе находят применение теоретические методы исследования - формализация и аксиоматический метод с приемами алгоритмизации и алгоритмического описания, гипотетико-дедуктивный метод и моделирование, в частности, графическое, логико-математическое и интуитивно-математическое моделирование, метод математической гипотезы, алгебраический метод — и эмпирические методы — мысленный эксперимент, метод теории автоматов, связанный с экспериментами. Кроме того, используется метод пошаговой детализации, принятый в информатике.

Материалом, на котором выполнено исследование, послужили структурные схемы двусоставных предложений со словом «это» (и его эквивалентами) между главными членами при отсутствии глагольной связки (в количестве 9 как основных, инвариантных, производных для составления алгоритмов), представленные в «Грамматике современного русского литературного языка» (1970), «Русской грамматике» (Т.Н, 1980), исследованиях Н.Ю. Шведовой (Шведова, 1967, 18-20). Материалом исследования явились также примеры из текстов художественных произведений и периодической печати, иллюстрирующие данные структурные схемы. Картотека составляет около 2 тысяч примеров.

Научная новизна предлагаемой диссертации состоит в том, что пунктуация и проблема употребления тире в простом предложении между главными членами при отсутствии связки перед словом «это» (и его эквивалентами) впервые исследуется в аспекте формализации и прикладном аспекте, что позволяет определить возможность автоматизации процесса постановки тире в указанном случае.

Теоретическая значимость работы состоит в том, что исследование проблемы формализации лингвистических знаний (на материале русской пунктуации) расширяет представление о методе формализации в языкознании, определяет возможность формализации пунктуационной системы языка, показывает логику и динамичность абстрактных языковых явлений, подтверждает тезис об однородности системы языка и системы программирования. Данное исследование является некоторым вкладом в теорию автоматической обработки текста, способствует дальнейшему продуктивному исследованию указанной проблемы.

Практическая ценность работы заключается в том, что исследование способствует пополнению созданного фонда лингвистических алгоритмов и программ по решению проблемы автоматизации данной пунктуационной нормы для текстовых редакторов, автокорректоров, программ издательской подготовки, одним из назначений которых является грамотная правка текста, находящегося в памяти ЭВМ. Кроме того, полученные результаты исследования могут послужить основой к составлению компьютерной программы по автоматизации процесса постановки тире в указанном случае, могут быть полезными при последующем изучении данной проблемы, при создании руководства, призванного усовершенствовать владение этим пунктуационным правилом. Также материалы работы могут быть использованы в школьной и вузовской практике преподавания русского языка, для создания обучающей компьютерной программы.

На защиту выносятся следующие положения:

1. Проведенное исследование показало, что метод формализации применим к синтаксическому уровню языка. Формальное представление синтаксического уровня способствует формализации пунктуационной системы языка. Для описания структуры системы знаков препинания могут быть использованы формальные способы порождающей грамматики.

2. Пунктуационную систему можно подвергнуть формализации. Формализация пунктуации основывается на структурно-синтаксическом (формально-грамматическом) принципе. Формализуется, в частности, случай постановки тире в простом предложении между главными членами перед словом «это» (и его эквивалентами). Здесь в большей степени выделяется формализуемая часть и - в меньшей - неформализуемый остаток. Этот определенный неформализуемый участок языка представляет собой закономерное явление, своего рода универсальный закон, распространяющийся как на систему естественного языка, так и на научное знание в целом.

3. Автоматизации процесса постановки тире в простом предложении между главными членами перед словом «это» (и его эквивалентами) способствует формализация структуры простого предложения с данной пунктуационной нормой, выделение структурных схем и их вариантов для предложений соответствующего типа.

4. Для решения задачи автоматизации указанного процесса возможно построение математической модели, представляющей структуру простого предложения с тире между главными членами перед формантом «это» (и его эквивалентами).

5. Автоматизация этого пунктуационного правила предполагает составление общего лингвистического алгоритма и вспомогательных алгоритмов, детализирующих общий алгоритм, по выделенным структурным схемам и их вариантам. Алгоритмы должны иметь определенную специфику — ориентацию на электронно-вычислительную машину.

Структура работы подчинена последовательной реализации цели и задач исследования. Диссертация состоит из Введения, трех глав, Заключения, Приложения, включающего общий алгоритм «Тире в простом предложении между главными членами перед словом «это» (и его эквивалентами)», списка источников лингвистического материала, списка литературы, в который включено 173 наименования работ по исследуемой теме.

 

Заключение научной работыдиссертация на тему "Проблема формализации лингвистических знаний"

Выводы по третьей главе

1. Для построения моделей простых предложений и лингвистического алгоритма исследовательского прототипа в целях автоматизации процесса постановки тире между главными членами перед словом «это» (и его эквивалентами) используются структурные схемы простых предложений со словом «это» (и его эквивалентами), взятые из «Грамматики современного русского литературного языка» (1970) и «Русской грамматики» (Т. И, 1980). Автоматизации подвергается 21 структурная схема из 25 структурных схем, включая инвариантные и вариантные схемы.

2. Решение задачи автоматизации обеспечивается построением структурных схем в качестве описательной информационной модели и ее формализацией - построением математической модели структуры простого предложения с формантом «это» (и его эквивалентами - это когда; это как; это (и) значит; это (и) есть; это одно из; это то, что) между главными членами. Решение задачи включает метод решения задачи — построение общего лингвистического алгоритма и вспомогательных алгоритмов, ориентированных на ЭВМ, по типу разветвляющегося алгоритма, описание метода решения с заданием исходных величин задачи: Ni, Numi, Adji, Inf, Adv-o, N2-6, Part-но (-то), слов когда; (и) значит; (и) есть; как; одно из ; то, что. Отладка алгоритмов проходит вручную с использованием примеров, иллюстрирующих данные структурные схемы предложений.

3. При составлении алгоритма для правила постановки тире устанавливается логически обусловленная последовательность операций для выяснения условий, которые определяют образование конструкций и постановку тире. Определены основные шаги алгоритма. Для разработки как общего, так и детализирующих алгоритмов, учитываются факультативные члены предложения, которые могут встречаться не только при дистантной сочетаемости главных членов, но и «до» и «после» главного элемента в левой или правой позициях структурной схемы от слова «это», тип предложения, дополнительная морфологическая информация, сведения о глубине предложения, используется способ фулькрумов и метод «циклических прогонов».

Показателями границ простого предложения со словом «это», если простое предложение входит в состав сложного, являются союзы и союзные слова. В предложениях, содержащих количество словоформ (без союзов, предлогов, частиц), равное числу 7±2, «совпадающие» случаи встречаются менее часто, чем в предложениях усложненного типа. При отладке алгоритма использовалось число 5. Одной из основных трудностей формализации для процесса автоматизации является омонимия связочного «это» и указательного местоимения это, которая в некоторых случаях может сниматься указанием на род одного из компонентов структурной схемы и использованием только определенных факультативных членов предложения.

4. При дальнейшей разработке алгоритма необходимо исследовать и учесть случаи употребления тире и двоеточия перед словом «это» в сложном предложении, если их постановка совпадает с «компьютерными» признаками тире перед словом «это» в простом предложении, а также тире перед словом «это» в двучленных бессоюзных сложных предложениях, случаи исключения, связанные, например, с омонимией связки «это» и указательного местоимения это.

Особый интерес для автоматизации процесса постановки тире перед словом «это» представляют такие комбинации языковых единиц, как, например, N1 (Numi, Adji, Inf). - это одно (другое); .то, что., — это; .одно (один, одна, одни) из. - это; N1 (Numi, Adji, Inf) - это самое (главное, важное, единственное); единственное, что . - это. (то, что.); . - это то, что, в которых формальные показатели - указанные слова — требуют постановки тире.

Заключение

В процессе исследования проблемы формализации лингвистических знаний, являющейся на современном этапе развития языкознания чрезвычайно актуальной в связи с автоматизацией лингвистического материала; формализации и автоматизации пунктуационной системы русского языка, а именно - проблемы формализации и автоматизации постановки тире в простом предложении между главными членами перед словом «это» (и его эквивалентами) мы пришли к следующему заключению.

1. Математическая логика и кибернетика сделали актуальными вопрос о познавательном значении и пределах формализации в различных науках и лингвистике в том числе. Формализация как метод и способ представления содержательной стороны объекта посредством фиксации его формы и оперирование нею с помощью языка специальных символов позволяет четко выделить главные черты при изучении объекта. Формализация, уточняя некоторый процесс, на основе которого строится математическое описание, также используется в языкознании. В лингвистике формализованный означает «исходящий из формы, основывающийся на особенностях выражения, служащий формой». Формализованное описание языка обеспечивает применение результатов лингвистического знания на практике. Формализация, таким образом, является основой алгоритмизации, моделирования, компьютеризации языкового материала.

2. Изучение проблемы формализации в отечественном и зарубежном языкознании показало, что формализация является логическим следствием тех результатов, к которым пришла структурная лингвистика, поэтому структурное описание является высшей степенью формализации. Лингвистические модели формализуют язык как структуру, и это дает основание для распространения на языкознание математических теорий и приемов исследования.

Для реализации цели и задач исследования важно, что мнение о том, что язык не относится к классу формализованных систем, не связано с прикладными формальными описаниями языковых фактов, которые употребляются с учетом их неполной адекватности для достижения ограниченных практических целей.

Установлено, что к методам формализованного представления систем относятся логические, лингвистические, семиотические и графические методы, к методам постепенной формализации задачи - структурно-лингвистическое и имитационное динамическое моделирование. Приемами формализации являются алгоритмизация и графическое исчисление. Существует идея постепенной формализации задачи, которая нашла применение в настоящем исследовании.

Выяснено, что процесс формализации тесно связан с моделированием. Лингвистическая модель представляет собой формализованное описание языковых единиц. Описательная лингвистическая модель формализуется тогда, когда она выражается с помощью схем, чертежей или геометрических объектов. Любая лингвистическая модель предполагает построение алгоритма, который формализует выполнение языкового процесса.

Полностью формализованными могут быть те содержательные области, которые имеют простую логическую структуру. Формализация в большей степени возможна там, где выражаемое содержание характеризуется стандартизированностью, но полного абстрагирования от содержания языковых единиц достичь чрезвычайно сложно.

Поскольку формализация обеспечивает процесс автоматической обработки текста, новым её способом является компьютерная формализация как основа компьютерного моделирования. В обработке текста автоматизируется то, что формализовано, для чего указаны формальные признаки. Для процесса автоматизации переработки материала на естественном языке необходимо моделирование языковых структур, которое предполагает формально-структурное членение объекта и выделение в нем формальных элементов.

3. Анализ специальной литературы позволил заключить, что формализация возможна и в пунктуации, т.к. пунктуационная система языка по своим основополагающим свойствам аналогична языковой системе (или подсистеме). Формализация языкового материала и формальное представление синтаксического уровня языка способствуют процессу автоматизации системы пунктуации, делают возможным построение алгоритмов и программ автоматической постановки знаков препинания. Для этого необходимо дать систему правил, по которым машина сможет проанализировать предложение. Синтаксические графы, деревья, системы синтаксических групп и др. наглядно представляют структуру предложения для его анализа.

Важным является то, что в работе выделены соответствующие способы установления формальных признаков для процесса автоматизации знаков препинания. Установлено также и то, что для такого процесса необходим учет структурного принципа русской пунктуации, т.к. машина может работать только на основе заданных в программе формальных признаков предложения. При построении моделей предложения для компьютерных алгоритмов требуется опираться на строение синтаксических единиц, элементы их структурных схем, способы выражения строевых элементов предложения. Так, в автоматизации процесса постановки тире в простом предложении учитывается синтаксическая специфика главных членов и различные способы их выражения.

4.В работе подтверждено, что для автоматизации процесса постановки тире в простом предложении между главными членами перед словом «это» (и его эквивалентами) необходимы формализация и моделирование предложений данного типа в целях алгоритмизации этой пунктуационной нормы. Формализацией при этом является выделение структурных схем простого предложения (инвариантных в количестве 9 и вариантных) и построение математической модели. Во все структурные схемы входят связка «это» или связочные образования (эквиваленты «это»). Нами было определено, что практически полностью формализованными предложениями могут быть для автоматизации те, которые имеют в своем составе не больше 5 словоформ от общего числа 7±2, по гипотезе В.Ингве, не считая слова «это» (и его эквивалентов), предлогов, союзов, частиц. Это подтверждает положение о том, что в случае постановки тире в простом предложении между главными членами перед словом «это» (и его эквивалентами) выделяется в большей части формализуемая часть и — в меньшей — неформализуемый остаток, который представляет собой закономерное явление, распространяющееся как на систему естественного языка, так и на научное знание в целом.

5. Процесс автоматизации тире обеспечивается построением общего лингвистического алгоритма исследовательского прототипа, ориентированного на ЭВМ, и вспомогательных алгоритмов, детализирующих общий, в количестве 21, построенных на основе инвариантных и вариантных 9 структурных схем. Определены основные шаги алгоритмов, «совпадающие» случаи — случаи исключения, т.е. отсутствие знака при всех «компьютерных» условиях его постановки.

Решение задачи автоматизации данного процесса также обеспечивается построением математической модели структуры простого предложения с формантом «это» (и его эквивалентами).

6. Исследование теоретического материала по синтаксису простого и сложного предложений, анализ фактического материала и отладка алгоритма вручную определили перспективу дальнейшего изучения данной проблемы. Так, целесообразно рассмотреть употребление слова «это» в сложных предложениях, сегментированных конструкциях, двучленных бессоюзных сложных предложениях и других случаях.

Новый, выявленный нами материал может быть использован при составлении компьютерной программы по автоматической постановке тире для общего лингвистического алгоритма или одного из вспомогательных алгоритмов; при решении проблемы автоматизации данной пунктуационной нормы для текстовых редакторов, автокорректоров, программ издательской подготовки. Полученные результаты исследования могут быть использованы и для создания руководств, призванных усовершенствовать владение правилами пунктуации, а также для написания обучающей компьютерной программы.

Думается, что проведенный нами анализ проблемы формализации лингвистических знаний (на материале русской пунктуации) открывает новые области, требующие специализированного исследования.

 

Список научной литературыАнненкова, Елена Алексеевна, диссертация по теме "Теория языка"

1. Автоматизация анализа научного текста. - Киев: «Наукова думка», 1984.

2. Автоматизация издательской деятельности. Ч. I. Применение текстового процессора Microsoft Word в настольных издательских системах. М., 1989.

3. Агеев В.Н. Семиотика. М.: Изд-во «Весь мир», 2002.

4. Актуальные вопросы структурной и прикладной лингвистики. М.: Наука, 1980.

5. Амирова Т.А. К истории и теории графемики. М.: «Наука», 1977.

6. Андрющенко В.М. 1985. Машинный фонд русского языка: постановка задачи и практические шаги // Вопросы языкознания. 1985. № 2.

7. Андрющенко В.М. 1993. Использование ЭВМ в лингвистических исследованиях // Вопросы языкознания. 1993. № 4.

8. Анисимов А.В. Компьютерная лингвистика для всех: Мифы. Алгоритмы. Язык. Киев: Наук, думка, 1991.

9. Апресян Ю.Д. Идеи и методы современной структурной лингвистики. -М.: Просвещение, 1966.

10. Ю.Арапов М.В. Система знаков препинания в русском языке. («Синтаксис знаков препинания».) // Труды III Всесоюзной конференции по информационно-поисковым системам и автоматизированной обработке научно-технической информации. Москва: ВИНИТИ, 1967, Т. 2.

11. Арутюнова Н.Д. Предложение и его смысл. М.: Наука, 1976. - 381 с.

12. Асиновский А.С., Кузнецова Е.Ж. и др. К вопросу об автоматизации лингвистических исследований // Вопросы языкознания. 1986. № 4.

13. Бабайцева В.В. Синтаксис и пунктуация.- М.: Просвещение, 1979.

14. Бабицкий К.И. К вопросу о моделировании структуры простого предложения //Проблемы структурной лингвистики. М.; Наука, 1962.

15. Базы данных России: Каталог. Москва: «НТЦ «Информрегистр», 1963.

16. Бектаев К.Б., Пиотровский Р.Г. Математические методы в языкознании. Ч И. Теория вероятностей и моделирование нормы языка. -Алма-Ата, 1973, -281с.

17. Белоногов Г.Г. 1973. Автоматизированные информационные системы. -М.: «Советское радио», 1973.

18. Белоногов Г.Г., Загика Е.А., Новосёлов А.П. 1987. Автоматизация лингвистической обработки словарей в системе НТИ. //Вопросы кибернетики. Прикладные аспекты лингвистической теории/ Под ред. А.П.Ершова. М., 1987.

19. Бидер И.Г. Добрина К.Н. Об одном способе формального описания синтаксиса. // Формальное описание структуры естественного языка. Сб. научных трудов /Под ред. А.С.Нариньяни. — Новосибирск, 1980.

20. Бирюков Б.В., Геллер Е.С. 1973. Кибернетика в гуманитарных науках. -М.: Наука, 1973.

21. Бирюков Б.В. 1974 Кибернетика и методология науки. М.: Нука, 1974.

22. Бирюков Б.В. 1985. Жар холодных чисел и пафос абстрактной логики. Формализация мышления от античных времен до эпохи кибернетики. -2-е изд. М.: Знание, 1985. - 192с.

23. Блинов Г.И. Методика изучения пунктуации в школе. М.: Просвещение, 1990.

24. Буторов В.Д Семантика // Лингвистические проблемы функционального моделирования речевой деятельности. Вып. II. Л.: Изд. Ленингр. ун-та, 1974.

25. Вайсберг Б.С. Многофункциональный текстовый редактор Multi-Edit; 5.00. Краткий справочник. «Обнинск», 1993

26. Валгина Н.С. Принципы русской пунктуации. — М., 1972.

27. Валгина Н.С. Русская пунктуация: принципы и назначение. — М.: Просвещение, 1979. 125 с.

28. Васильев В.И. 1981. Техника научного книгопечатания. — М., 1981.

29. Васильев Л.М. 1990. Теория и методология современного языкознания. Принципы знаковости и формальности языка. — Уфа, 1990.

30. Вашкевич Ю.Ф. и др. Редактор текстов ChiWriter. Справочник. М., 1993.31 .Ветров А.А. Методологические проблемы современной лингвистики. — М., 1973.т

31. Виноградов B.B. Проблемы современного русского правописания. — М., 1964.

32. Волкова В.Н. 1993. Методы формализованного представления систем. -С-П, 1993.

33. Волкова В.Н. 1999. Искусство формализации. С-П, 1999.

34. Волоцкая З.М Опыт построения русского языка в его письменной форме. Изд. «Наука», М., 1964.

35. Воройский Ф.С. Информатика. Новый систематизированный толковый словарь-справочник: (Вводный курс по информатике и вычислительной технике в терминах). 2-е изд., пер. и доп. — М.: Изд. «Либерея», 2001.- 536 с.

36. Гальперин И.Р. Информативность единиц языка. — М., 1974.

37. Гарвин П. Алгоритм синтаксического анализа. //Автоматический перевод.-М., 1971.

38. Гейн А.Г. Информатика: Учеб. Для 10-11 кл. общеобразоват. учр. — М., 2002.

39. Герд A.C. Русская морфология и Машинный фонд русского языка

40. Вопросы языкознания. 1986. № 6.

41. Гируцкий A.A. Общее языкознание: Учеб. пособие для студентов вузов / А.А.Гируцкий. Изд-е 2-е. - Мн.: «ТетраСистемс», 2001.- 304.

42. Гладкий A.B., Мельчук И.А. 1971. Грамматика деревьев. Опыт формализации преобразования синтаксических структур естественного языка. // Информационные вопросы семиотики, лингвистики и автоматического перевода. М., 1971. Вып. 1.

43. Гладкий A.B. 1985. Синтаксические структуры естественного языка вавтоматизированных системах общения. М.: Наука, 1985.

44. Горский Д.П. Гносеологические проблемы формализации. — Мн.: «Наука и техника», 1969.

45. Гусева Е.К. К проблеме понимания ЭВМ графематического уровня языка. // Кибернетическая лингвистика. М.: Наука, 1983.

46. Денисов П.Н. Принципы моделирования языка. М., 1965.

47. Дешериева Т.И. Некоторые проблемы грамматической семантики в связи с особенностями формализации в естественных языках // Вопросы языкознания. 1977. № 4.

48. Долинина И.Б. Гипотеза «глубины» и проблема « громоздкости» предложения. // Инвариантные синтаксические значения и структура предложения. Изд. «Наука», М., 1969.

49. Дудников A.B. Методика пунктуации в связи с изучением синтаксиса простого предложения. М., 1955.

50. Ершов А.П. Машинный фонд русского языка (Внешняя постановка вопроса) // Вопросы языкознания. 1985. № 2.

51. Ефимов М.В. Автоматизация технологических процессов. М., 1989.

52. Ибраев Л.И. Надзнаковость языка (К проблеме отношения семиотики и лингвистики)// Вопросы языкознания. 1981. № 1.

53. Избицкий Э. Инструкция по компьютерной технологии // Полиграфия. 1999. № 6.

54. Издательское дело и полиграфия. Допечатные процессы и оборудование/ Под ред. Б.С. Горбачевского. М., 1991.

55. Иомдин Л.Л. Автоматическая обработка текста на естественном языке. -М., 1990.

56. Иорданская Л.Н. О некоторых свойствах правильной синтаксической структуры // Вопросы языкознания 1963. № 4.

57. Искусственный интеллект: Справочник: в 3 кн. // Под ред. Э.В. Попова. М.: Радио и связь. 1990.

58. Использование ЭВМ в лингвистических исследованиях. Киев: Наук, думка, 1990.

59. Ицкович В.А. Опыт описания современной пунктуации. // Нерешенные вопросы русского правописания. -М.: Наука, 1974.

60. Коверин A.A. Экспериментальная проверка лингвистических моделей на ЭВМ. Иркутск, 1987.

61. Кодухов В.И. Общее языкознание. М., 1974.

62. Кокорина С.И. О реализации структурной схемы предложения // Вопросы языкознания. 1975. № 3.

63. Колодяжная Л.И. Автоматическое выделение фрагментов размеченной словарной статьи в филологических словарях. // Вопросы кибернетики. Прикладные аспекты лингвистической теории / Под ред. А.П.Ершова. -М., 1987.

64. Корнеев В.В., Гареев А.Ф. и др. Базы данных. Интеллектуальная обработка информации. М.: «Нолидж», 2000.

65. Крейдлин Г.Е. Математика помогает лингвистике. М.: Просвещение, 1994.

66. Ланда Л.Н. Алгоритмы и программированное обучение. М., 1965.

67. Лаптева O.A. К формально-функциональному моделированию системы устно-разговорного синтаксиса. // Вопросы языкознания. 1997. № 2.

68. Лекомцев Ю.К. Основные положения глоссемантики // Вопросы языкознания. 1962. №4.

69. Лекомцев Ю.К. Введение в формальный язык лингвистики. — М.: Наука, 1983.

70. Лингвистические вопросы алгоритмической обработки сообщений. -М.: Наука, 1983.

71. Лингвистическая прагматика и проблемы общения с ЭВМ. М.: Наука, 1989.

72. Лингвистические проблемы автоматизации редакционно-издательских процессов. Киев: Наук, думка, 1986.

73. Лингвистические проблемы функционального моделирования речевой деятельности. Вып. II. Л.: Изд. Ленингр. ун-та, 1974.

74. Ломтев Т.П. Основные направления в развитии структуры простого предложения в славянских языках. // Славянское языкознание. VII авг. 1973. Доклады советской делегации. М.: Наука, 1973.

75. Лосев А.Ф. Введение в общую теорию языковых моделей. М.: Наука, 1968.

76. Ляхович В.Ф. Основы информатики. Ростов н/Д: «Феникс», 1996.

77. Маковский М.М. Проблемы лингвистической комбинаторики // Вопросы языкознания. 1985. № 3.

78. Малаховский Л.В. О способах обработки знаков препинания при автоматическом переводе с английского языка на русский. // Статистика речи и автоматический анализ текста. Л.: Наука, 1971.

79. Малащенко В.П. 1966. Использование алгоритмов при обучении русскому языку. Изд. Рост, ун., 1966.

80. Малащенко В.П. 1978. Алгоритмы на уроках русского языка. Уч. Пособие. Ростов-на-Дону, 1978.

81. Малащенко В.П. 2001. Алгоритмический метод: проблемы и решения. Известия Юж. отд РАО. Вып. 3, Ростов-на-Дону, 2001.

82. Марчук Ю.Н. 1974. Некоторые тенденции в разработке информационных языков. // Машинный перевод и прикладная лингвистика. Вып. 17, 1974.

83. Марчук Ю.Н. 1983. Проблемы машинного перевода. М.: Наука, 1983.

84. Маслов Ю.С. Введение в языкознание. -М.: Высшая школа, 1975.

85. Машинный фонд русского языка: идеи и суждения. М.: Наука, 1986.

86. Мельчук И.А. 1963. Автоматический анализ текстов. // Славянское языкознание. М. 1963.

87. Мельчук И.А. 1964. Автоматический синтаксический анализ. Т. 1. -Новосибирск, 1964.

88. Мельчук И.А. 1974. Опыт теории лингвистических моделей. М.: Наука, 1974.

89. Методологические проблемы языкознания. Киев, 1988.

90. Методы программирования. М., 2000.

91. Моделирование языковой деятельности в интеллектуальных системах. -М.: Наука, 1987.

92. Моисеев А.И. Письмо и язык // Вопросы языкознания. 1983. № 6.

93. Москальская О.И. Проблемы системного описания синтаксиса. М.:наука, 1981.

94. Мороховская Э.Я. Основные аспекты общей теории лингвистических моделей. Киев «Вища школа», 1975.

95. Мусин К.А. Новости текстового процессора Microsoft Word для Windows 6.-М.: ABF, 1994.

96. Мустайоки А. возможна ли грамматика на семантической основе? // Вопросы языкознания. 1997. № 3.

97. Мухин А.М. Лингвистический анализ. Теоретические и методологические проблемы. Изд. «Наука», Лен. отд., Л., 1976.

98. Наумович А.Н. Современная русская пунктуация. Мн.: Вышейшая шк., 1988.

99. Нелюбин Л.Л. Рецензия на книгу «Закономерности структурной организации научно-реферативного текста» Киев, 1983 // Вопросы языкознания. 1989. № 3.

100. Никитина С.Е. Тезаурус по теоретической и прикладной лингвистике. (Автоматическая обработка текста) Изд. «Наука», М., 1978.

101. Новиков А.И. Семантика текста и ее формализация. М.: Наука, 1983.

102. Основы инженерной психологии. Учеб. для техн. вузов. / Под ред. Б.Ф. Ломова. М.: Высшая школа, 1986.

103. Падучева Е.В. Предварительное членение фразы при синтаксическом анализе. // Лингвистические исследования по машинному переводу. — М.: ВИНИТИ, 1961.

104. Пазухин P.B. Рецензия на книгу Ю.С. Степанова «Методы и принципы современной лингвистики. М.: Наука, 1975. // Вопросы языкознания. 1977. № 5.

105. Пиотровский Р.Г. 1979. Инженерная лингвистика и теория языка. — Л.: Наука, 1979.

106. Пиотровский Р.Г. 1981. Лингвистические аспекты «искусственного разума» // Вопросы языкознания. 1981. № 3.

107. Полиграфическая промышленность. Перспективы автоматизации издательских процессов. — М., 1974.

108. Попов Э.В. Общение с ЭВМ на естественном языке. М.: Наука, 1982.

109. Попов Э.В. 1987. Экспертные системы: Решение неформализованных задач в диалоге с ЭВМ. М.: Наука, 1987.

110. Почечуев А.Н. Вычитка рукописи. М., 1955.

111. Проблемы вычислительной лингвистики и автоматической обработки текста на естественном языке / Отв. ред. В.М.Андрющенко. -М.: Изд. Московского ун-та, 1980.

112. Проблемы рукописной и печатной книги. М. 1976.

113. Пумпянский АЛ. К вопросу о материальной стороне языка // Вопросы языкознания. 1986. № 3.

114. Развитие синтаксиса современного русского языка. М., 1966.

115. Распопов И.П. 1970. Строение простого предложения в современном русском языке. -М.: Просвещение, 1970.

116. Распопов И.П. 1973. Очерки по теории синтаксиса. Воронеж: Изд. Воронежского университета, 1973

117. Ревзин И.И. 1962. Модели языка. -М., 1962.

118. Ревзин И.И. 1967. Метод моделирования и типология славянских языков. -М.: Наука, 1967.

119. Реформатский A.A. 1933. Техническая редакция книги. Тория и методика работы. М., 1933.

120. Реформатский A.A. 1963. О перекодировании и трансформации коммуникативных систем. // Исследования по структурной типологии. -М., 1963.

121. Родичева Э.И. Об одном подходе к построению модели диалога «человек ЭВМ» на редуцированном проблемно-ориентированном языке. // Актуальные вопросы структурной и прикладной лингвистики. М.: Изд. Московского университета, 1980. - 232 с.

122. Рождественский Ю.В. Лекции по общему языкознанию. М.: «Высшая школа», 1990.

123. Рузавин Г.И. 1984. Математизация научного знания. М. 1984.

124. Рузавин Г.И. 1997. Логика и аргументация: Учебное пособие. М., 1997.

125. Румянцев М.К. Естественная и искусственная речь: языкознание. Кибернетика// Вопросы языкознания. 1986. № 5.

126. Севбо И.П. Графическое представление синтаксических структур и стилистическая диагностика. Киев: «Наукова думка», 1981.

127. Секерина И.А. Американские теории синтаксического анализа предложения // Вопросы языкознания. 1996. № 3.

128. Современный русский литературный язык: Учебник / Под ред. П.П. Леканта. -М.: «Высшая школа», 1982.

129. Степанов Ю.С. Методы и принципы современной лингвистики. — М., 1975.

130. Структурная и прикладная лингвистика. Сборник статей. Вып. 3 — Л.: Издательство Лен. университета, 1987.

131. Структурно-математические методы моделирования языка. Тезисы, докладов и сообщений. Ч.П. Киев, 1970.

132. Текстовый редактор. // Вычислительная техника и ее применение. — М., 1993, №3.

133. Теория и методология языкознания: Методы исследования языка. — М., 1989.

134. Турыгина Л.А. Моделирование языковых структур средствами вычислительной техники. — М., 1988.

135. Уханов Г.П. Типы предложений разговорной речи, соотносительные со сложными синтаксическими единствами. (Предложения с препозитивной придаточной частью) // Развитие синтаксиса современного русского языка. М., 1966.

136. Федоров А.К. Трудные вопросы синтаксиса. Пособие для учителя. — М.: Просвещение, 1972.

137. Филин В. Программное обеспечение в современной полиграфии 7/ Журналист, 2000, №11.

138. Фитиалов С.Я. О моделировании синтаксиса в структурной лингвистике. // Проблемы структурной лингвистики. М.: Изд. Академии наук СССР, 1962.

139. Фрид Э. Элементарное введение в абстрактную алгебру. М.: Мир, 1979.

140. Хансен К. Пути и цели структурализма // Вопросы языкознания. 1959. №4.

141. Хейс Д.Г. Методы исследований в области автоматического перевода. // Автоматический перевод. М. 1971.

142. Цыганенко A.M. Введение в автоматизацию редакционно-издательских процессов. М., 1990.

143. Шаляпина З.М. Автоматический перевод: эволюция и современные тенденции // Вопросы языкознания. 1996. № 2.

144. Шварцкопф Б.С. Современная русская пунктуация: система и ее функционирование. -М.: Наука, 1988. 192 с.

145. Шведова Н.Ю. 1964. Об активных процессах в современном русском синтаксисе // Вопросы языкознания. 1964. № 2.

146. Шведова Н.Ю. 1967. Парадигматика простого предложения в современном русском языке (опыт типологии). // Русский язык. Грамматические исследования. М., 1967.

147. Шведова Н.Ю. 1973. О соотношении грамматической и семантической структуры предложения // Славянское языкознание. VII августа 1973. Доклады советской делегации. М.: Наука, 1973.

148. Шемакин Ю.И. Начала компьютерной лингвистики. М.: МГОУ, «Росвузнаука», 1992. - 114 с.

149. Ширяев Рецензия на книгу Б.С. Шварцкопфа «Современная русская пунктуация: система и ее функционирование», М., 1988. / Вопросы языкознания. 1991. № 2.

150. Шрейдер Ю.А. О понятии «математическая модель языка». — М.: Знание. 1971.-64 с.

151. Электронная техника в процессах корректуры и редактирования. — М., 1973.

152. Юрченко В.В. Функциональный подход к формализации знаний. // Искусственный интеллект и проблемы организации знаний. М., 1991.

153. Якобсон Р. Язык в отношении к другим системам коммуникации. // Избранные работы. М., 1985.1. Словари и справочники.

154. Ахманова О.С. Словарь лингвистических терминов. — М., 1969.

155. Большая советская энциклопедия. 3 -е изд. — М.: «Советская энциклопедия». 1977.

156. Грамматика современного русского литературного языка. — М.: Наука. 1970.-767 с.

157. Зализняк A.A. Грамматический словарь русского языка: Словоизменение. Ок. 100 ООО слов. М., 1987.

158. Кондаков Н.И. Логический словарь. -М.: Наука, 1971.

159. Лингвистический энциклопедический словарь / Глав. ред. В.НЛрцева. М.: Советская энциклопедия», 1990.

160. Новейший философский словарь/ Сост. Грицанов A.A. Мн., 1998.

161. Орфография и пунктуация. Ростов-на-Дону, 1996.

162. Розенталь Д.Э. Справочник по орфографии и пунктуации. -Челябинск, Юж.-Урал. кн. издательство; М. АО «Столетие», 1996. -368 с.

163. Русская грамматика. Т. II. Издательство «Наука», М. 1980.

164. Толковый словарь русского языка / Под редакцией С.И. Ожегова, Н.Ю. Шведовой. М., 1999.

165. Толковый словарь по искусственному интеллекту. М., 1992.

166. Источники лингвистического материала Художественная литература

167. Алексеев С. Сокровища Валькирии: роман: В 2 кн.- М.: Ковчег. 1995.

168. Алешина Л. О вежливости, о такте, о деликатности. JL: Лениздат. 1990.-255 с.

169. Аксенов В. Остров Крым. М.: Изограф. 2000. - 320 с.

170. Аксенов В. Скажи изюм. М.: Изограф. 1999. - 408 с.

171. Акунин Б. Левиафан. М.: «Захаров», 2001.

172. Акунин Б. Пелагия и белый бульдог: Роман. М.: ООО «Изд-во Астрель», 2001.-288с.

173. Амонашвили Ш. Амон-Ра. Легенда о камне. М.: Беловодье, 2002. — 496с.

174. Бондарев Ю. Бермудский треугольник: Роман. М.: Мол. гвардия, 2000.-255с.

175. Бреславский Б.Б. Мёд и медолечение. Ростов-на-Дону: Молот, 1990. Ю.Довлатов С. Встретились, поговорили. - СПб.: Азбука, 2001. - 528с. П.Достоевский Ф.М. Дневник писателя: Избранные страницы. - М.:

176. Современник, 1989. 557с. 12.3алыгин С. Ирунчик: Повесть. — М.: Роман-газета, 1998, № 19.

177. Иванов A.C. Вечный зов: Роман. В 2-х кн. Красноярск: Гротеск, 1993.

178. Ильф И.А., Петров Е.П. Двенадцать стульев. Золотой телёнок: Романы. — Изд-во Ростовского унив-та, 1986. 656с.

179. Ким А. Отец-лес: Роман. М.: «Сов. писатель», 1989. - 400с.

180. Климов Г. Имя моё легион: Роман. Краснодар: «Сов. Кубань», 1994. -512с.

181. Куприн А.И. Повести. Ростовское книжное изд-во, 1980. — 320с.

182. Маканин В. Предтеча: Повесть. М.: Роман-газета, 2002, № 16.

183. Маринина А. Когда боги смеются: Роман. М.: Изд-во ЭКСМО-Пресс, 2000.-448с.

184. Маркова Е.Г. Актриса: Роман. М.: Изд-во «Олимп», 2001. - 349с.

185. Мурашова М. Просто жизнь. М.: Изд-во «Метагалактика», 2001. — 288с.

186. Набоков В.В. Приглашение на казнь. — М.: Слово, 1999. — 680с.

187. Пелевин В.О. Жизнь насекомых. М.: Вагриус, 2003. - 240с.

188. Пелевин В. Generation «П»: Роман. Рассказы. М.: Вагриус, 2001. -696с.

189. Пелевин В. Затворник и шестипалый. Желтая стрела: Повести. М.: Вагриус,2001. — 224с.

190. Пелевин В. Омон Ра. Принц Госплана: Романы и новеллы. М.: Вагриус,2001. - 398с.

191. Пелевин В. Чапаев и пустота: Роман. М.: Вагриус, 2001.

192. Песков В. Таёжный тупик. М.: Роман-газета, 2001 № 17.

193. Платонов А.П. Одухотворённые люди: Рассказы о войне. М.: Правда, 1986.-430с.

194. Платонов А. Ювенильное море //Антология русской поэзии и прозы. XX век. — М.: Изд. дом «Круглый год», 1994.31 .Поляков Ю.М. Козлёнок в молоке. М.: Роман-газета, 1996, № 14.

195. Поляков Ю.М. Небо падших. Демгородок. — М.: Роман-газета, 1996, № 14.

196. Пьецух В.А. Я и прочее: Циклы. Рассказы. Повести. Новая московская философия: Роман. М.: Худ. лит., 1990. - 334с.

197. Солоухин В.А. Каравай заварного хлеба. М.: Правда, 1986. - 416с.

198. Сухотина-Толстая T.JI. Дневник. М.: Правда, 1987. - 576с.

199. Токарева B.C. Мало ли что бывает.: Повести и рассказы. М.: ООО «Изд-во ACT», 2001. - 476с.

200. Толстой А.Н. Публицистика. Т. 10. М.: Сов Россия, 1975.

201. Трифонов Ю. Московские повести. М.: Сов. Россия, 1998. - 480с.

202. Успенский Э. Лжедмитрий второй настоящий: Роман. М.: Росмэн, 1999.

203. Хайрюзов В. Сербская девойка: Повесть. М.: Роман-газета, 1998, № 19.

204. Шаламов В. Рассказы //Антология русской поэзии и прозы. XX век. — М.: Изд.дом «Круглый год», 1994.1. Периодическая печать42.«Аргументы и факты» (газета), № 7, 17, 31-54, 2003; №1-7,2004.43.«Аргументы и факты на Дону» (газета), № 31-54,2003; № 1-7,2004.

205. Лингеистический алгоритм "Гире в простом предложении между главными тонами