автореферат диссертации по социологии, специальность ВАК РФ 22.00.01
диссертация на тему:
Методология и методика разработки компьютерных систем в социологии

  • Год: 1998
  • Автор научной работы: Чураков, Александр Николаевич
  • Ученая cтепень: кандидата социологических наук
  • Место защиты диссертации: Москва
  • Код cпециальности ВАК: 22.00.01
Автореферат по социологии на тему 'Методология и методика разработки компьютерных систем в социологии'

Полный текст автореферата диссертации по теме "Методология и методика разработки компьютерных систем в социологии"

«.»и

" > ■ Г "московский ГОСУДАРСТВЕННЫЙ ИНСТИТУТ - МЕЖДУНАРОДНЫХ ОТНОШЕНИЙ (УНИВЕРСИТЕТ) ' МИД РОССИЙСКОЙ ФЕДЕРАЦИИ

На правах рукописи

Алек

ЧУРАКОВ андр Н и к о/

\В и ч

МЕТОДОЛОГИЯ И МЕТОДИКА РАЗРАБОТКИ КОМПЬЮТЕРНЫХ СИСТЕМ В СОЦИОЛОГИИ

Специальность 22.00.01. - Теория, методология и история социологии

Автореферат диссертации на соискание ученой степени кандидата социологических наук

МОСКВА 1998

Диссертация выполнена в Институте социологии РАН

Научный руководитель:

доктор философских наук А.А. Давьщов

Официальные оппоненты:

доктор философских наук, профессор Г.С. Батыгин кандидат технических наук Ю.М. Плотинский

Ведущая организация: Институт системного анализа РАН

Зашла диссертации состоится " 2 У 1998г.

в /о "¿[асов на заседании диссертационного совета К.090.02.03 по социологическим наукам в Московском Государственном Институте Международных Отношений (Университете) МИД Российской Федерации по адресу: / ?/■/

Москва, проспект Вернадского, дом 76, аул. /

С диссертацией можно ознакомиться в библиотеке МГИМО (У) МИД РФ.

Автореферат разослан " ^-¿--сг^-А 1998г.

Ученый секретарь диссертационного совета кандидат философских наук

Чеснавская М.Н.

1. Общая характеристика работы

Актуальность. Быстрое развитие различных элементов информационного общества ставит перед социологией задачу создания новых методов изучения социальной реальности, адекватных произошедшим социальным, культурным и технологическим изменениям. Все это требует от российской эмпирической социологии активного использования современных компьютерных систем для анализа, моделирования и прогнозирования различных социальных явлений и процессов. Однако, недостаточная разработанность методологии и методики разработки социологического программного обеспечения сдерживает развитие и применение компьютерных систем в отечественной социологии.

Научная разработанность проблемы. В современной западной социологии компьютерные системы рассматриваются как весьма важный элемент теоретической и эмпирической деятельности, необходимость разработки которых вызывается требованиями времени и сложностью изучаемых социальных явлений и процессов. Многие исследователи предлагают заменить двухкомпонентную модель социологии (теоретические разработки и эмпирические исследования) на трехкомлонентную, добавив третий, компьютерный, компонент. Большое внимание, уделяемое в зарубежной социологии вычислительным экспериментам и построению компьютерных моделей, привело к появлению нового направления - "computational sociology" или "компьютерная социология"

В современной социологии активно разрабатываются и используются различные типы компьютерных систем. Для анализа количественных данных применяется более 100 различных статистических пакетов. Наиболее часто используются мощные

1 Hummon N.P., Fararo T.J. The Emergence of Computational Sociology // The Journal of Mathematical Sociology, 1995, 20, 2-3, p. 79-87.

универсальные пакеты BMDP, SPSS, SAS, Statgraphics, Systat, Statistica, Stadia и т.д. Анализ временных рядов осуществляется с помощью пакетов Эвриста, Олимп, Мезозавр, Forecast Expert и многих других.

Однако, возможности универсальных статистических пакетов не полностью соответствуют специфике социологии, так как они не предназначены для анализа качественной социальной информации. В связи с этим в современной зарубежной социологии возник специальный тип программного обеспечения для анализа качественных данных -CAQDAS (computer-assisted qualitative data analysis software). К этому типу относятся системы для контент-анализа текстовой информации, автоматического реферирования и рубрицирования документов, текстовые базы данных. В настоящее время активно создаются новые системы CAQDAS, например, пакеты HyperRESEARCH, MAX, ATLAS, Aquad, EDP и многие другие1.

В современной социологии компьютерное моделирование стало одним из базовых методов изучения социума2. Оно используется как при проведении эмпирических исследований, так и для проверки и уточнения теоретических гипотез. Используются различные виды

1 Evans iV. Computer-Supported Content Analysis: Trends, Tools and Techniques // Social Science Computer Review, 1996,-14, 3, p. 269-279. Jacques J. Analyses de contenu et de discours dans la recherche sociologique franaise: pratiques microinformatiques actueles et potentielles // Current Sociology / La Sosiologie Contemporaine, 1996, 44, 3, p. 279-290. Udo K. Computer-Assisted Qualitative Data Analysis Software in Germany // Current Sociology / La Sosiologie Contemporaine, 1996, 44, 3, p. 225-241. Miles M.B., Weitvnan E.A. The State of Qualitative Analysis Software: What Do We Need? // Current Sociology / La Sosiologie Contemporaine, 1996, 44, 3, p. 206-224.

2 Gilbert N. Using Computer Simulation to Study Social Phenomena // Bulletin de Methodologi Socioloque, 1995, 47, p. 99-111.

моделей, в том числе нелинейные причинные, графовые, нейронные сети и т.д.

Особое место в компьютерной социологии занимают системы искусственного интеллекта1. Сети фреймов используются для конструирования отдельных правил социальных взаимодействий, ассоциативные сети применяются для контент-анализа текстовой информации и построения компьютерных моделей, экспертные системы позволяют строить объяснительные модели, а также накапливать и обобщать полученные знания.

Активное использование вычислительной техники для решения социологических проблем вызвало разработку специальных алгоритмов для исследования процессов социальной самоорганизации, выяснения природы социальных закономерностей, извлечения социологических фактов из индивидуальных наблюдений, изучения вербальных взаимодействий2.

Процесс разработки социологического программного обеспечения можно также рассматривать с позиций программирования. Если методология создания отдельных программ и пакетов достаточно подробно исследована в программировании, то вопрос разработки компьютерных систем, базирующихся на развивающейся научной теории, практически не рассматривается. Это связано с тем, что в этом случае происходит качественное изменение методологии разработки программного обеспечения.

Активно развивающаяся в настоящее время инженерия программного обеспечения в основном базируется на системном подходе к разработке больших программных комплексов и определя'ется как конструирование (создание сложного продукта из простых) плюс

1 Carley K.M. Artificial Intelligence within Sociology // Sociological Methods and Research, 1996, 25, 1, p. 3-30.

2 Heise D.R. Sociological Algorithmns: Preface // The Journal of Mathematical Sociology, 1995, 20, 2-3, p. 73-77.

управление окружением (выбор средств и технологий реализации). При этом создание программного обеспечения рассматривается как типично инженерная задача разработки продукта с известными ограничениями для требуемых запросов. Оптимизирующие преобразования, повышающие качество программ при сохранении их смысла, получают все большее распространение как эффективное средство автоматизации построения качественных программ. Методы анализа программ позволяют во многих случаях доказать завершимость и частичную правильность программ.

В современном программировании рассматривается рад подходов, например, системный, систематический, объектно-ориентированный, позволяющих уменьшить количество ошибок и ускорить процесс разработки компьютерных систем. Конечная цель этого процесса -расширяемое программирование. Под ним понимается возможность конструирования таких иерархий модулей, когда каждый модуль добавляет новую функциональность в систему. Расширяемое программирование подразумевает, что добавление модуля возможно без необходимости вносить какие-либо изменения в существующие модули -не должно быть необходимости их перекомпилировать. Новые модули не только добавляют новые процедуры, но - что более важно - добавляют также новые (расширенные) типы данных.

В то же время в доступной автору социологической и компьютерной литературе не удалось обнаружить описания методологии и методики разработки компьютерных систем в социологии, что определило выбор темы исследования.

Объект исследования - компьютерные системы в социологии.

Предмет исследования - методология и методика разработки компьютерных систем в социологии.

Цель исследования - разработка компьютерных систем в социологии.

Задачи исследования: 1. Выявление методологии и методики разработки компьютерных систем в социологии.

2. Разработка компьютерной системы для контент-анализа текстовых материалов.

3. Разработка экспертно-диагностической системы для анализа и моделирования социальных систем.

Методологическая база исследования - компьютерная социология, включающая современные социологические теории, технологии разработки программного обеспечения, программную инженерию, компьютерное моделирование.

Организационная база исследования. Исследования проводились автором в Институте социологии РАН в 1993-1998 гг. в рамках академических научно-исследовательских проектов "Структурная гармония и дисгармония социальных систем" и "Законы социальных систем".

Новизна полученных результатов. Выявлена и практически реализована методология и методика разработки компьютерных систем в социологии. Разработаны две оригинальные компьютерные системы для контент-анализа текстовых материалов и модульного анализа и моделирования социальных систем.

Положения, выносимые на защиту:

1. Выявленная и практически реализованная диссертантом методология и методика разработки компьютерных систем в социологии, которую диссертант обозначает как "social software engineering" или "инженерия социологического программного обеспечения".

2. Разработанная диссертантом на основе "social software engineering" компьютерная система Контент-анализ Про 1.6, которая позволяет проводить частотный и смысловой анализ текста с автоматическим построением смысловых групп, определение тематической направленности текста, нахождение синонимичных выражений, поиск связей для данного термина в тексте, анализ совместной встречаемости словоформ, поиск фрагментов, содержащих заданные смысловые выражения, построение карт текстов и сравнение их между собой, вычисление стандартных коэффициентов (число слов, предложений, средняя длина предложения и т.п.) и интегральных характеристик

текста (лексическое разнообразие, структурная и грамматическая сложность), сравнение текстов по грамматическим, общесистемным и смысловым характеристикам с вычислением интегрального индекса идентичности, а также выполнять интервальное сравнение текстов. 3. Разработанная диссертантом на основе "social software engineering" экспертно-диагностическая система МАКС 3.0. В данной системе реализованы различные виды модульного, статистического, геоинформационного, геометрического, иерархического анализов в статике и динамике; имеется возможность моделирования социума в целом и его отдельных частей в режиме реального времени; реализованы процедуры сравнения различных социальных систем как между собой, так и с эталонами из базы знаний или пользовательскими эталонами; реализован автоматический поиск закономерностей; имеются возможности обучения системы, пополнения и уточнения ее базы знаний; автоматически генерируются прогнозы и т.д. Имеется возможность автоматической диагностики социальной системы, в результате которой система МАКС самостоятельно генерирует отчет на русском языке, содержащий диагностику системы, таблицы, графики и прогнозы, выявляет «слабые» и «сильные» стороны анализируемой системы, находит структурно-функциональные закономерности системы в статике и динамике.

Апробация результатов исследования. Методология, методика разработки и результаты применения компьютерных систем Контент-анализ и МАКС были доложены на ряде международных конференций, обсуждались на семинарах в научно-исследовательском комитете "Теория социальных систем" Российского общества социологов и семинарах по математическому моделированию социальных процессов на факультете социологии МГУ. Разработанные диссертантом компьютерные системы Контент-анализ и МАКС используются в различных организациях Российской Федерации, среди них:

Научные упреждения РАН - Институт социологии РАН, Институт системного анализа РАН, Институт философии РАН, Институт социально-политических исследований РАН.

Органы государственного управления РФ - Аналитическое управление администрации Президента РФ, Аналитическое управление Московской Городской Думы, аналитические центры глав администраций Нефтеюганска, Новгорода, Тольятти, Красноярска.

Высшие учебные заведения - факультет социологии МГУ, кафедра социологии МГИМО (У) МИД РФ, факультет социологии удмуртского государственного университета, факультет социологии красноярского государственного университета.

Коммерческие предприятия - телекомпания ОРТ, Акционерная компания "Алмазы России-Саха", Фонд "Общественное мнение", Московское предприятие МИГ, рекламное агентство "Партнер" и 25 других коммерческих фирм в городах: Калининград, Нижневартовск, Екатеринбург, Минск, Алма-Ата.

Структура диссертации. Диссертация состоит из введения, трех глав, заключения, списка литературы и приложений.

2. Основное содержание работы

Во введении обосновывается актуальность темы, выделяется проблема, объект и предмет исследования, его цель и задачи, определяется новизна работы.

Глава 1 "Компьютерные системы в социологии" состоит из двух параграфов.

В первом параграфе первой главы рассматриваются составные части информационного общества (компьютеры, информационные сети, программное обеспечение), особенности компьютерных систем и перспективы развития социологии в условиях информационного общества.

Массовая компьютеризация приводит к изменению всех сфер жизнедеятельности общества. Бурное развитие глобальных информационных сетей в последние годы кардинально изменило образ

жизни миллионов людей. Персональный компьютер перестал быть средством только для обработки информации и стал средством ее доставки и общения между людьми, существенно превосходящим по своим возможностям телевидение и телефон. К настоящему времени практически полностью завершилось объединение около 50000 различных региональных, локальных и международных информационных сетей в общемировую информационную сеть Интернет. Более 100 миллионов людей во всем мире (из них в России только около 150 тыс. человек) являются пользователями Интернета, и это число удваивается каждый год.

Развитие информационной сферы в настоящее время напрямую связывается с открытостью общественного устройства, действенностью феномена общественного мнения и степенью зрелости общества. В социологии начали изучаться такие явления, как компьютерное сообщество, киберпространство, отношения индивида и информационного общества и т.д.

Развитие информационного общества потребовало создания новых технологий анализа поступающей информации. Среди них можно отметить использование архитектуры хранилища данных (data warehouse), средств оперативной аналитической обработки данных или OLAP (Online Analytical Processing), создание информационных систем руководителя (Executive Information System), средств поддержки принятия решений (Decision Support System), средств data mining (например, нейронных сетей и динамических экспертных систем).

В информационном хранилище данные организуются по предметному принципу и накапливаются с течением времени, что позволяет производить анализ получаемых таким образом временных рядов. Информация в хранилище объединяется в целостную структуру по различным уровням детализации, где центральное место занимают метаданные - данные о данных.

Технология OLAP опирается на архитектуру клиент/сервер и многомерное представление данных, имеющее в своей основе единую логическую структуру. Особое внимание уделяется поддержке

многопользовательского режима работы, обеспечивающего возможность параллельного доступа к данным, а также их защиты и целостности при одновременной работе нескольких пользователей.

Одним из новых направлений анализа данных является использование нейронных сетей. Они являются альтернативой традиционным статистическим методам, поскольку не предполагают наличия каких-либо взаимосвязей между переменными, слабо чувствительны к неполной или искаженной информации и позволяют легко автоматизировать процесс ввода и первичной обработки данных.

Традиционным средством «интеллектуального» анализа информации являются экспертные системы. Методы искусственного интеллекта значительно ускоряют процесс разработки программ для решения конкретных задач и делают эти программы самообучающимися в процессе работы. Они применяются для анализа изменяющихся во времени данных, одновременного контроля за несколькими взаимосвязанными процессами, моделирования реальных систем и прогнозирования их поведения в будущем.

Данные направления анализа требуют разработки соответствующих компьютерных систем, поскольку традиционно используемые социологами отдельные программы и пакеты для статистического анализа данных не полностью удовлетворяют потребностям социологии при изучении информационного общества.

В последнее время за рубежом бурно развивается так называемая "компьютерная социология", которая включает социологию Интернет, анализ, моделирование и прогнозирование социальных явлений и процессов с помощью новых информационных технологий и разработку соответствующих компьютерных систем.

Во втором параграфе первой главы рассматривается разработка программного обеспечения как метод познания социальной реальности.

Социальные, культурные и технологические изменения в обществе оказывают большое влияние на методы познания социальной реальности. Широкое распространение компьютерной техники и быстрое

развитие различных элементов информационного общества соответственно приводят к изменению социологических методов.

Процесс разработки компьютерных систем также может использоваться как средство познания'социальной реальности. Для этого необходимо построение такой структурной схемы компьютерной системы и такая организация процесса разработки, которые приводили бы к получению нового содержательного знания о социальной реальности.

При разработке программного обеспечения традиционно выделяют два типа задач. Прямая задача - предсказание неизвестных значений параметров по известным законам. При разработке подобных систем не происходит накопления новых знаний, так как математическое описание используемых методов полностью известно еще до начала разработки программ и сам процесс разработки сводится к написанию программ по заранее известным алгоритмам. Обратная задача - построение математической модели ненаблюдаемых характеристик, т.е. нахождение законов, описывающих поведение исследуемой системы и ее математическая диагностика. Эта задача является значительно более сложной и разработка программного обеспечения в этом случае может выступать в качестве метода познания социальной реальности.

Для познания социальной реальности необходимо интегрировать в одной компьютерной системе подходы, относящиеся к гуманитарной, естественно-научной, математической и социально-инженерной парадигмам социологии. В связи с этим компьютерная система должна объединять в себе различные технологии анализа информации, присущие каждой из парадигм. В результате такая система должна состоять из статистического пакета, классической экспертной системы или базы знаний, системы "data mining" или системы обнаружения знаний, а также системы представления знаний.

В начале процесса разработки компьютерной системы, как правило, известны только некоторые объекты, которыми будет оперировать программа. Отсюда следует необходимость создания гибкой архитектуры программы, которая будет позволять безболезненно вводить новые объекты и произвольно модифицировать свойства уже имеющихся

объектов и систему взаимосвязей между ними. Для этого на этапе анализа задачи необходимо таким образом спроектировать программу, чтобы обеспечивалась возможность ее циклического развития, когда созданные блоки программы дают возможность получить новые знания, а они позволяют реализовать новые модули программы.

В результате процесс познания социума можно отождествить с раскручивающейся спиралью, когда, начав с некоторого представления о социальной реальности, мы в процессе его программной реализации получаем новые знания, которые дополняют и видоизменяют исходное представление. Программная реализация полученного представления опять позволяет получить новые знания и, следовательно, вновь изменить представление зздачи.

Подобная деятельность значительно выходит за рамки принятого в программировании термина "программная инженерия", поэтому мы предлагаем ввести для нее название "social software engineering" или "инженерия социологического программного обеспечения". Определить этот термин можно как комбинированный научно-практический подход к разработке социологического программного обеспечения, с помощью которого познается социальную реальность.

Глава 2 "Методология и методика разработки компьютерной системы для контент-анализа".

В первом параграфе второй главы описывается эволюция разработки системы "Контент-анализ" для анализа текстов. Разработка данной системы была начата диссертантом в 1995 году. Одной из причин создания данной системы стала потребность социологов в простой, эффективной и доступной компьютерной системе анализа текстов, а также отсутствие некоторых видов анализа тестов в известных зарубежных системах контент-анализа. Контент-анализ изначально проектировался для работы в среде Microsoft Windows, что позволило значительно упростить процесс создания пользовательского интерфейса, уйти от ограничений MS-DOS на объем используемой программой оперативной памяти, облегчить обмен информацией с другими программами.

Все версии системы Контент-анализ были написаны диссертантом на языке С++ с использованием библиотеки OWL (Object Windows Library). Объектно-ориентированный подход, использованный при разработке, позволил значительно уменьшить трудоемкость создания пользовательского интерфейса системы. Внутреннее представление текста в программе также является полностью объектно-ориентированным, что дает возможность легко объединять и сравнивать смысловые группы. Алгоритмы анализа текста базируются на бинарных деревьях, что позволяет значительно сократить время поиска каждого слова.

При создании версии 1.5 были разработаны специальные методы анализа больших текстов без загрузки их в оперативную память. Созданы специальные методы сравнения текстов по грамматическим и смысловым характеристикам с использованием разработанного автором оригинального индекса идентичности.

В версии 1.5 была реализована возможность создания пользовательских словарей. Они давали возможность автоматического объединения в группы сходных по смыслу слов. Было предусмотрено создание произвольного количества словарей, что позволило анализировать различные тексты, т.к. разница в смысловой направленности текстов приводит к тому, что для некоторых документов одни и те же слова являются синонимами, а для других - нет. Использование различных пользовательских словарей для таких случаев позволило адекватно формировать различные смысловые группы.

Процесс разработки системы Контент-анализ является примером последовательного совершенствования компьютерной системы без принципиальных изменений ее базовых принципов. Новые методы анализа текстов не заменяли ранее созданные методы, а дополняли их. В этом смысле. Контент-анализ - это компьютерная система, основывающаяся на описательном подходе.

В втором параграфе второй главы диссертации приводится описание системы Контент-анализ Про (версия 1.6). Она позволяет проводить частотный и смысловой анализ текста с автоматическим построением смысловых групп, определение тематической

направленности документов, нахождение синонимичных выражений с использованием словарей и критериев сходства словоформ по грамматическим признакам.

Контент-анализ 1.6 позволяет проводить поиск связей для данного термина в тексте, анализ совместной встречаемости словоформ. Это дает возможность определять отношение автора к описываемым проблемам, событиям и лицам.

Рис. 1. Структура системы Контент-анализ

При анализе текста вычисляются стандартные числовые коэффициенты (число слов, предложений, средняя длина предложения и т.п.) и интегральные характеристики текста (лексическое разнообразие, структурная и грамматическая сложность). В состав пакета Контент-анализ 1.6 была включена разработанная автором совместно с Д.В. Дубренским программа Алекс, являющаяся средством data mining. Она позволяет находить функциональные закономерности между

числовыми характеристиками различных текстов, что полностью отвечает исследовательскому предназначению системы. Возможны выбор набора функций для построения формул и проверка найденных зависимостей на устойчивость и достоверность.

Система Контент-анализ позволяет производить сравнение текстов по группам, словоформам и коэффициентам с вычислением интегрального индекса идентичности, а также интервальное сравнение текстов. Наличие нескольких методов сравнения текстов позволяет выявлять их сходство по грамматическим, общесистемным и смысловым характеристикам, определять авторство текста.

Также в Контент-анализе версии 1.6 реализованы средства полнотекстового поиска информации. Они позволяют превратить набор разнородных документов, хранящихся на конкретном компьютере, в базу текстовых данных. По результатам поиска производится построение карт текстов и сравнение их между собой. Анализ карт текстов является оригинальной разработкой диссертанта и позволяет выяснить периодичность появления нужной информации и информационную насыщенность частей текста или всего документа в целом.

С целью упрощения анализа текстовых документов, созданных в популярном редакторе Microsoft Word, в состав системы Контент-анализ 1.6 была включена специальная программа для этого редактора, которая осуществляет автоматический перенос текстовых документов из Microsoft Word в Контент-анализ. Анализ переданного текста может осуществляться параллельно с работой в других программах.

Глава 3 "Методология и методика разработки экспертно-диагностической системы для анализа и моделирования социальных систем".

В первом параграфе третьей главы анализируется эволюция разработки экспертно-диагностической системы МАКС для анализа и моделирования различных социальных систем. Данная система основана на модульной теории социума. Выбор данной теории был обусловлен работой диссертанта в научно-исследовательском проекте "Законы социальных систем" в Институте социологии РАН. Модульная теория

социума в тот момент позволяла реализовать три вида анализа данных: анализ одного модуля, анализ совокупности модулей, как некоторой системы, и иерархический анализ.

Разработка версии 1.0 системы МАКС была начата диссертантом в 1992 году. Первоначально планировалось создание небольшой компьютерной программы, базирующейся на модульной теории социума. Так как система МАКС предназначалась для широкого круга пользователей, то нее была выбрана операционная система MS-DOS и язык программирования Си, что позволило написать переносимую и компактную программу (размер исполняемого модуля 69 Кбайт). МАКС изначально создавался как экспертно-диагностическая система и уже в первой ее версии был реализован блок диагностики. Этот блок позволял диагностировать исследуемую социальную систему по ряду ее системных параметров. Эффективное взаимодействие человека и ЭВМ обеспечивал дружественный пользовательский интерфейс программы, основанный на системе меню.

Использование первых версий системы МАКС ддя проведения различных вычислительных экспериментов с массивами реальных данных позволило существенно расширить модульную теорию социума, дополнив ее рядом новых методов. Были найдены новые числовые коэффициенты, описывающие структурно-функциональные

характеристики исследуемой социальной системы. Пользователи системы своими советами и замечаниями внесли значительный вклад в дальнейшее развитие МАКС. Для решения задач, стоящих перед пользователями системы, были созданы различные методы сравнения, позволяющие оценивать уровень различия между сопоставляемыми объектами, и оригинальные методы динамического анализа данных, дающие возможность исследовать структурно-функциональные изменения, происходящие в анализируемой социальной системе с течением времени.

Версия 2.0 экспертно-диагностической системы МАКС создавалась диссертантом в 1993-1994 годах также для работы в среде MS-DOS, что позволило использовать ее на всех типах компьютеров. В качестве языка

программирования был выбран язык С++ (компилятор Borland С++ версии 3.1), использующий объектно-ориентированную технологию разработки программ. Поскольку изначально предполагалось, что пользователями МАКС будут люди, имеющие малый опыт работы с компьютером (социологи, системные аналитики, эксперты), то была создана максимально дружественную среда общения человека и компьютера. Это было реализовано с помощью HAMMER-методологии организации пользовательского интерфейса.

Процесс разработки системы МАКС является примером совместного развития компьютерной системы и научной теории. Результаты, получаемые с помощью МАКС, позволяли существенно расширить модульную теорию социума, что, в свою очередь, давало возможность создать новый вариант компьютерной системы. В результате этого итеративного процесса были найдены новые представления о социальной реальности, были разработаны новые методы анализа данных и числовые коэффициенты, а также разработаны новые правила интерпретации полученных результатов. Система МАКС превратилась в обучаемый пользователем научный инструмент, позволяющий не только исследовать социальные системы различными методами (см. рис), но и продуцировать содержательные знания.

Рис. 2. Структура экспертно-диагностической системы МАКС 2.0

Качественный анализ

Создание новых модулей ]

( Прогноз поведения ! ' Ч существующих I 1 динамических модулей.

Разработка системы МАКС была сопряжена со значительными трудностями в связи с нестандартностью решаемой задачи. Каждая версия системы фактически проектировалась и создавалась заново без использования фрагментов кода предыдущего варианта. От версии к версии переносились только общие концепции и накопленные знания. Это было связано с тем, что представления о социуме, претерпевали значительные изменения в процессе анализа реальных социальных систем и вычислительных экспериментов.

Пользовательский интерфейс системы МАКС за время ее развития претерпел значительные изменения. В то же время в каждой версии сохранялась базовая концепция "рабочего стола", на котором располагаются анализируемые данные, а сверху над ними размещаются инструменты анализа.

В втором параграфе третьей главы приводится описание экспертно-диагностической системы МАКС (версия 3.0).

Диссертант в 1996-1998 годах разработал версию 3.0 компьютерной экспертно-диагностической системы МАКС для анализа и

конструирования различных социальных систем. В данной версии системы реализованы различные виды модульного, статистического, геоинформационного, геометрического, иерархического анализов в статике и динамике; имеется возможность моделирования социума в целом и его отдельных частей в режиме реального времени; реализованы процедуры сравнения различных социальных систем как между собой, так и с эталонами из базы знаний или пользовательскими эталонами; реализован автоматический поиск закономерностей; имеются возможности обучения системы, пополнения и уточнения ее базы знаний; автоматически генерируются прогнозы и т.д. Имеется возможность автоматической диагностики социальной системы, в результате которой система МАКС самостоятельно генерирует отчет на русском языке, содержащий диагностику системы, таблицы, графики и прогнозы, выявляет «слабые» и «сильные» стороны анализируемой системы, находит структурно-функциональные закономерности системы в статике и динамике.

В версии 3.0 МАКС реализованы: анализ модуля (элементарной структурной единицы системы), анализ системы в конкретный период времени, анализ системы в целом, сравнение модулей и систем, динамический анализ модулей и систем, а также их диагностика.

Анализ модуля включает в себя расчет 20 различных статистических, информационных и системных характеристик, в частности, одномерные статистики и частотные распределения, энтропия, избыточность, пропорция, сложность и т.д.

Анализ системы в конкретный период времени содержит расчет 9 общесистемных и информационных характеристик, в том числе числа модулей, пропорции, суммарной энтропии и избыточности.

Анализ системы в целом включает в себя представление системы в виде поверхности в 3-х мерном пространстве и вычисление 16 ее характеристик: кривизны, размаха, высоты, размера, полноты, числа пустых ячеек и т.д.

В системе МАКС реализована оригинальная процедура сравнения модулей, систем в разные периоды времени и систем в целом с расчетом разработанного автором интегрального индекса идентичности.

Динамический анализ реализован для модуля и системы с автоматическим прогнозированием их характеристик, оценкой погрешности и визуализацией результатов.

Система МАКС предоставляет возможность написания диагностики по любой произвольной комбинации числовых характеристик модулей и систем. Система позволяет составлять диагнозы, модифицировать их в процессе работы, привязывать их к вычисляемым' характеристикам и выводить в процессе анализа все диагнозы, удовлетворяющие полученным значениям коэффициентов.

Реализованы процедуры моделирования модуля и системы одновременно по многим показателям в автоматическом режиме. При моделировании используется визуализация изменений системы, что позволяет находить ее «сильные» и «слабые» стороны, прогнозировать управленческие воздействия, находить оптимальные стратегии повышения стабильности или "варианты скорейшего разрушения системы. Информация в процессе моделирования отображается в графической форме, что значительно упрощает ее восприятие пользователем. Важной особенностью является возможность иерархического моделирования, когда пользователь, изменяя какой-либо модуль, тут же получает информацию о том, как это изменение влияет на всю систему в целом. При моделировании могут использоваться несколько стратегий построения оптимальной структуры модуля (модульный анализ, классическая статистика и экспертные оценки).

В заключении диссертации подведены итоги проведенного исследования и сделаны выводы, которые имеют теоретическое и практическое значение, намечен ряд перспектив дальнейшего развития данного направления.

3. Основные публикации автора по теме диссертации

1. Чураков А.Н. МАКС - компьютерная экспертно-диагностическая система для анализа социальных циклов. // Тезисы международной конференции "Циклические процессы в природе и обществе", г. Ставрополь 18-23 октября 1994 г. с. 163. (в соавторстве)

2. Чураков А.Н. Модульный анализ структуры зарегистрированных преступлений в Российской Федерации // Социологические исследования, 1995, №5 с. 116 - 122.

3. Чураков А.Н. Компьютерное оснащение социологических исследований // Социологические исследования 1996, №5 с. 103 - 107.

4. Чураков А.Н. Измерение идентичности социальных систем // Социологические исследования 1996, №11 с. 85 - 90 (в соавторстве)

5. Чураков А.Н. Компьютерный контент-анализ. Москва, ИСАН, 1996. 2,8 п.л.

6. Чураков А.Н. Компьютерные системы МАКС и Контент-анализ. Тезисы научно-технической конференция студентов, аспирантов и молодых специалистов МИЭМ. Москва 24-27 марта 1997 г. с. 199.

7. Чураков А.Н. МАКС (версия 3.0) - компьютерная экспертно-диагностическая система для прогнозирования социальных процессов// Тезисы международной конференции "Циклические процессы в природе и обществе", г. Ставрополь 16-21 октября 1997 г.

8. Чураков А.Н. Информационное общество и эмпирическая социология // Социологические исследования, 1998, №1 с. 35-44.