Последовательность действий при анализе данных

В зависимости от программных целей исследования анализ полученных данных может быть более или менее глубоким и основательным.

Цель исследования определяет уровень анализа в том смысле, что либо позволяет, либо запрещает прекратить его на какой-то стадии. В полном же объеме, т. е. от первого до последнего шага, последовательность действий социолога при анализе эмпирических данных может быть представлена следующим образом.

Первая стадия — описание всей совокупности данных в их простейшей форме. Предварительно осуществляется общий контроль качества полученной информации: мы выявляем ошибки и пропуски, допущенные при сборе данных и при вводе их в компьютер для обработки, бракуем какие-то единицы выборочной совокупности, не отвечающие модели выборки (коррекция выборки), отсеиваем некомпетентных респондентов (изымаем их данные полностью или частично), производим другие контрольные действия, которые на социологическом жаргоне называют чисткой массива.

Дальше следует собственно описание: мы используем аппарат дескриптивной статистики для упорядочения всех данных по отдельным признакам (переменным). Изучаются простые распределения, выявляются аномалии и скошенности, рассчитываются показатели средней тенденции, вариации распределений.

Все это необходимо для решения двух задач: (1) общей оценки выборочной совокупности и частных под-выборок (половозрастных, социально-профессиональных и других) с тем, чтобы понять, каким образом особенности выборок будут сказываться на интерпретации того или иного частного вывода и обобщающих заключений; (2) для того чтобы в последующих операциях с данными не утратить представления о составляющих более сложных зависимостей и комбинаций, которыми впоследствии будем оперировать.

Например, в итоговых или промежуточных выводах мы находим, что такие-то условия деятельности или характеристики людей более важны, чем некоторые другие. Чтобы правильно интерпретировать это заключение, следует вспомнить, каковы основные характеристики выборки, нет ли в ней заметных аномалий. Очень возможно, что в общей выборке доминируют представители определенного социального статуса, возрастной когорты, национальной принадлежности и т. п. С этими их особенностями связаны социальные функции, интересы, образ жизни. В итоге может оказаться, что наши суммарные выводы неосновательны: они преимущественно объясняются спецификой доминирующей подвыборки обследованных. Чтобы проверить эту рабочую гипотезу, надо расчленить массив информации на соответствующие подвыборки и повторить анализ раздельно для каждой из них, включая доминирующую. Так устанавливаются ограничения выводов.

Обращение к простой структуре данных нужно и для того, чтобы при всевозможных комбинациях и сложных построениях не утратить представления об их первооснове. Вдруг выскакивает интереснейший факт, какие-то явления неожиданно тесно коррелируют. При попытке объяснить, что происходит, мы забыли, что сведения об этих явлениях получены по ответам респондентов на два вопроса одинаковой конструкции, соседствующих в анкете, и что это, видимо, следствие монотонного реагирования на похожие по форме вопросы. Возвращаемся к исходным распределениям и видим, что они совершенно подобны именно в силу психологического эффекта эхо. Открытия не состоялось.

001. Малый ШАД — Вероятность в алгоритмах — Максим Бабенко


Читать еще…

Понравилась статья? Поделиться с друзьями: