Методы обработки данных количественные и качественные. Понятие о способах количественной обработке и качественном анализе данных психологических исследований

психологический исследование метод

Методы обработки экспериментальных данных разделяют на количественные и качественные.

К первым относится математико-статистическая обработка, ко вторым - описание типичных проявлений или исключений из общего правила.

К математико-статистической обработке следует отнести все процедуры перевода качественных данных в количественные показатели: экспертная оценка по шкале, рейтинг, нормирование, а также все формы статистического анализа - корреляционный, регрессионный, факторный, дисперсионный, кластерный и т.д.

Рассмотрим некоторые из них.

Метод экспертных оценок - формализованная процедура сбора, анализа и интерпретации независимых суждений достаточного количества экспертов о степени выраженности каждого из подлежащих оценке психологических качеств или явлений. Его широко применяют в психологии личности. При этом, экспертные оценки наиболее целесообразно проводить не в виде описания качественных проявлений свойств (это гораздо эффективнее сделать в последующей беседе с экспертами), а в виде количественной оценки степени того или иного свойства или элемента поведения.

Факторный метод - он представляет собой систему моделей и методов для преобразования исходного набора признаков к более простой и содержательной форме. Он базируется на предположении, что наблюдаемое поведение испытуемого может быть объяснено с помощью небольшого числа скрытых характеристик, называемых факторами.

При использовании этого метода обобщение данных представляет собой группировку испытуемых по степени их близости в пространстве измеряемых признаков, то есть выделяются группы похожих испытуемых.

Существуют два основных варианта постановки задачи:

Группировка испытуемых на незаданные группы;

Группировка испытуемых на заданные группы.

Задача группировки испытуемых на незаданные группы. Этот вариант задачи формулируется следующим образом: имеется многомерное психологическое описание выборки испытуемых и требуется осуществить их разделение на однородные группы, то есть такое разделение, при котором в составе выделенных групп оказались бы испытуемые, похожие по психологическим характеристикам. Такая постановка задачи группировки испытуемых соответствует интуитивным представлениям о типе личности.

Для решения этой задачи используется кластерный анализ, который разработан в рамках математической теории распознавания образов.

Задача группировки испытуемых на заданные группы. При решении этой задачи предполагается, что имеются результаты многомерного психологического обследования нескольких групп испытуемых и о каждом испытуемом заранее известно, к какой группе он принадлежит. Задача заключается в том, чтобы найти правило разбиения испытуемых на заданные группы по психологическим характеристикам.

Кластерный метод - метод автоматической классификации, предназначенный для анализа структуры взаимного расположения испытуемых в S пространстве измеряемых признаков. Он позволяет производить объективную классификацию испытуемых по большому набору признаков и основывается на гипотезе «компактности». Если представить каждого испытуемого в виде точки в многомерном пространстве признаков, то естественно предположить, что геометрическая близость точек в этом пространстве указывает на схожесть соответствующих испытуемых. Методы кластерного анализа (автоматической классификации) дают возможность получать сокращенное описание распределения испытуемых путем выделения их скоплений в пространстве исследуемых признаков Психология. Учебник / под ред. В.Н. Дружинина - М.: ЮНИТИ, 2009. С. 101. .

Процесс количественной обработки данных имеет две фазы: пер­вичную и вторичную.

    1. Методы первичной обработки

Первичная обработка нацелена на упорядочивание информации об объекте и предмете изучения, полученной на эмпирическом этапе исследования. На этой стадии «сырые» сведения группируются по тем или иным критериям, заносятся в сводные таблицы, а для наглядности представляются графически. Все эти манипуляции позволяют, во-пер­вых, обнаружить и ликвидировать ошибки, совершенные при фикса­ции данных, и, во-вторых, выявить и изъять из общего массива неле­пые данные, полученные в результате нарушения процедуры обследо­вания, несоблюдения испытуемыми инструкции и т. п. Кроме того, первично обработанные данные, представая в удобной для обозрения форме, дают исследователю в первом приближении представление о характере всей совокупности данных в целом: об их однородности - неоднородности, компактности - разбросанности, четкости - размы­тости и т. д. Эта информация хорошо читается на наглядных формах представления данных и связана с понятиями «распределение данных».

К основным методам первичной обработки относятся: табулирова­ние, т. е. представление количественной информации в табличной форме, и построение диаграмм (рис. I ), гистограмм (рис. 2), полигонов рас­пределения (рис. 3) и кривых распределения (рис. 4). Диаграммы отра­жают распределение дискретных данных, остальные графические формы используются для представления распределения непрерывных данных.

От гистограммы легко перейти к построению частотного полиго­на распределения, а от последнего - к кривой распределения. Частот­ный полигон строят, соединяя прямыми отрезками верхние точки цент­ральных осей всех участков гистограммы. Если же вершины участков соединить с помощью плавньгх кривых линий, то получится кривая рас­пределения первичных результатов. Переход от гистограммы к кривой распределения позволяет путем интерполяции находить те величины исследуемой переменной, которые в опыте не были получены.

2.2. Методы вторичной обработки

2.2.1. Общее представление о вторичной обработке

Вторичная обработка заключается главным образом в статис­тическом анализе итогов первичной обработки. Уже табулирование и построение графиков, строго говоря, тоже есть статистическая обра­ботка, которая в совокупности с вычислением мер центральной тен­денции и разброса включается в один из разделов статистики, а именно в описательную статистику. Другой раздел статистики - индуктивная статистика - осуществляет проверку соответствия данных вы­борки всей популяции, т. е. решает проблему репрезентативности ре­зультатов и возможности перехода от частного знания к общему . Третий большой раздел - корреляционная статистика - выявляет связи между явлениями. В целом же надо понимать, что «ста­тистика - это не математика, а, прежде всего, способ мышления, и для ее применения нужно лишь иметь немного здравого смысла и знать основы математики» .

Статистический анализ всей совокупности полученных в исследо­вании данных дает возможность охарактеризовать ее в предельно сжа­том виде, поскольку позволяет ответить на три главных вопроса: 1) ка­кое значение наиболее характерно для выборки?; 2) велик ли разброс данных относительно этого характерного значения, т. е. какова «размы­тость» данных?; 3) существует ли взаимосвязь между отдельными дан­ными в имеющейся совокупности и каковы характер и сила этих связей? Ответами на эти вопросы служат некоторые статистические показатели исследуемой выборки. Для решения первого вопроса вычисляются меры центральной тенденции (или локализации), второго - меры изменчиво­сти (или рассеивания, разброса), третьего - меры связи (или корреля­ции). Эти статистические показатели приложимы к количественным дан­ным (порядковым, интервальным, пропорциональным).

Меры центральной тенденции (м. ц. т.) - это величины, вокруг которых группируются остальные данные. Эти величины являются как бы обобщающими всю выборку показателями, что, во-первых, позво­ляет по ним судить обо всей выборке, а во-вторых, дает возможность сравнивать разные выборки, разные серии между собой. К мерам цент­ральной тенденции относятся: среднее арифметическое, медиана, мода, среднее геометрическое, среднее гармоническое.

Среднее арифметическое (М) -это результат деления суммы всех значений (X ) на их количество (N): М = ЕХ / N.

Медиана (Me ) - это значение, выше и ниже которого количество отличающихся значений одинаково, т. е. это центральное значение в последовательном ряду данных.

Примеры: 3,5,7,9,11,13,15; Me = 9.

3,5,7,9, 11, 13, 15, 17; Me = 10.

Из примеров ясно, что медиана не обязательно должна совпадать с имеющимся замером, это точка на шкале. Совпадение происходит в случае нечетного числа значений (ответов) на шкале, несовпадение - при четном их числе.

Мода (Мо) - это значение, наиболее часто встречающееся в вы­борке, т. е. значение с наибольшей частотой.

Пример: 2, 6, 6, 8, 9, 9, 9, 10; Мо = 9.

Если всё значения в группе встречаются одинаково часто, то счи­тается, что моды нет (например: 1, 1, 5, 5, 8, 8). Если два соседних значения имеют одинаковую частоту и они больше частоты любого дру­гого значения, мода есть среднее этих двух значений (например: 1, 2, 2, 2, 4, 4, 4, 5, 5, 7; Мо = 3). Если то же самое относится к двум несмеж­ным значениям, то существует две моды, а группа оценок является би­модальной (например: 0, 1, 1, 1, 2, 3, 4, 4, 4, 7; Мо = 1 и 4).

Обычно среднее арифметическое применяется при стремлении к наибольшей точности и когда впоследствии нужно будет вычислять стандартное отклонение. Медиана - когда в серии есть «нетипичные» данные, резко влияющие на среднее (например: 1, 3, 5, 7, 9, 26, 13). Мода - когда не нужна высокая точность, но важна быстрота опреде­ления м. ц. т.

Меры изменчивости (рассеивания, разброса) - это статисти­ческие показатели, характеризующие различия между отдельными зна­чениями выборки. Они позволяют судить о степени однородности по­лученного множества, о его компактности, а косвенно и о надежности полученных данных и вытекающих из них результатов. Наиболее ис­пользуемые в исследованиях показатели: размах, сред­нее отклонение, дисперсия, стандартное отклонение, полуквартилъное отклонение.

Размах (Р) -это интервал между максимальным и минимальным значениями признака. Определяется легко и быстро, но чувствителен к случайностям, особенно при малом числе данных.

Примеры: (0, 2, 3, 5, 8; Р = 8); (-0.2, 1.0, 1.4, 2.0; Р - 2,2).

Среднее отклонение (МД) - это среднеарифметическое разницы (по абсолютной величине) между каждым значением в выборке и ее средним: МД = Id / N, где: d = |Х-М|; М - среднее выборки; X - конкретное значение; N - число значений.

Множество всех конкретных отклонений от среднего характери­зует изменчивость данных, но, если их не взять по абсолютной величи­не, то их сумма будет равна нулю, и мы не получим информации об их изменчивости. МД показывает степень скученности данных вокруг сред­него. Кстати, иногда при определении этой характеристики выборки вместо среднего (М) берут иные меры центральной тенденции - моду или медиану.

Дисперсия (Д) (от лат. dispersus - рассыпанный). Другой путь из­мерения степени скученности данных предполагает избегание нулевой суммы конкретных разниц (d = Х-М) не через их абсолютные величи­ны, а через их возведение в квадрат. При этом получают так называе­мую дисперсию:

Д = Σd 2 / N - для больших выборок (N > 30);

Д = Σd 2 / (N-1) - для малых выборок (N < 30).

Стандартное отклонение (δ). Из-за возведения в квадрат отдель­ных отклонений d при вычислении дисперсии полученная величина оказывается далекой от первоначальных отклонений и потому не дает о них наглядного представления. Чтобы этого избежать и получить ха­рактеристику, сопоставимую со средним отклонением, проделывают обратную математическую операцию - из дисперсии извлекают квад­ратный корень. Его положительное значение и принимается за меру изменчивости, именуемую среднеквадратическим или стандартным отклонением:

МД, Д и d применимы для интервальных и пропорционных дан­ных. Для порядковых данных обычно в качестве меры изменчивости берут полуквартильное отклонение (Q ), именуемое еще полуквартильным коэффициентом или полумеждуквартильным размахом. Вычис­ляется этот показатель следующим образом. Вся область распределе­ния данных делится на четыре равные части. Если отсчитывать на­блюдения, начиная от минимальной величины на измерительной шкале (на графиках, полигонах, гистограммах отсчет обычно ведется слева направо), то первая четверть шкалы называется первым квартилем, а точка, отделяющая его от остальной части шкалы, обозначается сим­волом Q,. Вторые 25% распределения - второй квартиль, а соответ­ствующая точка на шкале - Q 2 . Между третьей и четвертой четвертя- ми распределения расположена точка Q,. Полу квартальный коэффи­циент определяется как половина интервала между первым и третьим квартилями: Q = (Q.-Q,) / 2.

Понятно, что при симметричном распределении точка Q 0 совпа­дет с медианой (а следовательно, и со средним), и тогда можно вычис­лить коэффициент Q для характеристики разброса данных относитель­но середины распределения. При несимметричном распределении это­го недостаточно. И тогда дополнительно вычисляют коэффициенты для левого и правого участков: Q лев = (Q 2 -Q,) / 2; Q прав = (Q, - Q 2) / 2.

Меры связи

Предыдущие показатели, именуемые статистиками, характери­зуют совокупность данных по одному какому-либо признаку. Этот из­меняющийся признак называют переменной величиной или просто «пе­ременной». Меры связи же выявляют соотношения между двумя пере­менными или между двумя выборками. Эти связи, или корреляции (от лат. correlatio - "соотношение, взаимосвязь") определяют через вы­числение коэффициентов корреляции (R ), если переменные находятся в линейной зависимости между собой. Но наличие корреляции не означает, что между переменными су­ществует причинная (или функциональная) связь. Функциональная за­висимость- это частный случай корреляции. Даже если связь при­чинна, корреляционные показатели не могут указать, какая из двух переменных причина, а какая - следствие. Кроме того, любая обнару­женная связь, как правило, существует благодаря и дру­гим переменным, а не только двум рассматриваемым. К тому же взаи­мосвязи признаков столь сложны, что их обусловлен­ность одной причиной вряд ли состоятельна, они детерминированы множеством причин.

Виды корреляции:

I. По тесноте связи:

1) Полная (совершенная): R = 1. Констатируется обязательная вза­имозависимость между переменными. Здесь уже можно говорить о функциональной зависимости.

2) связь не выявлена: R = 0.

3) Частичная: 0

Встречаются и другие градации оценок тесноты связи .

Кроме того, при оценке тесноты связи используют так называемую «частную» классификацию корреляционных связей. Эта классификация ориентирована не на абсолютную величину коэффици­ентов корреляции, а на уровень значимости этой величины при опреде­ленном объеме выборки. Эта классификация применяется при статис­тической оценке гипотез. Тогда чем больше выборка, тем меньшее зна­чение коэффициента корреляции может быть принято для признания достоверности связей. А для малых выборок даже абсолютно большое значение R может оказаться недостоверным .

II. По направленности:

1) Положительная (прямая);

Коэффициент R со знаком «плюс» означает прямую зависимость: при увеличении значения одной переменной наблюдается увеличение другой.

2) Отрицательная (обратная).

Коэффициент R со знаком «минус» означает обратную зависимость: увеличение значения одной переменной влечет уменьшение другой.

III. По форме:

1) Прямолинейная.

При такой связи равномерным изменениям одной переменной со­ответствуют равномерные изменения другой. Если говорить не только о корреляциях, но и о функциональных зависимостях, то такие формы зависимости называют пропорциональными.

2) Криволинейная.

Это связь, при которой равномерное изменение одного признака сочетается с неравномерным изменением другого.

Формулы коэффициента корреляции:

При сравнении порядковых данных применяется коэффициент ранговой корреляции по Ч. Спирмену (ρ): ρ = 6Σd 2 / N (N 2 - 1), где: d - разность рангов (порядковых мест) двух величин, N - число сравни­ваемых пар величин двух переменных (X и Y).

При сравнении метрических данных используется коэффициент корреляции произведений по К. Пирсону (r): r = Σ ху / Nσ x σ y

где: х - отклонение отдельного значения X от среднего выборки (М х), у - то же для Y, О х - стандартное отклонение для X, а - то же для Y, N - число пар значений X и Y.

Внедрение в научные исследования вычислительной техники по­зволяет быстро и точно определять любые количественные характери­стики любых массивов данных. Разработаны различные программы для ЭВМ, по которым можно проводить соответствующий статистический анализ практически любых выборок. Из массы статистических приемов наибольшее распространение получили следующие: 1) комплексное вычисление статистик; 2) корреляционный анализ; 3) дисперсионный анализ; 4) регрессионный анализ; 5) факторный ана­лиз; 6) таксономический (кластерный) анализ; 7) шкалирование.

В рамках психологии можно выделить два основных подхода к сбору данных - качественный и количественный. При количественном подходе информация преобразуется в числа. Примерами могут послужить заполнение анкеты или ответы на вопросы, связанные с тем, до какой степени люди согласны или не согласны с определенными высказываниями. Ответы можно оценивать в баллах, соответствующих взглядам отвечающих. Одно из преимуществ количественного метода заключается в том, что с его помощью можно проверять гипотезы и легко проводить сравнение различных социальных групп - например, работающих и безработных. Основной же недостаток заключается в том, что реальные высказывания людей скрываются за абстрактными цифрами.

При проведении качественных исследований все богатство и разнообразие чувств и мыслей людей сохраняется. В данном случае так же широко применяются опросы, но здесь важно то, что будет сделано потом с полученными данными, которые можно преобразовать в цифры. Например, анализируя ответы Джона количественным методом, можно подсчитать число употребленных им слов, указывающих на его подавленное психологическое состояние. Качественный же анализ состоит в анализе смысла этих ответов - например, того, что Джон имеет в виду под словом «безработица». Качественная методология изучает связи между событиями и видами активности, а также исследует то, как люди представляют себе эти связи.

С помощью количественного и качественного анализов так же можно изучать личность. Количественный или вариационно-статистический, анализ заключается в вычислении коэффициентов правильного решения задач, частоты повторения наблюдаемых психических явлений. Для сравнения результатов исследований по разным количеством задач или различным количественным составом группы пользуются не абсолютными, а относительными, преимущественно процентными показателями. При количественном анализе результатов исследования зачастую используют среднее арифметическое из всех исследований того или иного психического процесса или индивидуально-психологической особенности. Для того чтобы сделать выводы о вероятности среднего арифметического, исчисляют коэффициент отклонений от него отдельных показателей. Что меньше отклонения показателей отдельных исследований от среднего арифметического, то показательнее оно является для исследований психологической особенности личности.

Качественный анализ выполняют на основе количественного анализа, но не сводятся только к нему. В качественном анализе выясняют причины высоких или низких показателей, зависимость их от возрастных и индивидуальных особенностей личности, условий жизни и обучения, отношений в коллективе, отношение к деятельности и др.

Количественный и качественный анализ данных исследования дают основание для получения психолого-педагогической характеристики личности и выводов о воспитательные мероприятия.

Обработка данных направлена на решение следующих задач:

1) упорядочивание исходного материала, преобразование множества данных в целостную систему сведений, на основе которой возможно дальнейшее описание и объяснение изучаемых объекта и предмета;

2) обнаружение и ликвидация ошибок, недочетов, пробелов в сведениях;

3) выявление скрытых от непосредственного восприятия тенденций, закономерностей и связей;

4) обнаружение новых фактов, которые не ожидались и не были замечены в ходе эмпирического процесса;

5) выяснение уровня достоверности, надежности и точности собранных данных и получение на их базе научно обоснованных результатов.

Обработка данных имеет количественный и качественный аспекты. Количественная обработка есть манипуляция с измеренными характеристиками изучаемого объекта (объектов), с его «объективизированными» во внешнем проявлении свойствами. Качественная обработка - это способ предварительного проникновения в сущность объекта путем выявления его неизмеряемых свойств на базе количественных данных.

Количественная обработка направлена в основном на формальное, внешнее изучение объекта, качественная - преимущественно на содержательное, внутреннее его изучение. В количественном исследовании доминирует аналитическая составляющая познания, что отражено и в названиях количественных методов обработки эмпирического материала, которые содержат категорию «анализ»: корреляционный анализ, факторный анализ и т. д. Основным итогом количественной обработки является упорядоченная совокупность «внешних» показателей объекта (объектов). Реализуется количественная обработка с помощью математико-статистических методов.

3. В чем смысл проведения оценки достоверности различия показателей испытуемых?

Литература
1. Куликов Л. В. Психологическое исследование. - СПб., 2001.

2. Никандров В. В. Неэмпирические методы психологии. - СПб., 2003.

3. Математические методы анализа и интерпретация социологических данных. - М., 1989.

4. Сидоренко Е. В. Методы математической обработки в психологии. - СПб., 1996.

5. Тютюнник В. И. Основы психологических исследований. - М., 2002.

Собрав совокупность данных, исследователь приступает к их обработке, получая сведения более высокого уровня, называемые результатами. Он уподобляется портному, который снял мерку (данные) и теперь все зафиксированные размеры соотносит между собой, приводит в целостную систему в виде выкройки и в конечном итоге – в виде той или иной одежды. Параметры фигуры заказчика – это данные, а готовое платье – это результат. На этом этапе могут обнаружиться ошибки в замерах, неясности в согласовании отдельных деталей одежды, что требует новых сведений, и клиент приглашается на примерку, где вносятся необходимые коррективы. Так и в научном исследовании: полученные на предыдущем этапе «сырые» данные путем их обработки приводят в определенную сбалансированную систему, которая становится базой для дальнейшего содержательного анализа, интерпретации и научных выводов и практических рекомендаций. Если по обработке данных выявляются какие-либо ошибки, пробелы, несоответствия, препятствующие построению такой системы, то их можно ликвидировать и восполнить, проведя повторные замеры.

Обработка данных направлена на решение следующих задач: 1) упорядочивание исходного материала, преобразование множества данных в целостную систему сведений, на основе которой возможно дальнейшее описание и объяснение изучаемых объекта и предмета; 2) обнаружение и ликвидация ошибок, недочетов, пробелов в сведениях; 3) выявление скрытых от непосредственного восприятия тенденций, закономерностей и связей; 4) обнаружение новых фактов, которые не ожидались и не были замечены в ходе эмпирического процесса; 5) выяснение уровня достоверности, надежности и точности собранных данных и получение на их базе научно обоснованных результатов.

Если на предыдущих этапах происходит процесс увеличения разнообразия сведений (числа параметров, единичных измерений, источников и т. п.), то теперь наблюдается обратный процесс – ограничение разнообразия, приведение данных к общим знаменателям, позволяющим делать обобщения и прогнозировать развитие тех или иных психических явлений.



Рассматриваемый этап обычно связывается с обработкой количественного характера. Качественная сторона обработки эмпирического материала, как правило, только подразумевается либо вовсе опускается. Обусловлено это, видимо, тем, что качественный анализ часто ассоциируется с теоретическим уровнем исследования, который присущ последующим стадиям изучения объекта – обсуждению и интерпретации результатов. Представляется, однако, что исследование качественного характера имеет два уровня: уровень обработки данных, где проводится организационно-подготовительная работа по первичному выявлению и упорядочиванию качественных характеристик изучаемого объекта, и уровень теоретического проникновения в сущность этого объекта. Работа первого типа характерна для стадии обработки данных, а второго – для этапа интерпретации результатов. Результат в данном случае понимается как итог и количественного, и качественного преобразования первичных данных. Тогда количественная обработка есть манипуляция с измеренными характеристиками изучаемого объекта (объектов), с его «объективизированными» во внешнем проявлении свойствами. Качественная обработка – это способ предварительного проникновения в сущность объекта путем выявления его неизмеряемых свойств на базе количественных данных.

Количественная обработка направлена в основном на формальное, внешнее изучение объекта, качественная – преимущественно, на содержательное, внутреннее его изучение. В количественном исследовании доминирует аналитическая составляющая познания, что отражено и в названиях количественных методов обработки эмпирического материала, включающих в себя категорию «анализ» корреляционный анализ, факторный анализ и т. д. Основным гом количественной обработки является упорядоченная совокупность «внешних» показателей объекта (объектов). Реализуется количественная обработка с помощью математико-статистических методов.

В качественной обработке доминирует синтетическая составляющая познания, причем в этом синтезе превалирует компонент, объединения и в меньшей степени присутствует компонент обобщения. Обобщение – прерогатива последующего этапа исследовательского процесса – интерпретационного. В фазе качественной обработки данных главное заключается не в раскрытии сущности изучаемого явления, а пока лишь в соответствующем представлении сведений о нем, обеспечивающем дальнейшее его теоретическое изучение. Обычно результатом качественной обработки является интегрированное представление о множестве свойств объекта или множестве объектов в форме классификаций и типологий. Качественная обработка в значительной мере апеллирует к методам логики.

Противопоставление друг другу качественной и количествен ной обработок (а следовательно, и соответствующих методов) довольно условно. Они составляют органичное целое. Количественный анализ без последующей качественной обработки бессмыслен, так как сам по себе он не в состоянии превратить эмпирические данные в систему знаний. А качественное изучение: объекта без базовых количественных данных – немыслимо. В научном познании. Без количественных данных качественное познание – это чисто умозрительная процедура, не свойственная современной науке. В философии категории «качество» и «количество», как известно, объединяются в категории «мера».

Единство количественного и качественного осмысления эмпирического материала наглядно проступает во многих методах обработки данных: факторный и таксономический анализы, шкалирование, классификация и др. Но поскольку традиционно в науке принято деление на количественные и качественные характеристики, количественные и качественные методы, количественные и качественные описания, не будем «святее папы Римского» и примем количественные и качественные аспекты обработки данных за самостоятельные фазы одного исследовательского этапа, которым соответствуют определенные количественные и качественные методы.

Качественная обработка естественным образом выливается в описание и объяснение изучаемых явлений, что составляет уже следующий уровень их изучения, осуществляемый на стадии интерпретации результатов. Количественная же обработка полностью относится к рассматриваемому этапу исследовательского процесса, что в совокупности с ее особой спецификой побуждает к ее более подробному изложению. Процесс количественной обработки данных имеет две фазы: первичную и вторичную. Последовательно рассмотрим их.

Первичная обработка

На первой стадии «сырые» сведения группируются по тем или иным критериям, заносятся в сводные таблицы, а для наглядного представления данных строятся различные диаграммы и графики. Все эти манипуляции позволяют, во-первых, обнаружить и ликвидировать ошибки, совершенные при фиксации данных, и, во-вторых, выявить и изъять из общего массива нелепые данные, полученные в результате нарушения процедуры обследования, несоблюдения испытуемыми инструкции и т. п. Кроме того, первично обработанные данные, представая в удобной для обозрения форме, дают исследователю в первом приближении представление о характере всей совокупности данных в целом: об их однородности–неоднородности, компактности-разбросанности, четкости–размытости и т. д. Эта информация хорошо читается на наглядных формах представления данных и связана с понятием «распределение данных».

Под распределением данных понимается их разнесенность по категориям выраженности исследуемого качества (признака). Разнесенность по категориям показывает, как часто (или редко) в определенном массиве данных встречаются те или иные показатели изучаемого признака. Поэтому такой вид представления данных называют «распределением частот». Выраженность признака, как видели выше, может быть представлена в оценках: «есть – нет» или «равно – неравно» (номинативные данные), «больше – меньше» (порядковые данные), «настолько-то больше или меньше» (интервальные данные), «во столько-то раз больше или меньше» (пропорциональные данные). Первая категория оценок предполагает явную дискретность выраженности изучаемого признака, остальные – непрерывность (хотя бы теоретически). Проиллюстрируем это примерами.

Пример для дискретных данных

В трехтысячном трудовом коллективе были выбраны сто человек, которые давали ответ на вопрос: «какой цвет вы предпочитаете?». Предлагалось 6 вариантов: белый (Б), черный (Ч), красный (К), синий (С), зеленый (3), желтый (Ж). В данном случае каждый цвет – это самостоятельная категория выраженности признака «окраска». Допустим, цель – выбор дизайнером окраски рабочих помещений, где трудятся эти люди. Итоги опроса, зафиксированные в протоколе, подсчитали и занесли в таблицу 1 (табулировали).

Таблица 1

Итоги опроса

Частота (абсолютная частота) – это число ответов данной категории в выборке, частость (относительная частота) – это отношение частоты ко всей выборке. Под выборкой понимается все множество полученных в исследовании значений изучаемого признака (свойства, качества, состояния) объекта. В нашем примере выборка равна 100. Понятие выборки связано с понятием генеральной совокупности (или популяции), которая представляет собой все возможное множество значений изучаемого признака. В нашем примере она равна 3000. Поскольку даже ограниченные популяции обычно весьма велики, то опыты проводятся только на выборках. Поэтому встает вопрос о репрезентативности выборки, т. е. о том, можно ли результаты, полученные на выборке, переносить на всю совокупность. Для этого привлекают статистические методы доказательства репрезентативности. Таким образом, выборка есть часть генеральной совокупности. Краткое описание этих множеств производится с помощью так называемых описательных мер (мер центральной тенденции, разброса и связи), вычисление которых производится при вторичной обработке данных. Значения мер, вычисленные для генеральных совокупностей, называются параметрами, для выборок – статистиками. Параметр описывает генеральную совокупность также, как статистика – выборку. Принято обозначать статистики латинскими буквами, а параметры – греческими. Правда, в психологических исследованиях этих правил не всегда строго придерживаются.

На основании табличных данных можно построить диаграмму, где распределение представлено нагляднее:

Пример для непрерывных данных

Данные непрерывного характера можно представить веще более наглядной форме: в виде гистограмм, полигонов икривых.

В опытах В. К. Гайды, описанных в учебном пособии для студентов-психологов , участвовало 96 испытуемых. Определялся цвет последовательного образа восприятия насыщенного красного цвета. С этой целью каждый испытуемый в течение одной минуты рассматривал окрашенный в красный цвет образец, а затем переносил взгляд на белый экран, где видел круг в дополнительных цветах. Рядом с ним находился цветовой круг с разноокрашенными секторами, на котором испытуемый должен был выбрать тот цвет, который соответствовал цвету возникшего у него последовательного образа. При этом испытуемый не называл цвет, а лишь его номер в цветовом круге. Цветовой круг нормирован таким образом, что соседние цвета отличаются в нем друг от друга на одинаково замечаемую величину. Следовательно, цветовой круг можно рассматривать как интервальную шкалу. Наряду с этим цветовой круг характеризуется и еще одним свойством. В частности, можно себе представить, что между двумя соседними цветами, например между зеленовато-голубым и голубовато-зеленым, имеется еще множество не замечаемых человеческим глазом цветовых переходов. В этом смысле цветовой круг представляет собой пример непрерывной переменной. Фактически же испытуемые всегда выделяют конечное число цветовых оттенков и поэтому свой выбор останавливают на конкретном номере (или названии) цвета. В рассматриваемом эксперименте испытуемые определяли свой последовательный образ в диапазоне от № 16 – зеленовато-голубой цвет до № 23 – желтовато-зеленый. Полученные данные можно табулировать, что и сделано в таблице 2.

Таблица 2

Как видно, в построении таблиц 1 и 2 нет принципиального различия. Но разница в характере первичных данных, отображенных в обеих таблицах, все же есть, и она обнаруживается при их графическом изображении. В самом деле, рис. 2 представляет собой уже не столбиковую, а ступенчатую диаграмму, называемую гистограммой. Следует обратить внимание на то, что все участки (столбики) ступенчатой диаграммы расположены вплотную друг к другу (числовые переменные на оси абсцисс гистограммы пишут против центральной оси каждого участка).

От гистограммы легко перейти к построению частотного полигона распределения, а от последнего – к кривой распределения. Частотный полигон строят, соединяя прямыми отрезками верхние точки центральных осей всех участков ступенчатой диаграммы (рис. 3). Если же вершины участков соединить с помощью плавных кривых линий, то получится кривая распределения первичных результатов (рис. 4).

Переход от гистограммы к кривой распределения позволяет путем интерполяции находить те величины исследуемой переменной, которые в опыте не были получены.

Вторичная обработка

Публикации по теме