шкала Гутмана
![]() | В этой статье есть несколько проблем. Пожалуйста, помогите улучшить его или обсудите эти проблемы на странице обсуждения . ( Узнайте, как и когда удалять эти шаблонные сообщения )
|
При анализе многомерных наблюдений, предназначенных для оценки субъектов по признаку , шкала Гутмана (названная в честь Луиса Гутмана ) представляет собой единую (одномерную) порядковую шкалу для оценки признака, из которой могут быть воспроизведены исходные наблюдения. Обнаружение шкалы Гутмана в данных зависит от их многомерного распределения, соответствующего определенной структуре (см. Ниже). Следовательно, шкала Гутмана представляет собой гипотезу о структуре данных, сформулированную относительно определенного атрибута и определенной совокупности и не может быть построена для любого заданного набора наблюдений. Вопреки широко распространенному мнению, шкала Гутмана не ограничивается дихотомическими переменными и не обязательно определяет порядок среди переменных. Но если все переменные дихотомичны, они действительно упорядочены по их чувствительности при записи оцениваемого атрибута, как показано в примере 1.
Детерминированная модель
[ редактировать ]Пример 1: Дихотомические переменные
Шкалу Гуттмана можно предположить для следующих пяти вопросов, касающихся признака «принятие социальных контактов с иммигрантами» (на основе шкалы социальной дистанции Богардуса ), представленного подходящей группе населения:
- Приняли бы вы иммигрантов в качестве резидентов в своей стране? (Нет=0; Да=1)
- Приняли бы вы иммигрантов в качестве жителей в своем городе? (Нет=0; Да=1)
- Приняли бы вы иммигрантов в качестве жителей в вашем районе? (Нет=0; Да=1)
- Вы бы приняли иммигрантов в качестве ближайших соседей? (Нет=0; Да=1)
- Вы бы приняли иммигранта в качестве супруга своего ребенка? (Нет=0; Да=1)
Положительный ответ конкретного респондента на любой вопрос в этом списке предполагает положительные ответы этого респондента на все предыдущие вопросы в этом списке. Следовательно, можно было ожидать получения только ответов, перечисленных в заштрихованной части (столбцы 1–5) таблицы 1.

Каждая строка в заштрихованной части Таблицы 1 (столбцы 1–5) представляет собой профиль ответов любого количества (≥ 0) респондентов. Каждый профиль в этой таблице указывает на принятие иммигрантов во всех смыслах, указанных в предыдущем профиле, плюс дополнительный смысл, в котором иммигранты принимаются. Если при большом количестве наблюдений наблюдаются только профили, перечисленные в табл. 1, то гипотеза шкалы Гуттмана подтверждается, а значения шкалы (последний столбец табл. 1) обладают следующими свойствами:
- Они оценивают силу атрибута «принятие социальных контактов с иммигрантами»;
- Они воспроизводят оригинальные наблюдения. (Например, балл респондента по шкале 2 означает, что этот респондент ответил положительно на вопросы 1 и 2 и отрицательно на вопросы 3, 4 и 5.)
Шкала Гутмана, если она подкреплена данными, полезна для эффективной оценки субъектов (респондентов, испытуемых или любой совокупности исследуемых объектов) по одномерной шкале по отношению к указанному признаку. Обычно шкалы Гутмана используются для узко определенных атрибутов.
В то время как другие методы шкалирования (например, шкала Лайкерта ) создают единую шкалу путем суммирования оценок респондентов — процедура, которая предполагает, часто без обоснования, что все наблюдаемые переменные имеют равные веса — шкала Гуттмана избегает взвешивания наблюдаемых переменных; таким образом, «уважая» данные такими, какие они есть. Если шкала Гутмана подтверждается, измерение атрибута по сути является одномерным; одномерность не достигается суммированием или усреднением. Эта особенность делает его подходящим для построения воспроизводимых научных теорий и значимых измерений, как это объяснено в теории граней .
Порядковые переменные
[ редактировать ]Учитывая набор данных из N субъектов, наблюдаемых в отношении n порядковых переменных, каждая из которых имеет любое конечное число (≥2) числовых категорий, упорядоченных по возрастанию силы заранее заданного атрибута, пусть a ij будет оценкой, полученной субъектом i по переменной. j и определим список оценок, которые субъект i получил по n переменным, a i =a i1 ...a in , как профиль субъекта i . (Количество категорий может быть разным в разных переменных; порядок переменных в профилях не важен, но должен быть фиксированным).
Определять:
Два профиля, a s и a t равны a , обозначаются a s = at , тогда и только тогда, когда sj = a tj для всех j =1... n
Профиль a s больше , чем профиль a t , обозначаемый как > s at , тогда и только тогда, когда a sj ≥ a tj для всех j =1... n и a sj' > a tj' хотя бы для одной переменной j' .
Профили a s и a t сравнимы и обозначаются a s Sa t , если и только если a s = at ; или а с > а т ; или а т > а с
Профили a s и a t несравнимы j , обозначаются как s $ at , если они несравнимы (то есть хотя бы для одной переменной ' , a sj' > a tj' и хотя бы для одной другой переменной j '' , a tj'' > a sj '' .
Для наборов данных, в которых категории всех переменных упорядочены одинаково (от большего к меньшему или от меньшего к большему) относительно данного атрибута, шкала Гутмана определяется просто следующим образом:
Определение: Шкала Гутмана — это набор данных, в котором все пары профилей сопоставимы.
Пример: недихотомические переменные
[ редактировать ]Рассмотрим следующие четыре переменные, которые оценивают арифметические навыки среди учащихся P:
V1: Может ли ученик (р) складывать числа? Нет=1; Да, но только двузначных чисел=2; Да=3.
V2: Знает ли ученик (p) таблицу умножения (1-10)? Нет=1; Да=2.
V3: Может ли ученик (р) выполнять умножение чисел? Нет=1; Да, но только двузначных чисел=2; Да=3.
V4: Может ли ученик (p) выполнить деление столбиков? Нет=1; Да=2.
Можно предположить, что данные, собранные для вышеупомянутых четырех переменных среди школьников, отражают шкалу Гутмана, показанную ниже в Таблице 2:
Таблица 2. Предполагается, что данные четырех порядковых переменных навыков арифметики образуют шкалу Гуттмана.
VВ1 | VV2 | В 3 | В 4 | Возможный Оценка шкалы |
1 | 1 | 1 | 1 | 4 |
2 | 1 | 1 | 1 | 5 |
2 | 2 | 1 | 1 | 6 |
3 | 2 | 1 | 1 | 7 |
3 | 2 | 2 | 1 | 8 |
3 | 2 | 3 | 1 | 9 |
3 | 2 | 3 | 2 | 10 |
Набор предполагаемых профилей (заштрихованная часть в таблице 2) иллюстрирует определяющую особенность шкалы Гуттмана, а именно то, что любая пара профилей сопоставима. И здесь, если гипотеза подтверждается, единая шкала воспроизводит ответы испытуемого по всем наблюдаемым переменным.
Масштабом может служить любой упорядоченный набор чисел. На этой иллюстрации мы выбрали сумму баллов профиля. Согласно теории фасеток, такое суммирование может быть оправдано только для данных, соответствующих шкале Гутмана.
Воспроизводимость
[ редактировать ]На практике идеальные («детерминированные») шкалы Гутмана редки, но приблизительные были обнаружены в определенных группах населения в отношении таких атрибутов, как религиозные обычаи, узко определенные области знаний, конкретные навыки и владение бытовой техникой. [1] Когда данные не соответствуют шкале Гуттмана, они могут либо представлять шкалу Гуттмана с шумом (и обрабатываться стохастически). [1] ), или они могут иметь более сложную структуру, требующую многократного масштабирования для идентификации присущих им масштабов.
Степень соответствия набора данных шкале Гутмана можно оценить по коэффициенту воспроизводимости. [2] [3] из которых существует несколько версий, в зависимости от статистических предположений и ограничений. Первоначальное определение коэффициента воспроизводимости, данное Гуттманом, C R равно просто 1 минус отношение количества ошибок к количеству записей в наборе данных. И чтобы гарантировать наличие диапазона ответов (это не тот случай, если все респонденты поддержали только один вопрос), используется коэффициент масштабируемости. [4]
В шкале Гутмана заложено начало теории ответов на задания , которая, в отличие от классической теории тестов , признает, что не все задания в анкетах имеют одинаковый уровень сложности. Были разработаны недетерминированные (то есть стохастические) модели, такие как шкала Моккена и модель Раша . Шкала Гутмана была обобщена на теорию и процедуры «множественного масштабирования», которые определяют минимальное количество шкал, необходимое для удовлетворительной воспроизводимости.
Как процедура, которая связывает существенное содержание с логическими аспектами данных, шкала Гуттмана ознаменовала появление теории фасетов, разработанной Луисом Гуттманом и его коллегами.
Шкала Гутмана в качественных переменных
[ редактировать ]Гутмана [3] оригинальное определение шкалы позволяет также проводить исследовательский масштабный анализ качественных переменных (номинальных переменных или порядковых переменных, которые не обязательно принадлежат заранее определенному общему атрибуту). Это определение шкалы Гутмана основано на предыдущем определении простой функции .
Для полностью упорядоченного набора X , скажем, 1,2,..., m , и другого конечного набора Y с k элементами k ⩽ m функция из X в Y является простой функцией , если X можно разбить на k интервалы, которые находятся во взаимно однозначном соответствии со значениями Y .
Затем можно определить шкалу Гутмана для набора данных из n переменных с j й переменная, имеющая k j (качественные, не обязательно упорядоченные) категории, таким образом:
Определение: шкала Гутмана — это набор данных, для которого существует порядковая переменная X с конечным числом m категорий, скажем, 1,..., m с m ≥ max j ( k j ) и перестановкой субъектов. в которых каждая переменная в наборе данных является простой функцией X. профили ,
Несмотря на кажущуюся элегантность и привлекательность для поисковых исследований, это определение недостаточно изучено и применено.
Ссылки
[ редактировать ]- ^ Jump up to: а б Кумбс, Клайд; Кумбс, Лолаген; Лингоес, Джеймс (1978). «Глава 11: Стохастические кумулятивные шкалы». В Шай, Сэмюэл (ред.). Построение теории и анализ данных в поведенческих науках . Сан-Франциско: Джосси-Басс. стр. 280–298. ISBN 0-87589-379-1 .
- ^ Стоуффер С.А., Гуттман Л., Сучман Э.А., Лазарсфельд П.Ф., Стар С.А., Клаузен Дж.А. (1950) Измерение и прогнозирование Princeton University Press
- ^ Jump up to: а б Гутман, Луи (1944). «Основа для масштабирования качественных данных». Американский социологический обзор . 9 (2): 139–150. дои : 10.2307/2086306 . JSTOR 2086306 .
- ^ Мензель, Х. (1953) Новый коэффициент для анализа скалограмм в журнале Educational and Public Opinion Quarterly , том: 15, выпуск: 2, страницы: 268-280.
Дальнейшее чтение
[ редактировать ]- Кумбс, CH, Кумбс, LC, и Лингос, JC (1978). «Стохастические кумулятивные шкалы». В С. Шай (ред.), Построение теории и анализ данных в поведенческих науках. Сан-Франциско : Джосси-Басс.
- Гудман, Луизиана (1975). «Новая модель масштабирования шаблонов ответа: применение концепции квазинезависимости». Журнал Американской статистической ассоциации , 70, 755–768.
- Гуттман, Л. (1944). «Основа для масштабирования качественных данных». Американский социологический обзор , 9, 139–150.
- Грин, Б.Ф. (1956). «Метод скалограммного анализа с использованием сводной статистики». Психометрика , 21, 79–88.