Общая надежность
В статистических моделях, применяемых к психометрии , родственная надежность («ро С») [1] коэффициент надежности теста однократного применения (т. е. надежность людей по отношению к предметам, имеющим фиксированный случай), обычно называемый комплексной надежностью , конструкционной надежностью и коэффициентом омега . представляет собой коэффициенты надежности, основанные на модели структурных уравнений (SEM), и получаются на основе одномерной модели. является вторым наиболее часто используемым фактором надежности после тау-эквивалентной надежности ( ; также известный как альфа Кронбаха), и его часто рекомендуют в качестве альтернативы.
История и имена
[ редактировать ]Величина, подобная (но не математически эквивалентная) родственной надежности, впервые появляется в приложении к статье Макдональдса 1970 года по факторному анализу , обозначенной как . [2] В работе Макдоналдса новая величина — это, прежде всего, математическое удобство: хорошо себя зарекомендовавший промежуточный продукт, разделяющий два значения. [3] [4] По-видимому, не зная о работе McDonald's, Йорескуг впервые проанализировал величину, эквивалентную родственной надежности, в статье в следующем году. [4] [5] Йореског определил родственную надежность (теперь обозначенную ρ) с помощью бескоординатной записи: [5] а три года спустя Вертс предложил современную, скоординированную формулу того же самого. [6] Обе последние две статьи назвали новую величину просто «надежностью». [5] [6] Современное название происходит от названия Йорескуга модели, из которой он получил. : «родственная модель». [1] [7] [8]
Прикладные статистики впоследствии придумали множество названий для . «Комплексная надежность» подчеркивает, что измеряет статистическую надежность комплексных оценок. [1] [9] Психология называет « конструктами » любые скрытые характеристики, которые можно измерить только с помощью комплексных показателей. [10] также называют «надежностью конструкции». [11] После недавней разъяснительной работы Макдоналда по теории тестирования некоторые коэффициенты надежности, основанные на SEM, включая родственную надежность, называются «коэффициентами надежности». ", часто без определения. [1] [12] [13]
Формула и расчет
[ редактировать ]Общая надежность применяется к наборам данных векторов . : каждая строка X в наборе данных представляет собой список X i числовых оценок, соответствующих одному человеку что существует одно основное свойство («фактор») отдельного F , так что каждая числовая оценка X i представляет собой зашумленное измерение F. Родственная модель предполагает , Более того, связь между X и F приблизительно линейна : существуют (неслучайные) векторы λ и µ такие, что где E i — статистически независимый шумовой член. [5]
В этом контексте λ i часто называют факторной нагрузкой на элемент i .
Поскольку λ и µ являются свободными параметрами, модель демонстрирует аффинную инвариантность , и F можно нормализовать до значения 0 и дисперсии 1 без потери общности . Доля дисперсии, объясненная в пункте Xi посредством , F тогда просто В более общем смысле, для любого ковектора w доля дисперсии wX, объясняемая F, равна которая максимизируется, когда w ∝ 𝔼[ EE * ]л . [5]
ρ C — это доля объясненной дисперсии в случае, когда w ∝ [1 1 ... 1] (все компоненты X одинаково важны):
Пример
[ редактировать ]Вот оценки факторных нагрузок и ошибок:
Сравните это значение со значением применения тау-эквивалентной надежности к тем же данным.
Связанные коэффициенты
[ редактировать ]Тау-эквивалентная надежность ( ), который традиционно называли «Кронбаховским ", предполагает, что все факторные нагрузки равны (т.е. ). В действительности это случается редко и, таким образом, надежность систематически занижается. Напротив, родственная надежность ( ) явно признает существование различных факторных нагрузок. По мнению Багоцци и Йи (1988), должно иметь значение не менее 0,6. [14] Часто желательны более высокие значения. Однако такие ценности не следует понимать неправильно как строгие границы между «хорошим» и «плохим». [15] Более того, значения, близкие к 1, могут указывать на то, что элементы слишком похожи. Еще одним свойством «хорошей» модели измерения, помимо надежности, является конструктная валидность .
Соответствующий коэффициент представляет собой полученную среднюю дисперсию .
Ссылки
[ редактировать ]- ^ Jump up to: а б с д Чо, Э. (2016). Обеспечение надежности: системный подход к коэффициентам надежности. Методы организационных исследований, 19 (4), 651–682. https://doi.org/10.1177/1094428116656239
- ^ Хотя Макдональд, Р.П. (1985). Факторный анализ и родственные методы . Хиллсдейл, Нью-Джерси: Лоуренс Эрлбаум и (1999). Теория теста . Махва, Нью-Джерси: Лоуренс Эрлбаум утверждает, что Макдональд в 1970 году изобрел родственную надежность, существует тонкая разница между приведенной там формулой и современной. Как обсуждалось в Cho & Chun 2018 , знаменатель McDonald's суммирует наблюдаемые ковариации, но современное определение делится на сумму подобранных ковариаций.
- ^ Макдональд, Р.П. (1970). Теоретические канонические основы анализа главных факторов, канонического факторного анализа и альфа-факторного анализа. Британский журнал математической и статистической психологии, 23, 1–21. doi:10.1111/j.2044-8317.1970.tb00432.x.
- ^ Jump up to: а б Чо, Э. и Чун, С. (2018), Починка сломанных часов: исторический обзор создателей коэффициентов надежности, включая альфа Кронбаха. Обзорные исследования, 19 (2), 23–54.
- ^ Jump up to: а б с д и Йорескуг, КГ (1971). Статистический анализ наборов родственных тестов. Психометрика, 36(2), 109–133. https://doi.org/10.1007/BF02291393
- ^ Jump up to: а б Вертс, К.Э., Линн, Р.Л., и Йорескуг, К.Г. (1974). Оценки внутриклассовой надежности: проверка структурных предположений . Образовательные и психологические измерения , 34, 25–33. дои : 10.1177/001316447403400104
- ^ Грэм, Дж. М. (2006). Родственные и (по существу) тау-эквивалентные оценки надежности оценок. Что они собой представляют и как их использовать. Образовательные и психологические измерения, 66 (6), 930–944. https://doi.org/10.1177/0013164406288165
- ^ Лаке, JF (2005). «Рассмешка кабана»: влияние ошибки коррелированного элемента на внутреннюю согласованность, классическую надежность и родственную надежность. Прикладные психологические измерения, 29(2), 106–125. https://doi.org/10.1177/0146621604272739
- ^ Вертс, CE, Рок, DR, Линн, RL, и Йорескуг, KG (1978). Общий метод оценки надежности композита. Образовательные и психологические измерения, 38 (4), 933–938. https://doi.org/10.1177/001316447803800412
- ^ Кронбах, Л.Дж., и Миль, Ч.П. (1955). Конструируйте валидность в психологических тестах. Психологический бюллетень, 52 (4), 281–302. https://doi.org/10.1037/h0040957
- ^ Волосы, JF, Бабин, BJ, Андерсон, RE, и Блэк, WC (2018). Многомерный анализ данных (8-е изд.). Сенгаге.
- ^ Падилья, М. (2019). Учебник по надежности с помощью коэффициентов альфа и омега. Архив психологии, 3 (8), статья 8. https://doi.org/10.31296/aop.v3i8.125.
- ^ Ревелл, В., и Зинбарг, RE (2009). Альфа, бета, омега и коэффициенты glb: Комментарии к журналу «Наука». Психометрия, 74(1), 145–154. https://doi.org/10.1007/s11336-008-9102-z
- ^ Багоцци и Йи (1988), https://dx.doi.org/10.1177/009207038801600107
- ^ Руководство и Кетокиви (2015), https://dx.doi.org/10.1016/S0272-6963(15)00056-X.
Внешние ссылки
[ редактировать ]- RelCalc — инструменты для расчета общей надежности и других коэффициентов.
- Справочник по шкалам управления , Wikibook, который содержит модели измерения, связанные с управлением, их показатели и часто связанные с ними надежность.