Масштаб (социальные науки)
![]() | Эта статья включает список литературы , связанную литературу или внешние ссылки , но ее источники остаются неясными, поскольку в ней отсутствуют встроенные цитаты . ( декабрь 2020 г. ) |
Эта статья нуждается в дополнительных цитатах для проверки . ( декабрь 2020 г. ) |
В социальных науках масштабирование — это процесс измерения или упорядочивания объектов по количественным атрибутам или характеристикам. Например, метод масштабирования может включать оценку уровня экстраверсии людей или воспринимаемого качества продуктов. Некоторые методы масштабирования позволяют оценивать величины в континууме , тогда как другие методы обеспечивают только относительный порядок сущностей.
Уровень измерения — это тип измеряемых данных.
Слово «шкала», в том числе в академической литературе, иногда используется для обозначения другой составной меры — индекса . Однако эти понятия различны. [1]
Масштабируйте строительные решения
[ редактировать ]- Какой уровень ( уровень измерения ) данных задействован ( номинальный , порядковый , интервальный или коэффициент )?
- Для чего будут использоваться результаты?
- Что следует использовать – шкалу, индекс или типологию?
- Какие виды статистического анализа были бы полезны?
- Выберите, использовать сравнительную или несравнительную шкалу.
- Сколько делений или категорий шкалы следует использовать (от 1 до 10; от 1 до 7; от −3 до +3)?
- Должно ли быть нечетное или четное количество делений? (Нечетное дает нейтральное центральное значение; даже заставляет респондентов занимать ненейтральную позицию.)
- Каковы должны быть характер и информативность меток шкалы?
- Какой должна быть физическая форма или расположение весов? (графический, простой линейный, вертикальный, горизонтальный)
- Должен ли ответ быть принудительным или оставить его необязательным?
Метод построения шкалы
[ редактировать ]![]() | Этот раздел содержит инструкции, советы и инструкции . ( апрель 2024 г. ) |
Построенные шкалы должны быть репрезентативными для конструкции, которую они собираются измерять. [2] Вполне возможно, что что-то похожее на шкалу, которую человек намеревается создать, уже существует, поэтому включение этой шкалы(й) и возможных зависимых переменных в опрос может повысить достоверность шкалы.
- Начните с создания не менее десяти пунктов, представляющих каждую из подшкал. Администрирование опроса; чем репрезентативнее и крупнее выборка, тем больше доверия к шкале.
- Просмотрите средние значения и стандартные отклонения для элементов, исключив все элементы с искаженными средними значениями или очень низкой дисперсией.
- Проведите исследовательский факторный анализ с наклонным вращением элементов шкал — важно дифференцировать их в зависимости от их нагрузки на факторы, чтобы создать подшкалы, представляющие конструкцию. Запросите факторы с собственными значениями (для расчета собственного значения для каждого фактора, возведите факторную нагрузку в квадрат и суммируйте столбцы) больше 1. Элементы проще группировать по целевым шкалам. Чем более различимы другие элементы, тем больше шансов, что они будут лучше загружаться в собственном масштабе.
- «Чисто загруженные предметы» — это те предметы, нагрузка которых по одному фактору составляет не менее 0,40 и более чем на 0,10 больше по этому фактору, чем по любому другому. Определите те, которые входят в модель факторов.
- «Перекрестно загруженные предметы» — это те, которые не соответствуют вышеуказанному критерию. Это кандидаты, которых следует исключить.
- Определите факторы с помощью всего лишь нескольких пунктов, которые не представляют четких понятий, это «неинтерпретируемые шкалы». Также определите любые факторы, используя только один элемент. Эти факторы и их элементы являются кандидатами на исключение.
- Посмотрите на кандидатов, которых следует исключить, и на факторы, которые следует исключить. Есть ли что-нибудь, что необходимо сохранить, поскольку это имеет решающее значение для конструкции ? Например, если концептуально важный элемент только перекрестно нагружает фактор, который нужно отбросить, хорошо сохранить его для следующего раунда.
- Отбросьте элементы и запустите подтверждающий факторный анализ, попросив программу указать только количество факторов после исключения неинтерпретируемых факторов и факторов, состоящих из одного элемента. Повторите процедуру, начиная с шага 3. Здесь по обеспечению надежности испытаний. также могут быть приняты различные меры
- Продолжайте выполнять процесс, пока не получите «чистые факторы» (пока все факторы не будут иметь чисто загруженные элементы).
- Запустите Альфу в статистической программе (спрашивая Альфу, если каждый элемент выброшен). Любые шкалы с недостаточным количеством альфа следует отбросить и повторить процесс, начиная с шага 3. [ Коэффициент альфа = количество элементов. 2 x средняя корреляция между различными элементами/сумма всех корреляций в матрице корреляции (включая диагональные значения) ]
- Запустите корреляционную или регрессионную статистику, чтобы убедиться в достоверности шкалы. Для лучшей практики сохраняйте конечные коэффициенты и все нагрузки вашей и аналогичных шкал, выбранных в Приложении к созданной шкале.
Многопунктовые и однопредметные шкалы
[ редактировать ]В большинстве практических ситуаций шкалы, состоящие из нескольких пунктов, более эффективны для прогнозирования результатов, чем шкалы, состоящие из отдельных пунктов. Использование отдельных показателей в исследованиях рекомендуется с осторожностью, их использование должно быть ограничено конкретными обстоятельствами. [3] [4]
Критерий | Многопозиционная шкала | Шкала одного пункта |
---|---|---|
Конструируйте конкретность | Абстрактный | Конкретный |
Размерность/сложность конструкции | Многомерный, умеренно сложный | Одномерный или чрезвычайно сложный |
Семантическая избыточность | Низкий | Высокий |
Основная роль конструкции | Зависимая или независимая переменная | Модератор или управляющая переменная |
Желаемая точность | Высокий | Низкий |
Мониторинг изменений | Соответствующий | Проблемный |
Выборочная совокупность | Однородный | Разнообразный |
Размер выборки | Большой | Ограниченный |
Таблица: Критерии оценки потенциального использования однопунктовых показателей [4]
Типы данных
[ редактировать ]Тип собираемой информации может влиять на построение шкалы. Различные типы информации измеряются по-разному.
- Некоторые данные измерены на номинальном уровне . То есть любые используемые числа являются просто метками; они не выражают никаких математических свойств. Примерами являются инвентарные коды SKU и штрих-коды UPC.
- Некоторые данные измеряются на порядковом уровне . Числа указывают относительное положение предметов, но не величину разницы. Примером может служить рейтинг предпочтений.
- Некоторые данные измеряются на уровне интервалов . Числа указывают величину разницы между элементами, но абсолютного нуля не существует. Примерами являются шкалы отношения и шкалы мнений.
- Некоторые данные измеряются на уровне соотношения . Числа обозначают величину разницы и имеют фиксированную нулевую точку. Коэффициенты можно рассчитать. Примеры включают в себя: возраст, доход, цену, затраты, выручку от продаж, объем продаж и долю рынка.
Комплексные меры
[ редактировать ]Составные показатели переменных создаются путем объединения двух или более отдельных эмпирических показателей в единый показатель. Комплексные показатели более адекватно измеряют сложные понятия, чем отдельные показатели, расширяют диапазон доступных оценок и более эффективны при обработке нескольких показателей.
Помимо шкал, существуют еще два типа составных мер. Индексы аналогичны шкалам, за исключением того, что несколько показателей переменной объединяются в один показатель. Например, индекс потребительского доверия представляет собой комбинацию нескольких показателей отношения потребителей. Типология номинальном аналогична индексу, за исключением того, что переменная измеряется на уровне .
Индексы строятся путем накопления баллов, присвоенных отдельным атрибутам, а шкалы строятся путем присвоения баллов шаблонам атрибутов.
Хотя индексы и шкалы обеспечивают измерения одного измерения , типологии часто используются для изучения пересечения двух или более измерений. Типологии являются очень полезными аналитическими инструментами и могут легко использоваться в качестве независимых переменных , хотя, поскольку они не являются одномерными, их трудно использовать в качестве зависимой переменной .
Сравнительное и несравнительное масштабирование
[ редактировать ]При сравнительном масштабировании предметы напрямую сравниваются друг с другом (пример: Кто предпочитает пепси или кока-колу ?). При несравнительном масштабировании каждый элемент масштабируется независимо от других. (Пример: Как человек относится к кока-коле?)
Методы сравнительного масштабирования
[ редактировать ]- Шкала парного сравнения – респонденту одновременно предлагаются два предмета и предлагается выбрать один (пример: кто предпочитает пепси или кока-колу?). Это метод порядкового уровня, когда модель измерения не применяется. Крус и Кеннеди (1977) разработали шкалу парного сравнения в рамках своей модели, привязанной к предметной области. Модель Брэдли-Терри-Люса (BTL) (Bradley and Terry, 1952; Luce, 1959) может применяться для получения измерений при условии, что данные, полученные в результате парных сравнений, обладают соответствующей структурой. Терстоуна Закон сравнительного суждения также может быть применен в таких контекстах.
- Масштабирование модели Раша – респонденты взаимодействуют с элементами, и из ответов делаются сравнения между элементами для получения значений шкалы. Респонденты впоследствии также ранжируются на основе их ответов на вопросы с учетом значений шкалы пунктов. Модель Раша тесно связана с моделью BTL.
- Ранжирование – респонденту одновременно предлагается несколько товаров и предлагается оценить их (пример: Оцените следующие рекламные объявления от 1 до 10). Это техника порядкового уровня.
- Шкала социальной дистанции Богардуса – измеряет степень, в которой человек готов общаться с классом или типом людей. Он спрашивает, насколько респондент готов создавать различные ассоциации. Результаты сводятся к одному баллу по шкале. Существуют также несравнительные версии этой шкалы.
- Q-сортировка – до 140 элементов сортируются в группы на основе процедуры ранжирования.
- Шкала Гутмана . Это процедура, позволяющая определить, можно ли упорядочить набор элементов по одномерной шкале. Он использует структуру интенсивности среди нескольких показателей данной переменной. Утверждения перечислены в порядке важности. Рейтинг рассчитывается путем суммирования всех ответов до первого отрицательного ответа в списке. Шкала Гутмана связана с измерением Раша; в частности, модели Раша привносят подход Гуттмана в вероятностную структуру.
- Шкала постоянной суммы – респонденту дают постоянную сумму денег, сценарий, кредиты или баллы и просят распределить их по различным предметам (пример: если бы у человека было 100 иен, которые он мог бы потратить на продукты питания, сколько бы он потратил на продукт А , по товару Б, по товару С и т. д.). Это техника порядкового уровня.
- Шкала оценки величины . В психофизической процедуре, изобретенной С.С. Стивенсом, люди просто присваивают числа размерности суждения. Среднее геометрическое этих чисел обычно дает степенной закон с характеристическим показателем. При кросс-модальном сопоставлении вместо присвоения чисел люди манипулируют другим измерением, таким как громкость или яркость, чтобы соответствовать элементам. Обычно показатель психометрической функции можно предсказать на основе показателей оценки величины каждого измерения.
Методы несравнительного масштабирования
[ редактировать ]- Визуальная аналоговая шкала (также называемая непрерывной рейтинговой шкалой и графической рейтинговой шкалой) – респонденты оценивают элементы, ставя отметку на строке. Линия обычно помечена на каждом конце. Иногда под линией находится ряд цифр, называемых точками шкалы (скажем, от нуля до 100). Подсчет баллов и кодификация сложны для бумажно-карандашных шкал, но не для компьютеризированных и интернет-визуальных аналоговых шкал. [5]
- Шкала Лайкерта . Респондентов просят указать степень согласия или несогласия (от «полностью согласен» до «полностью не согласен») по шкале ответов от пяти до девяти баллов (не путать со шкалой Лайкерта). Один и тот же формат используется для нескольких вопросов. Именно комбинация этих вопросов и образует шкалу Лайкерта. Эту процедуру категориального масштабирования можно легко расширить до процедуры оценки величины , которая использует полную шкалу чисел, а не вербальные категории.
- Шкалы завершения фраз . Респондентам предлагается завершить фразу по 11-балльной шкале ответов, где 0 означает отсутствие теоретической конструкции, а 10 представляет собой теоретическое максимальное количество измеряемой конструкции. Один и тот же базовый формат используется для нескольких вопросов.
- Семантическая дифференциальная шкала . Респондентов просят оценить по 7-балльной шкале предмет по различным признакам. Для каждого атрибута требуется шкала с метками биполярных клемм.
- Шкала Стапеля – это однополярная десятибалльная шкала оценок. Он колеблется от +5 до −5 и не имеет нейтральной нулевой точки.
- Шкала Терстоуна . Это метод масштабирования, который учитывает структуру интенсивности показателей.
- Математически полученная шкала . Исследователи делают математические выводы об оценках респондентов. Двумя примерами являются многомерное масштабирование и совместный анализ .
Масштабная оценка
[ редактировать ]Шкалы следует проверять на надежность , обобщаемость и валидность . Обобщаемость — это способность делать выводы из выборки в генеральную совокупность с учетом выбранного масштаба. Надежность — это степень, в которой весы будут давать стабильные результаты. Надежность повторного тестирования проверяет, насколько схожи результаты, если исследование повторяется при аналогичных обстоятельствах. Надежность альтернативных форм проверяет, насколько схожи результаты, если исследование повторяется с использованием разных форм шкалы. Надежность внутренней согласованности проверяет, насколько хорошо отдельные показатели, включенные в шкалу, преобразуются в составную меру.
Шкалы и индексы должны быть проверены. Внутренняя валидация проверяет связь между отдельными показателями, включенными в шкалу, и самой составной шкалой. Внешняя валидация проверяет связь между составной шкалой и другими показателями переменной, показателями, не включенными в шкалу. Проверка содержания (также называемая лицевой достоверностью) проверяет, насколько хорошо шкала измеряет то, что предполагается измерять. Проверка критериев проверяет, насколько значимы критерии шкалы по сравнению с другими возможными критериями. Проверка конструкции проверяет, какая базовая конструкция измеряется. Существует три варианта конструктной валидности . Это конвергентная валидность , дискриминантная валидность и номологическая валидность (Кэмпбелл и Фиске, 1959; Крус и Ней, 1978). Коэффициент воспроизводимости показывает, насколько хорошо данные отдельных показателей, включенных в шкалу, можно восстановить по составной шкале.
См. также
[ редактировать ]- Шкала оценок
- Уровень измерения
- Социальные исследования
- Маркетинг
- Маркетинговые исследования
- Количественные маркетинговые исследования
- Степенной закон
- Психофизика
Ссылки
[ редактировать ]- ^ Эрл Бэбби (1 января 2012 г.). Практика социальных исследований . Cengage Обучение. п. 162. ИСБН 978-1-133-04979-1 .
- ^ Макдональд, Родерик П. (17 июня 2013 г.). Теория испытаний: единое лечение . Психология Пресс. ISBN 978-1-135-67531-8 .
- ^ Диамантопулос, Адамантио; Сарстедт, Марко; Фукс, Кристоф (2012). «Руководство по выбору между многопунктовыми и однопунктовыми шкалами для измерения конструкции: перспектива прогнозируемой достоверности» . Журнал Академии маркетинговых наук . 40 (3): 434–449. дои : 10.1007/s11747-011-0300-3 . hdl : 1959.13/1052296 .
- ^ Перейти обратно: а б Фукс, Кристоф; Диамантопулос, Адамантиос (2009). «Использование отдельных показателей для конструктивного измерения в исследованиях в области управления: концептуальные проблемы и рекомендации по применению» (PDF) . Die Betriebswirtschaft . 69 (2).
- ^ У.-Д. Рейпс и Ф. Функе (2008) «Измерение интервального уровня с помощью визуальных аналоговых шкал в интернет-исследованиях: генератор VAS». дои : 10.3758/BRM.40.3.699
Дальнейшее чтение
[ редактировать ]- ДеВеллис, Роберт Ф. (2003), Развитие масштаба: теория и приложения (2-е изд.), Лондон: Публикации SAGE , ISBN 0-7619-2604-6 , получено 11 августа 2010 г. , мягкая обложка. ISBN 0-7619-2605-4
- Лодж, Милтон (1981), Масштабирование величины: количественное измерение мнений , Беверли-Хиллз и Лондон: Публикации SAGE, ISBN 0-8039-1747-3
- МакИвер, Джон П. и Карминс, Эдвард Дж. (1981), Одномерное масштабирование , Беверли-Хиллз и Лондон: Публикации SAGE, ISBN 0-8039-1736-8 , получено 11 августа 2010 г.
- Брэдли Р.А. и Терри М.Э. (1952): Ранговый анализ неполных блочных конструкций, I. Метод парных сравнений . Биометрика, 39, 324–345.
- Кэмпбелл, Д.Т. и Фиске, Д.В. (1959)Конвергентная и дискриминантная проверка с помощью матрицы мультипризнаков и мультиметодов. Психологический вестник, 56, 81–105.
- Ходж, Д.Р. и Гиллеспи, Д.Ф. (2003). Дополнение фраз: альтернатива шкалам Лайкерта. Исследования в области социальной работы, 27 (1), 45–55.
- Ходж, Д.Р. и Гиллеспи, Д.Ф. (2005). Шкалы завершения фраз. В К. Кемпф-Леонарде (редактор). Энциклопедия социальных измерений. (Том 3, стр. 53–62). Сан-Диего: Академическая пресса.
- Крус, DJ и Кеннеди, PH (1977) Нормальное масштабирование матриц доминирования: модель, привязанная к предметной области. Образовательные и психологические измерения, 37, 189–193 (перепечатка по запросу).
- Крус, DJ & Ney, RG (1978)Конвергентная и дискриминантная достоверность в анализе заданий. Образовательные и психологические измерения, 38, 135–137 (перепечатка по запросу).
- Люс, Р.Д. (1959): Индивидуальный выбор поведения: теоретический анализ . Нью-Йорк: Дж. Уайли.