Валидность теста

Валидность теста – это степень, в которой тест (например, химический , физический или учебный тест ) точно измеряет то, что он должен измерять . В области психологического тестирования и образовательного тестирования «валидность означает степень, в которой доказательства и теория поддерживают интерпретации результатов тестов, вытекающие из предлагаемого использования тестов». ^[1] Хотя классические модели делили концепцию на различные «действительности» (такие как достоверность содержания , достоверность критерия и достоверность конструкции ), ^[2] В настоящее время преобладает мнение, что валидность представляет собой единую унитарную конструкцию. ^[3]

Валидность обычно считается наиболее важным вопросом в психологическом и образовательном тестировании. ^[4] потому что это касается значения, придаваемого результатам теста. ^[3] Хотя во многих учебниках валидность представлена как статическая конструкция, ^[5] различные модели валидности развивались со времени первых опубликованных рекомендаций по построению психологических и образовательных тестов. ^[6] Эти модели можно разделить на две основные группы: классические модели, которые включают несколько типов валидности, и современные модели, которые представляют валидность как единую конструкцию. Современные модели реорганизуют классические «валидности» в «аспекты» валидности. ^[3] или «типы» доказательств, подтверждающих достоверность ^[1]

Валидность теста часто путают с надежностью , которая относится к согласованности меры. Адекватная надежность является предпосылкой валидности, но высокая надежность никоим образом не гарантирует валидность меры.

Историческая справка

Хотя психологам и педагогам было известно о нескольких аспектах валидности до Второй мировой войны, их методы установления валидности обычно ограничивались корреляцией результатов тестов с каким-либо известным критерием. ^[7] Под руководством Ли Кронбаха в 1954 году были разработаны Технические рекомендации по психологическим тестам и диагностическим методам. ^[6] попытались прояснить и расширить сферу валидности, разделив ее на четыре части: (а) параллельная валидность , (б) прогностическая валидность , (в) содержательная валидность и (г) конструктная валидность . Последующая публикация Кронбаха и Миля ^[8] сгруппировали прогностическую и параллельную достоверность в «ориентацию на критерии», которая в конечном итоге стала критериальной достоверностью .

В течение следующих четырех десятилетий многие теоретики, включая самого Кронбаха, ^[9] выразили свое недовольство этой моделью действительности «три в одном». ^[10]^[11]^[12] Их аргументы завершились статьей Сэмюэля Мессика 1995 года, в которой валидность описывалась как единая конструкция, состоящая из шести «аспектов». ^[3] По его мнению, различные выводы, сделанные на основе результатов тестов, могут требовать разных типов доказательств, но не разной достоверности.

1999 г. Стандарты образовательного и психологического тестирования ^[1] в значительной степени систематизировал модель Мессика. Они описывают пять типов доказательств, подтверждающих достоверность, которые включают в себя каждый из аспектов Мессика и не упоминают содержание, критерии и конструктную достоверность классических моделей.

Процесс проверки

Согласно Стандартам 1999 года , ^[1] валидация — это процесс сбора доказательств, обеспечивающих «надежную научную основу» для интерпретации результатов, предложенных разработчиком теста и/или пользователем теста. Таким образом, валидация начинается с структуры, которая определяет объем и аспекты (в случае многомерных шкал) предлагаемой интерпретации. Структура также включает рациональное обоснование, связывающее интерпретацию с рассматриваемым тестом.

Затем исследователи валидности перечисляют ряд предположений, которые должны быть выполнены, чтобы интерпретация была достоверной. Или, наоборот, они могут составить список вопросов, которые могут поставить под угрозу достоверность интерпретаций. В любом случае исследователи продолжают собирать доказательства – будь то оригинальные эмпирические исследования, метаанализ или обзор существующей литературы или логический анализ проблем – чтобы поддержать или подвергнуть сомнению положения интерпретации (или угрозы достоверности интерпретации). . Особое внимание уделяется качеству, а не количеству доказательств.

Единственная интерпретация любого результата теста может потребовать, чтобы несколько утверждений были истинными (или могут быть подвергнуты сомнению любым из множества угроз его достоверности). Веские доказательства в поддержку одного утверждения не уменьшают требования к поддержке других предположений.

Доказательства, подтверждающие (или подвергающие сомнению) обоснованность интерпретации, можно отнести к одной из пяти категорий:

Доказательства, основанные на содержании теста
Доказательства, основанные на процессах реагирования
Доказательства, основанные на внутренней структуре
Доказательства, основанные на отношениях к другим переменным
Доказательства, основанные на последствиях тестирования

Методы сбора каждого типа доказательств следует использовать только в том случае, если они дают информацию, которая поддержит или подвергнет сомнению предположения, необходимые для рассматриваемой интерпретации.

Каждое доказательство в конечном итоге интегрируется в аргумент достоверности. Аргумент может потребовать пересмотра теста, протокола его проведения или теоретических конструкций, лежащих в основе интерпретаций. Если тест и/или интерпретация результатов теста каким-либо образом пересматриваются, новый процесс проверки должен собрать доказательства в поддержку новой версии.

См. также

Шкала достоверности

Ссылки

^ Jump up to: ^а ^б ^с ^д Американская ассоциация исследований в области образования, Американская психологическая ассоциация и Национальный совет по измерениям в образовании. (1999) Стандарты образовательного и психологического тестирования . Вашингтон, округ Колумбия: Американская ассоциация исследований в области образования.
^ Гион, РМ (1980). О тринитарных доктринах справедливости. Профессиональная психология, 11 , 385–398.
^ Jump up to: ^а ^б ^с ^д Мессик, С. (1995). Валидность психологической оценки: проверка выводов на основе ответов и действий людей как научное исследование значения оценок. Американский психолог, 50 , 741–749.
^ Пофэм, WJ (2008). Все об оценивании / Непонятый Грааль. Образовательное лидерство, 66 (1), 82-83.
^ Нитко, Дж. Дж., Брукхарт, С. М. (2004). Учебная оценка учащихся . Река Аппер-Сэддл, Нью-Джерси: Меррилл-Прентис Холл.
^ Jump up to: ^а ^б Американская психологическая ассоциация, Американская ассоциация исследований в области образования и Национальный совет по измерениям в образовании. (1954). Технические рекомендации по психологическим тестам и диагностическим методикам . Вашингтон, округ Колумбия: Ассоциация.
^ Ангофф, WH (1988). Действительность: развивающаяся концепция. В Х. Вайнере и Х. Брауне (ред.), Проверка достоверности (стр. 19–32). Хиллсдейл, Нью-Джерси: Лоуренс Эрлбаум.
^ Кронбах, Л.Дж., и Миль, Ч.П. (1955). Конструируйте валидность в психологических тестах. Психологический бюллетень, 52 , 281–302.
^ Кронбах, ЖЖ (1969). Валидация образовательных мер. Материалы приглашенной конференции по проблемам тестирования 1969 года. Принстон , Нью-Джерси: Служба образовательного тестирования, 35–52.
^ Левинджер, Дж. (1957). Объективные тесты как инструменты психологической теории. Психологические отчеты, 3 , 634–694.
^ Тенопир, ML (1977). Путаница содержания и конструкции. Психология персонала, 30 , 47-54.
^ Гион, РМ (1977). Достоверность содержания – источник моего недовольства. Прикладные психологические измерения, 1 , 1-10.

[1999standards-1] Jump up to: ^а ^б ^с ^д Американская ассоциация исследований в области образования, Американская психологическая ассоциация и Национальный совет по измерениям в образовании. (1999) Стандарты образовательного и психологического тестирования . Вашингтон, округ Колумбия: Американская ассоциация исследований в области образования.

[guion1980-2] Гион, РМ (1980). О тринитарных доктринах справедливости. Профессиональная психология, 11 , 385–398.

[messick1995-3] Jump up to: ^а ^б ^с ^д Мессик, С. (1995). Валидность психологической оценки: проверка выводов на основе ответов и действий людей как научное исследование значения оценок. Американский психолог, 50 , 741–749.

[popham2008-4] Пофэм, WJ (2008). Все об оценивании / Непонятый Грааль. Образовательное лидерство, 66 (1), 82-83.

[5] Нитко, Дж. Дж., Брукхарт, С. М. (2004). Учебная оценка учащихся . Река Аппер-Сэддл, Нью-Джерси: Меррилл-Прентис Холл.

[1954recommendations-6] Jump up to: ^а ^б Американская психологическая ассоциация, Американская ассоциация исследований в области образования и Национальный совет по измерениям в образовании. (1954). Технические рекомендации по психологическим тестам и диагностическим методикам . Вашингтон, округ Колумбия: Ассоциация.

[angoff1988-7] Ангофф, WH (1988). Действительность: развивающаяся концепция. В Х. Вайнере и Х. Брауне (ред.), Проверка достоверности (стр. 19–32). Хиллсдейл, Нью-Джерси: Лоуренс Эрлбаум.

[cronbachmeehl1955-8] Кронбах, Л.Дж., и Миль, Ч.П. (1955). Конструируйте валидность в психологических тестах. Психологический бюллетень, 52 , 281–302.

[9] Кронбах, ЖЖ (1969). Валидация образовательных мер. Материалы приглашенной конференции по проблемам тестирования 1969 года. Принстон , Нью-Джерси: Служба образовательного тестирования, 35–52.

[10] Левинджер, Дж. (1957). Объективные тесты как инструменты психологической теории. Психологические отчеты, 3 , 634–694.

[11] Тенопир, ML (1977). Путаница содержания и конструкции. Психология персонала, 30 , 47-54.

[12] Гион, РМ (1977). Достоверность содержания – источник моего недовольства. Прикладные психологические измерения, 1 , 1-10.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

v т и Психология
История Философия Портал Психолог
Базовый психология	Аномальный Аффективная нейробиология Аффективная наука Поведенческая генетика Поведенческая нейробиология Бихевиоризм Когнитивизм / Когнитивизм Когнитивная нейробиология Социальные Сравнительный Межкультурный Культурный развивающий Дифференциал Экологический Эволюционный Экспериментальный гештальт Интеллект Математический Мораль Нейропсихология Восприятие Личность Психолингвистика Психофизиология Количественный Социальные Теоретический
Применяемый психология	Аномалистический Прикладной анализ поведения Оценка Клинический Коучинг Сообщество Потребитель Консультирование Критический Образовательный Эргономика феминистка судебно-медицинская экспертиза Здоровье гуманистический Промышленная и организационная Юридический СМИ Медицинский Военный Музыка Гигиена труда Пастораль Политический Позитивный Психометрия Психотерапия Религия Школа Спорт и упражнения Суицидология Системы Трафик
Методологии	Тестирование на животных Архивные исследования Эпигенетика поведения Тематическое исследование Контент-анализ Эксперименты Исследования на людях Интервью Нейровизуализация Наблюдение Психофизика Качественные исследования Количественные исследования Инвентаризация с самоотчетом Статистические исследования
Концепции	Поведение Поведенческая инженерия Поведенческая генетика Поведенческая нейробиология Познание Компетентность Сознание Потребительское поведение Эмоции Чувства Человеческий фактор и эргономика Интеллект Разум Психология религии Психометрия
Психологи	Вильгельм Вундт Уильям Джеймс Иван Павлов Зигмунд Фрейд Эдвард Торндайк Карл Юнг Джон Б. Ватсон Кларк Л. Халл Курт Левин Жан Пиаже Гордон Олпорт Дж. П. Гилфорд Карл Роджерс Эрик Эриксон Б. Ф. Скиннер Дональд О. Хебб Эрнест Хилгард Гарри Харлоу Раймонд Кеттелл Авраам Маслоу Нил Э. Миллер Джером Брунер Дональд Т. Кэмпбелл Ганс Айзенк Герберт А. Саймон Дэвид Макклелланд Леон Фестингер Джордж А. Миллер Ричард Лазарус Стэнли Шахтер Роберт Зайонц Альберт Бандура Роджер Браун Эндель Тулвинг Лоуренс Кольберг Ноам Хомский Ульрик Нейссер Джером Каган Уолтер Мишель Эллиот Аронсон Дэниел Канеман Пол Экман Майкл Познер Амос Тверски Брюс МакИвен Ларри Сквайр Ричард Э. Нисбетт Мартин Селигман Эд Динер Шелли Э. Тейлор Джон Андерсон Рональд К. Кесслер Джозеф Э. Леду Ричард Дэвидсон Сьюзен Фиш Рой Баумайстер
Списки	Темы консультирования Дисциплины Организации Контур Психологи Психотерапия Методы исследования Школы мысли Хронология Темы
Определение в Викисловаре Категория викисловаря Викиисточник Викисклад Викицитатник Викиновости Викикниги