Приравнивание

Приравнивание тестов традиционно относится к статистическому процессу определения сопоставимых баллов на различных формах экзамена . ^[1] Этого можно достичь, используя либо классическую теорию тестирования , либо теорию ответов на задания .

В теории ответа на предмет приравнивание ^[2] Это процесс помещения оценок из двух или более параллельных форм теста в общую шкалу оценок. В результате результаты двух разных форм теста можно сравнивать напрямую или рассматривать их так, как если бы они были получены из одной и той же формы теста. Когда тесты не параллельны, общий процесс называется связыванием. Это процесс приравнивания единиц и начал двух шкал, по которым оцениваются способности учащихся на основе результатов различных тестов. Этот процесс аналогичен приравниванию градусов Фаренгейта к градусам Цельсия путем преобразования измерений из одной шкалы в другую. Определение сопоставимых оценок является побочным продуктом приравнивания, которое является результатом приравнивания шкал, полученных по результатам тестов.

Цель

Предположим, что Дик и Джейн оба сдают экзамен, чтобы получить лицензию на определенную профессию. Поскольку высокие ставки (вы сможете практиковать свою профессию, если пройдете тест) могут создать соблазн обмануть, организация, которая наблюдает за тестом, создает две формы. Если мы знаем, что Дик набрал 60% по форме А, а Джейн — 70% по форме Б, знаем ли мы наверняка, кто из них лучше усвоил материал? Что, если форма А состоит из очень сложных заданий, а форма Б относительно проста? Для решения этой самой проблемы проводится уравнивающий анализ, чтобы оценки были максимально справедливыми.

Приравнивание в теории ответа на предмет

В теории ответа на задание «места» человека (меры некоторого качества, оцениваемые с помощью теста) оцениваются по интервальной шкале ; т.е. местоположения оцениваются относительно единицы и происхождения. При оценке образования обычно используются тесты для оценки различных групп учащихся с целью создания общей шкалы путем приравнивания происхождения, а при необходимости и единиц шкал, полученных на основе данных ответов из разных тестов. Этот процесс называется приравниванием или тестовым приравниванием.

В теории ответов на вопросы есть два разных типа уравнивания: горизонтальное и вертикальное. ^[3] Вертикальное уравнивание относится к процессу уравнивания тестов, проводимых для групп учащихся с разными способностями, например, учащихся разных классов (годов обучения). ^[4] Горизонтальное уравнивание означает уравнивание тестов, проводимых для групп со схожими способностями; например, два теста, проводимые учащимся одного и того же класса в течение двух последовательных календарных лет. Чтобы избежать практических эффектов, используются различные тесты.

С точки зрения теории ответов на задания, приравнивание — это всего лишь частный случай более общего процесса масштабирования , применимого, когда используется более одного теста. Однако на практике масштабирование часто реализуется отдельно для разных тестов, а затем шкалы впоследствии уравниваются.

Часто проводят различие между двумя методами приравнивания; приравнивание обычного человека и общего предмета . Приравнивание обычного человека предполагает проведение двух тестов для общей группы людей. Среднее и стандартное отклонение масштабных положений групп в двух тестах приравниваются с помощью линейного преобразования. Приравнивание общих заданий предполагает использование набора общих заданий, называемого якорным тестом, встроенного в два разных теста. Среднее расположение общих предметов приравнивается.

Классические подходы к приравниванию

В классической теории тестов приравнивание среднего просто корректирует распределение баллов так, чтобы среднее значение одной формы было сопоставимо со средним значением другой формы. Хотя приравнивание средних является привлекательным из-за своей простоты, ему не хватает гибкости, а именно, учета возможности различия стандартных отклонений форм. ^[1]

Линейное уравнение корректируется таким образом, чтобы обе формы имели сопоставимое среднее значение и стандартное отклонение . Существует несколько типов линейного уравнения, которые различаются допущениями и математическими методами, используемыми для оценки параметров. Методы Такера и Левина по наблюдаемым показателям оценивают взаимосвязь между наблюдаемыми оценками в двух формах, а метод Левайна истинных оценок оценивает взаимосвязь между истинными оценками в двух формах. ^[1]

Приравнивание равнопроцентиля определяет приравнивающее отношение как такое, при котором оценка может иметь эквивалентный процентиль в любой форме. Эта зависимость может быть нелинейной.

В отличие от теории ответов на задания, уравнивание, основанное на классической теории тестирования, несколько отличается от масштабирования. Приравнивание представляет собой преобразование «необработанные данные» в том смысле, что оно оценивает исходный балл в форме B, который эквивалентен каждому исходному баллу в базовой форме A. Любое используемое преобразование масштабирования затем применяется поверх или вместе с приравниванием.

См. также

Оценка по кривой

Ссылки

^ Jump up to: ^а ^б ^с Колен, М.Дж., и Бреннан, Р.Л. (1995). Тестовое уравнение. Нью-Йорк: Весна.
^ Национальный совет по измерению в образовании http://www.ncme.org/ncme/NCME/Resource_Center/Glossary/NCME/Resource_Center/Glossary1.aspx?hkey=4bb87415-44dc-4088-9ed9-e8515326a061#anchorE . Архивировано в 2017–2007 гг. -22 в Wayback Machine
^ Бейкер, Ф. (1983). Сравнение показателей способностей, полученных с помощью двух процедур теории скрытых черт. Прикладные психологические измерения, 7, 97–110.
^ Бейкер, Ф. (1984). Преобразования показателей способностей, участвующие в вертикальном уравнивании в рамках теории ответов на задания. Прикладные психологические измерения, 8 (3), 261–271.

Внешние ссылки

[KolenBrennan-1] Jump up to: ^а ^б ^с Колен, М.Дж., и Бреннан, Р.Л. (1995). Тестовое уравнение. Нью-Йорк: Весна.

[2] Национальный совет по измерению в образовании http://www.ncme.org/ncme/NCME/Resource_Center/Glossary/NCME/Resource_Center/Glossary1.aspx?hkey=4bb87415-44dc-4088-9ed9-e8515326a061#anchorE . Архивировано в 2017–2007 гг. -22 в Wayback Machine

[3] Бейкер, Ф. (1983). Сравнение показателей способностей, полученных с помощью двух процедур теории скрытых черт. Прикладные психологические измерения, 7, 97–110.

[4] Бейкер, Ф. (1984). Преобразования показателей способностей, участвующие в вертикальном уравнивании в рамках теории ответов на задания. Прикладные психологические измерения, 8 (3), 261–271.

[1]

[2]

[3]

[4]