Jump to content

Приравнивание

Приравнивание тестов традиционно относится к статистическому процессу определения сопоставимых баллов на различных формах экзамена . [1] Этого можно достичь, используя либо классическую теорию тестирования , либо теорию ответов на задания .

В теории ответа на предмет приравнивание [2] Это процесс помещения оценок из двух или более параллельных форм теста в общую шкалу оценок. В результате результаты двух разных форм теста можно сравнивать напрямую или рассматривать их так, как если бы они были получены из одной и той же формы теста. Когда тесты не параллельны, общий процесс называется связыванием. Это процесс приравнивания единиц и начал двух шкал, по которым оцениваются способности учащихся на основе результатов различных тестов. Этот процесс аналогичен приравниванию градусов Фаренгейта к градусам Цельсия путем преобразования измерений из одной шкалы в другую. Определение сопоставимых оценок является побочным продуктом приравнивания, которое является результатом приравнивания шкал, полученных по результатам тестов.

Предположим, что Дик и Джейн оба сдают экзамен, чтобы получить лицензию на определенную профессию. Поскольку высокие ставки (вы сможете практиковать свою профессию, если пройдете тест) могут создать соблазн обмануть, организация, которая наблюдает за тестом, создает две формы. Если мы знаем, что Дик набрал 60% по форме А, а Джейн — 70% по форме Б, знаем ли мы наверняка, кто из них лучше усвоил материал? Что, если форма А состоит из очень сложных заданий, а форма Б относительно проста? Для решения этой самой проблемы проводится уравнивающий анализ, чтобы оценки были максимально справедливыми.

Приравнивание в теории ответа на предмет

[ редактировать ]
Рисунок 1: Кривые характеристик теста, показывающие взаимосвязь между общим баллом и местоположением человека для двух разных тестов по отношению к общей шкале. В этом примере сумма баллов 37 по Оценке 1 соответствует сумме 34,9 баллов по Оценке 2, как показано вертикальной линией.

В теории ответа на задание «места» человека (меры некоторого качества, оцениваемые с помощью теста) оцениваются по интервальной шкале ; т.е. местоположения оцениваются относительно единицы и происхождения. При оценке образования обычно используются тесты для оценки различных групп учащихся с целью создания общей шкалы путем приравнивания происхождения, а при необходимости и единиц шкал, полученных на основе данных ответов из разных тестов. Этот процесс называется приравниванием или тестовым приравниванием.

В теории ответов на вопросы есть два разных типа уравнивания: горизонтальное и вертикальное. [3] Вертикальное уравнивание относится к процессу уравнивания тестов, проводимых для групп учащихся с разными способностями, например, учащихся разных классов (годов обучения). [4] Горизонтальное уравнивание означает уравнивание тестов, проводимых для групп со схожими способностями; например, два теста, проводимые учащимся одного и того же класса в течение двух последовательных календарных лет. Чтобы избежать практических эффектов, используются различные тесты.

С точки зрения теории ответов на задания, приравнивание — это всего лишь частный случай более общего процесса масштабирования , применимого, когда используется более одного теста. Однако на практике масштабирование часто реализуется отдельно для разных тестов, а затем шкалы впоследствии уравниваются.

Часто проводят различие между двумя методами приравнивания; приравнивание обычного человека и общего предмета . Приравнивание обычного человека предполагает проведение двух тестов для общей группы людей. Среднее и стандартное отклонение масштабных положений групп в двух тестах приравниваются с помощью линейного преобразования. Приравнивание общих заданий предполагает использование набора общих заданий, называемого якорным тестом, встроенного в два разных теста. Среднее расположение общих предметов приравнивается.

Классические подходы к приравниванию

[ редактировать ]

В классической теории тестов приравнивание среднего просто корректирует распределение баллов так, чтобы среднее значение одной формы было сопоставимо со средним значением другой формы. Хотя приравнивание средних является привлекательным из-за своей простоты, ему не хватает гибкости, а именно, учета возможности различия стандартных отклонений форм. [1]

Линейное уравнение корректируется таким образом, чтобы обе формы имели сопоставимое среднее значение и стандартное отклонение . Существует несколько типов линейного уравнения, которые различаются допущениями и математическими методами, используемыми для оценки параметров. Методы Такера и Левина по наблюдаемым показателям оценивают взаимосвязь между наблюдаемыми оценками в двух формах, а метод Левайна истинных оценок оценивает взаимосвязь между истинными оценками в двух формах. [1]

Приравнивание равнопроцентиля определяет приравнивающее отношение как такое, при котором оценка может иметь эквивалентный процентиль в любой форме. Эта зависимость может быть нелинейной.

В отличие от теории ответов на задания, уравнивание, основанное на классической теории тестирования, несколько отличается от масштабирования. Приравнивание представляет собой преобразование «необработанные данные» в том смысле, что оно оценивает исходный балл в форме B, который эквивалентен каждому исходному баллу в базовой форме A. Любое используемое преобразование масштабирования затем применяется поверх или вместе с приравниванием.

См. также

[ редактировать ]
  1. ^ Jump up to: а б с Колен, М.Дж., и Бреннан, Р.Л. (1995). Тестовое уравнение. Нью-Йорк: Весна.
  2. ^ Национальный совет по измерению в образовании http://www.ncme.org/ncme/NCME/Resource_Center/Glossary/NCME/Resource_Center/Glossary1.aspx?hkey=4bb87415-44dc-4088-9ed9-e8515326a061#anchorE . Архивировано в 2017–2007 гг. -22 в Wayback Machine
  3. ^ Бейкер, Ф. (1983). Сравнение показателей способностей, полученных с помощью двух процедур теории скрытых черт. Прикладные психологические измерения, 7, 97–110.
  4. ^ Бейкер, Ф. (1984). Преобразования показателей способностей, участвующие в вертикальном уравнивании в рамках теории ответов на задания. Прикладные психологические измерения, 8 (3), 261–271.
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 3eb616c69ada0e5ea58297a30595eb7f__1632231720
URL1:https://arc.ask3.ru/arc/aa/3e/7f/3eb616c69ada0e5ea58297a30595eb7f.html
Заголовок, (Title) документа по адресу, URL1:
Equating - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)