Психометрическое программное обеспечение

Психометрическое программное обеспечение относится к специализированным программам, используемым для психометрического анализа данных , полученных в результате тестов , анкет, опросов или опросов, которые измеряют скрытые психообразовательные переменные. Хотя некоторый психометрический анализ можно провести с использованием общего статистического программного обеспечения, такого как SPSS , для большинства из них требуются специальные инструменты, разработанные специально для психометрических целей. ^{[ нужна ссылка ]}^[1]

Источники свободного программного обеспечения

Исследователи и преподаватели разработали множество бесплатных психометрических инструментов. Известные веб-сайты и ресурсы, предлагающие такое программное обеспечение, включают:

CASMA в Университете Айовы, США : размещает набор компьютерных программ GENOVA для теории обобщения .
REMP в Массачусетском университете, США : предоставляет программное обеспечение для теории ответов на вопросы, последнее обновление которого было выпущено в 2008 году.
Программное обеспечение от Брэда Хэнсона : предлагает C++ библиотеки для теории реагирования на элементы (IRT).
Программное обеспечение от Джона Юберсакса : содержит программное обеспечение для анализа скрытых классов .
Программное обеспечение от Дж. Патрика Мейера, jMetrik : предоставляет программное обеспечение с открытым исходным кодом для психометрического анализа.
Программное обеспечение от PMaps : специализируется на программном обеспечении для психометрической оценки.
Каталог программного обеспечения в Институте объективных измерений : перечислены различные психометрические
Программное обеспечение от Мэтью Кортни, Кевина Чанга, Эрика Мэя, Кейна Мейселя, Люка Роу и Лейлы Исаевой .

Существует также инструмент R Shiny для воспроизводимого анализа Раша , дифференциального функционирования элементов, приравнивания и изучения групповых эффектов.

Кроме того, все большее количество пакетов для R можно найти в представлении задач CRAN: психометрические модели и методы.

Классическая теория тестирования

Классическая теория тестирования (КТТ) — это подход к психометрическому анализу, который предполагает меньше предположений, чем теория ответов на вопросы, и больше подходит для выборок меньшего размера.

вскрытие

Autopsych — это бесплатное веб-приложение с открытым исходным кодом и множеством функций для проведения классической теории испытаний (КТТ) и моделирования Раша. Функции СТТ включают в себя:

Процент правильных
Наблюдаемые баллы для каждой категории предметов
Корреляции между позициями и общим количеством
Корреляции между позициями и остальными (с доверительными интервалами, указанными пользователем)
Бисериальные/полисерийные корреляции точка-остаток
Альфа Кронбаха
Альфа-если удален
Полная корреляционная матрица Пирсона (матрица позиций) с уровнями статистической значимости

Autopsych также выполняет несколько функций на основе Rasch, в том числе:

Базовый многогранный анализ Раша для дифференциального функционирования элементов (DIF)
Исправлено сопоставление элементов для дихотомических матриц ответов на вопросы.
Односторонний дисперсионный анализ
Межэкспертный анализ надежности

ДРУГОЙ

CITAS (таблица для анализа классических заданий и тестов) — это бесплатная книга Excel, предназначенная для выставления оценок и статистического анализа классных тестов. Пользователи могут вводить или вставлять ответы элементов (ABCD) и ключи в книгу, и выходные данные заполняются автоматически. В отличие от некоторых других программ, CITAS не требует какого-либо опыта или опыта психометрического анализа, что делает его доступным для учителей и профессоров.

jМетрика

jMetrik — бесплатное программное обеспечение с открытым исходным кодом для проведения комплексного психометрического анализа, разработанное Дж. Патриком Мейером в Университете Вирджинии . Он включает в себя методы:

Классический анализ предметов
Анализ функционирования дифференциального элемента (DIF)
Подтверждающий факторный анализ
Теория ответа на предмет (IRT)
IRT приравнивание
Непараметрическая теория ответа на предмет

Анализ элементов jMetrik включает пропорции, двухрядную статистику по точкам и двухрядную статистику для всех вариантов ответа. Он рассчитывает различные коэффициенты надежности, включая альфа Кронбаха , лямбда Гутмана и коэффициент Фельдта-Гилмера. В анализе DIF используются непараметрические характеристические кривые элементов и процедура Мантеля-Хензеля, сообщаются размеры эффекта и классификация ETS DIF. Методы IRT включают модели Раша , частичной оценки и модели рейтинговой шкалы с такими методами приравнивания, как среднее/среднее, среднее/сигма, процедуры Хаебары и Стокинга-Лорда.

jMetrik также имеет:

ИРТ-иллюстратор
Базовая описательная статистика
Графические возможности для гистограмм , круговых диаграмм , гистограмм , оценок плотности ядра и линейных графиков.

jMetrik — это чистое Java- приложение, которое работает в 32-битных и 64-битных версиях операционных систем Windows , Mac и Linux . На главном компьютере требуется Java 1.6.

Иман

Itman — коммерческая программа для Windows, специально разработанная для классического анализа тестов. Он создает технические отчеты в Microsoft Word с графиками, пояснениями и встроенными таблицами. Иман рассчитывает пропорции и двухрядные точки каждого элемента, пропорции высоких/низких подгрупп и подробные графики производительности элемента. Он также предоставляет описательную статистику, включая среднее значение, стандартное отклонение, надежность и стандартную ошибку измерения для каждой области и общих тестов. Iteman доступен в компании Assessment Systems Corporation.

Потеря глины

Lertap5 (Программа анализа тестов лаборатории образовательных исследований) — это комплексный пакет программного обеспечения для анализа тестов и опросов, разработанный для компьютеров Windows и Macintosh с Microsoft Excel . Лертап5 включает в себя:

Статистика тестов, предметов и опций
Согласованность классификации и анализ тестов на зачетность
Процедуры обнаружения мошенничества
Обширная графика (например, линии трассировки для параметров элемента, условные стандартные ошибки измерения, осыпи , диаграммы коробчатые диаграммы , гистограммы, рассеяния )

Lertap5 поддерживает анализ заданий CTT и Rasch для дихотомических тестовых заданий. DIF (дифференциальное функционирование элементов) поддерживается с использованием методов Мантеля-Хэнзеля с графическими результатами. Он также взаимодействует с R и R Studio , создавая файлы данных и управления для различных программ IRT, таких как X Caliber и Bilog MG, а также подготавливая данные для SAS.

Lertap5 был разработан Ларри Нельсоном из Университета Кертина и доступен на сайте Lertap5.com.

КРАН

TAP (Программа анализа тестов) — это бесплатная программа для Windows, написанная на Delphi Pascal, которая выполняет анализ тестов и элементов на основе классической теории тестирования. TAP предоставляет отчеты об общих баллах экзаменуемого, статистике заданий (например, сложности задания, различении заданий, бисерии баллов), анализе вариантов и другую полезную информацию. Он также предоставляет отдельные отчеты экзаменуемых об общем количестве баллов и ответах на задания.

ВиСта-СИТА

ViSta-CITA (классический анализ заданий и тестов) — это модуль в системе визуальной статистики (ViSta), который применяет графически-ориентированные методы к психометрическому анализу. Разработан Рубеном Ледесмой, Дж. Габриэлем Молиной, Педро М. Валеро-Мора и Форрестом. У. Янг. ViSta не обновлялась с 2014 года.

Психика

Psych — это пакет R, предоставляющий процедуры для изучения личности, психометрии и экспериментальной психологии. Его функции поддерживают:

Построение шкалы с использованием факторного анализа, кластерного анализа и анализа надежности.
Базовая описательная статистика
Теория реакции на предмет посредством факторного анализа тетрахорических и полихорических корреляций
Моделирование структур заданий и тестов
Моделирование структурными уравнениями

Psych создает графическое отображение диаграмм путей, факторного анализа и моделей структурных уравнений, используя базовую графику. Для получения дополнительной информации посетите веб-страницу person-project.org/r.

Калибровка теории реагирования на предмет

Теория ответа на предмет (IRT) — это психометрический подход, который предполагает, что вероятность определенного ответа является прямой функцией основной черты или черт. Для моделирования этой взаимосвязи были предложены различные функции, и это отражено в различных пакетах калибровки. Несколько пакетов программного обеспечения были разработаны для дополнительного анализа, такого как приравнивание ; они перечислены в следующем разделе.

вскрытие

Программа с открытым исходным кодом Autopsych используется для проведения одномерного анализа Раша. Приложение может обрабатывать как дихотомические, так и политомические данные посредством применения частичной кредитной модели Мастера. Приложение использует оценку предельного максимального правдоподобия и использует в общей сложности 31 пакет R с открытым исходным кодом (включая TAM, psych, Knitr и т. д.). Пользователи загружают матрицы ответов на вопросы (файлы .csv), настраивают параметры анализа Rasch, и приложение автоматически генерирует PDF-файл со встроенным повествованием о методологии и результатах. Файлы Excel содержат результаты всех выполненных анализов, включая правдоподобные значения. Пользователи также могут выполнять базовый многогранный анализ Раша для проверки элемента DIF, фиксированное привязочное уравнение для двух дихотомических матриц, дисперсионный анализ (ANOVA) тета-оценок EAP для изучения влияния групповых эффектов и анализ надежности между экспертами. для проверки последовательности экзаменатора. Полное описание веб-приложения представлено в журнале PLOS ONE SCIENCE. ^[2]

КРУГ-МГ

BILOG-MG — это программное обеспечение для IRT-анализа дихотомических (правильных/неправильных) данных, включая функционирование подходящих и дифференциальных элементов . Он является коммерческим и доступен только у Scientific Software International.

Декстер

Dexter, впервые опубликованный в феврале 2017 года, представляет собой пакет R, задуманный как надежная и достаточно комплексная система для управления и анализа тестовых данных, организованных в буклетах. Пакет включает в себя средства для импорта и управления тестовыми данными, оценки и улучшения качества данных посредством базового анализа тестов и заданий, подбора модели IRT и вычисления различных оценок способностей. Предоставляются многие психометрические методы, которых нет в других источниках, такие как модель взаимодействия Хабермана (2007), обобщенная для политомических элементов, эффективное генерирование правдоподобных значений или оценок, новые методы исследовательского и подтверждающего анализа DIF, поддержка метода установления стандартов 3DC и многие другие. более. Центральная модель IRT представляет собой политомическое обобщение расширенной маргинальной модели Раша. Оценка осуществляется с помощью CML или байесовских методов. Существует два сопутствующих пакета: dextergui, впервые опубликованный в июне 2018 года и обеспечивающий простой графический интерфейс для наиболее широко используемых функций в dexter; и dexterMST, впервые опубликованный в июле 2018 года, для управления и анализа данных многоэтапных тестовых проектов. Все пакеты подробно документированы как для новичков, так и для профессионалов.

Facets — это программное обеспечение для анализа Rasch оценок или данных, поступающих от судей, таких как оценки за эссе, соревнования по дайвингу, опросы удовлетворенности и данные о качестве жизни. Другие приложения включают ранговые данные, биномиальные испытания и подсчет Пуассона.

ФлексМИРТ

Программное обеспечение FlexMIRT IRT — это многоуровневый пакет программного обеспечения с несколькими группами для анализа элементов, калибровки элементов и оценки результатов испытаний. Программный пакет flexMIRT IRT подходит для различных одномерных и многомерных моделей теории реагирования элементов (также известных как модели факторного анализа элементов) для одноуровневых и многоуровневых данных в любом количестве групп.

Иртойс

Irtoys — это пакет R, впервые опубликованный в 2007 году и поддерживающий почти все, что есть в книге, но ограниченный одним буклетом с дихотомическими элементами. Он хорош для обучения, небольших проектов, как швейцарский нож психометриста.и как источник строительных материалов для других проектов. Файлы простого синтаксиса для ICL и BILOG-MG, которые он записывает, можно изучать и модифицировать для решения более сложных задач.

ICL

ICL (язык команд IRT) выполняет калибровку IRT, включая логистические модели с 1, 2 и 3 параметрами, а также модель частичного кредита и обобщенную модель частичного кредита. Он также может генерировать данные ответа. Как следует из названия, он полностью управляется командным кодом и не имеет графического пользовательского интерфейса.

jМетрика

jMetrik — это бесплатное программное обеспечение с открытым исходным кодом для проведения комплексного психометрического анализа. Он был разработан Дж. Патриком Мейером в Университете Вирджинии . Текущие методы включают классический анализ заданий, анализ дифференциального функционирования заданий (DIF), теорию ответа на задание, уравнение IRT и непараметрическую теорию ответа на задание. Анализ элементов включает в себя пропорции, двухрядную статистику по точкам и двухрядную статистику для всех вариантов ответа. Коэффициенты надежности включают альфа Кронбаха, лямбда Гуттмана, коэффициент Фельдта-Гилмера, коэффициент Фельдта-Бреннана, индексы согласованности решений, условную стандартную ошибку измерения и надежность в случае удаления элемента. Анализ DIF основан на непараметрических кривых характеристик изделия и процедуре Мантеля-Хэнзеля. В выходные данные включаются размеры эффекта DIF и классификации ETS DIF. Методы IRT включают модели Раша, модели частичного кредита и рейтинговой шкалы, оцениваемые с помощью JMLE. jMetrik также предоставляет модели 3PL, 4PL и обобщенные частичные кредитные модели, оцениваемые с помощью MMLE. Методы оценки личности включают MLE, MAP и EAP. Методы приравнивания IRT включают процедуры «среднее/среднее», «среднее/сигма», «Хебара» и «Стокинг-Лорд».

jMetrik также включает базовую описательную статистику и графическое средство, которое создает гистограммы, круговые диаграммы, гистограммы, оценки плотности ядра и линейные графики.

jMetrik — это чистое Java-приложение, работающее в 32-битных и 64-битных версиях операционных систем Windows, Mac и Linux. jMetrik требует наличия Java 1.6 на главном компьютере.

Лертап5

Lertap5 имеет встроенную поддержку анализа Rasch (Lertap5-Rasch), а также обеспечивает поддержку пользователей Xcaliber, Bilog-MG, процедур IRT в SAS и «EIRT», эквивалента пакета «RIRT» в Excel. Lertap5 запускает «приложение» Excel, как и EIRT.

МУЛЬТИЛОГ

MULTILOG — это расширение BILOG для данных с политомическими (множественными) ответами. Он является коммерческим и доступен только у Scientific Software International.

ИМРТ

BMIRT — это бесплатная многоцелевая прикладная программа Java, которая выполняет калибровку элементов и оценку способностей в рамках многомерной многогрупповой модели теории ответов элементов (IRT); он может соответствовать дихотомическим или политомическим моделям, а также смешанным моделям. Он поддерживает как исследовательские, так и подтверждающие, а также компенсаторные и некомпенсаторные модели MIRT.

ПАРСКАЛЬ

PARSCALE — это программа, разработанная специально для политомического IRT-анализа. Он является коммерческим и доступен только у Scientific Software International.

ПАРАМ-3ПЛ

PARAM-3PL — бесплатная программа для калибровки 3-параметрической логистической модели IRT. Он был разработан Лоуренсом Руднером в Информационном центре образовательных ресурсов (ERIC). Последним выпуском была версия 0.93, выпущенная в августе 2012 года.

ТЕСТФакт

Функции Testfact — исследовательский факторный анализ предельного максимального правдоподобия (MML) и классический элементный анализ двоичных данных.- Вычисляет тетрахорические корреляции, решение главных факторов, классическую описательную статистику, таблицы и графики фрактильности.- Обрабатывает до 10 факторов с использованием числовой квадратуры: до 5 для неадаптивной и до 10 для адаптивной квадратуры- Обрабатывает до 15 факторов с использованием методов интеграции Монте-Карло.- Varimax (ортогональное) и PROMAX (наклонное) вращение факторных нагрузок- Осуществляет важную форму подтверждающего факторного анализа, известную как «бифакторный» анализ: Факторная модель состоит из одного основного фактора плюс групповых факторов.- Моделирование ответов на элементы на основе заданных пользователем параметров.- Исправление угадывания и недостигнутых предметов- Позволяет накладывать ограничения на оценки параметров элемента.- Обрабатывает пропущенные и непредставленные элементы.- Подробная онлайн-документация HELP включает синтаксис и аннотированные примеры.

ВИНМИРА 2001

WINMIRA 2001 — это программа для анализа с использованием модели Раша для дихотомических и политомических порядковых ответов, с анализом скрытых классов и с моделью Раша распределения смеси для дихотомических и политомических ответов на элементы. ^[3]^[4] Программное обеспечение обеспечивает оценку условного максимального правдоподобия (CML) параметров элемента, а также оценки параметров человека MLE и WLE, а также статистику соответствия человека и объекта, а также информационные критерии (AIC, BIC, CAIC) для выбора модели. Программное обеспечение также выполняет процедуру параметрической загрузки для выбора количества компонентов смеси. Бесплатная студенческая версия доступна на веб-странице Маттиаса фон Давьера , а также доступна коммерческая версия.

Уинстепс

Winsteps — это программа, предназначенная для анализа с использованием модели Раша , однопараметрической модели теории ответов на вопросы, которая отличается от модели 1PL тем, что каждый человек в выборке людей параметризуется для оценки элементов, и она является предписывающей и привязанной к критериям, а не описательный и нормативный характер. ^[5] Он коммерчески доступен от Winsteps, Inc. Также доступна предыдущая версия BIGSTEPS для DOS.

Xкалибровка

Xкалибровка — это коммерческая программа, которая выполняет оценку предельного максимального правдоподобия как дихотомических (1PL-Rasch, 2PL, 3PL), так и всех основных политомических моделей IRT. Интерфейс представляет собой «укажи и щелкни»; код команды не требуется. Его выходные данные включают в себя как электронные таблицы, так и подробный, озвученный отчет со встроенными таблицами и рисунками, которые можно распечатать и передать экспертам в данной области для проверки. Его можно приобрести только у компании Assessment Systems Corporation.

СМОТРИТЕ

IATA — это пакет программного обеспечения для анализа данных психометрических и образовательных оценок. Интерфейс основан на принципах «укажи и щелкни», а все функции предоставляются через интерфейсы в стиле мастера, основанные на различных рабочих процессах или целях анализа, таких как пилотное тестирование или сопоставление. IATA читает и записывает файлы в форматах csv, Excel и SPSS, а также создает экспортируемые графики для любого статистического анализа. Каждый анализ также включает эвристику, предлагающую соответствующую интерпретацию численных результатов. IATA выполняет факторный анализ, масштабирование и калибровку (1PL-Rasch, 2PL, 3PL), анализ функционирования дифференциальных элементов (DIF), (базовую) разработку компьютерных тестов, приравнивание, установление стандартов на основе IRT, согласование оценок и генерацию правдоподобных значений. Его можно бесплатно получить в Polymetrika International.

Умереть

пакет Р. Анализ данных дихотомических и политомических ответов с использованием одномерных и многомерных моделей скрытых черт в рамках парадигмы теории ответа на предмет. Исследовательские и подтверждающие модели можно оценить с помощью квадратурных (EM) или стохастических (MHRM) методов. Для моделирования тестовых заданий доступны подтверждающие двухфакторные и двухуровневые анализы. Также доступны множественный групповой анализ и планы со смешанными эффектами для выявления различий в функционировании предметов и моделирования ковариат предметов и людей.

лтм

пакет Р. Анализ многомерных дихотомических и политомических данных с использованием моделей скрытых черт в рамках подхода теории ответа на предмет. Он включает в себя модель Раша, двухпараметрическую логистическую модель, трехпараметрическую модель Бирнбаума, дифференцированный ответ и обобщенную модель частичного кредита.

ТАМ

пакет Р. Пакет включает в себя маргинальную и совместную оценку максимального правдоподобия одномерных и многомерных моделей ответов на вопросы (Rasch, 2PL, Generalized Partial Credit, Rating Scale, Multi Facets), статистику соответствия, оценку стандартной ошибки, а также вменение правдоподобного значения и оценку взвешенного правдоподобия. способностей.

ACER Завоевание

ACER ConQuest — это компьютерная программа для подбора как одномерных, так и многомерных моделей ответа на вопросы и скрытой регрессии. Он обеспечивает анализ данных на основе комплексного и гибкого набора моделей ответов на вопросы (IRM), что позволяет изучать свойства оценок производительности, традиционных оценок и рейтинговых шкал. ACER ConQuest 4 также предлагает более широкие процедуры измерения и анализа исследовательского сообщества, основанные на самых современных психометрических методах многогранных моделей ответов на вопросы, многомерных моделей ответов на вопросы, моделей скрытой регрессии и построения правдоподобных значений.

Иртплей

пакет Р. Адаптируйте одномерные модели теории ответов на задания (IRT) к смеси дихотомических и политомических данных, калибруйте параметры онлайн-заданий, оценивайте скрытые способности испытуемых и исследуйте соответствие данных модели IRT на уровне заданий различными способами, а также предоставляйте полезные функции, связанные с к одномерному ИРТ.

УМИРАЮЩИЙ

Общая программа с открытым исходным кодом для анализа ответов на задания, разработанная в Службе образовательного тестирования. ^[6] Программа может обрабатывать независимые переменные, многомерные параметры способностей, неполные данные и сложную выборку. Переменные способностей могут быть политомическими или многомерными нормальными, а предметы могут быть дихотомическими или политомическими.

Дополнительное программное обеспечение для теории реагирования на предметы

Из-за сложности IRT существует мало пакетов программного обеспечения, допускающих калибровку. Однако существует множество программ для специального вспомогательного анализа IRT, такого как приравнивание и масштабирование. Ниже приведены примеры такого программного обеспечения.

СсылкаМИРТ

LinkMIRT — это бесплатная прикладная программа Java, которая связывает два набора параметров элементов в многомерной структуре IRT (MIRT). Программное обеспечение может реализовать метод Стокинга и Лорда, метод среднего/среднего и метод среднего/сигмы. Поддерживаются ссылки по комментаторам и по случайным эквивалентным группам.

ПЕЙСЕР

PACER (Психометрический анализ и вычислительная среда для исследователей) — это психометрическая экосистема и облачное приложение для психометристов и специалистов по обработке данных, разработанное Гарольдом Дораном. Программное обеспечение предлагает оценку параметров IRT и человека (MLE, MAP, EAP, TCC и бифакторные модели), оценку параметров и человека в рамках двух общих моделей когнитивной диагностики (DINA/DINO), среду построения тестов, включая автоматическую сборку тестов, шесть подходов к уравнению тестов. на основе планов общих элементов, линейных регрессий с ошибками в переменных, включая модели с фиксированными и смешанными эффектами, классического анализа элементов, дифференциальной функции элементов с помощью процедуры Мантеля-Хэнзеля, процедур сопоставления элементов, интерактивного исследования данных и базового статистического анализа, расчета надежности использование альфа Кронбаха, стратифицированной альфа и Фельдта-Раджу вместе с дисперсиями складного ножа, классического анализа тестовых заданий, статистики соответствия на основе IRT, включая графики соответствия элементов, регуляризованных регрессий (эластичная сеть, гребень, лассо), Q1 и Q3 Йена статистика, методы согласованности классификации и точности классификации, а также процедуры прямой оценки, используемые в анализах в стиле NAEP.

СимуМИРТ

SimuMIRT — это программа, которая моделирует многомерные данные (способности испытуемого и ответы на задания) для теста фиксированной формы (например, бумага и карандаш) на основе заданного пользователем набора параметров. Поддерживается модель рейтингового эффекта.

СимуMCAT

SimuMCAT — это бесплатная прикладная программа Java, имитирующая многомерный компьютерный адаптивный тест (MCAT). Пользователь может выбрать одну из пяти различных процедур выбора элементов MCAT («Объем», «Информация Кульбака-Лейблера», «Минимизировать дисперсию ошибки линейной комбинации», «Минимальный угол» и «Минимизировать дисперсию ошибки составной оценки с оптимизированным весом»). ^[7] Возможны два подхода к контролю воздействия: традиционный подход Симпсона-Хеттера и подход к максимальному контролю воздействия. Также возможно реализовать ограничения контента с помощью метода индекса приоритета. Различные правила остановки реализуются с помощью тестов фиксированной длины и тестов переменной длины. Пользователь указывает истинные способности испытуемого, наборы предметов и процедуры выбора предметов, а программа выводит выбранные предметы с ответами на задания и оценками способностей. Пользователь может указать байесовские и небайесовские методы. Пулы способностей и предметов экзаменуемых также могут быть созданы из программы с помощью заданных пользователем дистрибутивов.

ИРТЕК

IRTEQ — это бесплатное приложение для Windows с графическим пользовательским интерфейсом , реализующее масштабирование и уравнение IRT, разработанное Кюнгом (Крисом) Т. Ханом. В нем реализованы методы масштабирования/уравнивания IRT, которые широко используются в проекте «Якорный тест неэквивалентных групп»: методы «среднее/среднее», «среднее/сигма», «робастное среднее/сигма» и TCC. ^[8]^[9]^[10]^[11]^[12] Для методов TCC IRTEQ предоставляет пользователю возможность выбирать различные распределения оценок для включения в функцию потерь. IRTEQ поддерживает различные популярные одномерные модели IRT: логистические модели для дихотомических ответов (с 1, 2 или 3 параметрами) и обобщенную модель частичного кредита (GPCM) (включая модель частичного кредита (PCM), которая является частным случаем GPCM) и Модель градуированного ответа (GRM) для политомических ответов. IRTEQ также может приравнивать результаты тестов по шкале одного теста к шкале другого теста, используя приравнивание истинных баллов IRT. ^[13]

ResidPlots-2

ResidPlots-2 — бесплатная программа для графического остаточного анализа IRT. Его разработали Ти Лян, Кьюнг (Крис) Т. Хан и Рональд К. Хэмблтон в Массачусетском университете в Амхерсте .

ВинГен

WinGen — это бесплатная программа для Windows, которая генерирует параметры IRT и ответы элементов. Кён (Крис) Т. Хан в Массачусетском университете в Амхерсте . ^[14]

СТ

ST проводит преобразования шкалы теории ответов на задания (IRT) для тестов с дихотомической оценкой.

ПОЛИСТ

POLYST выполняет преобразования шкалы IRT для дихотомических и политомических тестов.

СТЮАРТ

STUIRT выполняет преобразования шкалы IRT для тестов смешанного формата (тестов, которые включают некоторые задания с несколькими вариантами ответов и некоторые политомические задания).

Плинк

пакет Р. В этом пакете используются методы теории ответа на задание для вычисления констант связывания и проведения цепочки связывания одномерных или многомерных тестов для нескольких групп в рамках общего дизайна задания. Одномерные методы включают методы «Среднее/среднее», «Среднее/сигма», «Хебара» и «Стокинг-Лорд» для дихотомических (1PL, 2PL и 3PL) и/или политомических (дифференцированный ответ, частичная зачетная оценка/обобщенная частичная зачетная единица, номинальный метод и метод с множественным выбором). модель) предметы. Многомерные методы включают метод наименьших квадратов и расширения метода Хаебары и Стокинга-Лорда с использованием одного или нескольких параметров расширения для многомерных расширений всех одномерных дихотомических и политомических моделей ответов на задания. Пакет также включает функции для импорта параметров предметов и/или способностей из обычного программного обеспечения IRT, проведения приравнивания истинного балла IRT и наблюдаемого балла, а также построения кривых/поверхностей отклика предметов, векторных графиков и графиков сравнения для изучения дрейфа параметров.

Последовательность решений

Методы согласованности решений применимы к тестам, основанным на критериях, таких как экзамены на получение лицензии и тестирование академического мастерства.

Иман

Иман предоставляет индекс согласованности решений, а также классическую оценку условной стандартной ошибки измерения при минимальном балле, который часто запрашивается для аккредитации программы тестирования.

jМетрика

jMetrik — это бесплатное программное обеспечение с открытым исходным кодом для проведения комплексного психометрического анализа. Подробная информация указана выше. jMetrik включает оценки последовательности решений Хьюна, если в анализе элементов предусмотрены сокращенные баллы.

Потеря глины

Лертап рассчитывает несколько статистических данных, связанных с согласованностью решений и классификаций, включая коэффициент Ливингстона, индекс надежности Бреннана-Кейна, каппа и оценку p (0), количества правильных классификаций как пропорции, полученную с использованием адаптации Пенга-Субковиака Метод Хьюня. Более подробная информация о Лертапе представлена выше, в разделе «Классическая теория тестов».

Другие анализы

Большая часть психометрического программного обеспечения предназначена для анализа данных ответов для оценки заданий и результатов тестов; большая часть вышеперечисленного программного обеспечения ориентирована на это. Некоторое программное обеспечение предназначено для других психометрических анализов.

ПРОСЕЯТЬ

SIFT предназначен для криминалистики данных, а именно для поиска доказательств мошенничества или другого поведения, которое ставит под угрозу достоверность и целостность теста. Это программа для Windows с пользовательским интерфейсом «укажи и щелкни» и выводом в Microsoft Excel .

Обнаружение копирования

CopyDetect — это пакет R, предназначенный для анализа данных, а именно для поиска доказательств мошенничества или другого поведения, которое ставит под угрозу достоверность и целостность теста.

ТестАссемблер

TestAssembler — это программа Windows, выполняющая автоматическую тестовую сборку.

МИНУТЫ

ATA — это пакет R для автоматизированной тестовой сборки.

Программное обеспечение для общего статистического анализа

Программное обеспечение, предназначенное для общего статистического анализа, часто можно использовать для определенных типов психометрического анализа. Более того, часто доступен код для более сложных типов психометрического анализа.

Р

R — это среда программирования, предназначенная для статистических вычислений и создания графики. Базовую функциональность R можно расширить путем установки дополнительных «пакетов», а список пакетов, связанных с психометрией, поддерживается на веб-сайте CRAN . ^[15]

САС

SAS — это коммерчески доступный пакет для статистического анализа и обработки данных. Это также основано на командах.

СПСС

SPSS , первоначально называвшийся Статистическим пакетом для социальных наук, представляет собой коммерческую программу общего статистического анализа, в которой данные представлены в виде электронной таблицы, а общий анализ осуществляется с помощью меню.

S-Плюс

S-Plus — пакет коммерческого анализа, основанный на языке S. программирования

Был

Stata — это коммерческий пакет. Реализация IRT компании Stata включает логистические модели с 1, 2 и 3 параметрами, модели дифференцированного ответа, модели частичного зачета и обобщенного частичного зачета, модели рейтинговой шкалы и модель номинального ответа для неупорядоченных категориальных ответов. Он управляется панелью управления, которая позволяет пользователю указать модель, проверить соответствие численно и графически, а также исследовать функционирование различных элементов с помощью единого интерфейса. ^[16]

См. также

Ссылки

^ Грациотин, Даниэль; Ленберг, Пер; Фельдт, Роберт; Вагнер, Стефан (2021). «Психометрика в поведенческой разработке программного обеспечения: методологическое введение с рекомендациями». Транзакции ACM по программной инженерии и методологии . 31 (1)7:1–36. arXiv : 2005.09959 . дои : 10.1145/3469888 .
^ Кортни, MGR; Чанг, ККТ; Мэй, Б.; Мейсель, К.; Роу, Л.И.; Исаева, Л.Б. (2021). «Вскрытие: инструмент R Shiny для воспроизводимого анализа Раша, дифференциального функционирования элементов, приравнивания и изучения групповых эффектов» . ПЛОС Один . дои : 10.1371/journal.pone.0257682 . hdl : 2292/57424 .
^ Рост, Дж. (1990). Модели Раша в скрытых классах: интеграция двух подходов к анализу элементов. Прикладные психологические измерения, 14, 271–282.
^ фон Давьер, М., и Рост, Дж. (1995). Политомические смешанные модели Раша . В книге Г.Х. Фишера и И.В. Моленаара (ред.), Модели Раша, основы, последние разработки и приложения (стр. 371-382). Нью-Йорк: Спрингер.
^ Дихотомическая модель Раша и однопараметрическая логистическая модель [1] . Rasch Measurement Transactions [2] , 2005, 19:3 с. 1032
^ «МИРТ» . Гитхаб . 23 апреля 2021 г.
^ Яо, Лихуа (17 мая 2012 г.). «Многомерные методы выбора элементов CAT для оценок предметной области и составных оценок: теория и приложения». Психометрика . 77 (3): 495–523. дои : 10.1007/s11336-012-9265-5 . ISSN 0033-3123 . ПМИД 27519778 . S2CID 14868583 .
^ Лойд и Гувер, 1980.
^ Марко, 1977
↑ Линн, Левин, Гастингс и Уордроп, 1981.
^ Хаебара, Т. (1980). Уравнение масштабов логистических возможностей с помощью взвешенного метода наименьших квадратов. Японские психологические исследования, 22 , 144–149.
^ Чулок, ML, и Лорд, FM (1983). Разработка общей метрики в теории ответов на вопросы. Прикладные психологические измерения, 7 , 201–210.
^ Лорд, FM (1980). Применение теории реагирования на задания к практическим задачам тестирования . Махва, Нью-Джерси: Lawrence Erlbaum Associates, Inc.
^ Хан, КТ (2007). WinGen: программное обеспечение Windows, которое генерирует параметры IRT и ответы элементов. Прикладные психологические измерения, 31 , 457-459.
^ [3] Представление задачи CRAN: психометрические модели и методы
^ [4] Онлайн-руководство Stata IRT

[1] Грациотин, Даниэль; Ленберг, Пер; Фельдт, Роберт; Вагнер, Стефан (2021). «Психометрика в поведенческой разработке программного обеспечения: методологическое введение с рекомендациями». Транзакции ACM по программной инженерии и методологии . 31 (1)7:1–36. arXiv : 2005.09959 . дои : 10.1145/3469888 .

[2] Кортни, MGR; Чанг, ККТ; Мэй, Б.; Мейсель, К.; Роу, Л.И.; Исаева, Л.Б. (2021). «Вскрытие: инструмент R Shiny для воспроизводимого анализа Раша, дифференциального функционирования элементов, приравнивания и изучения групповых эффектов» . ПЛОС Один . дои : 10.1371/journal.pone.0257682 . hdl : 2292/57424 .

[3] Рост, Дж. (1990). Модели Раша в скрытых классах: интеграция двух подходов к анализу элементов. Прикладные психологические измерения, 14, 271–282.

[4] фон Давьер, М., и Рост, Дж. (1995). Политомические смешанные модели Раша . В книге Г.Х. Фишера и И.В. Моленаара (ред.), Модели Раша, основы, последние разработки и приложения (стр. 371-382). Нью-Йорк: Спрингер.

[5] Дихотомическая модель Раша и однопараметрическая логистическая модель [1] . Rasch Measurement Transactions [2] , 2005, 19:3 с. 1032

[6] «МИРТ» . Гитхаб . 23 апреля 2021 г.

[7] Яо, Лихуа (17 мая 2012 г.). «Многомерные методы выбора элементов CAT для оценок предметной области и составных оценок: теория и приложения». Психометрика . 77 (3): 495–523. дои : 10.1007/s11336-012-9265-5 . ISSN 0033-3123 . ПМИД 27519778 . S2CID 14868583 .

[8] Лойд и Гувер, 1980.

[9] Марко, 1977

[10] Линн, Левин, Гастингс и Уордроп, 1981.

[11] Хаебара, Т. (1980). Уравнение масштабов логистических возможностей с помощью взвешенного метода наименьших квадратов. Японские психологические исследования, 22 , 144–149.

[12] Чулок, ML, и Лорд, FM (1983). Разработка общей метрики в теории ответов на вопросы. Прикладные психологические измерения, 7 , 201–210.

[13] Лорд, FM (1980). Применение теории реагирования на задания к практическим задачам тестирования . Махва, Нью-Джерси: Lawrence Erlbaum Associates, Inc.

[14] Хан, КТ (2007). WinGen: программное обеспечение Windows, которое генерирует параметры IRT и ответы элементов. Прикладные психологические измерения, 31 , 457-459.

[15] [3] Представление задачи CRAN: психометрические модели и методы

[16] [4] Онлайн-руководство Stata IRT

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

Источники свободного программного обеспечения

Классическая теория тестирования

вскрытие

ДРУГОЙ

jМетрика

Иман

Потеря глины

КРАН

ВиСта-СИТА

Психика

Калибровка теории реагирования на предмет

вскрытие

КРУГ-МГ

Декстер

Фасеты

ФлексМИРТ

Иртойс

ICL

jМетрика

Лертап5

МУЛЬТИЛОГ

ИМРТ

ПАРСКАЛЬ

ПАРАМ-3ПЛ

ТЕСТФакт

ВИНМИРА 2001

Уинстепс

Xкалибровка

СМОТРИТЕ

Умереть

лтм

ТАМ

ACER Завоевание

Иртплей

УМИРАЮЩИЙ

Дополнительное программное обеспечение для теории реагирования на предметы

СсылкаМИРТ

ПЕЙСЕР

СимуМИРТ

СимуMCAT

ИРТЕК

ResidPlots-2

ВинГен

СТ

ПОЛИСТ

СТЮАРТ

Плинк

Последовательность решений

Иман

jМетрика

Потеря глины

Другие анализы

ПРОСЕЯТЬ

Обнаружение копирования

ТестАссемблер

МИНУТЫ

Программное обеспечение для общего статистического анализа

Р

САС

СПСС

S-Плюс

Был

См. также

Ссылки