Jump to content

Стандартизированный тест

Молодые люди в Польше сдают экзамены на аттестат зрелости . Экзамен Matura стандартизирован, поэтому университеты могут легко сравнивать результаты студентов по всей стране.

Стандартизированный тест — это тест , который проводится и оценивается последовательным или «стандартным» способом. Стандартизированные тесты разработаны таким образом, чтобы вопросы и интерпретации были единообразными, а их назначение и оценка проводились в заранее установленном стандартном порядке. [1]

Любой тест, в котором один и тот же тест дается всем участникам одинаково и оценивается одинаково для всех, является стандартизированным тестом. Стандартизированные тесты не обязательно должны быть тестами с высокими ставками , ограниченными по времени тестами, тестами с несколькими вариантами ответов , академическими тестами или тестами, предназначенными для большого числа тестируемых. Стандартизированным тестом может быть любой тип теста: письменный тест, устный тест или тест на практические навыки . Вопросы могут быть простыми или сложными. Предметом учащихся школьного возраста часто являются академические навыки, но стандартизированный тест можно сдать практически по любой теме, включая экзамены по вождению , творческие способности , атлетизм , личность , профессиональную этику или другие характеристики.

Противоположностью стандартизированного тестирования является нестандартизированное тестирование , при котором либо разные тесты даются разным тестируемым, либо один и тот же тест назначается в существенно разных условиях (например, одной группе дается гораздо меньше времени для завершения теста, чем другой группе). следующая группа) или оцениваются по-разному (например, один и тот же ответ засчитывается как правильный для одного учащегося, но неправильный для другого).

Большинство ежедневных тестов и тестов, сдаваемых учащимися в школе, соответствуют определению стандартизированного теста: все в классе сдают один и тот же тест, в одно и то же время, при одинаковых обстоятельствах, и все учащиеся получают одинаковые оценки от своих учителей. способ. Однако термин «стандартизированный тест» чаще всего используется для обозначения тестов, которые проводятся для более крупных групп, например, тест, который сдают все взрослые, желающие получить лицензию на работу определенного вида, или все студенты определенного вида работы. возраст. Большинство стандартизированных тестов представляют собой формы суммативного оценивания (оценки, которые измеряют уровень обучения участников в конце учебного модуля).

Поскольку все получают одинаковый тест и одну и ту же систему оценок, стандартизированные тесты часто считаются более справедливыми, чем нестандартизированные. Такие тесты часто считаются более справедливыми и объективными, чем система, в которой одни учащиеся получают более простой тест, а другие — более сложный. Стандартизированные тесты созданы для того, чтобы обеспечить надежное сравнение результатов всех участников тестирования, поскольку все сдают один и тот же тест. [2] Однако некоторые критикуют как тестирование в целом, так и стандартизированное тестирование в частности. Например, некоторые люди считают, что несправедливо задавать всем учащимся одни и те же вопросы, если в школах некоторых учащихся не действуют одинаковые стандарты обучения .

Определение [ править ]

Двое мужчин выполняют искусственное дыхание кукле для сердечно-лёгочной реанимации
Двое мужчин сдают аутентичный , неписьменный , стандартизированный тест, основанный на критериях . Если они проведут сердечно-легочную реанимацию на манекене с правильной скоростью и давлением, они пройдут этот экзамен.

Определение стандартизированного теста со временем несколько изменилось. [3] В 1960 году стандартизированные тесты были определены как тесты, в которых условия и содержание были равными для всех, сдающих тест, независимо от того, когда, где и кем тест проводился или оценивался. Стандартизированные тесты имеют последовательный и единый метод оценки. [4] Это означает, что все учащиеся, ответившие на вопрос теста одинаково, получат одинаковый балл за этот вопрос. Цель этой стандартизации — убедиться, что баллы достоверно отражают измеряемые способности или навыки, а не другие вещи, такие как различные инструкции о том, что делать, если испытуемый не знает ответа на вопрос. [3]

К началу XXI века акцент сместился от строгого сходства условий к равной справедливости условий тестирования. [3] Например, тестируемый со сломанным запястьем мог бы писать медленнее из-за травмы, и это было бы более справедливо и давало бы более достоверное представление о фактических знаниях тестируемого, если бы этому человеку было предоставлено еще несколько минут для написания. запишите ответы на ограниченный по времени тест. Изменение условий тестирования таким образом, чтобы повысить справедливость в отношении постоянной или временной нетрудоспособности, но не подрывает основную суть оценки, называется приспособлением . Однако если бы целью теста было выяснить, насколько быстро студент может писать, то предоставление тестируемому дополнительного времени стало бы модификацией содержания, а не стандартизированным тестом.

Примеры стандартизированных и нестандартизированных тестов
Предмет Формат Стандартизированный тест Нестандартизированный тест
История Оральный
Каждому студенту задаются одни и те же вопросы, и их ответы оцениваются одинаково. Учитель задает каждому ученику отдельный вопрос. Некоторые вопросы сложнее других.
Вождение Практические навыки Каждого студента-водителя просят делать одно и то же, и все они оцениваются по одним и тем же стандартам. Некоторым студентам-водителям приходится ездить по шоссе, а другим достаточно медленно объезжать квартал. Одного сотрудника снимают баллы за «плохое отношение».
Математика Написано
Каждому студенту задаются одни и те же вопросы, и их ответы оцениваются одинаково. Учитель дает разные вопросы разным ученикам: простой тест для бедных учеников, еще один тест для большинства учеников и сложный тест для лучших учеников.
Музыка Прослушивание Все музыканты играют одно и то же музыкальное произведение. Судьи заранее договорились, какое значение имеют такие факторы, как время, экспрессия и музыкальность. Каждый музыкант выбирает для исполнения свое музыкальное произведение. Судьи выбирают музыканта, который им больше всего нравится. Один судья дает дополнительные баллы музыкантам, которые носят костюмы.

История [ править ]

Китай [ править ]

Самые ранние свидетельства стандартизированного тестирования были в Китае , во времена династии Хань . [5] где императорские экзамены охватывали шесть искусств , включая музыку, стрельбу из лука, верховую езду, арифметику, письмо и знание ритуалов и церемоний как публичной, так и частной жизни. Эти экзамены использовались для отбора сотрудников государственной бюрократии.

Позже к тестированию были добавлены разделы по военной стратегии, гражданскому праву, доходам и налогообложению, сельскому хозяйству и географии. В таком виде экзамены были институционализированы более тысячелетия.

Сегодня стандартизированное тестирование по-прежнему широко используется, особенно в системе Гаокао .

Великобритания [ править ]

Стандартизированное тестирование было введено в Европе в начале 19 века по образцу экзаменов по китайскому китайскому языку . [6] при поддержке британских колониальных администраторов, самым «настойчивым» из которых был британский консул в Гуанчжоу, Китай , Томас Тейлор Медоуз . [6] Медоуз предупредил о крахе Британской империи, если стандартизированное тестирование не будет немедленно внедрено по всей империи. [6]

До их принятия стандартизированное тестирование традиционно не было частью западной педагогики. Основываясь на скептической и открытой традиции дебатов, унаследованной от Древней Греции, западные академические круги отдавали предпочтение нестандартизированным оценкам с использованием эссе, написанных студентами. Именно по этой причине первое европейское внедрение стандартизированного тестирования произошло не в самой Европе, а в Британской Индии . [7] Вдохновленные использованием Китаем стандартизированного тестирования, в начале 19 века британские «менеджеры компаний нанимали и продвигали по службе сотрудников на основе конкурсных экзаменов, чтобы предотвратить коррупцию и фаворитизм». [7] Эта практика стандартизированного тестирования была позже принята в конце 19 века на материковой части Великобритании. В последовавших за этим парламентских дебатах было много упоминаний о «китайской мандариновой системе». [6]

Именно из Британии стандартизированное тестирование распространилось не только по всему Британскому Содружеству , но и в Европе, а затем и в Америке. [6] Его распространение было вызвано промышленной революцией . Увеличение числа школьников во время и после промышленной революции в результате принятия законов об обязательном образовании привело к уменьшению использования открытого оценивания, которое было сложнее массово производить и оценивать объективно из-за его по своей сути субъективного характера.

Мужчина сортирует мелкие предметы в деревянный поднос
Британские солдаты проходили стандартизированные тесты во время Второй мировой войны. Этот новичок сортирует механические детали, чтобы проверить свое понимание механизмов. На его униформе нет имени, звания или других знаков, которые могли бы повлиять на оценку его работы.

Стандартизированные тесты, такие как отборочные комиссии военного ведомства, были разработаны для британской армии во время Второй мировой войны для отбора кандидатов для подготовки офицеров и выполнения других задач. [8] В ходе тестов оценивались умственные способности солдат, механические навыки, способность работать с другими и другие качества. Предыдущие методы страдали предвзятостью и приводили к выбору не тех солдат для подготовки офицеров. [8]

США [ править ]

Стандартизированное тестирование является частью образования в США с 19-го века, но широкое распространение стандартизированного тестирования в школах США во многом является явлением 20-го века.

Иммиграция в середине 19 века способствовала росту стандартизированных тестов в США. [9] Стандартизированные тесты использовались, когда люди впервые приезжали в США, чтобы проверить социальные роли и обрести социальную власть и статус. [10]

В 1901 году Комиссия по вступительным экзаменам в колледж начала предлагать стандартизированные тесты для поступления в университеты и колледжи , охватывающие девять предметов. Этот тест был реализован с целью создания стандартизированного приема в элитные университеты северо-востока США. Первоначально тест также предназначался для лучших школ-интернатов , чтобы согласовать учебную программу между школами. [11] Первоначально стандартизированный тест состоял из эссе и не предназначался для широкого тестирования. [ нужна ссылка ]

Во время Первой мировой войны были разработаны армейские альфа- и бета- тесты, чтобы помочь новобранцам получить соответствующие задания в зависимости от их оцененного уровня интеллекта. [12] Первое издание современного стандартизированного теста на IQ , тест интеллекта Стэнфорда-Бине , появилось в 1916 году. Затем в 1926 году Совет колледжей разработал SAT (тест способностей ученого). Первый тест SAT был основан на армейских тестах IQ, в которых цель – определить интеллект тестируемого, его навыки решения проблем и критическое мышление . [13] В 1959 году Эверетт Линдквист предложил ACT (тестирование в американских колледжах). впервые [14] По состоянию на 2020 год ACT включает четыре основных раздела с вопросами с несколькими вариантами ответов для проверки английского языка, математики, чтения и естественных наук, а также дополнительный раздел письма. [15]

Отдельные штаты начали тестировать большое количество детей и подростков через системы государственных школ в 1970-х годах. К 1980-м годам американские школы оценивали результаты на национальном уровне. [16] В 2012 году 45 штатов заплатили в среднем 27 долларов США за каждого студента и 669 миллионов долларов США в целом за крупномасштабные ежегодные академические тесты. [17] Однако косвенные затраты , такие как оплата учителям подготовки учащихся к тестам и время, потраченное на проведение тестов, значительно превышают прямые затраты на сам тест. [17]

Необходимость федерального правительства проводить значимые сравнения в высоко децентрализованной (контролируемой на местном уровне) системе государственного образования стимулировала использование крупномасштабного стандартизированного тестирования. Закон о начальном и среднем образовании 1965 года требовал стандартизированного тестирования в государственных школах. Закон 2001 года «Ни один ребенок не останется без внимания» дополнительно привязал некоторые виды финансирования государственных школ к результатам стандартизированного тестирования. В соответствии с этими федеральными законами школьная программа по-прежнему устанавливалась каждым штатом, но федеральное правительство требовало от штатов оценивать, насколько хорошо школы и учителя преподают выбранный штатом материал с помощью стандартизированных тестов. [18] Результаты учащихся по крупномасштабным стандартизированным тестам использовались для выделения средств и других ресурсов школам, а также для закрытия школ с плохой успеваемостью. Закон «Каждый студент преуспевает» заменил NCLB в конце 2015 года. [19] К тому моменту эти крупномасштабные стандартизированные тесты стали спорными в Соединенных Штатах не обязательно потому, что все учащиеся сдавали одни и те же тесты и получали одинаковые оценки, а потому, что они стали тестами с высокими ставками для школьной системы и учителей. . [20]

В последние годы многие университеты и колледжи США отказались от требования о проведении стандартизированных тестов абитуриентами. [21]

Австралия [ править ]

Стандартизированное тестирование Австралийской национальной программы оценки грамотности и счета (NAPLAN) было начато в 2008 году Австралийским органом по учебной программе, оценке и отчетности, независимым органом, «ответственным за разработку национальной учебной программы, национальной программы оценки и национального сбора данных». и программа отчетности, которая поддерживает обучение 21 века для всех австралийских студентов». [22]

В тестировании участвуют все учащиеся 3, 5, 7 и 9 классов австралийских школ, которые должны пройти оценку с использованием национальных тестов. В число предметов, охватываемых этими тестами, входят чтение, письмо, правила языка (орфография, грамматика и пунктуация) и умение считать.

Программа представляет отчеты об уровне учащихся, предназначенные для того, чтобы родители могли видеть прогресс своего ребенка в течение школьной жизни и помочь учителям улучшить индивидуальные возможности обучения для своих учеников. Данные об учащихся и уровне школы также предоставляются соответствующей школьной системе при том понимании, что их можно использовать для направления конкретной поддержки и ресурсов школам, которые в них больше всего нуждаются. Учителя и школы используют эту информацию в сочетании с другой информацией, чтобы определить, насколько хорошо учатся их ученики, и выявить любые области, требующие помощи.

Концепция тестирования успеваемости учащихся не нова, хотя можно сказать, что нынешний австралийский подход берет свое начало в нынешних структурах образовательной политики как в США, так и в Великобритании. Существует несколько ключевых отличий между австралийской NAPLAN и стратегиями Великобритании и США. Школам, которые оказались неэффективными в австралийских условиях, будет предложена финансовая помощь в соответствии с текущей политикой федерального правительства.

Колумбия [ править ]

В 1968 году был создан Колумбийский институт оценки образования (ICFES), призванный регулировать высшее образование. Была внедрена прежняя система общественной оценки для разрешения деятельности и юридического признания учреждений и университетских программ.

В Колумбии существует несколько стандартизированных тестов, оценивающих уровень образования в стране. Эти экзамены проводятся ICFES.

Учащиеся третьего, пятого и девятого классов сдают экзамен «Сабля 3°5°9°». Этот тест в настоящее время представлен на компьютере в контролируемых и переписных выборках.

По окончании школы старшеклассникам вручается «Сабля 11», позволяющая им поступать в разные вузы страны. Студенты, обучающиеся дома, могут сдать этот экзамен, чтобы окончить среднюю школу и получить аттестат и диплом.

Студенты, покидающие университет, должны сдать экзамен «Sabre Pro».

Канада [ править ]

Канада оставляет образование и, как следствие, стандартизированное тестирование под юрисдикцией провинций. В каждой провинции действует свой собственный стандартизированный режим тестирования, охватывающий всю провинцию: от отсутствия обязательных стандартизированных тестов для учащихся в Саскачеване до экзаменов, составляющих 40% итоговых оценок средней школы в Ньюфаундленде и Лабрадоре. [23]

Дизайн и озвучивание [ править ]

Дизайн [ править ]

Чаще всего основной академический тест включает разделы, оцениваемые как человеком, так и компьютером.

Стандартизированный тест может состоять из вопросов с несколькими вариантами ответов, вопросов «верно-неверно», вопросов-эссе, аутентичных оценок или практически любой другой формы оценки. Задания с множественным выбором и ответами «верно-неверно» часто выбираются для тестов, которые сдают тысячи людей, поскольку их можно сдавать и оценивать недорого, быстро и надежно за счет использования специальных листов ответов, которые можно прочитать с помощью компьютера или с помощью адаптивных к компьютеру программ. тестирование . Некоторые стандартизированные тесты включают в себя компоненты краткого ответа или написания эссе, которым независимые оценщики присваивают баллы, которые используют рубрики (правила или рекомендации) и контрольные документы (примеры работ для каждого возможного балла) для определения оценки, которая будет присвоена ответу.

Любая тема [ править ]

Плакат на стене с указанием требуемого поведения и баллов, которые будут вычитаться за ошибки на английском и китайском языках.
Плакат, показывающий стандарты сдачи экзаменов по вождению на Тайване. Каждый человек, желающий получить водительские права, сдает один и тот же тест и получает одинаковые баллы.

Не все стандартизированные тесты предполагают ответы на вопросы. Настоящая оценка спортивных навыков может принимать форму бега в течение определенного времени или ведения мяча на определенную дистанцию. Медицинские работники должны пройти тесты, доказывающие, что они могут выполнять медицинские процедуры. Кандидаты на получение водительских прав должны пройти стандартный тест, показывающий, что они умеют водить автомобиль. Канадский стандартизированный тест физической подготовки использовался в медицинских исследованиях, чтобы определить, насколько физически подготовлены участники теста. [24] [25]

человеческий подсчет и Машинный

В некоторых стандартизированных тестах используются тесты с несколькими вариантами ответов, оценка которых относительно недорога, но можно использовать любую форму оценивания.

Со второй половины 20-го века крупномасштабное стандартизированное тестирование отчасти формировалось благодаря простоте и дешевизне оценки тестов с несколькими вариантами ответов с помощью компьютера. Большинство национальных и международных оценок не в полной мере оцениваются людьми.

Люди привыкли оценивать предметы, которые сложно оценить с помощью компьютера (например, эссе). Например, выпускной экзамен представляет собой адаптивную к компьютеру оценку, которая не требует от людей выставления оценок, за исключением письменной части. [26]

Оценка, выполняемая человеком, является относительно дорогостоящей и часто варьирующейся, поэтому, когда это возможно, предпочтительнее использовать компьютерную оценку. Например, некоторые критики говорят, что низкооплачиваемые сотрудники будут иметь плохие результаты на тестах. [27] Согласие между оценками может варьироваться от 60 до 85 процентов, в зависимости от теста и сеанса оценки. При проведении крупномасштабных тестов в школах некоторые тестировщики платят за то, чтобы каждый документ прочитали два или более экспертов; если их оценки не совпадают, то работа передается дополнительным оценщикам. [27]

Хотя этот процесс сложнее, чем электронная оценка тестов с несколькими вариантами ответов, эссе также можно оценивать с помощью компьютера. В других случаях эссе и другие открытые ответы оцениваются в соответствии с заранее установленными критериями оценки обученными оценщиками. Например, в Pearson все оценщики эссе имеют четырехлетнюю университетскую степень, и большинство из них являются нынешними или бывшими классными руководителями. [28]

Использование рубрик для справедливости [ править ]

Использование критериев призвано повысить справедливость при оценке успеваемости учащегося. При стандартизированном тестировании ошибку измерения (постоянную картину ошибок и систематических ошибок при оценке теста) легко определить. Когда оценка зависит от индивидуальных предпочтений оценщиков, тогда оценки учащихся зависят от того, кто оценивает тест.

Стандартизированные тесты также устраняют предвзятость оценщиков при оценке. Исследования показывают, что учителя создают своего рода самоисполняющееся пророчество в своей оценке учеников, гарантируя тем, кто, по их ожиданиям, достигнет более высоких результатов, и давая тем, кто, по их ожиданиям, провалится, более низкие оценки. [29] При нестандартизированном оценивании оценщики обладают большей индивидуальной свободой действий и, следовательно, с большей вероятностью будут давать несправедливые результаты из-за неосознанной предвзятости .

Пример оценки за открытый вопрос по истории: Что стало причиной Второй мировой войны ?
Ответы учащихся Стандартизированная оценка Нестандартизированная оценка
Рубрика выставления оценок: Ответы должны быть отмечены как правильные, если в них упоминается хотя бы один из следующих вопросов: вторжение Германии в Польшу, вторжение Японии в Китай или экономические проблемы. Никаких стандартов оценивания. Каждый учитель выставляет оценки так, как он или она хочет, учитывая любые факторы, которые выбирает учитель, такие как ответ, количество усилий, академическое образование учащегося, языковые способности или отношение.
Студент №1: Вторая мировая война была вызвана вторжением Гитлера и Германии в Польшу.

Учитель №1: В этом ответе упоминается один из обязательных пунктов, поэтому он правильный.
Учитель №2: Это правильный ответ.

Учитель №1: Мне кажется, этот ответ достаточно хорош, поэтому я отмечу его как правильный.
Учитель №2: Этот ответ правильный, но этот хороший ученик должен добиться большего, поэтому я ставлю лишь частичную оценку.

Студент №2: Вторая мировая война была вызвана множеством факторов, включая Великую депрессию и общую экономическую ситуацию, рост национал-социализма, фашизма и империалистического экспансионизма, а также неразрешенное недовольство, связанное с Первой мировой войной. Война в Европе началась с вторжения Германии в Польшу.

Учитель №1: В этом ответе упоминается один из обязательных пунктов, поэтому он правильный.
Учитель №2: Это правильный ответ.

Учитель №1: Я считаю, что этот ответ правильный и полный, поэтому я отдаю должное.
Учитель №2: Ответ правильный, поэтому я ставлю полные баллы.

Студент №3: Причиной Второй мировой войны стало убийство эрцгерцога Фердинанда в 1914 году.

Учитель №1: В этом ответе не упоминается ни один из обязательных пунктов. Никаких баллов.
Учитель №2: Это неправильный ответ. Никакого кредита.

Учитель №1: Этот ответ неправильный. Никаких баллов.
Учитель №2: Ответ неправильный, но этот ученик очень старался, и предложение грамматически правильное, поэтому я дам один балл за старание.

Использование оценок для сравнения [ править ]

Существует два типа интерпретации результатов тестов : интерпретация оценок, основанная на нормах , и интерпретация оценок , основанная на критериях . [4]

  • Интерпретация оценок, основанная на нормах, сравнивает участников тестирования с выборкой сверстников . [4] Цель состоит в том, чтобы оценить учеников как лучше или хуже, чем другие студенты. Интерпретация результатов тестов, основанная на нормах, связана с традиционным образованием . Студенты, показавшие лучшие результаты, чем другие, проходят тест, а студенты, показавшие результаты хуже других, проваливают тест.
  • Интерпретация оценок, основанная на критериях, сравнивает участников теста с критерием (формальным определением содержания), независимо от оценок других испытуемых. [4] Их также можно назвать оценками, основанными на стандартах , поскольку они соответствуют движению за реформу образования, основанному на стандартах . [30] Интерпретация оценок, основанная на критериях, касается исключительно того, является ли ответ данного конкретного учащегося правильным и полным. В системах, основанных на критериях, все учащиеся могут пройти тест или все учащиеся не пройти тест.

Любую из этих систем можно использовать при стандартизированном тестировании. Что важно для стандартизированного тестирования, так это то, всем ли учащимся задаются одинаковые вопросы, при достаточно равных обстоятельствах, и получают ли они оценки в соответствии с одними и теми же стандартами.

общая нормальная кривая с отмеченными стандартными отклонениями
Тест, основанный на нормах, может быть разработан таким образом, чтобы определить, где тестируемый находится на нормальной кривой .

Нормативная оценка сравнивает каждого тестируемого с другими тестируемыми. Нормативно -ориентированный тест (НРТ) — это тип теста, оценки или оценки , который позволяет оценить положение тестируемого человека в заранее определенной популяции. Оценка получена на основе анализа результатов тестов и других соответствующих данных выборки, составленной из населения. Этот тип теста определяет, показал ли тестируемый результаты лучше или хуже, чем другие учащиеся, сдающие этот тест.

Сравнение с другими делает стандартизированные тесты, соответствующие нормам, полезными для целей поступления в высшие учебные заведения, когда школа пытается сравнить студентов со всей страны или со всего мира. Стандартизация гарантирует, что все учащиеся проходят одинаковое тестирование, а ссылки на нормы определяют, кто из них лучше, а кто хуже. Примеры таких международных эталонных тестов включают «Тенденции в международных исследованиях в области математики и естественных наук» ( TIMMS ) и «Прогресс в международном исследовании читательской грамотности» ( PIRLS ).

Техник держит карточку с цветовой кодировкой и стандартами тестирования воды.
При тестировании воды используется тестирование, основанное на критериях, поскольку важнее определить, безопасна ли местная вода для питья, чем сравнивать ее с водой из другого места.

Тест на основе критериев (CRT) — это стиль теста, в котором результаты тестов используются для того, чтобы показать, насколько хорошо испытуемые справились с заданной задачей, а не насколько хорошо они справились с заданием по сравнению с другими участниками теста. Большинство тестов и викторин, написанных школьными учителями, представляют собой тесты, основанные на критериях. В этом случае цель состоит в том, чтобы просто увидеть, сможет ли студент правильно ответить на вопросы. Учитель обычно не пытается сравнить результаты каждого ученика с результатами других учеников.

Стандарты [ править ]

Соображения валидности и надежности обычно рассматриваются как важные элементы для определения качества любого стандартизированного теста. Однако ассоциации профессионалов и практиков часто помещают эти проблемы в более широкий контекст при разработке стандартов и вынесении общих суждений о качестве любого стандартизированного теста в целом в данном контексте.

Стандарты оценки [ править ]

В области оценки , и в частности оценки образования , Объединенный комитет по стандартам оценки образования [31] опубликовал три набора стандартов для оценок. Стандарты оценки персонала [32] был опубликован в 1988 году «Стандарты оценки программ» (2-е издание). [33] был опубликован в 1994 году, а «Стандарты оценки студентов» [34] был опубликован в 2003 году.

В каждой публикации представлен и разработан набор стандартов для использования в различных образовательных учреждениях. Стандарты содержат рекомендации по разработке, внедрению, оценке и совершенствованию определенной формы оценки. Каждый из стандартов отнесен к одной из четырех основных категорий, чтобы обеспечить правильность, полезность, осуществимость и точность образовательных оценок. В этих наборах стандартов вопросы достоверности и надежности рассматриваются в рамках темы точности. Однако тесты направлены на то, чтобы оценки учащихся давали надежную, точную и достоверную информацию об обучении и успеваемости учащихся; Стандартизированные тесты предоставляют ограниченную информацию о многих формах интеллекта, и использование их вредит учащимся, поскольку неточно измеряет потенциал учащегося на успех. [35]

Стандарты тестирования [ править ]

Молодые люди в голубой форме сидят за столами с контрольными бумагами и карандашами.
Зачисленные военнослужащие сдают бумажный стандартизированный тест с несколькими вариантами ответов в надежде получить повышение по службе. Все они отвечают на одни и те же вопросы и получают одинаковые оценки.

В области психометрии Стандарты образовательного и психологического тестирования. [36] устанавливать стандарты достоверности и надежности, а также ошибки измерения и вопросы, связанные с размещением людей с ограниченными возможностями . Третья и последняя основная тема охватывает стандарты, связанные с тестированием приложений, аттестацией , а также тестированием при оценке программ и государственной политике .

достоверность Статистическая

Одним из основных преимуществ крупномасштабного стандартизированного тестирования является то, что результаты можно документировать эмпирически; следовательно, можно показать, что результаты тестов имеют относительную степень достоверности и надежности , а также являются результатами, которые можно обобщить и воспроизвести. [37] Это часто противопоставляется оценкам в школьной ведомости, которые выставляются отдельными учителями. При рассмотрении индивидуально выставленных оценок может быть сложно учесть различия в образовательной культуре в разных школах, сложность заданий конкретного учителя, различия в стиле преподавания, давление на завышение оценок , а также другие методы и предубеждения, влияющие на выставление оценок.

Еще одним преимуществом является агрегирование. Хорошо разработанный стандартизированный тест обеспечивает оценку владения человеком областью знаний или навыков, которая на определенном уровне агрегирования предоставит полезную информацию. То есть, хотя индивидуальные оценки могут быть недостаточно точными для практических целей, средние баллы классов, школ, филиалов компании или других групп вполне могут предоставить полезную информацию из-за уменьшения ошибки, достигаемой за счет увеличения размера выборки.

Ежегодные стандартизированные тесты в школе [ править ]

Стандартизированное тестирование является очень распространенным способом определения прошлых академических достижений учащегося и его будущего потенциала.

Валидность, качество или использование тестов, особенно ежегодных стандартизированных тестов, распространенных в образовании, по-прежнему широко поддерживаются или критикуются. Как и сами тесты, поддержка и критика тестов часто различаются и могут исходить из разных источников, таких как родители, тестируемые, преподаватели, бизнес-группы, университеты или государственные контролирующие органы.

Сторонники широкомасштабных стандартизированных тестов в образовании часто приводят следующие причины для продвижения тестирования в образовании:

  • Обратная связь или диагностика результатов тестируемого: [38] Стандартизированные тесты позволяют учителям увидеть, как учатся их ученики по сравнению с другими учениками в стране. Это поможет им при необходимости пересмотреть свои методы преподавания, чтобы помочь своим ученикам соответствовать стандартам. [39] Студентам предоставляется возможность поразмышлять над своими оценками и увидеть, в чем их сильные и слабые стороны. [39] Результаты могут позволить родителям получить представление об успеваемости их ребенка. [40]
  • Честно и эффективно [41]
  • Способствует подотчетности: [38] [41] Стандартизированное тестирование используется в качестве стратегии государственной политики для установления более строгих мер подотчетности в сфере государственного образования . Идея движения за политику стандартизированного тестирования заключается в том, что тестирование является первым шагом к улучшению школ, практики преподавания и методов обучения посредством сбора данных. Сторонники утверждают, что данные, полученные с помощью стандартизированных тестов, действуют как табель успеваемости для сообщества, демонстрируя, насколько хорошо работают местные школы. Критики движения, однако, указывают на различные несоответствия, возникающие в результате нынешних государственных стандартизированных методов тестирования, включая проблемы с валидностью и надежностью тестов, а также ложные корреляции (см. Парадокс Симпсона ).
  • Прогнозирование и выбор [38]
  • Улучшает производительность [38]

Критики стандартизированных тестов в образовании часто приводят следующие причины для пересмотра или удаления стандартизированных тестов в образовании:

  • Плохое качество прогнозирования. [42] [43]
  • Увеличение оценок за тесты или оценок. [44] [45] [46]
  • Культурные или социально-экономические предвзятости. [47] [48]
  • Психологически вредно. [49]
  • Плохой показатель интеллекта или способностей. [50] [51] [52] [53]
автомобиль из автошколы
Если учитель знает, что конкретный предмет, например, параллельная парковка , не тестируется, он может не тратить время на обучение этому предмету. Это верно независимо от того, стандартизирован тест или нет.

Кроме того, успехи учащихся отслеживаются по относительной успеваемости учителя, в результате чего продвижение учителя зависит от успехов учителя в успеваемости ученика. Этические и экономические вопросы возникают у учителей, когда они сталкиваются с явно отстающими или недостаточно квалифицированными учениками и стандартизированным тестом.

В своей книге « Теперь вы это видите » Кэти Дэвидсон критикует стандартизированные тесты. Она описывает молодежь как «детей сборочного конвейера на модели конвейера», имея в виду использование стандартизированного теста как часть единой образовательной модели. Она также критикует узость проверяемых навыков и называет детей, не имеющих этих навыков, неудачниками или учениками с ограниченными возможностями. [54] Широко распространенное и организованное мошенничество стало растущей культурой. [55]

Существует три показателя, по которым оцениваются страны с лучшими показателями в TIMMS («страны А+»): целенаправленность, последовательность и строгость. Фокус определяется как количество тем, рассматриваемых в каждом классе; Идея состоит в том, что чем меньше тем рассматривается в каждом классе, тем больше внимания можно уделить каждой теме. Определение связности соответствует последовательности рассматриваемых тем, которая следует естественному развитию или логической структуре математики. CCSSM . сравнивался как с действующими государственными стандартами, так и со стандартами страны A+ При том, что в среднем освещается большинство тем, действующие государственные стандарты имеют наименьшую направленность. [56] Целью Common Core Standards является устранение этого несоответствия, помогая преподавателям сосредоточиться на том, что ученики должны выучить, а не отвлекаться на посторонние темы. Они побуждают образовательные материалы переходить от поверхностного освещения широкого спектра тем к нескольким более глубоким темам. [57]

Время и деньги [ править ]

Стандартизированные тесты — это способ измерения уровня образования учащихся и школ в широком масштабе. От детского сада до 12-го класса большинство американских учащихся ежегодно сдают стандартизированные тесты. Средний учащийся сдает около 10 таких тестов в год (например, один или два теста на понимание прочитанного, один или два теста по математике, тест по письму, тест по естественным наукам и т. д.). [58] Средний объем тестирования занимает около 2,3% от общего времени занятий (что соответствует примерно четырем учебным дням в году). [59]

Стандартизированные тесты дороги в проведении. Сообщается, что Соединенные Штаты ежегодно тратят на эти испытания около 1,7 миллиарда долларов США. [60] В 2001 году также сообщалось, что только три компании (Harcourt Educational Measurement, CTB McGraw-Hill и Riverside Publishing) разрабатывают 96% тестов, проводимых на уровне штата. [61]

Образовательные решения

Национальная академия наук рекомендует, чтобы основные образовательные решения не основывались исключительно на одном результате теста. [62] Использование минимальных проходных баллов для поступления или окончания обучения не подразумевает единого стандарта, поскольку результаты тестов почти всегда сочетаются с другими минимальными критериями, такими как количество кредитов, обязательные курсы, посещаемость и т. д. Результаты тестов часто воспринимаются как « единственные критерии» просто потому, что они наиболее трудны, либо автоматически предполагается выполнение других критериев. Единственным исключением из этого правила является GED , который позволил многим людям признать свои навыки, даже если они не соответствовали традиционным критериям. [ нужна ссылка ]

Некоторые учителя утверждают, что один стандартизированный тест измеряет только текущие знания учащегося и не отражает прогресс учащегося с начала года. [63] Результат, созданный людьми, которые не участвуют в обычном обучении учащихся, а профессионалами, которые определяют, что учащиеся должны знать в разном возрасте. Кроме того, учителя сходятся во мнении, что лучшим создателем и координатором тестов являются они сами. Они утверждают, что лучше всех осведомлены о способностях, способностях и потребностях учащихся, что позволило бы им уделять больше времени изучению предметов или продолжить обучение по обычной учебной программе.

Влияние на учащихся из неблагополучных семей [ править ]

Монти Нил, директор Национального центра справедливого и открытого тестирования, утверждает, что студентам, которые говорят на английском как на втором языке, имеют инвалидность или происходят из семей с низким доходом, непропорционально часто отказывают в дипломе из-за результатов теста. что несправедливо и вредно. Например, в конце 1970-х годов, когда в Соединенных Штатах начались выпускные испытания, в иске утверждалось, что многие чернокожие студенты не имели справедливых возможностей по материалу, который они тестировали на выпускном тесте, потому что они посещали школы, разделенные по закону. «Взаимодействие школ с ограниченными ресурсами и тестированием сильнее всего бьет по цветным учащимся», как утверждает Нил, «им непропорционально часто отказывают в дипломах или повышении в классе, а школы, которые они посещают, скорее всего, будут плохо сдавать тесты и столкнутся с трудностями. санкции, такие как реструктуризация». [64]

В журнале The Progressive Барбара Майнер объясняет недостатки стандартизированного тестирования, анализируя три разные книги. Содиректор Центра образования Университета Райса и профессор педагогики Линда М. Макнил в своей книге « Противоречия школьной реформы: образовательные затраты на стандартизированное тестирование» пишет: «Образовательная стандартизация вредит преподаванию и обучению и в долгосрочной перспективе , рестратирует образование по расе и классу». Макнил считает, что реформа образования, основанная на тестировании, устанавливает более высокие стандарты для цветных учащихся. По словам Майнера, Макнил «показывает, как реформа, основанная на тестировании, централизует власть в руках корпоративной и политической элиты - особенно пугающее событие в это время растущего корпоративного и консервативного влияния на реформу образования». Такая реформа, основанная на тестировании, затруднила обучение, особенно для цветных учащихся. [65]

FairTest заявляет, что негативные последствия неправильного использования тестов включают в себя вытеснение учащихся из школы, вытеснение учителей из профессии, а также подрыв вовлеченности учащихся и школьного климата. [66]

Использование стандартизированных тестов при поступлении университеты в

Стандартизированные тесты рассматриваются университетами как часть заявления вместе с другими подтверждающими доказательствами, такими как личные заявления , оценки в средней школе , предыдущие курсовые работы и рекомендательные письма . [67] В разных странах проводятся разные тесты, например SAT в США, Gaokao в Китае и совместный вступительный экзамен в Индии.

Натан Кансел, ученый в области высшего образования, говорит, что вступительные экзамены в колледж и другие стандартизированные тесты «помогают перегруженным сотрудникам приемной комиссии разделить огромное количество абитуриентов на группы для дальнейшей оценки. Высокие баллы не гарантируют поступления куда-либо, а низкие баллы не являются определяющими. это, но школы серьезно относятся к тестам». [68]

Исследования показывают, что тесты предсказывают не только оценки первого года обучения и уровень курсов, которые студент, скорее всего, пройдёт. Лонгитюдное исследование, проведенное учеными, показывает, что студенты с высокими результатами тестов с большей вероятностью выберут сложный путь поступления в колледж. [69] Тесты также могут показать результаты студентов после окончания колледжа, включая оценки преподавателей, научные достижения, получение ученой степени, результаты на комплексных экзаменах и профессиональную лицензию. [70]

Поскольку оценки различаются в разных школах и даже для двух учащихся в одной школе, общий показатель, обеспечиваемый результатами тестов, более полезен для сравнения учащихся.

Однако в «метаанализе», опубликованном в апреле 1995 года в «Журнале образовательных и психологических измерений» , Тодд Моррисон и Мелани Моррисон изучили две дюжины исследований валидности теста, необходимого для поступления практически в любую программу магистратуры или докторантуры в Америке: «Выпускник» Запись экзаменов (GRE). В этом исследовании за последние 30 лет приняли участие более 5000 тестируемых. Авторы обнаружили, что результаты GRE составляют лишь 6 процентов разницы в оценках в аспирантуре. GRE кажется «практически бесполезным с точки зрения прогнозирования», пишут авторы. Повторные исследования вступительного теста на юридический факультет (LSAT) показали то же самое.

Ведутся споры о том, укажет ли тест на долгосрочный успех в работе и жизни, поскольку существует множество других факторов, но фундаментальные навыки, такие как чтение, письмо и математика, связаны с производительностью работы.

Лонгитюдное исследование 2007 года показало, что важные жизненные достижения, такие как публикация романа или патентование технологии, также связаны с результатами тестов, даже если принять во внимание возможности получения образования. Существует даже значительное количество доказательств того, что эти навыки связаны с эффективным лидерством и творческими достижениями на работе. Умение читать тексты и понимать их смысл, а также иметь сильные количественные рассуждения имеют решающее значение в современной информационной экономике . [70]

Многие аргументы свидетельствуют о том, что навыки, полученные в результате тестов, полезны, но только до определенного момента.

Тем не менее, в замечательном продольном исследовании, опубликованном в 2008 году в журнале Psychoological Science, были изучены студенты, которые в возрасте 13 лет входили в 1% лучших. Двадцать лет спустя они в среднем добились очень высоких результатов, имели высокие доходы, крупные награды и карьерные достижения, которыми мог бы гордиться любой родитель. [71]

Существует корреляция между результатами тестов и социальным классом, но успех на стандартизированных тестах и ​​в колледже зависит не только от класса. Исследования показывают, что «тесты были действительны даже с учетом социально-экономического класса. Независимо от их семейного происхождения, учащиеся с хорошими результатами тестов и школьными оценками лучше учатся в колледже, чем учащиеся с более низкими баллами и более слабыми успеваемостью». [72]

Еще одна критика, касающаяся социального класса и стандартизированного тестирования, заключается в том, что только богатые люди получают подготовку к экзаменам и обучение. Тем не менее, «исследователи провели сочетание экспериментальных исследований и контролируемых полевых исследований, чтобы проверить этот вопрос. некоторые компании по подготовке к испытаниям». [73]

Что еще более важно, многие люди придерживаются мнения, что тесты предотвращают разнообразие при поступлении, поскольку меньшинства имеют более низкие баллы на тестах по сравнению с другими представленными группами. [74] Исследование 2012 года изучило школы, в которых вступительные тесты не являются обязательными для абитуриентов, и сравнило их со школами, в которых эти тесты используются, и результат показывает, что «недавнее исследование показывает, что школы, в которых вступительные испытания не являются обязательными для абитуриентов, набирают все более разнообразные группы учащихся. Но то же самое верно». школ, требующих тестирования». [75]

Противники утверждают, что стандартизированные тесты используются неправильно и являются некритическими суждениями об интеллекте и производительности, но сторонники утверждают, что это не отрицательные стороны стандартизированных тестов, а критика плохо разработанных режимов тестирования. Они утверждают, что тестирование должно и действительно фокусирует образовательные ресурсы на наиболее важных аспектах образования – передаче заранее определенного набора знаний и навыков – и что другие аспекты либо менее важны, либо должны быть добавлены в схему тестирования.

Факты показывают, что чернокожие и латиноамериканские студенты в среднем получают более низкие баллы, чем белые и азиаты. Поэтому стандартные тесты по математике и чтению, такие как SAT, подвергаются растущим нападкам со стороны прогрессистов. Однако в исчерпывающем отчете сената факультета Калифорнийского университета, подготовленном по заказу Джанет Наполитано и опубликованном в 2020 году, тесты не являются дискриминационными и играют важную роль в защите качества образования. [76]

В докладе говорится, что ухудшение инфляции оценок , особенно в богатых средних школах, делает стандартную оценку особенно важной. [76]

Что касается намерения школ Калифорнийского университета отказаться от стандартных тестов, таких как SAT и ACT, при поступлении в колледж, то субъективные и индивидуальные тесты, такие как эссе и внеклассные занятия, могут быть легко адаптированы и наносить ущерб учащимся, которые не знакомы с этим процессом. Прием без тестирования может быть еще более склонен в пользу людей с хорошими связями. [77]

В январе 2020 года сенат факультета Калифорнийского университета рекомендовал системе Калифорнийского университета сохранить стандартизированные тесты в качестве требований к поступающим. [76] В отчете говорится, что стандартизированные тесты по математике и чтению полезны для прогнозирования успеваемости в колледже. Основываясь на данных учащихся системы Калифорнийского университета, в отчете делается вывод, что «результаты тестов в настоящее время являются лучшим предиктором среднего балла первого года обучения, чем средний балл средней школы». [76] В докладе продолжается: результаты также позволяют спрогнозировать общий средний балл колледжа и вероятность того, что студент окончит его. В то время как «прогностическая сила результатов тестов возросла», добавляется в докладе, «прогностическая сила оценок в средней школе снизилась». [76]

Результаты тестов позволяют школам Калифорнийского университета «отбирать тех учащихся из недостаточно представленных групп , которые с большей вероятностью получат более высокие оценки и закончат обучение вовремя». [76] «Первоначальной целью SAT было выявить студентов, пришедших из не относительно привилегированных кругов, которые могли бы иметь потенциал для достижения успеха в университете», — говорится в отчете. [76] Создатель SAT, Служба образовательного тестирования (ETS), теперь утверждает, что SAT — это не тест на «способности», а скорее оценка «развитых способностей». [78]

относящиеся к стандартизации Проблемы тестирования , не

Большинство тестов можно разделить на несколько категорий. Например, тест может быть как стандартизированным, так и тестом с высокими ставками, или стандартизированным и одновременно тестом с несколькими вариантами ответов. Жалобы на «стандартизированные тесты» (все тестируемые сдают один и тот же тест в достаточно схожих условиях и получают одинаковые оценки) часто сосредоточены на проблемах, не связанных со стандартизацией, и в равной степени применимы к нестандартизированным тестам. Например, критик может жаловаться, что «все стандартизированные тесты являются ограниченными по времени тестами», но критика сосредоточена на ограничении по времени, а не на том, что все проходят один и тот же тест и получают одинаковые оценки за ответы.

Тесты ставками с высокими

Виды тестов
Тест с низкими ставками Тест с высокими ставками
Стандартизированный тест Личностный тест на сайте для Вступительный экзамен определения поступления в университет
Нестандартизированный тест Учитель просит каждого ученика рассказать что-нибудь, что он запомнил из домашнего задания. Театр проводит прослушивание , чтобы определить, кому достанется главная роль.

Тест с высокими ставками — это тест с желаемой наградой за хорошую работу. [4] Некоторые стандартизированные тесты, в том числе многие тесты, используемые при поступлении в университеты по всему миру, представляют собой тесты с высокими ставками. Большинство стандартизированных тестов, таких как обычные тесты в классе, представляют собой тесты с низкими ставками. [4]

Сильная зависимость от важных стандартизированных тестов при принятии решений часто вызывает споры. Общая проблема, связанная с тестами с высокими ставками, заключается в том, что они измеряют производительность в течение одного события, тогда как критики считают, что более целостная оценка была бы уместна. Критики часто предлагают делать акцент на кумулятивных или даже нечисловых показателях, таких как оценки в классе или краткие индивидуальные оценки (написанные прозой) учителей. Сторонники утверждают, что результаты тестов представляют собой четкий и объективный стандарт, который служит ценным средством проверки завышения оценок . [79]

Нормативные тесты [ править ]

женщина пересекает финишную черту
Бег это настоящее испытание, соответствующее нормам . Цель забега — увидеть, кто бежит быстрее всех, а не посмотреть, сможет ли каждый бежать с определенной скоростью.

Тест, основанный на нормах, — это тест, который разработан и оценивается таким образом, чтобы некоторые участники теста оценивались лучше или хуже, чем другие. [4] Рейтинг предоставляет информацию об относительном рейтинге, что полезно, когда цель состоит в том, чтобы определить, кто является лучшим (например, при поступлении в элитные университеты). [4]

Несогласие с образовательными стандартами [ править ]

Тест на основе критериев является более распространенным и более практичным, когда цель состоит в том, чтобы узнать, усвоили ли тестируемые необходимый материал. [4]

Однако некоторые критики возражают против «стандартизированных тестов» не потому, что они возражают против предоставления учащимся одного и того же теста в достаточно схожих условиях и одинаковой оценки ответов, а потому, что они возражают против типа материала, который обычно проверяется в школах. Хотя существуют стандартизированные тесты на неакадемические качества, такие как тесты творческого мышления Торренса , школы редко проводят стандартизированные тесты для измерения «инициативы, креативности, воображения... любознательности... доброй воли, этического размышления или множества других ценных качеств». диспозиции и атрибуты». [80] [81] Вместо этого тесты, проводимые в школах, как правило, меньше фокусируются на развитии нравственности или характера, а больше на индивидуальных идентифицируемых академических навыках, таких как понимание прочитанного и арифметика .

В своей книге «Позор нации » Джонатан Козол утверждает, что студенты, прошедшие стандартизированное тестирование, являются жертвами «когнитивного обезглавливания». Козол пришел к этому выводу после разговора со многими детьми в городских школах, у которых нет пространственной памяти о времени, периодах времени и исторических событиях. Это особенно актуально в школах, где из-за нехватки финансирования и строгой политики подотчетности школы отказались от таких предметов, как искусство, история и география; чтобы сосредоточиться на содержании обязательных тестов. [82]

Тест на тревожность [ править ]

Некоторые люди начинают волноваться во время прохождения теста. Это явление чаще встречается для тестов с высокими ставками, чем для тестов с низкими ставками. Тесты с высокими ставками (стандартизованные или нестандартизированные) могут вызывать беспокойство.

Сами учащиеся критикуют, что тесты, хотя и стандартизированы, несправедливы по отношению к отдельному учащемуся. Некоторые студенты утверждают, что они «плохо сдают тесты», то есть они нервничают и теряют концентрацию на тестах. Таким образом, хотя тест является стандартным и должен давать справедливые результаты, тестируемые утверждают, что они находятся в невыгодном положении и не имеют возможности доказать свои знания иным образом, поскольку не существует другой альтернативы тестированию, которая позволила бы учащимся доказать свои знания и решить проблемы. навыки решения.

Некоторые студенты испытывают тревогу перед экзаменами . От десяти до сорока процентов студентов испытывают этот тип тревоги. [83] Больше всего тревогой перед тестированием страдают дети, живущие в бедности. [84] Тревога перед тестированием применима как к стандартизированным, так и к нестандартизированным тестам.

Тесты с множественным выбором и форматы тестов [ править ]

часть теста с несколькими вариантами ответов
Тесты с множественным выбором могут быть стандартизированными и нестандартизированными тестами.

Тест с несколькими вариантами ответов предоставляет испытуемому вопросы в сочетании с заранее определенным списком возможных ответов. Это тип закрытого вопроса . Экзаменуемый выбирает правильный ответ из списка.

Многие критики стандартизированного тестирования возражают против формата с несколькими вариантами ответов, который обычно используется для недорогого крупномасштабного тестирования и который не подходит для некоторых целей, например, для проверки того, может ли тестируемый написать абзац. Однако в стандартизированном тестировании может использоваться любой формат теста, включая открытые вопросы , при условии, что все участники теста сдают один и тот же тест в достаточно схожих условиях и получают одинаковые оценки.

Обучение на тесте [ править ]

Преподавание теста – это процесс сознательного сужения инструкций, чтобы сосредоточиться только на материале, который будет измеряться в тесте. Например, если учитель знает, что предстоящий тест по истории не будет включать никаких вопросов по истории музыки или искусства, тогда учитель может «учить на тесте», пропуская материал в учебнике по музыке и искусству. Критики также утверждают, что стандартизированные тесты поощряют « обучение тесту » в ущерб творческому подходу и углубленному освещению предметов, не включенных в тест. Критики говорят, что обучение с помощью теста не способствует обучению более высокого порядка; это меняет то, что учителям разрешено преподавать, и сильно ограничивает объем другой информации, которую учащиеся изучают на протяжении многих лет. [85] Хотя можно использовать стандартизированный тест, не позволяя его содержанию определять учебную программу и обучение, часто то, что не проверяется, не преподается, и то, как проверяется предмет, часто становится моделью преподавания этого предмета.

Навязанные извне тесты, например, тесты, созданные отделом образования для учащихся в их районе, побуждают учителей сужать формат учебной программы и преподавать в соответствии с тестом. [86]

Оплата по результатам – это идея, согласно которой учителям следует платить больше, если учащиеся хорошо сдают тесты, и меньше, если они показывают плохие результаты. [85] Когда учителей или школы вознаграждают за лучшие результаты на тестах, эти награды побуждают учителей « учить на тестах », а не предоставлять насыщенную и обширную учебную программу. В 2007 году качественное исследование, проведенное О Уэйном, продемонстрировало, что стандартизированное тестирование сужает учебную программу и поощряет обучение, ориентированное на преподавателя, а не на обучение, ориентированное на учащихся . [87] Губернатор Нью-Джерси Крис Кристи предложил образовательную реформу в Нью-Джерси, которая заставляет учителей не только «учить по тесту», но и заставлять своих учеников работать за счет потенциальной стоимости их зарплаты и гарантий занятости. Реформа предусматривала оплату по результатам, которая зависит от успеваемости учащихся на стандартизированных тестах и ​​их образовательных успехов. [88]

Критики утверждают, что чрезмерное и неправильное использование этих тестов вредит преподаванию и обучению, поскольку сужает учебную программу. По данным группы FairTest , когда стандартизированные тесты являются основным фактором подотчетности, школы используют тесты, чтобы узко определить учебную программу и сфокусировать обучение. Подотчетность создает огромное давление на результаты, и это может привести к неправильному использованию и неправильной интерпретации стандартизированных тестов. [66]

Критика тестирования [ править ]

Некоторые люди критикуют тестирование в целом, независимо от того, стандартизирован тест или нет.

См. также [ править ]

Основные темы [ править ]

Другие темы [ править ]

Ссылки [ править ]

  1. ^ Пофэм, WJ (1999). «Почему стандартизированные тесты не измеряют качество образования». Образовательное лидерство . 56 (6): 8–15.
  2. ^ Фелпс, Ричард П. «Роль и важность тестирования» . Nonpartisaneducation.org . Проверено 17 мая 2016 г.
  3. Перейти обратно: Перейти обратно: а б с Олсон, Эми М.; Сэйбрс, Даррелл (октябрь 2008 г.). «Стандартизированные тесты» . В Гуде, Томас Л. (ред.). Образование XXI века: Справочник . Публикации SAGE. стр. 423–430. дои : 10.4135/9781412964012.n46 . ISBN  9781452265995 . S2CID   241229809 .
  4. Перейти обратно: Перейти обратно: а б с д и ж г час я Аллен, Дж. Дональд; Росс, Аманда (10 ноября 2017 г.). «Тесты и ярлыки с низкими ставками» . Педагогика и содержание математики в средней и старшей школе . Спрингер. ISBN  978-94-6351-137-7 .
  5. ^ «Китайская государственная служба» . Британская энциклопедия . Проверено 2 мая 2015 г.
  6. Перейти обратно: Перейти обратно: а б с д и Марк и Бойер (1996), 9–10.
  7. Перейти обратно: Перейти обратно: а б Казин, Эдвардс и Ротман (2010), 142.
  8. Перейти обратно: Перейти обратно: а б Трэхэр, Ричард (01 июня 2015 г.). Поведение, технологии и организационное развитие: Эрик Трист и Тавистокский институт . Издатели транзакций. ISBN  9781412855495 .
  9. ^ Джонсон, Роберт. «Стандартизированные тесты». Энциклопедия образовательной реформы и инакомыслия. SAGE Publications, INC. 2010. 853–856.Web.
  10. ^ Гаррисон, Марк Дж. Мера неудачи: политические истоки стандартизированного тестирования. Олбани: Государственный университет Нью-Йорка, 2009. Печать.
  11. ^ Дарити, Уильям младший «Международная энциклопедия социальных наук» . Энциклопедия справочной информации . Гейл Сенгадж Обучение . Проверено 25 января 2017 г.
  12. ^ Гулд, С.Дж., «Нация дебилов», New Scientist (6 мая 1982 г.), 349–352.
  13. ^ Дарити, Уильям младший «Международная энциклопедия социальных наук» . Энциклопедии для справочной информации . Гейл Сенгадж Обучение . Проверено 25 января 2017 г.
  14. ^ Флетчер, Дэн. «Стандартизированное тестирование». Время. Time Inc., 11 декабря 2009 г. Интернет. 09 марта 2014 г.
  15. ^ «Что в ACT». Разделы теста ACT. Нп и Интернет. 05 мая 2014 г.
  16. ^ Стиггинс, Ричард (2002). «Кризис оценивания: отсутствие оценивания ДЛЯ обучения» (PDF) . Пхи Дельта Каппан . 83 (10): 758–765. дои : 10.1177/003172170208301010 . S2CID   145683785 .
  17. Перейти обратно: Перейти обратно: а б Штраус, Валери (11 марта 2015 г.). «Пять причин, по которым стандартизированное тестирование не прекратится» . Вашингтон Пост . Вашингтон Пост . Проверено 26 января 2017 г.
  18. ^ «История и предыстория организации «Ни один ребенок не оставлен позади»» . Bright Hub Education9 июня 2015 г. Интернет. 12 октября 2015 г. http://www.brighthubeducation.com/student-assessment-tools/3140-history-of-the-no-child-left-behind-act/
  19. ^ «Закон об успехе каждого студента (ESSA) | Министерство образования США» .
  20. ^ Клэйборн, Чарльз. «Тестирование с высокими ставками». Энциклопедия одаренности, творчества и таланта. Публикации SAGE, 2009. 9 апреля 2014 г.
  21. ^ Валери, Штраус (21 июня 2020 г.). «Это похоже на начало конца американской одержимости стандартизированными тестами для студентов» . Вашингтон Пост .
  22. ^ «Дом – Австралийская учебная программа, версия 8.1» . www.australiancurriculum.edu.au . Проверено 17 мая 2016 г.
  23. ^ Коули, Питер; Макферсон, Пейдж (2022). ТЕСТИРОВАНИЕ КАНАДСКИХ УЧЕНИКОВ K-12: региональные различия, возможности для улучшения (PDF) . ISBN  978-0-88975-694-6 . Проверено 19 декабря 2023 г. {{cite book}}: |website= игнорируется ( помогите )
  24. ^ Горовиц, MR; Монтгомери, Д.Л. (январь 1993 г.). «Физиологический профиль пожарных по сравнению с нормами для населения Канады». Канадский журнал общественного здравоохранения . 84 (1): 50–52. ISSN   0008-4263 . ПМИД   8500058 .
  25. ^ Канадская ассоциация спортивных наук; Программа сертификации и аккредитации по фитнес-аттестации; Канадское общество физиологии физических упражнений; Фитнес Канада (1987). Канадский стандартизированный тест физической подготовки (CSTF): для детей от 15 до 69 лет: руководство по интерпретации и консультированию . Глостер, Онтарио: Канадское общество физиологии физических упражнений. ISBN  0-662-15736-2 . OCLC   16048356 .
  26. ^ Веб-страница ETS. Архивировано 18 июня 2009 г. на Wayback Machine, где рассказывается о результатах GRE.
  27. Перейти обратно: Перейти обратно: а б Хаутц, Джолейн (27 августа 2000 г.) «Временные люди тратят всего несколько минут, чтобы пройти государственный тест. Математическая задача WASL может занять 20 секунд; эссе - 2 1 10 минуты». Архивировано марта 2007 г. в Wayback Machine . Seattle Times «В считанные минуты временный сотрудник за 10 долларов в час выставляет оценку за тест вашего ребенка».
  28. ^ Рич, Мотоко (22 июня 2015 г.). «Оценка общего ядра: опыт преподавания не требуется» . Нью-Йорк Таймс . ISSN   0362-4331 . Проверено 06 октября 2015 г.
  29. ^ Ли, Джуссим (1989). «Ожидания учителя: самоисполняющиеся пророчества, предвзятость восприятия и точность». Журнал личности и социальной психологии . 57 (3): 469–480. дои : 10.1037/0022-3514.57.3.469 .
  30. ^ Где мы находимся: оценка и подотчетность на основе стандартов (Американская федерация учителей) [1] Архивировано 24 августа 2006 г., в Wayback Machine.
  31. ^ «Объединенный комитет по стандартам оценки образования» . Архивировано из оригинала 15 октября 2009 года . Проверено 2 мая 2015 г.
  32. ^ Объединенный комитет по стандартам оценки образования. (1988). Стандарты оценки персонала: как оценивать системы оценки преподавателей. Архивировано 12 декабря 2005 г. в Wayback Machine Newbury Park, Калифорния: Sage Publications.
  33. ^ Объединенный комитет по стандартам оценки образования. (1994). Стандарты оценки программ, 2-е издание. Архивировано 22 февраля 2006 г. в Wayback Machine Newbury Park, Калифорния: Sage Publications.
  34. ^ Комитет по стандартам оценки образования. (2003). Стандарты оценки учащихся: как улучшить оценки учащихся. Архивировано 24 мая 2006 г. в парке Wayback Machine в Ньюбери, Калифорния: Corwin Press.
  35. ^ Морган, Хани (2016). «Опираться на сложные стандартизированные тесты для оценки школ и учителей: плохая идея». Информационный центр: журнал образовательных стратегий, проблем и идей . 89 (2): 67–72. дои : 10.1080/00098655.2016.1156628 . S2CID   148015644 .
  36. ^ «Стандарты образовательного и психологического тестирования» . www.apa.org . Проверено 2 мая 2015 г.
  37. ^ Кунцель, Северная Каролина; Хезлетт, SA (2007). «ОЦЕНКА: стандартизированные тесты предсказывают успех аспирантов». Наука . 315 (5815): 1080–81. дои : 10.1126/science.1136618 . ПМИД   17322046 . S2CID   143260128 .
  38. Перейти обратно: Перейти обратно: а б с д Фелпс, Ричард (2005). Защита стандартизированного тестирования . Лондон: Psychology Press. ISBN  978-0-8058-4912-7 .
  39. Перейти обратно: Перейти обратно: а б «Плюсы и минусы стандартизированных тестов» . Оксфордское обучение . 29 октября 2014 г. Проверено 19 февраля 2018 г.
  40. ^ «Плюсы и минусы стандартизированного тестирования» (PDF) . Колумбийский университет . Весна 2013 г. Архивировано из оригинала (PDF) 27 января 2018 г. Проверено 19 февраля 2018 г.
  41. Перейти обратно: Перейти обратно: а б Хирш, Эрик младший (1999). Школы, которые нам нужны: и почему их у нас нет . Нью-Йорк: Якорь. ISBN  978-0-385-49524-0 .
  42. ^ «Критика SAT FairTest» . Fairtest.org. 20 августа 2007 г.
  43. ^ «Стандартизированные тесты не всегда лучший показатель успеха» . 20 августа 2007 г.
  44. ^ Патон, Грэм (6 июля 2010 г.). «Университеты критикуют «раздувание оценок» экзаменов » . «Дейли телеграф» . Лондон. Архивировано из оригинала 12 января 2022 г.
  45. ^ Васагар, Дживан (2 августа 2010 г.). «Опасения за учащихся государственных учреждений, поскольку ведущие университеты настаивают на получении A* на уровне A» . Хранитель . Лондон.
  46. ^ Финч, Джулия (10 марта 2010 г.). «Они не умеют читать, не умеют писать, следить за временем и соблюдать порядок: приговор директора Tesco выпускникам школ» . Хранитель . Лондон.
  47. ^ Хеджес, Ларри В.; Лейн, Ричард Д.; Гринвальд, Роб (1994). «Хеджес Л.В. (1994). Обмен: Часть I *: Имеют ли деньги значение? Метаанализ исследований влияния дифференциальных школьных ресурсов на результаты учащихся». Исследователь образования . 23 (3): 5–14. дои : 10.3102/0013189X023003005 . S2CID   36771659 .
  48. ^ Кофлан, Шон. Яркая беднота «сдерживается десятилетиями» , BBC , 16 октября 2013 г. Проверено 17 октября 2013 г.
  49. ^ «Нейронаука стандартизированного тестирования» .
  50. ^ «Стандартизированные тесты не показывают того, что знают дети» . 10 июля 2017 г.
  51. ^ «Согласно новому исследованию, стандартизированные тесты не являются хорошим показателем подвижного интеллекта» . 11 января 2014 г.
  52. ^ «Стандартизированные тесты не измеряют интеллект или способности» . 27 сентября 2016 г.
  53. ^ «Наблюдения: результаты стандартизированных тестов не отражают способности учащихся» .
  54. ^ Дэвидсон, Кэти (2011). Теперь вы это видите: как наука о мозге и внимании изменит то, как мы живем, работаем и учимся . Нью-Йорк: Викинг.
  55. ^ Новости США (2 мая 2015 г.). «Скандал с мошенничеством: федералы говорят, что учителя наняли дублеров для сдачи сертификационных тестов» . Новости Эн-Би-Си . Проверено 2 мая 2015 г.
  56. ^ Шмидт, Уильям Х.; Хуанг, Ричард Т. (2012). «Связность учебных программ и общие основные стандарты по математике». Исследователь образования . 41 (8): 294–308. дои : 10.3102/0013189x12464517 . S2CID   121779439 .
  57. ^ Портер, А.; МакМакен, Дж.; Хван, Дж.; Ян, Р. (2011). «Общие основные стандарты: новая учебная программа, предназначенная для США». Исследователь образования . 40 (7): 103–116. дои : 10.3102/0013189x11405038 . S2CID   51453603 .
  58. ^ Лейтон, Линдси (24 октября 2015 г.). «Исследование показывает, что стандартизированное тестирование переполняет государственные школы страны» . Вашингтон Пост . Проверено 26 июля 2015 г.
  59. ^ Деринг, Кристофер (25 октября 2015 г.). «План Обамы ограничивает стандартизированное тестирование не более чем 2% учебного времени» . США сегодня . Проверено 26 июля 2016 г.
  60. ^ Кучински-Браун, Алекс. «По данным исследования, расходы на стандартизированное тестирование составляют 1,7 миллиарда долларов в год». Хаффингтон Пост. TheHuffingtonPost.com, 29 ноября 2012 г. Интернет. 7 апреля 2014 г.
  61. ^ «Большая четверка индустрии тестирования» . PBS «Линия фронта» . ПБС. 2001 . Проверено 21 января 2015 г.
  62. ^ «Просмотреть все темы – Пресса национальных академий» . Архивировано из оригинала 18 апреля 2008 г. Проверено 2 мая 2015 г.
  63. ^ «Плюсы и минусы стандартизированного тестирования» (PDF) . Колумбийский университет. 21 ноября 2017 г.
  64. ^ Нил, Монти (осень 2009 г.). Стандартизированные тесты несправедливы и вредны . Детройт: Фармингтон-Хиллз, Мичиган: Greenhaven Press. стр. 28–35. ISBN  9780737747812 . Проверено 4 декабря 2016 г.
  65. ^ Майнер, Барбара (август 2000 г.). «Стандартизированное мышление: высокая цена американской культуры тестирования и что мы можем сделать, чтобы изменить ее / Противоречия школьной реформы: образовательные затраты на стандартизированное тестирование». Прогрессивный . 64 : 40–43. ПроКвест   231959849 .
  66. Перейти обратно: Перейти обратно: а б Холлоуэй, Дж. Х. (2001). «Использование и неправильное использование стандартизированных тестов». Образовательное лидерство . 59 (1): 77.
  67. ^ Мерфи, Сара С; Клигер, Дэвид М; Борнеман, Мэтью Дж; Кунцель, Натан Р. (2009). «Прогностическая сила личных заявлений при поступлении: метаанализ и поучительная история» . Колледж и университет . 84 : 83–86, 88.
  68. ^ Кунцель, Натан; Сакетт, Пол (8 марта 2018 г.). «Правда о SAT и ACT» . Уолл Стрит Джорнал .
  69. ^ Кунцель, Натан; Хезлетт, Сара А. (2007). «Стандартизированные тесты предсказывают успех аспирантов» . Наука . 315 (5815): 1080–1. дои : 10.1126/science.1136618 . ПМИД   17322046 . S2CID   143260128 .
  70. Перейти обратно: Перейти обратно: а б Кунцель, Натан; Хезлетт, Сара А. (2007). «Стандартизированные тесты предсказывают успех аспирантов» . Наука . 315 (5815): 1080–1081. дои : 10.1126/science.1136618 . ПМИД   17322046 . S2CID   143260128 .
  71. ^ Парк, Грегори; Любинский, Дэвид; Бенбоу, Камилла П. (1 октября 2008 г.). «Различия в способностях людей, имеющих соизмеримую степень, имеют значение для научного творчества». Психологическая наука . 19 (10): 957–961. дои : 10.1111/j.1467-9280.2008.02182.x . ПМИД   19000201 . S2CID   6443429 .
  72. ^ Кунцель, Натан; Арнесон (2009). «Объясняет ли социально-экономический статус взаимосвязь между вступительными испытаниями и академической успеваемостью после окончания средней школы?» . Психологический вестник : 1–22.
  73. ^ Коннелли, Брайан С.; Кунцель, Натан (3 ноября 2012 г.). «Балансирование групп лечения и контроля в квазиэкспериментах: введение в оценку склонности». Психология персонала . 66 (2): 407–442. дои : 10.1111/peps.12020 .
  74. ^ Коуч, Майкл; Фрост, Маркиша; Сантьяго, Дж.; Хилтон, Адриэль (9 сентября 2021 г.). «Переосмысление стандартизированного тестирования с точки зрения доступа, равенства и достижений: изменилось ли что-нибудь для афроамериканских студентов?» . Журнал исследовательских инициатив . 5 (3). ISSN   2168-9083 .
  75. ^ Кунцель, Натан; Сакетт, Пол; Битти, Адам С. (2 августа 2012 г.). «Роль социально-экономического статуса в отношениях с выпускниками SAT и в решениях о поступлении в колледж». Психологическая наука . 23 (9): 1000–7. дои : 10.1177/0956797612438732 . ПМИД   22858524 . S2CID   22703783 .
  76. Перейти обратно: Перейти обратно: а б с д и ж г КАЛИФОРНИЙСКИЙ УНИВЕРСИТЕТ, УЧЕНЫЙ СЕНАТ (январь 2020 г.). «Отчет Целевой группы по стандартизированному тестированию Академического совета Калифорнийского университета» (PDF) .
  77. ^ Редколлегия (17 мая 2020 г.). «Калифорния определяет тестирование вниз» . Уолл Стрит Джорнал .
  78. ^ Тодд Моррисон и Мелани Моррисон. «Метааналитическая оценка прогностической достоверности…» Журнал образовательных и психологических измерений. 1995. Компоненты http://epm.sagepub.com/content/55/2/309.abstract.
  79. ^ Бакли, Джек; Летукас, Линн; Вильдавски, Бен (2017), Измерение успеха: тестирование, оценки и будущее поступления в колледж , Балтимор: Издательство Университета Джонса Хопкинса, стр. 344, ISBN  9781421424965
  80. ^ Кон, Алфи (2000). Аргументы против стандартизированного тестирования: повышение результатов, разрушение школ . Портсмут, Нью-Хэмпшир: Хайнеманн. ISBN  978-0325003252 .
  81. ^ Преподавать: путь учителя, Уильям Айерс, Teachers College Press, 1993, ISBN   0-8077-3985-5 , ISBN   978-0-8077-3985-3 , стр. 116
  82. ^ Козол, Джонатан (2005). Позор нации: восстановление школьного апартеида в Америке . Печать: Рэндом Хаус. стр. 118–119. ISBN  9781415924167 .
  83. ^ Древесина; Харт; Маленький; Филлипс (2016). «Тестовая тревога и стандартизированный тест на понимание прочитанного с высокими ставками: взгляд на поведенческую генетику» . Ежеквартальный журнал Меррилл-Палмер . 62 (3): 233–251. дои : 10.13110/merrpalmquar1982.62.3.0233 . ISSN   0272-930X . ПМК   5487000 . ПМИД   28674461 .
  84. ^ «Тесты и стрессовая предвзятость» . Гарвардская высшая школа образования . 12 февраля 2019 года . Проверено 27 октября 2022 г.
  85. Перейти обратно: Перейти обратно: а б Уильямс, Мэри (2015). «Стандартизированное тестирование вредит обучению учащихся» . go.galegroup.com . Проверено 28 марта 2018 г.
  86. ^ «Госвами У (1991). Испытание: влияние внешнего тестирования на учителей. Исследователь образования 20: 8-11» . Архивировано из оригинала 2 февраля 2013 г.
  87. ^ Ау, Уэйн (01 июня 2007 г.). «Тестирование с высокими ставками и учебный контроль: качественный метасинтез». Исследователь образования . 36 (5): 258–267. дои : 10.3102/0013189X07306523 . ISSN   0013-189X . S2CID   507582 .
  88. ^ Арко, Мэтт (12 июня 2015 г.). «Выступление Christie Education в Айове» . Нью-Джерси.com . Проверено 25 июля 2016 г.

95.) Тестируемые 1

96.) Тестируемые 2

Дальнейшее чтение [ править ]

Внешние ссылки [ править ]

Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: c3efacf1e469f9c9851e737240c309bd__1716057720
URL1:https://arc.ask3.ru/arc/aa/c3/bd/c3efacf1e469f9c9851e737240c309bd.html
Заголовок, (Title) документа по адресу, URL1:
Standardized test - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)