Стандартизированный тест
![]() | Эта статья может потребовать редактирования копий для письма, станет немного неформальным, а в некоторых разделах похожа на эссе. Полем ( Сентябрь 2023 г. ) |

Стандартизированный тест - это тест , который вводится и набирается в последовательном или «стандартном», способ. Стандартизированные тесты разработаны таким образом, чтобы вопросы и интерпретации были последовательны и вводились и оцениваются в заранее определенном, стандартном образом. [ 1 ]
Любой тест, в котором один и тот же тест проводится таким же образом для всех тестирующих, и оценивается таким же образом для всех, является стандартизированным тестом. Стандартизированные тесты не должны быть тестами с высокими ставками , ограниченными по времени тестами, тестами с множественным выбором , академическими тестами или тестами, проведенными большим количеству тестовых участников. Стандартизированным тестом может быть любой тип теста: письменный тест, пероральный тест или тест на практические навыки . Вопросы могут быть простыми или сложными. Предмет среди учеников школьного возраста часто заключается в академических навыках, но стандартизированный тест может быть проведен практически на любую тему, включая тесты вождения , творческий потенциал , атлетизм , личность , профессиональную этику или другие атрибуты.
Противоположностью стандартизированного тестирования является нестандартизированное тестирование , в котором либо существенно различные тесты даются различным тестовым, или один и тот же тест присваивается в значительно различных условиях (например, одной группе разрешено гораздо меньше времени для завершения теста, чем в тесте, чем в тесте, чем в Следующая группа) или оценивается по -разному (например, тот же ответ считается правильно для одного студента, но неправильно для другого студента).
Большинство повседневных тестов и тестов, пройденных учащимися во время школы, соответствуют определению стандартизированного теста: каждый в классе сдает один и тот же тест, в то же время, при тех же обстоятельствах, и все ученики оцениваются их учителем в том же способ. Тем не менее, термин стандартизированный тест чаще всего используется для обозначения тестов, которые даются более крупным группам, таким как тест, проведенный всем возраст. Наиболее стандартизированные тесты являются формами итоговых оценок (оценки, которые измеряют изучение участников в конце учебной единицы).
Поскольку каждый получает один и тот же тест и одну и ту же систему оценки, стандартизированные тесты часто воспринимаются как более справедливые, чем нестандартные тесты. Такие тесты часто считаются более справедливыми и объективными, чем система, в которой некоторые студенты получают более легкий тест, а другие получают более сложный тест. Стандартизированные тесты предназначены для обеспечения надежного сравнения результатов по всем тестирующим, потому что каждый проходит один и тот же тест. [ 2 ]
Определение
[ редактировать ]
Определение стандартизированного теста несколько изменилось с течением времени. [ 3 ] В 1960 году стандартизированные тесты были определены как условия, в которых условия и содержание были равны для всех, кто проходил тест, независимо от того, когда, где или от которого тест был проведен или оценен. Стандартизированные тесты имеют постоянный, равномерный метод для оценки. [ 4 ] Это означает, что все студенты, которые отвечают на тестовый вопрос таким же образом, получат одинаковую оценку для этого вопроса. Цель этой стандартизации состоит в том, чтобы убедиться, что оценки надежно указывают на способности или навыки, а не другие вещи, такие как различные инструкции о том, что делать, если тестовый набор не знает ответа на вопрос. [ 3 ]
К началу 21 -го века фокус отключился от строгого сходства условий к равным справедливости условий тестирования. [ 3 ] Например, тестирование с сломанным запястьем может писать медленнее из -за травмы, и это было бы более справедливым и создавать более надежное понимание реальных знаний тестового совещания, если этому человеку было дано еще несколько минут, чтобы написать Вниз по ответам на ограниченный по времени тест. Изменение условий тестирования таким образом, чтобы улучшить справедливость в отношении постоянной или временной инвалидности, но без подрыва основной точки оценки называется жильем . Однако, если бы целью было увидеть, как быстро студент может написать, то предоставление тестированию дополнительное время стало бы модификацией контента и больше не стандартизированным тестом.
Предмет | Формат | Стандартизированный тест | Нестандартный тест | |
---|---|---|---|---|
История | Оральный | ![]() |
Каждому студенту дают одинаковые вопросы, и их ответы оцениваются одинаково. | Учитель задает каждому ученику другой вопрос. Некоторые вопросы сложнее других. |
Вождение | Практические навыки | ![]() |
Каждый студент -водитель просят сделать одно и то же, и все они оцениваются по тем же стандартам. | Некоторым студентам -водителям приходится ехать по шоссе, но другим приходится медленно ездить по кварталу. Один сотрудник принимает очки за «плохое отношение». |
Математика | Написано | ![]() |
Каждому студенту дают одинаковые вопросы, и их ответы оцениваются одинаково. | Учитель дает разные вопросы разным ученикам: легкий тест для бедных учеников, еще один тест для большинства учеников и трудный тест для лучших учеников. |
Музыка | Прослушивание | ![]() |
Все музыканты играют одно и то же музыкальное произведение. Судьи заранее согласились, сколько таких факторов, как сроки, выражение и музыкальность. | Каждый музыкант выбирает разные музыкальные произведения. Судьи выбирают музыканта, который им нравится больше всего. Один судья дает дополнительные очки музыкантам, которые носят костюм. |
История
[ редактировать ]Китай
[ редактировать ]Самые ранние доказательства стандартизированного тестирования были в Китае , во время династии Хань , [ 5 ] Там, где имперские экзамены освещали шесть искусств , которые включали в себя музыку, стрельбу из лука, верховое мнение, арифметику, письмо и знание ритуалов и церемоний как общественных, так и частных частей. Эти экзамены были использованы для выбора сотрудников для государственной бюрократии.
Позже, в тестирование были добавлены разделы о военных стратегиях, гражданском праве, доходах и налогообложении, сельском хозяйстве и географии. В этой форме экзамены были институционализированы на протяжении более тысячелетия.
Сегодня стандартизированное тестирование остается широко используемым, наиболее известным в системе Гаокао .
Великобритания
[ редактировать ]Стандартизированное тестирование было введено в Европу в начале 19 -го века, по образцу китайских экзаменов мандарина , [ 6 ] Благодаря пропаганде британских колониальных администраторов, наиболее «настойчивой» из которых был британский консул в Гуанчжоу, Китай , Томас Тейлор Медоуз . [ 6 ] Медоуз предупредил о крахе Британской империи, если стандартизированное тестирование не было проведено по всей Империи немедленно. [ 6 ]
До их принятия стандартизированное тестирование традиционно не было частью западной педагогики. Основываясь на скептической и открытой традиции дебатов, унаследованной от древней Греции, западные академии предпочитали нестандартные оценки, используя эссе, написанные студентами. Именно из -за этого первая европейская реализация стандартизированного тестирования произошла не в самой Европе, а в Британской Индии . [ 7 ] Вдохновленный китайским использованием стандартизированного тестирования, в начале 19 -го века британские «менеджеры компании наняли и продвигали сотрудников на основе конкурентных экзаменов, чтобы предотвратить коррупцию и фаворитизм». [ 7 ] Эта практика стандартизированного тестирования была позже принята в конце 19 -го века британским материком. Парламентские дебаты, которые последовали, сделали много ссылок на «Китайскую систему мандарина». [ 6 ]
Именно из Великобритании было распространено стандартизированное тестирование не только по всему британскому Содружеству , но и в Европу, а затем в Америку. [ 6 ] Его распространение было вызвано промышленной революцией . Увеличение числа учащихся школьников во время и после промышленной революции в результате обязательных законов об образовании снизило использование открытой оценки, которая была сложнее для массового производства и объективно оценивать его по своей внутренней субъективной природе.

Стандартизированные тесты, такие как советы по отбору военного офиса, были разработаны для Британской армии во время Второй мировой войны, чтобы выбрать кандидатов на подготовку офицеров и другие задачи. [ 8 ] В тестах рассматривались умственные способности солдат, механические навыки, способность работать с другими и другие качества. Предыдущие методы пострадали от предвзятости и привели к выбору не тех солдат для обучения офицеров. [ 8 ]
Соединенные Штаты
[ редактировать ]Стандартизированное тестирование было частью образования Соединенных Штатов с 19-го века, но широко распространенная зависимость от стандартизированного тестирования в школах в США в основном является феноменом 20-го века.
Иммиграция в середине 19-го века способствовала росту стандартизированных тестов в Соединенных Штатах. [ 9 ] Стандартизированные тесты использовались, когда люди впервые вошли в США, чтобы проверить социальные роли и найти социальную власть и статус. [ 10 ]
Совет по вступительным экзаменам в колледже начал предлагать стандартизированные тестирование для поступления в университет и колледжа в 1901 году, охватывая девять предметов. Этот тест был реализован с идеей создания стандартизированного приема для Соединенных Штатов в северо -восточных элитных университетах. Первоначально тест также предназначался для ведущих школ -интернатов , чтобы согласовать учебную программу между школами. [ 11 ] Первоначально стандартизированный тест был сделан из эссе и не предназначался для широкого распространения тестирования. [ 11 ]
Во время Первой мировой войны были были разработаны альфа -тесты армии разработаны и для того, чтобы помочь новым новобранцам в соответствующих заданиях на основе их оцененных уровней разведки. [ 12 ] Первое издание современного стандартизированного теста для IQ , тестирования разведки Стэнфорд -Бинет , появилось в 1916 году. Затем совет колледжа разработал SAT (тест на способность ученого) в 1926 году. Первый тест SAT был основан на испытаниях Army IQ, с Цель определения интеллекта, навыки решения проблем и критического мышления . [ 13 ] В 1959 году Эверетт Линдквист предложил акт (тестирование американского колледжа). впервые [ 14 ] По состоянию на 2020 год этот акт включает в себя четыре основных раздела с вопросами с множественным выбором для тестирования английского языка, математики, чтения и науки, а также дополнительного раздела письма. [ 15 ]
Отдельные штаты начали тестировать большое количество детей и подростков через системы государственных школ в 1970 -х годах. К 1980 -м годам американские школы оценивали на национальном уровне. [ 16 ] В 2012 году 45 штатов заплатили в среднем 27 долларов США на студента и 669 миллионов долларов США в целом на крупномасштабные академические тесты. [ 17 ] Тем не менее, косвенные затраты , такие как оплата учителей, чтобы подготовить учащихся к тестам и для времени, проведенного в классе, администрирование тестов, значительно превышают прямые затраты на сам тест. [ 17 ]
Необходимость федерального правительства провести значимые сравнения в высокоцентрализованной (локально контролируемой) системе государственного образования поощряла использование крупномасштабных стандартизированных испытаний. Закон начального и среднего образования 1965 года потребовал некоторое стандартизированное тестирование в государственных школах. Закон «без ребенка» 2001 года дополнительно связал некоторые виды финансирования государственных школ с результатами стандартизированного тестирования. В соответствии с этими федеральными законами школьная программа все еще была установлена каждым штатом, но федеральное правительство требовало, чтобы штаты оценили, насколько хорошо школы и учителя преподавали материалы, выбранные штатом со стандартизированными тестами. [ 18 ] Результаты учащихся по крупномасштабным стандартизированным тестам были использованы для распределения средств и других ресурсов в школы и для закрытия плохо выполняемых школ. Закон «Каждый студент сменил успех», заменил NCLB в конце 2015 года. [ 19 ] К этому моменту эти крупномасштабные стандартизированные тесты стали противоречивыми в Соединенных Штатах не обязательно потому, что все учащиеся проходили те же тесты и оценивали одинаково, а потому, что они стали тестами для школьных систем и учителей Полем [ 20 ]
В последние годы многие университеты США и колледжи отказались от требований стандартизированных результатов тестов со стороны кандидатов. [ 21 ]
Австралия
[ редактировать ]Австралийская национальная программа оценки - Стандартизированное тестирование грамотности и счета (NAPLAN) было начато в 2008 году Австралийским Управлением по учебным программам, оценке и отчетности, независимым органом, ответственным за разработку национальной учебной программы, национальной программы оценки и национального сбора данных и программа отчетности, которая поддерживает обучение 21 -го века для всех австралийских студентов ». [ 22 ]
Тестирование включает в себя всех учащихся в 3, 5, 7 и 9 годах в австралийских школах, которые будут оценены с использованием национальных тестов. Субъекты, рассмотренные в этих тестах, включают чтение, письменность, языковые соглашения (орфография, грамматика и пунктуация) и счета.
Программа представляет учащихся на уровне отчетов, предназначенных для того, чтобы родители могли видеть прогресс своего ребенка в течение их школьной жизни, и помогают учителям улучшить индивидуальные возможности обучения для своих учеников. Данные учащихся и школьного уровня также предоставляются соответствующей школьной системе о понимании того, что их можно использовать для нацеливания на конкретную поддержку и ресурсы для школ, которые им больше всего нуждаются. Учителя и школы используют эту информацию в сочетании с другой информацией, чтобы определить, насколько хорошо работают их ученики, и для определения любых потребностей, требующих помощи.
Концепция тестирования успеваемости учащихся не является новой, хотя, как можно сказать, нынешний австралийский подход имеет свое начало в текущих структурах образовательной политики как в США, так и в Великобритании. Существует несколько ключевых различий между стратегиями Австралии Naplan и Великобритании и США. Школам, которые, как установлены, неэффективны в австралийском контексте, будет предложена финансовая помощь в соответствии с действующей политикой федерального правительства.
Колумбия
[ редактировать ]В 1968 году родился Колумбийский институт оценки образования (ICFES) для регулирования высшего образования. Была реализована предыдущая общественная система оценки для разрешения операции и юридического признания для учреждений и университетских программ.
Колумбия имеет несколько стандартизированных тестов, которые оценивают уровень образования в стране. Эти экзамены выполняются ICFES.
Учащиеся третьего класса, пятого класса и девятого класса сдают экзамен «Сабля 3 ° 5 ° 9 °». Этот тест в настоящее время представлен на компьютере в контролируемых образцах и переписи.
Оставив ученики старших классов представить «Сабли 11», которая позволяет им входить в разные университеты страны. Ученики, обучающиеся дома, могут сдать этот экзамен, чтобы получить высшее образование и получить сертификат и диплом.
Студенты, покидающие университет, должны сдать экзамен «Sabre Pro».
Канада
[ редактировать ]Канада оставляет образование и стандартизированное тестирование в результате, под юрисдикцией провинций. Каждая провинция имеет свой собственный стандартизированный режим тестирования в масштабе провинции, начиная от не требуемых стандартизированных тестов для учащихся в Саскачеване до экзаменов на сумму 40% окончательных средних классов в Ньюфаундленде и Лабрадоре. [ 23 ]
Дизайн и счет
[ редактировать ]Дизайн
[ редактировать ]Чаще всего основной академический тест включает как на человека, так и на компьютерные, разделы.
Стандартизированный тест может быть составлен из вопросов с множественным выбором, вопросов истинного, вопросов эссе, аутентичных оценок или почти любой другой формы оценки. Многочисленные варианты и истинные предметы часто выбираются для тестов, которые проходят тысячи людей, потому что их можно давать и забивать недорого, быстро и надежно, используя специальные листы ответов, которые могут быть прочитаны компьютером или через компьютерный адаптирующий тестирование . Некоторые стандартизированные тесты имеют компоненты с коротким ответом или написанием эссе, которым присваивается оценка независимыми оценщиками, которые используют рубрики (правила или руководящие принципы) и контрольные документы (примеры документов для каждого возможного балла), чтобы определить оценку, который будет предоставлен для ответа.
Любой предмет
[ редактировать ]
Не все стандартизированные тесты включают в себя ответные вопросы. Подлинная оценка спортивных навыков может занять форму бега в течение определенного количества времени или дриблинга на определенное расстояние. Специалисты здравоохранения должны пройти тесты, доказывающие, что они могут выполнять медицинские процедуры. Кандидаты на водительские права должны пройти стандартизированный тест, показывающий, что они могут управлять автомобилем. Канадский стандартизированный тест на физическую форму использовался в медицинских исследованиях, чтобы определить, насколько физически подходят тестовые уборки. [ 24 ] [ 25 ]
Машина и человеческий счет
[ редактировать ]С последней части 20-го века крупномасштабное стандартизированное тестирование было частично сформировано с легкостью и низкой стоимостью оценки тестов с множественным выбором на компьютере. Большинство национальных и международных оценок не полностью оцениваются людьми.
Люди используются для оценки предметов, которые не могут быть легко забиты компьютером (например, эссе). Например, экзамен для выпускников -это компьютерная адаптивная оценка, которая не требует отчетов людей, за исключением письменной части. [ 26 ]
Человеческая оценка является относительно дорогой и часто переменной, поэтому оценка компьютера предпочтительнее, когда это возможно. Например, некоторые критики говорят, что плохо оплачиваемые сотрудники будут плохо набрать тесты. [ 27 ] Соглашение между бомбардирами может варьироваться от 60 до 85 процентов, в зависимости от теста и сессии оценки. За крупномасштабные тесты в школах некоторые испытатели платят за то, что два или более бомбардировщики читали каждую статью; Если их оценки не согласны, то статья передается дополнительным бомбардирам. [ 27 ]
Хотя процесс более сложный, чем оценка тестов с множественным выбором в электронном виде, эссе также могут быть оценены на компьютере. В других случаях эссе и другие открытые ответы оцениваются в соответствии с заранее определенной рубрикой оценки обученными грейдерами. Например, в Пирсоне все эссе-грейдеры имеют четырехлетние университетские степени, а большинство-текущие или бывшие учителя в классе. [ 28 ]
Использование рубриков для справедливости
[ редактировать ]Использование рубрики предназначено для повышения справедливости при оценке успеваемости студента. В стандартизированном тестировании ошибка измерения (последовательная структура ошибок и смещений при оценке теста) легко определить при стандартизированном тестировании. Когда оценка зависит от индивидуальных предпочтений грейдеров, то оценки студентов зависят от того, кто оценивает тест.
Стандартизированные тесты также удаляют смещение класса в оценке. Исследования показывают, что учителя создают своего рода самоисполняющееся пророчество в своей оценке студентов, предоставляя тем, кто они ожидают, достигнет более высоких результатов и предоставят тем, кто, как они ожидают, потерпят неудачу в более низких классах. [ 29 ] В нестандартной оценке грейдеры имеют больше индивидуального усмотрения и, следовательно, с большей вероятностью дают несправедливые результаты посредством бессознательного предвзятости .
Студент Ответы | Стандартизированная оценка | Нестандартная оценка |
---|---|---|
Оценка рубрика: Ответы должны быть отмечены правильными, если они упоминают хотя бы одну из следующих: вторжение Германии в Польшу, вторжение Японии в Китай или экономические проблемы. | Нет стандартов оценки. Каждый учитель оценивает, однако он или она хочет, учитывая любые факторы, которые учитель выбирает, например, ответ, количество усилий, академическое образование ученика, языковые способности или отношение. | |
Студент № 1: Вторая мировая война была вызвана Гитлером и Германией, вторгшимися в Польшу. |
Учитель № 1: В этом ответе упоминается один из необходимых предметов, так что это правильно. |
Учитель № 1: Я чувствую, что этот ответ достаточно хорош, поэтому я отмечу его правильно. |
Студент № 2: Вторая мировая война была вызвана множественными факторами, включая Великую депрессию и общую экономическую ситуацию, рост национального социализма, фашизма и империалистического экспансионизма, а также неразрешенные обиды, связанные с Первой мировой войной. Война в Европе началась с немецкого вторжения в Польшу. |
Учитель № 1: В этом ответе упоминается один из необходимых предметов, так что это правильно. |
Учитель № 1: Я чувствую, что этот ответ правильный и полный, поэтому я отдам полную кредит. |
Студент № 3: Вторая мировая война была вызвана убийством эрцгерцога Фердинанда в 1914 году. |
Учитель № 1: В этом ответе не упоминается ни один из необходимых предметов. Нет очков. |
Учитель № 1: Этот ответ неверен. Нет очков. |
Использование результатов для сравнений
[ редактировать ]Существует два типа интерпретаций баллов теста : с нормой интерпретация упоминавшаяся по критерию . , или интерпретация, [ 4 ]
- Нормальные интерпретации оценки сравнивают тестируемых с образцом сверстников . [ 4 ] Цель состоит в том, чтобы оценить студентов как лучше или хуже, чем другие студенты. Интерпретации тестов, упоминавшихся от норм, связаны с традиционным образованием . Студенты, которые работают лучше, чем другие, проходят тест, и студенты, которые работают хуже, чем другие, проваливают тест.
- Критерийные интерпретации оценки сравнивают тестирующих с критерием (формальное определение содержания), независимо от баллов других исследований. [ 4 ] Они также могут быть описаны как оценки на основе стандартов , так как они соответствуют движению реформы на основе стандартов . [ 30 ] Критерийные интерпретации, связанные с оценками, касаются исключительно того, является ли ответ этого конкретного студента правильным и полным. В соответствии с критериями систем, все студенты могут пройти тест, или всем учащимся провалить тест.
Любая из этих систем может использоваться в стандартизированном тестировании. Что важно для стандартизированного тестирования, так это то, задают ли все учащиеся эквивалентные вопросы при разумно равных обстоятельствах и оцениваются в соответствии с теми же стандартами.

Нормативная оценка сравнивает каждую тестирующие с другими тестирующими. Тест на норму (NRT)-это тип теста, оценки или оценки , которая дает оценку позиции проверенного человека в предопределенной популяции. Оценка получена из анализа результатов тестов и других соответствующих данных из выборки, взятой из популяции. Этот тип теста определяет, выступил ли тест -продавец лучше или хуже, чем другие студенты, которые проходили этот тест.
Сравнение с другими делает стандартизированные тесты с нормой, полезные для приема в высшее образование, где школа пытается сравнивать учащихся со всей страны или во всем мире. Стандартизация гарантирует, что все учащиеся тестируются одинаково, а норм-ссылка идентифицирует, что лучше или хуже. Примеры таких международных контрольных тестов включают тенденции в международном исследовании математики и науки ( TIMMS ) и прогресс в международном исследовании грамотности чтения ( Pirls ).

Критерийный тест (CRT)-это стиль теста, который использует результаты тестов, чтобы показать, насколько хорошо тестирующие выполняются на данной задаче, а не о том, насколько хорошо они выполнялись по сравнению с другими тестирующими. Большинство тестов и тестов, которые написаны школьными учителями, являются критериями тестов. В этом случае цель состоит в том, чтобы просто увидеть, может ли студент правильно ответить на вопросы. Учитель обычно не пытается сравнить результат каждого студента с другими учениками.
Стандарты
[ редактировать ]Соображения достоверности и надежности обычно рассматриваются как важные элементы для определения качества любого стандартизированного теста. Тем не менее, профессиональные ассоциации и практикующие ассоциации часто ставят эти проблемы в более широкие контексты при разработке стандартов и выводя общие суждения о качестве любого стандартизированного теста в целом в данном контексте.
Стандарты оценки
[ редактировать ]В области оценки и, в частности, оценки образования , Объединенный комитет по стандартам для оценки образования [ 31 ] опубликовал три набора стандартов для оценки. Стандарты оценки персонала [ 32 ] был опубликован в 1988 году, стандарты оценки программы (2 -е издание) [ 33 ] был опубликован в 1994 году, и стандарты оценки студентов [ 34 ] был опубликован в 2003 году.
Каждая публикация представляет и разрабатывает набор стандартов для использования в различных образовательных условиях. Стандарты предоставляют руководящие принципы для проектирования, реализации, оценки и улучшения идентифицированной формы оценки. Каждый из стандартов был поставлен в одну из четырех фундаментальных категорий для содействия образовательной оценке, которые являются правильными, полезными, осуществимыми и точными. В этих наборах стандартов соображения достоверности и надежности охватываются по теме точности. Тесты направлены на обеспечение того, чтобы оценки учащихся предоставили надежную, точную и достоверную информацию о обучении и производительности учащихся; Стандартизированные тесты предлагают узкую информацию о многих формах интеллекта и полагаясь на то, что они наносят ущерб учащимся, потому что они неточно измеряют потенциал студента для успеха. [ 35 ]
Стандарты тестирования
[ редактировать ]
В области психометрии стандарты для образовательного и психологического тестирования [ 36 ] Поместите стандарты о достоверности и надежности, наряду с ошибками измерения и вопросами, связанными с размещением людей с ограниченными возможностями . Третья и последняя основная тема охватывает стандарты, связанные с приложениями для тестирования, учетными средствами , а также тестированием в оценке программ и государственной политике .
Статистическая достоверность
[ редактировать ]Одним из основных преимуществ более масштабного стандартизированного тестирования является то, что результаты могут быть эмпирически документированы; Следовательно, можно показать, что результаты тестов имеют относительную степень достоверности и надежности , а также результаты, которые являются обобщенными и воспроизводимыми. [ 37 ] Это часто контрастирует с оценками по школьной стенограмме, которые назначаются отдельными учителями. При рассмотрении индивидуально назначенных оценок, может быть трудно объяснить различия в образовательной культуре в разных школах, сложность заданий данного учителя, различия в стиле преподавания, давление на инфляцию оценки , а также другие методы и предубеждения, которые влияют на оценку.
Другим преимуществом является агрегация. Хорошо разработанный стандартизированный тест обеспечивает оценку мастерства человека в области знаний или навыков, которые на некотором уровне агрегации предоставит полезную информацию. То есть, хотя индивидуальные оценки могут быть недостаточно точными для практических целей, средние оценки классов, школ, филиалов компании или других групп вполне могут предоставить полезную информацию из -за сокращения ошибки, совершенной путем увеличения размера выборки.
Ежегодные стандартизированные тесты в школе
[ редактировать ]Стандартизированное тестирование - очень распространенный способ определения прошлых академических достижений и будущего студента.
Достоверность, качество или использование тестов, особенно годовые стандартизированные тесты, распространенные в образовании, по -прежнему широко поддерживаются или подвергаются критике. Как и сами тесты, поддержка и критика тестов часто варьируются и могут происходить из различных источников, таких как родители, тестирующие, инструкторы, бизнес -группы, университеты или государственные наблюдатели.
Сторонники крупномасштабных стандартизированных тестов в образовании часто дают следующие причины для продвижения тестирования в образовании:
- Обратная связь или диагноз результатов тестового такера: [ 38 ] Стандартизированные тесты позволяют учителям видеть, как работают их ученики по сравнению с другими в стране. Это поможет им пересмотреть свои методы преподавания, если это необходимо, чтобы помочь своим ученикам соответствовать стандартам. [ 39 ] Студентам предоставляется возможность подумать о своих оценках и увидеть, где находятся их сильные и слабые стороны. [ 39 ] Оценки могут позволить родителям получить представление о том, как у их ребенка дела в академическом порядке. [ 40 ]
- Справедливо и эффективно [ 41 ]
- Способствует подотчетности: [ 38 ] [ 41 ] Стандартизированное тестирование используется в качестве стратегии государственной политики для установления более строгих мер по подотчетности для государственного образования . Идея, лежащая в основе стандартизированного движения политики тестирования, заключается в том, что тестирование является первым шагом к улучшению школ, практики преподавания и образовательных методов с помощью сбора данных. Сторонники утверждают, что данные, генерируемые стандартизированными тестами, действуют как таковая карта сообщества, демонстрируя, насколько хорошо работают местные школы. Критики движения, однако, указывают на различные несоответствия, которые возникают в результате современных стандартизированных методов тестирования, включая проблемы с достоверностью теста и надежностью и ложными корреляциями (см. Парадокс Симпсона ).
- Прогноз и выбор [ 38 ]
- Улучшает производительность [ 38 ]
Критики стандартизированных тестов в образовании часто дают следующие причины пересмотра или удаления стандартизированных тестов в образовании:
- Плохое предиктивное качество. [ 42 ] [ 43 ]
- Оценка инфляция тестов или оценки. [ 44 ] [ 45 ] [ 46 ]
- Культурно или социально -экономически предвзятый. [ 47 ] [ 48 ]
- Психологически разрушительный. [ 49 ]
- Плохой индикатор интеллекта или способности. [ 50 ] [ 51 ] [ 52 ] [ 53 ]

Кроме того, успех ученика отслеживается до относительного успеваемости учителя, что делает преподавательский прогресс, зависящий от успеха учителя с успеваемостью ученика. Этические и экономичные вопросы возникают для учителей, когда они сталкиваются с явно недостаточными или недостаточными учениками и стандартизированным тестом.
В своей книге, теперь вы видите это , Кэти Дэвидсон критикует стандартизированные тесты. Она описывает молодежь как «Ассамблежные дети на модели сборки», что означает использование стандартизированного теста в качестве части однократной образовательной модели. Она также критикует узость тестируемых навыков и маркировки детей без этих навыков как неудач или студентов с ограниченными возможностями. [ 54 ] Широко распространенное и организованное мошенничество было растущей культурой. [ 55 ]
Существует три показателя, с помощью которых измеряются лучшие страны в Тимме («А+ страны»): фокусировка, когерентность и строгость. Фокус определяется как количество тем, представленных в каждом классе; Идея состоит в том, что чем меньше тем, представленных в каждом классе, тем больше фокуса может быть уделено каждой теме. Определение когерентности придерживается последовательности охватываемых тем, которые следует за естественной прогрессией или логической структурой математики. CCSSM . сравнивался как с текущими стандартами состояния, так и с стандартами A+ страны С наибольшим количеством тем, охватываемых в среднем, текущие стандарты состояния были самыми низкими. [ 56 ] Стандарты Common Core направлены на то, чтобы исправить это несоответствие, помогая преподавателям сосредоточиться на том, что студенты должны учиться, вместо того, чтобы отвлекаться от посторонних тем. Они поощряют образовательные материалы к неглубокому покрытию на несколько тем, до нескольких тем на гораздо большей глубине. [ 57 ]
Время и деньги
[ редактировать ]Стандартизированные тесты - это способ измерить уровень образования учащихся и школ в широком масштабе. От детского сада до 12 -го класса большинство американских студентов участвуют в ежегодных стандартизированных тестах. Средний студент проходит около 10 из этих тестов в год (например, один или два теста на понимание прочитанного, один или два математических теста, письменный тест, научный тест и т. Д.). [ 58 ] Средняя сумма тестирования занимает около 2,3% от общего времени класса (равна примерно четырем школьным дням в году). [ 59 ]
Стандартизированные тесты дороги для администрирования. Сообщалось, что Соединенные Штаты ежегодно тратят около 1,7 миллиарда долларов США на эти тесты. [ 60 ] В 2001 году также сообщалось, что только три компании (Harcourt образовательные измерения, CTB McGraw-Hill and Riverside Publishing) проектируют 96% тестов, пройденных на уровне штата. [ 61 ]
Образовательные решения
[ редактировать ]Национальная академия наук рекомендует, чтобы основные образовательные решения не были основаны исключительно на одном результате теста. [ 62 ] Использование минимальных сокращений для входа или выпуска не подразумевает ни одного стандарта, поскольку результаты тестов почти всегда сочетаются с другими минимальными критериями, такими как количество кредитов, предпосылки, курсы, посещаемость и т. Д. Единственные критерии «просто потому, что они наиболее сложные, или выполнение других критериев автоматически предполагается. Единственным исключением из этого правила является GED , который позволил многим людям признавать свои навыки, даже если они не соответствовали традиционным критериям. [ Цитация необходима ]
Некоторые учителя утверждают, что единственный стандартизированный тест измеряет только текущие знания студента, и он не отражает прогресс учащихся с начала года. [ 63 ] Результат, созданный людьми, которые не являются частью регулярного обучения студента, а профессионалами, которые определяют, что студенты должны знать в разных возрастах. Кроме того, учителя согласны с тем, что лучшие тестовые создатели и фасилитатор сами. Они утверждают, что они наиболее осведомлены о способностях студентов, возможностях и потребностях, которые позволили бы им продолжать продолжать предметы или продолжить регулярную учебную программу.
Влияние на обездоленные студентов
[ редактировать ]Монти Нил, директор Национального центра справедливого и открытого тестирования, утверждает, что студентам, которые говорят по-английски как на втором языке, у которых есть инвалидность, или которые приходят из семей с низким доходом, непропорционально отрицают диплом из-за результата теста, что несправедливо и вредно. Например, в конце 1970 -х годов начался выпускной тест в Соединенных Штатах, в иске утверждалось, что многие чернокожие ученики не имели справедливой возможности для материала, которые они были проверены на выпускном тесте, поскольку они посещали школы, разделенные по закону. «Взаимодействие школ с низким разрешением и тестирование наиболее сильно поражает цветных учеников», как утверждает Нил,-они непропорционально отказаны Санкции, такие как реструктуризация ». [ 64 ]
В журнале «Прогрессивный» Барбара Майнер объясняет недостатки стандартизированного тестирования, анализируя три разные книги. Будучи со-директором Центра образования в Университете Райс и профессором образования, Линда М. Макнейл в своей книге противоречия школьной реформе: расходы на образование стандартизированного тестирования пишет: «Образовательная стандартизация наносит ущерб преподаванию и обучению и в долгосрочной перспективе , переопределяет образование по расу и классам ». Макнил считает, что реформа образования, основанная на тестировании, устанавливает более высокие стандарты для студентов цветных. По словам Майнера, Макнейл «показывает, как реформа, основанная на тестировании, централизует власть в руках корпоративной и политической элиты-особенно пугающее развитие в это время растущего корпоративного и консервативного влияния на реформу образования». Такая тестовая реформа запустила обучение, особенно для цветных студентов. [ 65 ]
Fairtest говорит, что негативные последствия злоупотребления тестированием включают в себя толкание учеников из школы, изгнание учителей из профессии и подрывать вовлечение учащихся и школьное климат. [ 66 ]
Использование стандартизированных тестов при поступлении в университет
[ редактировать ]Стандартизированные тесты рассматриваются университетами в рамках заявления, наряду с другими подтверждающими доказательствами, такими как личные заявления , оценки средней школы , предыдущая курсовая работа и рекомендательные письма . [ 67 ] В разных странах есть разные тесты, такие как SAT в США, Гаокао в Китае, и совместный вступительный экзамен в Индии.
Натан Кунсель, ученый из высшего образования, говорит, что поступление в колледж и другие стандартизированные тесты »Помощь перегружена офицеры. Это, но школы серьезно относятся к тестам ». [ 68 ]
Исследования показывают, что тесты предсказывают больше, чем просто первокурсники и уровень курсов, который может пройти студент. Продольные исследования, проведенные учеными, показывают, что студенты с высокими результатами тестов с большей вероятностью проведут сложный путь через колледж. [ 69 ] Тесты также могут указывать на результаты студентов за пределами колледжа, включая оценки преподавателей, достижения в области исследований, достижение степени, результаты комплексных экзаменов и профессиональное лицензирование. [ 70 ]
Поскольку оценка варьируется в разных школах, и даже для двух учеников в одной школе, общая мера, предоставляемая баллом теста, более полезна как способ сравнения учащихся.
Однако в апреле 1995 года «Мета-анализ», опубликованный в Журнале образовательных и психологических измерений , Тодд Моррисон и Мелани Моррисон изучили два десятка исследования валидности теста, необходимых для попадания в любую магистратуру или докторскую программу в Америке: выпускник Записывающие экзамены (GRE). Это исследование охватывало более 5000 тестирующих за последние 30 лет. Авторы обнаружили, что оценки GRE составляли всего 6 процентов от вариаций в аспирантуре. GRE, по -видимому, «практически бесполезен с точки зрения прогнозирования», написал авторы. Повторные исследования теста на приема юридической школы (LSAT) находят то же самое.
Существует дискуссия, будет ли тест указывать долгосрочный успех в работе и жизни, поскольку существует много других факторов, но фундаментальные навыки, такие как чтение, письмо и математика, связаны с работой.
Продольное исследование в 2007 году продемонстрировало, что крупные жизненные достижения, такие как публикация новой или патентной технологии, также связаны с результатами тестов, даже после учета возможностей образования. Существует даже значительное количество доказательств того, что эти навыки связаны с эффективными лидерством и творческими достижениями на работе. Возможность читать тексты и размышлять над ними и иметь сильные количественные рассуждения, имеют решающее значение в современной информационной экономике . [ 70 ]
Многие аргументы предполагают, что навыки из тестов полезны, но только до определенного момента.
Тем не менее, замечательное продольное исследование, опубликованное в 2008 году в журнале «Психологическая наука», исследовали студентов, которые забили в первую очередь в возрасте 13 лет. Двадцать лет спустя они были в среднем очень высоко, с высокими доходами, крупными наградами и наградами и наградами и наградами. карьерные достижения, которые заставили бы любого родителя гордиться. [ 71 ]
Существует корреляция между результатами тестов и социальным классом, но успех в стандартизированных тестах и в колледже не просто зависит от класса. Исследования показывают, что «тесты были действительными, даже когда контролировали социально-экономический класс. Независимо от их семейного происхождения, студенты с хорошими результатами тестов и высокими оценками в колледже лучше, чем студенты с более низкими оценками и более слабыми стенограммами». [ 72 ]
Другая критика, касающаяся социального класса и стандартизированного тестирования, заключается в том, что только богатые люди получают подготовку к тестам и коучинг. Однако »исследователи провели сочетание экспериментальных исследований и контролируемых полевых исследований, чтобы проверить этот вопрос. Они, как правило, пришли к выводу, что выгоды из -за подготовки к тестированию более от 5 до 20 баллов, а не от 100 до 200 баллов, заявленных Некоторые тестовые подготовительные компании. " [ 73 ]
Что еще более важно, многие люди придерживаются мнения, что тесты предотвращают разнообразие приема, поскольку меньшинства имеют более низкие оценки в тестах по сравнению с другими представленными группами. [ 74 ] В исследовании 2012 года рассматривались школы, в которых тесты на прием, обязательны для кандидатов и сравнивали их со школами, которые используют тесты, и результат показывает, что «недавние исследования демонстрируют, что школы-тестирование в школах зачисляют все более разнообразные студенческие органы. Но то же самое и правда. школ, которые требуют тестирования ». [ 75 ]
Оппоненты утверждают, что стандартизированные тесты являются неправильными и некритическими суждениями об интеллекте и производительности, но сторонники утверждают, что это не негативы стандартизированных тестов, а критика плохо спроектированных режимов тестирования. Они утверждают, что тестирование должно и фокусируют образовательные ресурсы на наиболее важных аспектах образования-с учетом заранее определенного набора знаний и навыков-и что другие аспекты либо менее важны, либо должны быть добавлены в схему тестирования.
Данные показывают, что чернокожие и латиноамериканские студенты в среднем набирают ниже, чем белые и азиаты. Таким образом, стандартные тесты математики и чтения, такие как SAT, столкнулись с эскалационными атаками от прогрессивных. Тем не менее, исчерпывающий отчет Сената факультета Калифорнийского университета, по заказу Джанет Наполитано и опубликованный в 2020 году, обнаружил, что тесты не являются дискриминационными и играют важную роль в защите качества образования. [ 76 ]
В отчете предполагается, что ухудшение инфляции класса , особенно в богатых средних школах, делает стандартную оценку особенно важной. [ 76 ]
Что касается намерения UC школ в сбросе стандартных тестов, таких как SAT и ACT при поступлении в колледж, субъективные и индивидуальные тесты, такие как эссе и внеклассные науки, могут быть легко адаптированы и вредны для учащихся, которые не знакомы с процессом. Прием без тестирования может быть еще более наклоненным в пользу хорошо связанных. [ 77 ]
В январе 2020 года сенат факультета в Калифорнийском университете рекомендовал, чтобы система UC провела стандартизированные тесты в качестве требований к приеме. [ 76 ] В отчете говорится, что стандартизированные тесты по математике и чтению полезны для прогнозирования успеваемости в колледже. Основываясь на данных от учащихся в системе UC, в отчете делается вывод о том, что «оценки тестов в настоящее время являются лучшими предикторами среднего балла первого года, чем в среднем по баллам средней школы». [ 76 ] Отчет продолжается: баллы также хороши в прогнозировании общего среднего балла в колледже и возможности, которую студент закончит. В то время как «прогнозирующая сила результатов тестовых результатов выросла, - добавляет отчет, - прогнозирующая сила оценки средней школы снизилась». [ 76 ]
Результаты тестов позволяют школам UC «выбирать этих учеников из недопредставленных групп , которые с большей вероятностью получат более высокие оценки и заканчиваются вовремя». [ 76 ] «Первоначальным намерением SAT было выявление студентов, которые пришли из -за пределов относительно привилегированных кругов, которые могут добиться успеха в университете», - говорится в отчете. [ 76 ] Создатель SAT, Служба образовательных тестирования (ETS), теперь утверждает, что SAT не является тестом «способности», а скорее оценкой «развитых способностей». [ 78 ]
Проблемы тестирования, не специфичные для стандартизации
[ редактировать ]Большинство тестов можно классифицировать по нескольким категориям. Например, тест может быть как стандартизирован, а также тест с высокими ставками, или стандартизированный, а также тест с множественным выбором. Жалобы на «стандартизированные тесты» (все тестируемые проводят один и тот же тест, в разумно схожих условиях, оцененных одинаково) часто сосредоточены на опасениях, не связанных с стандартизацией и в равной степени применяются к нестандартным тестам. Например, критик может жаловаться на то, что «стандартизированные тесты-это все ограниченные по времени тесты», но в центре внимания критики сосредоточено на сроке, а не на всех, проходящих один и тот же тест и оценивали свои ответы одинаково.
Тесты с высокими ставками
[ редактировать ]Тест низких ставок | Тест высоких ставок | |
---|---|---|
Стандартизированный тест | на Личность викторины веб -сайте | Образовательный вступительный экзамен для определения поступления в университет |
Нестандартный тест | Учитель просит каждого ученика поделиться тем, что они помнят из своей домашней работы. | Театр проводит прослушивание , чтобы определить, кто получит главную роль. |
Тест с высокими ставками -это тест с желаемой наградой за хорошую производительность. [ 4 ] Некоторые стандартизированные тесты, в том числе многие тесты, используемые для поступления в университет по всему миру, являются тестами с высокими ставками. Наиболее стандартизированные тесты, такие как обычные тесты в классе, представляют собой тесты с низкими ставками. [ 4 ]
Тяжелая зависимость от стандартизированных тестов с высокими ставками для принятия решений часто является спорной. Общая проблема с тестами с высокими ставками заключается в том, что они измеряют производительность во время одного события, когда критики считают, что более целостная оценка будет подходящей. Критики часто предлагают подчеркнуть совокупные или даже нечетные меры, такие как классные оценки или краткие индивидуальные оценки (написанные в прозе) от учителей. Сторонники утверждают, что результаты тестов обеспечивают четкий, объективный стандарт, который служит ценной проверкой на инфляцию оценки . [ 79 ]
Нормальные тесты
[ редактировать ]
Тест, упомянутый на норме, является разработанным и забитым таким образом, чтобы некоторые испытатели занимали лучшее или хуже, чем другие. [ 4 ] Рейтинг предоставляет информацию об относительном рейтинге, что полезно, когда цель состоит в том, чтобы определить, кто лучше (например, в поступлении в элитные университеты). [ 4 ]
Разногласия с образовательными стандартами
[ редактировать ]Тест , упомянутый критерием, является более распространенным и более практичным, когда цель состоит в том, чтобы узнать, изучили ли тестовые участники необходимый материал. [ 4 ]
Тем не менее, некоторые критики возражают против «стандартизированных тестов» не потому, что они возражают против того, чтобы дать учащимся один и тот же тест при разумно схожих условиях и оценку ответов одинаково, потому что они возражают против типа материала, который обычно проверяется школами. Хотя стандартизированные тесты для неакадемических атрибутов, таких как тесты Торранса творческого мышления , существуют, школы редко дают стандартизированные тесты для измерения «Инициатива, творчество, воображение ... любопытство ... добрая воля, этическая рефлексия или множество других ценных расположение и атрибуты ». [ 80 ] [ 81 ] Вместо этого тесты, представленные школами, имеют тенденцию сосредотачиваться меньше на развитии морали или характера, а также на индивидуальных идентифицируемых академических навыках, таких как понимание прочитанного и арифметика .
В своей книге «Стыд нации » Джонатан Козол утверждает, что студенты, подчиненные стандартизированному тестированию, являются жертвами «когнитивного обезглавливания». Козол приходит к этому осознанию после разговора со многими детьми в городских школах, которые не имеют пространственного воспоминания о времени, периодах времени и исторических мероприятиях. Это особенно относится к школам, где из -за нехватки финансирования и строгой политики подотчетности школы покончили с такими предметами, как искусство, история и география; Чтобы сосредоточиться на содержании обязательных тестов. [ 82 ]
Тестовая тревога
[ редактировать ]Некоторые люди становятся обеспокоенными при прохождении теста. Это явление чаще встречается для тестов с высокими ставками, чем для тестов с низкими ставками. Тесты с высокими ставками (будь то стандартизированные или нестандартные) могут вызвать беспокойство.
Существует критика со стороны самих студентов, что тесты, хотя и стандартизированы, несправедливы по отношению к отдельному студенту. Некоторые студенты утверждают, что это «плохие тестирующие», что означает, что они нервничают и не сфокусированы на тестах. Следовательно, хотя тест является стандартным и должен предоставить справедливые результаты, тестируемые утверждают, что они находятся в невыгодном положении и не имеют возможности доказать свои знания в противном случае, так как нет другой альтернативы тестирования, которая позволяет студентам доказать свои знания и проблемы. Решение навыков.
Некоторые студенты испытывают тревогу . От десяти до сорока процентов студентов испытывают этот тип беспокойства. [ 83 ] Дети, живущие в бедности, наиболее поражены тестированием тревоги. [ 84 ] Тестирование тревоги применяется как к стандартизированным, так и к нестандартным тестам.
Испытания с несколькими вариантами выбора и форматы тестирования
[ редактировать ]
Тест с несколькими вариантами выбора предоставляет тестовому заряду вопросы в сочетании с заранее определенным списком возможных ответов. Это тип закрытого вопроса . Тест -брак выбирает правильный ответ из списка.
Многие критики стандартизированного объекта тестирования в формате с множественным выбором, который обычно используется для недорогого, крупномасштабного тестирования и который не подходит для некоторых целей, например, видя, может ли тестовый писатель написать абзац. Тем не менее, стандартизированное тестирование может использовать любой тестовый формат, включая открытые вопросы , при условии, что все тестирующие проводят один и тот же тест, в разумно схожих условиях и оцениваются так же.
Обучение испытанию
[ редактировать ]Преподавание в тесте - это процесс преднамеренного сужения инструкций, чтобы сосредоточиться только на материале, который будет измерен на тесте. Например, если учитель знает, что предстоящий исторический тест не будет включать какие -либо вопросы об истории музыки или искусства, то учитель может «преподавать тест», пропустив материал в учебнике о музыке и искусстве. Критики также обвиняют, что стандартизированные тесты поощряют « преподавание в испытании » за счет творчества и углубленного охвата субъектов, не входящих в тест. Критики говорят, что преподавание испытаний преодолевает обучение высшего порядка; Он трансформирует то, что учителям разрешено преподавать, и в значительной степени ограничивает объем другой информации, который студенты изучают на протяжении многих лет. [ 85 ] Хотя можно использовать стандартизированный тест, не позволяя его содержимому определять учебную программу и инструкции, часто, что не тестируется, не преподается, и как тестируется субъект, часто становится моделью для обучения субъекта.
Внешне навязанные тесты, такие как тесты, созданные Департаментом образования для учащихся в их регионе, поощряют учителей сузить формат учебного плана и преподавать в тесте. [ 86 ]
Заработная плата на основе эффективности -это идея о том, что учителям следует платить больше, если ученики хорошо выполняют тесты, и меньше, если они работают плохо. [ 85 ] Когда учителя или школы получают вознаграждение за лучшую работу в тестах, эти вознаграждения побуждают учителей « преподавать тест » вместо того, чтобы предоставлять богатую и широкую учебную программу. В 2007 году качественное исследование, проведенное Au Wayne, продемонстрировало, что стандартизированное тестирование сужает учебную программу и поощряет обучение, ориентированное на учителя, вместо обучения, ориентированного на учащихся . [ 87 ] Губернатор Нью -Джерси Крис Кристи предложил образовательную реформу в Нью -Джерси, которая дает учителей не только «преподавать тестирование», но и за тем, как их ученики выступают за потенциальную стоимость их зарплаты и обеспечения работы. Реформа требовала заработной платы на основе эффективности, которая зависит от выступлений студентов по стандартизированным тестам и их обучения. [ 88 ]
Критики утверждают, что чрезмерное использование и неправильное использование этих тестов наносят ущерб преподаванию и обучению, сузив учебную программу. Согласно группе Fairtest , когда стандартизированные тесты являются основным фактором подотчетности, школы используют тесты, чтобы узко определить учебную программу и инструкции по фокусировке. Ответственность создает огромное давление для выполнения, и это может привести к неправильному использованию и неверному толкованию стандартизированных тестов. [ 66 ]
Смотрите также
[ редактировать ]Основные темы
[ редактировать ]- Тест достижений
- Концепция инвентаризации - инструмент оценки знаний
- Оценка образования - метод оценки образования
- Оценка - систематическое определение заслуг, ценности и значимости субъекта
- Список стандартизированных тестов в Соединенных Штатах
- Психометрика - теория и техника психологического измерения
- Теория ответа предмета - парадигма для проектирования, анализа и оценки тестов
- Оценка на основе стандартов -оценка на основе указанных стандартов
- Тест (оценка) -
Другие темы
[ редактировать ]- Альтернативная оценка
- Закон Кэмпбелла - поговорка о извращенных стимулах
- Выпускной экзамен в старшей школе - Страницы экзаменов в старшей школе,
- IBM 805 Test Scoring Machine - Электромеханическая тестовая машина, представленная IBM на
- Реформа образования на основе стандартов -система образования, основанная на желаемых
- Эффект Volvo - термин для критики стандартизированного тестирования
Ссылки
[ редактировать ]- ^ Popham, WJ (1999). «Почему стандартизированные тесты не измеряют качество образования». Образовательное лидерство . 56 (6): 8–15.
- ^ Фелпс, Ричард П. «Роль и важность тестирования» . nonpartisaneducation.org . Получено 2016-05-17 .
- ^ Jump up to: а беременный в Олсон, Эми М.; Сабли, Даррелл (октябрь 2008 г.). «Стандартизированные тесты» . В хорошем, Томас Л. (ред.). Образование 21 -го века: справочный справочник . SAGE Publications. С. 423–430. doi : 10.4135/9781412964012.n46 . ISBN 9781452265995 Полем S2CID 241229809 .
- ^ Jump up to: а беременный в дюймовый и фон глин час я Аллен, Дж. Дональд; Росс, Аманда (2017-11-10). «Тесты с низкими ставками и этикетки» . Педагогика и содержание в математике средней и средней школы . Спрингер. ISBN 978-94-6351-137-7 .
- ^ «Китайская государственная служба» . Encyclopædia Britannica . Получено 2 мая 2015 года .
- ^ Jump up to: а беременный в дюймовый и Марк и Бойер (1996), 9–10.
- ^ Jump up to: а беременный Казин, Эдвардс и Ротман (2010), 142.
- ^ Jump up to: а беременный Trahair, Richard (2015-06-01). Поведение, технологии и организационное развитие: Эрик Трист и Институт Тавистока . ПРИБОРЫ Издатели. ISBN 9781412855495 .
- ^ Джонсон, Роберт. «Стандартизированные тесты». Энциклопедия образовательной реформы и инакомыслия. Sage Publications, Inc. 2010. 853–856.Web.
- ^ Гаррисон, Марк Дж. Мера неудачи: политическое происхождение стандартизированного тестирования. Олбани: Государственный университет Нью -Йорка, 2009. Печать.
- ^ Jump up to: а беременный Моллер, Стефани; Potochnick, Stephanie (2008). «Стандартизированные тесты». В Darity, Уильям -младший (ред.). Международная энциклопедия социальных наук . Gale Cengage Learning .
- ^ Гулд, SJ, «Нация дебил», новый ученый (6 мая 1982 г.), 349–352.
- ^ Дарти, Уильям -младший «Международная энциклопедия социальных наук» . Энциклопедии для справочной информации . Gale Cengage Learning . Получено 25 января 2017 года .
- ^ Флетчер, Дэн. «Стандартизированное тестирование». Время. Time Inc., 11 декабря 2009 года. Web. 09 марта 2014 года.
- ^ «Что на акте». ACT -тестовые разделы. NP, ND Web. 05 мая 2014 года
- ^ Стиггинс, Ричард (2002). «Кризис оценки: отсутствие оценки для обучения» (PDF) . Пхи Дельта Каппан . 83 (10): 758–765. doi : 10.1177/003172170208301010 . S2CID 145683785 .
- ^ Jump up to: а беременный Штраус, Валери (11 марта 2015 г.). «Пять причин стандартизированное тестирование не сдаст» . The Washington Post . The Washington Post . Получено 26 января 2017 года .
- ^ «История и опыт не оставшегося ребенка». Bright Hub Education9 июня 2015 года. Веб. 12 октября 2015 года .
- ^ «Каждый студент добивается успеха (ESSA) | Департамент образования США» .
- ^ Клэйборн, Чарльз. «Высокие ставки». Энциклопедия одаренности, творчества и таланта. Sage Publications, 2009. 9 апреля 2014 года.
- ^ Валери, Штраус (21 июня 2020 г.). «Похоже, начало окончания одержимости Америки становятся стандартизированными студенческими тестами» . The Washington Post .
- ^ «Дом - Австралийская учебная программа v8.1» . www.australiancurriculum.edu.au . Получено 2016-05-17 .
- ^ Коули, Питер; Макферсон, Пейдж (2022). Тестирование канадских студентов K-12: региональная изменчивость, место для улучшения (PDF) . Фрейзер Институт. ISBN 978-0-88975-694-6 Полем Получено 19 декабря 2023 года .
- ^ Горовиц, MR; Монтгомери, Д.Л. (январь 1993 г.). «Физиологический профиль пожарных по сравнению с нормами для канадской популяции». Канадский журнал общественного здравоохранения . 84 (1): 50–52. ISSN 0008-4263 . PMID 8500058 .
- ^ Канадская ассоциация спортивных наук; Программа сертификации и аккредитации по оценке фитнеса; Канадское общество физиологии упражнений; Fitness Canada (1987). Канадский стандартизированный тест пригодности (CSTF): в возрасте от 15 до 69 лет: Руководство по интерпретации и консультированию . Глостер, Онтарио: Канадское общество физиологии упражнений. ISBN 0-662-15736-2 Полем OCLC 16048356 .
- ^ Ets Webage Archived 2009-06-18 на The Wayback Machine о забитии GRE.
- ^ Jump up to: а беременный HOUTZ, Джолайн (27 августа 2000 г.) «Тримпейт потратьте всего минуты, чтобы забить государственный тест. 1 № 2 минуты " Архивировано 2007-03-10 на машине Wayback . Seattle Times " За считанные минуты температура за 10 долларов за час назначает оценку теста вашего ребенка "
- ^ Rich, Motoko (2015-06-22). «Оценка общего ядра: опыт преподавания не требуется» . New York Times . ISSN 0362-4331 . Получено 2015-10-06 .
- ^ Ли, Юссим (1989). «Ожидания учителя: самоисполняющие пророчества, смещение восприятия и точность». Журнал личности и социальной психологии . 57 (3): 469–480. doi : 10.1037/0022-3514.57.3.469 .
- ^ Там, где мы стоим: оценка и ответственность на основе стандартов (Американская федерация учителей) [1] Архивировано 24 августа 2006 г., на машине Wayback
- ^ «Совместный комитет по стандартам для оценки образования» . Архивировано из оригинала 15 октября 2009 года . Получено 2 мая 2015 года .
- ^ Совместный комитет по стандартам для оценки образования. (1988). Стандарты оценки персонала: как оценить системы для оценки педагогов. Архивированный 2005-12-12 в машине Wayback Newbury Park, CA: Sage Publications.
- ^ Совместный комитет по стандартам для оценки образования. (1994). Стандарты оценки программы, 2 -е издание. Архивированный 2006-02-22 в машине Wayback Newbury Park, CA: Sage Publications.
- ^ Комитет по стандартам для оценки образования. (2003). Стандарты оценки студентов: как улучшить оценки студентов. Архивированный 2006-05-24 в машине Wayback Newbury Park, CA: Corwin Press.
- ^ Морган, Хани (2016). «Опираясь на стандартизированные тесты с высокими ставками для оценки школ и учителей: плохая идея». Клярный дом: журнал образовательных стратегий, проблем и идей . 89 (2): 67–72. doi : 10.1080/00098655.2016.1156628 . S2CID 148015644 .
- ^ «Стандарты для образовательного и психологического тестирования» . www.apa.org . Получено 2 мая 2015 года .
- ^ Кунсель, NR; Hezlett, SA (2007). «Оценка: стандартизированные тесты предсказывают успех аспирантов». Наука . 315 (5815): 1080–81. doi : 10.1126/science.1136618 . PMID 17322046 . S2CID 143260128 .
- ^ Jump up to: а беременный в дюймовый Фелпс, Ричард (2005). Защита стандартизированного тестирования . Лондон: Psychology Press. ISBN 978-0-8058-4912-7 .
- ^ Jump up to: а беременный «Плюсы и минусы стандартизированных тестов» . Оксфордское обучение . 2014-10-29 . Получено 2018-02-19 .
- ^ «Плюсы и минусы стандартизированного тестирования» (PDF) . Колумбийский университет . Весна 2013. Архивировано из оригинала (PDF) 2018-01-27 . Получено 19 февраля 2018 года .
- ^ Jump up to: а беременный Хирш, Эрик -младший (1999). Школы, которые нам нужны: и почему у нас их нет . Нью -Йорк: якорь. ISBN 978-0-385-49524-0 .
- ^ «Справедливая критика SAT» . fairtest.org. 20 августа 2007 г.
- ^ «Стандартизированные тесты не всегда лучший показатель успеха» . 20 августа 2007 г.
- ^ Патон, Грэм (6 июля 2010 г.). «Университеты критикуют экзамен« инфляция оценки » . Ежедневный телеграф . Лондон Архивировано из оригинала 2022-01-12.
- ^ Васагар, Дживан (2 августа 2010 г.). «Опасения за государственных учеников, поскольку лучшие университеты настаивают на* на уровне A» . Хранитель . Лондон
- ^ Финч, Джулия (10 марта 2010 г.). «Они не могут читать, не могут писать, сохранить время или быть аккуратными: вердикт директора Tesco о школьных лидерах» . Хранитель . Лондон
- ^ Хеджес, Ларри В.; Лейн, Ричард Д.; Гринвальд, Роб (1994). «Хеджес Л.В. (1994). Обмен: часть I*: Деньги имеют значение? Метаанализ исследований влияния дифференциальных школьных ресурсов на результаты учащихся». Образовательный исследователь . 23 (3): 5–14. doi : 10.3102/0013189x023003005 . S2CID 36771659 .
- ^ Кафлан, Шон. Яркий бедный «сдерживается на протяжении десятилетий» , Би -би -си , 16 октября 2013 года. Получено 17 октября 2013 года.
- ^ «Нейробиология стандартизированного тестирования» .
- ^ «Стандартизированные тесты не показывают, что знают дети» . 10 июля 2017 года.
- ^ «Стандартизированные тесты не являются хорошими показателями интеллекта жидкости в соответствии с новым исследованием» . 11 января 2014 года.
- ^ «Стандартизированные тесты не измеряют интеллект или способность» . 27 сентября 2016 года.
- ^ «Наблюдения: стандартизированные результаты тестов не отражают способности учащихся» .
- ^ Дэвидсон, Кэти (2011). Теперь вы видите это: как наука о мозге внимания изменит способ, которым мы живем, работаем и учимся . Нью -Йорк: викинг.
- ^ Американские новости (2 мая 2015 г.). «Скандал с мошенничеством: федералы говорят, что учителя наняли, чтобы сдать свои сертификационные тесты» . NBC News . Получено 2 мая 2015 года .
- ^ Шмидт, Уильям Х.; Houang, Richard T. (2012). «Учебная когерентность и общие основные стандарты для математики». Образовательный исследователь . 41 (8): 294–308. doi : 10.3102/0013189x12464517 . S2CID 121779439 .
- ^ Портер, а.; McMaken, J.; Hwang, J.; Ян Р. (2011). «Common Core Standards: новая американская учебная программа». Образовательный исследователь . 40 (7): 103–116. doi : 10.3102/0013189x11405038 . S2CID 51453603 .
- ^ Лейтон, Линдси (24 октября 2015 г.). «Исследование говорит, что стандартизированное тестирование является подавляющим государственными школами страны» . The Washington Post . Получено 26 июля 2015 года .
- ^ Доринг, Кристофер (25 октября 2015 г.). «План Обамы ограничивает стандартизированное тестирование не более чем на 2% времени класса» . USA сегодня . Получено 26 июля 2016 года .
- ^ Кучински-Браун, Алекс. «Стандартизированные затраты на тестирование составляют 1,7 миллиарда долларов в год, обнаруживает исследование». Huffington Post. Thehuffingtonpost.com, 29 ноября 2012 года. Веб. 7 апреля 2014 года.
- ^ «Большая четверка индустрии тестирования» . PBS Frontline . Пбс. 2001 . Получено 2015-01-21 .
- ^ «Просмотрите все темы - национальная пресса академий» . Архивировано из оригинала 2008-04-18 . Получено 2 мая 2015 года .
- ^ «Плюсы и минусы стандартизированного тестирования» (PDF) . Колумбийский университет. 21 ноября 2017 года.
- ^ Нил, Монти (осень 2009 г.). Стандартизированные тесты несправедливы и вредны . Детройт: Фармингтон -Хиллз, Мичиган: Greenhaven Press. С. 28–35. ISBN 9780737747812 Полем Получено 4 декабря 2016 года .
- ^ Шахтер, Барбара (август 2000). «Стандартизированные умы: высокая цена культуры тестирования Америки и то, что мы можем сделать, чтобы изменить ее / противоречия школьной реформы: затраты на образование стандартизированного тестирования». Прогрессивный . 64 : 40–43. ProQuest 231959849 .
- ^ Jump up to: а беременный Holloway, JH (2001). «Использование и неправильное использование стандартизированных тестов». Образовательное лидерство . 59 (1): 77.
- ^ Мерфи, Сара С; Клигер, Дэвид М; Борнман, Мэтью Дж; Кунсель, Натан Р. (2009). «Предсказательная сила личных заявлений в приемных комиссиях: метаанализ и предостерегающий рассказ» . Колледж и университет . 84 : 83–86, 88.
- ^ Кунсель, Натан; Сакетт, Пол (8 марта 2018 г.). «Правда о SAT и ACT» . Wall Street Journal .
- ^ Кунсель, Натан; Хезлетт, Сара А. (2007). «Стандартизированные тесты предсказывают успех аспирантов» . Наука . 315 (5815): 1080–1. doi : 10.1126/science.1136618 . PMID 17322046 . S2CID 143260128 .
- ^ Jump up to: а беременный Кунсель, Натан; Хезлетт, Сара А. (2007). «Стандартизированные тесты предсказывают успех аспирантов» . Наука . 315 (5815): 1080–1081. doi : 10.1126/science.1136618 . PMID 17322046 . S2CID 143260128 .
- ^ Парк, Грегори; Любинский, Дэвид; Бенбоу, Камилла П. (1 октября 2008 г.). «Различия способностей среди людей, имеющих соразмерность степени для научного творчества». Психологическая наука . 19 (10): 957–961. doi : 10.1111/j.1467-9280.2008.02182.x . PMID 19000201 . S2CID 6443429 .
- ^ Кунсель, Натан; Арнесон (2009). «Объясняет ли социально-экономический статус взаимосвязь между тестами на прием и успешной успеваемостью?» Полем Психологический бюллетень : 1–22.
- ^ Коннелли, Брайан С.; Кунсель, Натан (3 ноября 2012 г.). «Балансировка лечебных и контрольных групп в квазиэкспериментах: введение в оценку склонности». Персональная психология . 66 (2): 407–442. doi : 10.1111/peps.12020 .
- ^ Couch, Майкл; Мороз, Маркиша; Сантьяго, Дж.; Хилтон, Адриэль (2021-09-09). «Переосмысление стандартизированного тестирования с точки зрения доступа, справедливости и достижений: что -то изменилось для афроамериканских студентов?» Полем Журнал исследовательских инициатив . 5 (3). ISSN 2168-9083 .
- ^ Кунсель, Натан; Сакетт, Пол; Битти, Адам С. (2 августа 2012 г.). «Роль социально-экономического статуса в отношениях SAT и в принятии колледжа». Психологическая наука . 23 (9): 1000–7. doi : 10.1177/0956797612438732 . PMID 22858524 . S2CID 22703783 .
- ^ Jump up to: а беременный в дюймовый и фон глин Калифорнийский университет, Академический Сенат (январь 2020 г.). «Отчет о стандартизированной целевой группе тестирования Академического совета UC» (PDF) .
- ^ Редакция (17 мая 2020 года). «Калифорния определяет тестирование» . Wall Street Journal .
- ^ Тодд Моррисон и Мелани Моррисон. «Метааналитическая оценка прогнозной достоверности ...» Журнал образовательного и психологического измерения. 1995. ComponentShttp: //epm.sagepub.com/content/55/2/309.abstract.
- ^ Бакли, Джек; Летукас, Линн; Wildavsky, Ben (2017), Измерение успеха: тестирование, оценки и будущее поступления в колледж , Балтимор: издательство Джона Хопкинса, с. 344, ISBN 9781421424965
- ^ Кон, Альфи (2000). Дело против стандартизированного тестирования: повышение баллов, разрушая школы . Портсмут, NH: Heinemann. ISBN 978-0325003252 .
- ^ Преподавать: Путешествие учителя, Уильям Айерс, Pecsemers College Press, 1993, ISBN 0-8077-3985-5 , ISBN 978-0-8077-3985-3 , стр. 116
- ^ Козол, Джонатан (2005). Стыд нации: восстановление апартеидского обучения в Америке . Печать: случайный дом. С. 118–119. ISBN 9781415924167 .
- ^ Древесина; Харт; Маленький; Филлипс (2016). «Тестовая тревога и стандартный тест на понимание чтения с высокими ставками: перспектива поведенческой генетики» . Merrill-Palmer Quarterly . 62 (3): 233–251. doi : 10.13110/merrpalmquar1982.62.3.0233 . ISSN 0272-930X . PMC 5487000 . PMID 28674461 .
- ^ «Тесты и предвзятость стресса» . Гарвардская аспирантура образования . 12 февраля 2019 года . Получено 2022-10-27 .
- ^ Jump up to: а беременный Уильямс, Мэри (2015). «Стандартизированное тестирование наносит ущерб обучению студентов» . go.galegroup.com . Получено 28 марта 2018 года .
- ^ «Госвами У (1991). Проверьте: влияние внешнего тестирования на учителей. Исследователь образования 20: 8-11» . Архивировано с оригинала 2013-02-02.
- ^ AU, Wayne (2007-06-01). «Тестирование с высокими ставками и контроль учебных программ: качественный метасинтез». Образовательный исследователь . 36 (5): 258–267. doi : 10.3102/0013189x07306523 . ISSN 0013-189X . S2CID 507582 .
- ^ Арко, Мэтт (12 июня 2015 г.). «Речь в образовании Christie в Айове» . Nj.com . Получено 25 июля 2016 года .
96.) Теста 2
Дальнейшее чтение
[ редактировать ]- Справедливый, «Что не так со стандартизированными тестами», архивировано 2019-10-18 в информационном бюллетене Wayback Machine . (Нью -Йорк: Основные книги, 1985), с. 172–181.
- Харрис, Смит и Харрис Мифы о стандартизированных тестах: почему они не говорят вам, что, по вашему мнению, они делают, Rowman & Littlefield 2011* Huddleston, Mark W. Boyer, William W. Высшая государственная служба в Соединенных Штатах: поиск к реформа (Университет Питтсбург Пресс, 1996)
- Фелпс, Ричард П. Влияние тестирования на успеваемость учащихся, 1910–2010 , Международный журнал тестирования, 10 (1), 2012.
- Фелпс, Ричард П., изд. Исправление ошибок в образовании и психологическом тестировании . (Вашингтон, округ Колумбия: Американская психологическая ассоциация, 2008)
- Фелпс, Ричард П., Стандартизированное тестирование праймер. (Нью -Йорк, Нью -Йорк: Питер Ланг, 2007)
- Фелпс, Ричард П. Роль и важность стандартизированного тестирования в мире преподавания и обучения
- Равич, Дайан , «Использование и неправомерность испытаний» архивировали 2017-10-18 на машине Wayback , в школах, которые мы заслуживаем * Штраус, Валери. Подтверждено: стандартизированное тестирование захватило наши школы. Но кто виноват?