Образовательная оценка

Образовательная оценка или образовательная оценка ^[1] Это систематический процесс документирования и использования эмпирических данных о знаниях , навыках , отношениях , склонностях и убеждениях для совершенствования программ и улучшения обучения учащихся. ^[2] Данные оценивания могут быть получены путем изучения работы учащихся непосредственно для оценки достижения результатов обучения или основаны на данных, на основе которых можно сделать выводы об обучении. ^[3] Оценка часто используется как синоним теста, но не ограничивается тестами. ^[4] Оценка может быть сосредоточена на отдельном учащемся, обучающемся сообществе (классе, семинаре или другой организованной группе учащихся), курсе, академической программе, учебном заведении или образовательной системе в целом (также известное как детализация). Слово «оценка» вошло в употребление в образовательном контексте после Второй мировой войны . ^[5]

Будучи непрерывным процессом, оценка устанавливает измеримые результаты обучения учащихся, предоставляет достаточный объем возможностей обучения для достижения этих результатов, реализует систематический способ сбора, анализа и интерпретации данных для определения того, насколько обучение учащихся соответствует ожиданиям, и использует собранную информацию для дать обратную связь по улучшению обучения учащихся. ^[6] Оценивание является важным аспектом образовательного процесса, определяющим уровень достижений обучающихся. ^[7]

Конечная цель практик оценивания в образовании зависит от теоретических основ практиков и исследователей, их предположений и убеждений о природе человеческого разума, происхождении знаний и процессе обучения.

Типы

Термин «оценка» обычно используется для обозначения всех видов деятельности, которые учителя используют, чтобы помочь ученикам учиться и оценить прогресс учащихся. ^[8] Для удобства оценки можно разделить на следующие категории:

Размещение, формирующее, суммативное и диагностическое оценивание
Объективное и субъективное
Ссылки (ссылающиеся на критерии, на нормы и ипсативные (принудительный выбор) )
Неформальный и формальный
Внутренний и внешний

Размещение, формирующее, суммирующее и диагностическое

Оценка часто делится на начальную, формирующую и итоговую категории с целью рассмотрения различных целей практики оценивания.

(1) Оценка размещения. Оценка размещения может использоваться для распределения учащихся в соответствии с предыдущими достижениями, уровнем знаний или личными характеристиками в наиболее подходящий момент в последовательности обучения, в уникальную стратегию обучения или к подходящему учителю. ^[9] проводится посредством вступительного тестирования , то есть тестов, которые колледжи и университеты используют для оценки готовности к поступлению в колледж и распределения учащихся в начальные классы. Оценка размещения, также называемая предварительной оценкой, первоначальной оценкой или пороговым тестом знаний (TKT), проводится перед обучением или вмешательством, чтобы установить базовый уровень, на основе которого можно измерить индивидуальный рост учащегося. Этот тип оценки используется для того, чтобы узнать уровень навыков ученика по предмету, а также может помочь учителю более эффективно объяснить материал. Эти оценки, как правило, не оцениваются. ^[10]

(2) Формирующая оценка . Обычно она проводится на протяжении всего курса или проекта. Его также называют «образовательной оценкой», которая используется для облегчения обучения. В образовательной среде формирующая оценка может проводиться учителем (или сверстником ) или учащимся (например, посредством самооценки). ^[11]^[12]), предоставляющий отзыв о работе учащегося и не обязательно используемый для выставления оценок. Формативное оценивание может принимать форму диагностических, стандартизированных тестов, викторин, устных вопросов или черновых работ. Формирующее оценивание проводится одновременно с инструктированием, и его результаты могут иметь значение. Цель формативного оценивания – проверить, понимают ли учащиеся инструкцию, прежде чем приступать к суммирующему оцениванию. ^[10]

(3) Суммативная оценка – обычно проводится в конце курса или проекта. В образовательной среде суммативное оценивание обычно используется для присвоения учащимся оценки за курс и носит оценочный характер. Суммативное оценивание проводится для подведения итогов того, что учащиеся изучили, чтобы узнать, хорошо ли они понимают предмет. Этот тип оценки обычно оценивается по шкале (например, зачтено/не зачтено, 0–100) и может принимать форму тестов, экзаменов или проектов. Суммативное оценивание в основном используется для определения того, сдал ли студент урок или не сдал его. Суммативное оценивание критикуется за то, что оно является редуктивным и учащиеся обнаруживают, насколько хорошо они усвоили знания, слишком поздно, чтобы они могли пригодиться. ^[10]

(4) Диагностическая оценка. В конце диагностическая оценка фокусируется на всех трудностях, возникших в процессе обучения.

Джей МакТай и Кен О'Коннор предложили семь практик эффективного обучения. ^[10] Один из них касается демонстрации критериев оценки перед тестом, а другой — важности предварительной оценки, чтобы узнать, каковы уровни навыков учащегося, прежде чем давать инструкции. Еще одним методом является предоставление большого количества отзывов и поощрений.

Исследователь в области образования Роберт Стейк ^[13] объясняет разницу между формирующим и суммативным оцениванием следующей аналогией:

Когда повар пробует суп, это формирует. Когда гости пробуют суп, это подводит итог. ^[14]

Суммативное и формирующее оценивание в контексте обучения часто называют оценкой обучения и оценкой обучения соответственно. Оценка обучения, как правило, носит суммирующий характер и предназначена для измерения результатов обучения и сообщения о них учащимся, родителям и администраторам. Оценка обучения чаще всего происходит в конце класса, курса, семестра или учебного года, в то время как оценка обучения обычно носит формирующий характер и используется учителями для рассмотрения подходов к преподаванию и следующих шагов для отдельных учащихся и класса. ^[15]

Распространенной формой формативного оценивания является диагностическое оценивание . Диагностическая оценка измеряет текущие знания и навыки учащегося с целью определения подходящей программы обучения. Самооценка – это форма диагностического оценивания, при которой учащиеся оценивают себя.

Перспективная оценка требует от оцениваемых рассмотреть себя в гипотетических будущих ситуациях. ^[16]

Оценка, основанная на результатах, аналогична суммирующей оценке, поскольку она фокусируется на достижениях. Это часто согласуется с реформой образования, основанной на стандартах , и движением за образование, основанное на результатах . Хотя в идеале они значительно отличаются от традиционных тестов с множественным выбором, они чаще всего связаны с оценкой, основанной на стандартах , в которой используются ответы в свободной форме на стандартные вопросы, оцениваемые людьми по стандартной шкале, соответствующие, падающие ниже или превышающие стандарт производительности, а не ранжирование по кривой. Определяется четко определенная задача, и учащихся часто просят создать, произвести или сделать что-то в условиях, предполагающих практическое применение знаний и навыков. Мастерство демонстрируется предоставлением расширенного ответа. Форматы выступлений далее подразделяются на продукты и выступления. Результатом исполнения может стать продукт, такой как картина, портфолио, статья или выставка, или оно может состоять из выступления, такого как речь, спортивное мастерство, музыкальное выступление или чтение.

Объективное и субъективное

Оценку (обобщающую или формирующую) часто подразделяют на объективную и субъективную. Объективная оценка – это форма опроса, предполагающая единственный правильный ответ. Субъективная оценка — это форма опроса, при которой может быть более одного правильного ответа (или более одного способа выражения правильного ответа). Существуют различные типы объективных и субъективных вопросов. Объективные типы вопросов включают в себя ответы «верно/неверно», вопросы с множественным выбором , множественными ответами и вопросы на совпадение, тогда как субъективные вопросы включают вопросы с расширенным ответом и эссе. Объективная оценка хорошо подходит для набирающего популярность компьютерного или онлайн-формата оценки .

Некоторые утверждают, что различие между объективными и субъективными оценками не является ни полезным, ни точным, поскольку в действительности не существует такого понятия, как «объективная» оценка. Фактически, все оценки создаются с учетом присущих им предубеждений, заложенных в решениях о соответствующем предмете и содержании, а также культурных (классовых, этнических и гендерных) предубеждений. ^[17]

Основа сравнения

Результаты теста можно сравнивать с установленным критерием, с успеваемостью других учащихся или с предыдущими достижениями:

(5) Оценка, основанная на критериях , обычно с использованием теста, основанного на критериях , как следует из названия, происходит, когда кандидаты оцениваются по определенным (и объективным) критериям. Критериальная оценка часто, но не всегда, используется для установления компетентности человека (может ли он/она что-то сделать). Самым известным примером оценки на основе критериев является экзамен по вождению, когда водители-ученики оцениваются по ряду четких критериев (например, «Не подвергать опасности других участников дорожного движения»).

(6) Оценка, основанная на нормах (в просторечии известная как « оценка по кривой »), обычно с использованием теста, основанного на нормах , не измеряется по определенным критериям. Этот тип оценки относится к студенческому составу, проводящему оценку. По сути, это способ сравнения учащихся. Тест IQ — самый известный пример оценки, основанной на нормах. Многие вступительные испытания (в престижные школы или университеты) привязаны к нормам, что позволяет пройти фиксированной доле учащихся («сдача» в этом контексте означает поступление в школу или университет, а не определенный уровень способностей). Это означает, что стандарты могут меняться из года в год в зависимости от качества когорты; критериальная оценка не меняется из года в год (если только критерии не меняются). ^[18]

(7) Ипсативное оценивание – это самосравнение либо в одной и той же области с течением времени, либо с другими областями одного и того же учащегося.

Неформальный и формальный

Оценка может быть формальной или неформальной . Формальная оценка обычно подразумевает письменный документ, например тест, викторину или бумагу. При формальной оценке присваивается числовой балл или оценка, основанная на успеваемости учащегося, тогда как неформальная оценка не влияет на итоговую оценку учащегося. Неформальная оценка обычно происходит в более непринужденной форме и может включать наблюдение, инвентаризацию, контрольные списки, рейтинговые шкалы, рубрики , оценку эффективности и портфолио, участие, коллегиальную и самооценку, а также обсуждение. ^[19]

Внутренний и внешний

Внутренняя оценка устанавливается и выставляется школой (т.е. учителями), учащиеся получают оценку и обратную связь по поводу оценки. Внешняя оценка устанавливается руководящим органом и выставляется непредвзятым персоналом, некоторые внешние оценки дают гораздо более ограниченную обратную связь при выставлении оценок. Однако в таких тестах, как австралийский NAPLAN, критерию, к которому обращаются учащиеся, предоставляется подробная обратная связь, чтобы учителя могли рассмотреть и сравнить учебные достижения учащегося, а также спланировать будущее.

Стандарты качества

В целом, высококачественными оценками считаются оценки с высоким уровнем надежности и валидности . Другими общими принципами являются практичность , аутентичность и возврат. ^[20]^[21]

Надежность

Надежность связана с последовательностью оценки. Надежная оценка – это оценка, которая последовательно достигает одних и тех же результатов с одной и той же (или похожей) группой учащихся. На надежность влияют различные факторы, в том числе двусмысленные вопросы, слишком много вариантов в вопроснике, расплывчатые инструкции по выставлению оценок и плохо обученные маркеры. Традиционно надежность оценки основывается на следующем:

Временная стабильность: результаты теста сравнимы в двух или более отдельных случаях.
Эквивалентность формы: результаты экзаменуемых эквивалентны в различных формах теста, основанных на одном и том же содержании.
Внутренняя согласованность: ответы в тесте одинаковы на всех вопросах. Например: в опросе, в котором респондентов просят оценить отношение к технологиям, следует ожидать последовательности в ответах на следующие вопросы:
- «Я очень негативно отношусь к компьютерам в целом».
- «Мне нравится пользоваться компьютерами». ^[22]

Надежность измерения x также можно определить количественно как: $R_{\text{x}}=V_{\text{t}}/V_{\text{x}}$ где $R_{\text{x}}$ – надежность наблюдаемой (тестовой) оценки, x; $V_{\text{t}}$ и $V_{\text{x}}$ представляют собой изменчивость «истинных» (т. е. врожденных результатов кандидата) и измеренных результатов тестов соответственно. $R_{\text{x}}$ может принимать значения от 0 (полностью ненадежно) до 1 (полностью достоверно).

Существует четыре типа надежности: связанная со студентом, которая может быть связана с личными проблемами, болезнью или усталостью , связанная с оценщиком, которая включает в себя предвзятость и субъективность , связанная с проведением теста, которая является условиями процесса сдачи теста, связанная с тестированием, которая в основном связана с к характеру теста. ^[23]^[20]^[24]

Срок действия

Валидная оценка – это та, которая измеряет то, для измерения чего предназначена. Например, было бы неправильно оценивать навыки вождения только с помощью письменного теста. Более достоверным способом оценки навыков вождения было бы сочетание тестов, которые помогают определить, что знает водитель, например, с помощью письменного теста на знание вождения, и того, что водитель умеет делать, например, посредством оценки фактических навыков вождения. вождение. Учителя часто жалуются, что некоторые экзамены не дают должной оценки учебной программе , на которой основан экзамен; они, по сути, ставят под сомнение достоверность экзамена.

Обоснованность оценки обычно оценивается путем изучения доказательств в следующих категориях:

Валидность содержания . Соответствует ли содержание теста заявленным целям?
Критерий валидности – коррелируют ли оценки с внешними данными? (пример: точно ли высокие баллы на тесте по чтению в 4-м классе предсказывают навыки чтения в будущих классах?)
Конструктивная валидность – соответствует ли оценка другим значимым переменным? (Пример: Постоянно ли учащиеся ESL сдают письменный экзамен иначе, чем носители английского языка?) ^[25]

Другие: ^[20]^[23]

косвенная действительность
очевидная достоверность

Хорошая оценка обладает как достоверностью, так и надежностью, а также другими качествами, отмеченными выше для конкретного контекста и цели. На практике оценка редко бывает полностью валидной или абсолютно надежной. Линейка с неправильной разметкой всегда будет давать одни и те же (неправильные) измерения. Это очень надежно, но не очень валидно. Просьбу случайных людей определить время, не глядя на часы, иногда используется как пример валидной, но ненадежной оценки. Ответы будут различаться у разных людей, но средний ответ, вероятно, близок к фактическому времени. Во многих областях, таких как медицинские исследования, образовательное тестирование и психология, часто приходится искать компромисс между надежностью и достоверностью. Тест по истории, написанный для высокой валидности, будет включать в себя много вопросов-эссе и вопросов для заполнения пропусков. Это будет хорошим показателем владения предметом, но получить абсолютно точную оценку будет сложно. Исторический тест, написанный для высокой надежности, будет полностью множественным выбором. Он не так хорош для измерения знаний по истории, но его легко оценить с большой точностью. Мы можем сделать из этого обобщение. Чем более надежна наша оценка того, что мы намереваемся измерить, тем менее мы уверены, что действительно измеряем этот аспект достижений.

Следует различать «предметную» валидность и «прогностическую» валидность. Первый метод, широко используемый в образовании, предсказывает, какой балл получит учащийся за аналогичный тест, но с другими вопросами. Последний, широко используемый на рабочем месте, предсказывает производительность. Таким образом, целесообразным является предметно-действительный тест на знание правил вождения, тогда как прогнозно-действительный тест позволит оценить, может ли потенциальный водитель следовать этим правилам.

Практичность

Этот принцип относится к временным и финансовым ограничениям во время разработки и применения инструмента оценки. ^[20] теста должно быть экономичным Это означает, что проведение . Формат теста должен быть простым для понимания. Более того, решение теста должно оставаться в пределах подходящего времени. В целом он прост в управлении. Процедура ее оценки должна быть конкретной и эффективной по времени. ^[24]

Подлинность

Инструмент оценки является аутентичным, если он контекстуализирован, содержит естественный язык и содержательную, актуальную и интересную тему, а также воспроизводит реальный опыт. ^[20]

обратная вода

Этот принцип относится к последствиям оценки преподавания и обучения в классах. ^[20] Возврат может быть положительным и отрицательным. Положительная обратная связь относится к желаемым эффектам теста, а отрицательная обратная связь относится к отрицательным последствиям теста. Чтобы получить положительный результат, можно использовать планирование обучения. ^[26]

Стандарты оценки

В области оценки , и в частности оценки образования в Северной Америке, Объединенный комитет по стандартам оценки образования опубликовал три набора стандартов оценки. Стандарты оценки персонала были опубликованы в 1988 году. ^[27] Стандарты оценки программ (2-е издание) были опубликованы в 1994 г. ^[28] и «Стандарты оценки студентов» были опубликованы в 2003 году. ^[29]

В каждой публикации представлен и разработан набор стандартов для использования в различных образовательных учреждениях. Стандарты содержат рекомендации по разработке, внедрению, оценке и совершенствованию определенной формы оценки. Каждый из стандартов отнесен к одной из четырех основных категорий, чтобы обеспечить правильность, полезность, осуществимость и точность образовательных оценок. В этих наборах стандартов вопросы достоверности и надежности рассматриваются в рамках темы точности. Например, стандарты точности учащихся помогают гарантировать, что оценки учащихся будут предоставлять надежную, точную и достоверную информацию об обучении и успеваемости учащихся.

В Великобритании существует награда в области обучения, оценки и обеспечения качества (TAQA), которая помогает сотрудникам изучать и развивать передовую практику оценки образования в контексте образования и обучения взрослых, дальнейшего обучения и на рабочем месте. ^[30]

Инфляция оценок

Инфляция оценок (также известная как снисходительность оценок) — это общее присвоение более высоких оценок за одинаковое качество работы с течением времени, что обесценивает оценки. ^[31] Однако более высокие средние оценки сами по себе не доказывают инфляцию оценок. Чтобы это было повышением оценок, необходимо продемонстрировать, что качество работы не заслуживает высокой оценки. ^[31]

Из-за увеличения оценок стандартизированные тесты могут иметь более высокую достоверность, чем результаты нестандартизированных экзаменов. ^[32] Увеличение числа выпускников в последнее время можно частично объяснить повышением оценок . ^[33]

Сводная таблица основных теоретических основ

В следующей таблице суммированы основные теоретические основы, лежащие в основе почти всех теоретических и исследовательских работ, а также педагогической практики в образовании (одной из них, конечно же, является практика оценивания). Эти различные концепции вызвали интересные дебаты среди ученых.

Темы	Эмпиризм	Рационализм	Социокультурализм
Философская направленность	Юм : Британский эмпиризм	Кант , Декарт : Континентальный рационализм.	Гегель , Маркс : культурная диалектика.
Метафорическая направленность	Механика/работа машины или компьютера	Организм/Рост растения	Контекстуалист/Исследование исторического события
Ведущие теоретики	Б. Ф. Скиннер ( бихевиоризм ) / Херб Саймон , Джон Андерсон , Роберт Ганье : ( когнитивизм )	Жан Пиаже / Робби Кейс	Лев Выготский , Лурия , Брунер /Алан Коллинз, Джим Грино, Энн Браун , Джон Брансфорд
Природа ума	Изначально пустое устройство, обнаруживающее закономерности в мире и оперирующее ими. Качественно идентичны низшим животным, но количественно превосходят их.	Орган, который развился, чтобы приобретать знания, осмысливая мир. Уникально человек, качественно отличающийся от низших животных.	Уникальный среди видов по развитию языка, инструментов и образования.
Природа знания (эпистемология)	Иерархически организованные ассоциации, дающие точное, но неполное представление о мире. Предполагает, что сумма компонентов знания равна целому. Поскольку знание точно представлено компонентами, предполагается, что тот, кто демонстрирует эти компоненты, знает.	Общие и/или специфические когнитивные и концептуальные структуры, построенные разумом и в соответствии с рациональными критериями. По сути, это структуры более высокого уровня, которые созданы для ассимиляции новой информации с существующей структурой, а также для того, чтобы структуры вмещали больше новой информации. Знания представлены способностью решать новые проблемы.	Распространены среди людей, сообществ и физической среды. Представляет культуру сообщества, которое продолжает ее создавать. Знать означает быть настроенным на ограничения и возможности систем, в которых происходит деятельность. Знания представлены в закономерностях успешной деятельности.
Характер обучения (процесс, посредством которого знания увеличиваются или изменяются)	Формирование и укрепление когнитивных или СР-ассоциаций. Генерация знаний путем (1) воздействия шаблонов, (2) эффективного распознавания шаблонов и реагирования на них (3) распознавания шаблонов в других контекстах.	Участие в активном процессе осмысления («рационализации») окружающей среды. Умите применять существующую структуру к новому опыту, чтобы рационализировать его. На самом деле вы не изучаете компоненты, а изучаете только структуры, необходимые для работы с этими компонентами позже.	Повышение способности участвовать в конкретном сообществе практиков. Вступление в жизнь группы, усиление способности к участию путем адаптации к ограничениям и возможностям.
Особенности достоверной оценки	Оцените компоненты знаний. Сосредоточьтесь на овладении многими компонентами и беглости речи. Используйте психометрию для стандартизации.	Оцените расширенную производительность при решении новых задач. Кредитные сорта превосходства.	Оцените участие в исследовании и социальных практиках обучения (например, портфолио, наблюдения). Учащиеся должны участвовать в процессе оценки. Оценки должны быть интегрированы в более широкую среду.

Споры

Обеспокоенность по поводу того, как лучше всего применять методы оценивания в системах государственных школ, в основном сосредоточена на вопросах использования комплексного тестирования и стандартизированных тестов, которые часто используются для оценки успеваемости учащихся, качества учителей, а также успехов в образовании на уровне школы, округа или штата. .

Ни один ребенок не останется позади

Для большинства исследователей и практиков вопрос не в том, следует ли вообще проводить тесты — существует общее мнение, что, если проводить их полезным образом, тесты могут предоставить полезную информацию об успеваемости учащихся и выполнении учебной программы, а также предложить формирующее использование для учащиеся. ^[34] Реальная проблема, таким образом, заключается в том, могут ли методы тестирования, реализованные в настоящее время, предоставить эти услуги преподавателям и студентам.

Президент Буш подписал Закон «Ни один ребенок не останется без внимания» (NCLB) 8 января 2002 года. Закон NCLB повторно утвердил Закон о начальном и среднем образовании (ESEA) 1965 года. Президент Джонсон подписал ESEA, чтобы помочь в борьбе с бедностью и помочь финансировать начальное образование. и средние школы. Целью президента Джонсона было подчеркнуть равный доступ к образованию и установить высокие стандарты и подотчетность. Закон NCLB требовал от штатов проводить оценку базовых навыков. Чтобы получить федеральное финансирование школ, штаты должны были дать эти оценки всем учащимся в выбранном классе.

В США Закон «Ни один ребенок не останется без внимания» требует стандартизированного тестирования по всей стране. Эти тесты соответствуют учебной программе штата и связывают ответственность учителей, учащихся, округа и штата за результаты этих тестов. Сторонники NCLB утверждают, что она предлагает реальный метод измерения успехов в образовании, привлечения учителей и школ к ответственности за плохие результаты и сокращения разрыва в успеваемости между классами и этническими группами. ^[35]

Противники стандартизированного тестирования оспаривают эти утверждения, утверждая, что привлечение преподавателей к ответственности за результаты тестов приводит к практике « обучения с помощью теста ». Кроме того, многие утверждают, что акцент на стандартизированном тестировании побуждает учителей вооружать учащихся узким набором навыков, которые повышают эффективность тестов, но на самом деле не способствуют более глубокому пониманию предмета или ключевых принципов в области знаний. ^[36]

Тестирование с высокими ставками

Оценки, вызвавшие наибольшее противоречие в США, — это использование выпускных экзаменов средней школы , которые используются для отказа в выдаче дипломов учащимся, которые посещали среднюю школу в течение четырех лет, но не могут продемонстрировать, что они усвоили необходимый материал при написании экзаменов. . Оппоненты утверждают, что ни одному учащемуся, отучившемуся четыре года обучения, не должно быть отказано в аттестате средней школы только из-за неоднократного провала на экзамене или даже из-за незнания необходимого материала. ^[37]^[38]^[39]

Тесты с высокими ставками обвиняют в том, что они вызывают болезни и беспокойство перед экзаменами у учащихся и учителей, а также в том, что учителя решают сузить учебную программу до того, что, по мнению учителя, будет проверяться. В ходе упражнения, предназначенного для того, чтобы дети чувствовали себя комфортно во время тестирования, газета Спокана, штат Вашингтон, опубликовала изображение монстра , питающегося страхом. ^[40] Опубликованное изображение предположительно является ответом студентки, которую попросили нарисовать, что она думает о государственной аттестации.

из Университета штата Вашингтон Другие критики, такие как Дон Орлич , ставят под сомнение использование тестовых заданий, выходящих далеко за рамки стандартных когнитивных уровней для учащихся возраста. ^[41]

По сравнению с оценкой портфолио, простые тесты с несколькими вариантами ответов намного дешевле, менее подвержены разногласиям между оценивающими и могут быть оценены достаточно быстро, чтобы вернуться до конца учебного года. По этим причинам в стандартизированных тестах (все учащиеся сдают один и тот же тест в одинаковых условиях) часто используются тесты с несколькими вариантами ответов. Орлич критикует использование дорогих тестов с целостной оценкой вместо недорогих «пузырьковых тестов» с несколькими вариантами ответов для измерения качества как системы, так и отдельных лиц для очень большого числа студентов. ^[41] Среди других видных критиков тестирования с высокими ставками — Fairtest и Алфи Кон .

Использование тестов IQ было запрещено в некоторых штатах при принятии образовательных решений, а тесты, основанные на нормах , которые ранжируют учащихся от «лучших» до «худших», подвергались критике за предвзятость в отношении меньшинств. Большинство чиновников от образования поддерживают тесты, основанные на критериях (баллы каждого отдельного учащегося зависят исключительно от того, правильно ли он ответил на вопросы, независимо от того, лучше или хуже справились его соседи) для принятия важных решений.

Оценка 21 века

Широко отмечено, что с появлением социальных сетей , технологий и мышления Web 2.0 обучение становится все более совместным, а знания все чаще распределяются между многими членами учебного сообщества. Однако традиционные методы оценки в значительной степени ориентированы на человека и не учитывают накопление знаний и обучение в контексте. Поскольку исследователи в области оценивания рассматривают культурные сдвиги, возникающие в результате появления культуры более широкого участия , им необходимо будет найти новые методы применения оценивания к учащимся. ^[42]

Масштабная оценка обучения

Крупномасштабные оценки обучения (LSLA) — это оценки на уровне системы, которые предоставляют моментальную картину успеваемости группы учащихся за определенный год и в ограниченном количестве областей. Их часто относят к национальным или межнациональным оценкам и привлекают внимание к вопросам, связанным с уровнями обучения и определяющими факторами обучения, включая учителей квалификацию ; качество школьной среды; родительская поддержка и руководство; социальное и эмоциональное здоровье в школах и за их пределами. ^[43]

Оценка в демократической школе

Школы демократического образования по модели Садбери не работают и не предлагают оценок, оценок, стенограмм или рекомендаций. Они утверждают, что не оценивают людей и что школа не судья; сравнение учащихся друг с другом или с каким-либо установленным стандартом является для них нарушением права учащегося на неприкосновенность частной жизни и на самоопределение . Студенты сами решают, как измерять свой прогресс в качестве самостоятельного ученика, используя процесс самооценки: настоящее обучение на протяжении всей жизни и правильная образовательная оценка для 21-го века, утверждают они. ^[44]

По мнению школ Садбери, эта политика не причиняет вреда их ученикам, поскольку они переходят к жизни за пределами школы. Однако они признают, что это усложняет процесс, но такие трудности являются частью того, что студенты учатся идти своим путем, устанавливать свои собственные стандарты и достигать своих собственных целей.

Политика отсутствия оценок и оценок помогает создать атмосферу, свободную от конкуренции среди учащихся и борьбы за одобрение взрослых, а также способствует созданию позитивной атмосферы сотрудничества среди учащихся. ^[45]

Заключительным этапом обучения в Садбери, если студент решит его пройти, является дипломная работа. Каждый ученик пишет на тему того, как он подготовил себя к взрослой жизни и вхождению в общество в целом. Этот тезис представляется Ассамблее, которая его рассматривает. Заключительным этапом работы над диссертацией является устная защита студента, в ходе которой он предоставляет слово для вопросов, проблем и комментариев от всех членов Ассамблеи. В конце Ассамблея тайным голосованием решает, присуждать ли диплом. ^[46]

Оценка учащихся ELL

Основная проблема, связанная с использованием образовательных оценок, заключается в общей достоверности, точности и справедливости, когда речь идет об оценке изучающих английский язык (ELL). Большинство оценок в Соединенных Штатах имеют нормативные стандарты, основанные на англоязычной культуре, которая не отражает адекватно население ELL. ^{[ нужна ссылка ]} Следовательно, во многих случаях было бы неточно и неуместно делать выводы на основе нормативных баллов учащихся ELL. Исследования показывают, что большинство школ не меняют методы оценки должным образом, чтобы учесть учащихся с уникальным культурным прошлым. ^{[ нужна ссылка ]} Это привело к чрезмерному направлению учащихся ELL на специальное образование, в результате чего они стали непропорционально представлены в программах специального образования. Хотя некоторые могут рассматривать такое неподходящее размещение в специальном образовании как поддержку и помощь, исследования показали, что учащиеся, попавшие в неподходящее место, на самом деле регрессировали в прогрессе. ^{[ нужна ссылка ]}

Часто бывает необходимо воспользоваться услугами переводчика, чтобы провести оценивание на родном языке учащегося ELL; однако при переводе элементов оценки возникает ряд проблем. Одна из проблем заключается в том, что переводы часто могут подсказывать правильный или ожидаемый ответ, меняя сложность задания. ^[47] Кроме того, перевод элементов оценивания иногда может исказить исходное значение элемента. ^[47] Наконец, многие переводчики не имеют квалификации или надлежащей подготовки для работы со студентами ELL в ситуации оценивания. ^{[ нужна ссылка ]} Все эти факторы ставят под угрозу достоверность и справедливость оценок, делая результаты ненадежными. Невербальные оценки оказались менее дискриминационными для учащихся ELL, однако некоторые из них все еще демонстрируют культурные предубеждения в рамках оценочных заданий. ^[47]

При выборе учащегося ELL для получения специального образования группа по оценке должна интегрировать и интерпретировать всю собранную информацию, чтобы обеспечить непредвзятое заключение. ^[47] Решение должно основываться на многомерных источниках данных, включая интервью с учителями и родителями, а также наблюдения в классе. ^[47] Решения должны принимать во внимание уникальное культурное, языковое и практическое происхождение учащихся и не должны основываться строго на результатах оценки.

Универсальный скрининг

Оценка может быть связана с неравенством, когда учащиеся из традиционно недостаточно представленных групп исключаются из тестирования, необходимого для доступа к определенным программам или возможностям, как в случае с программами для одаренных детей . Одним из способов борьбы с этим неравенством является всеобщий скрининг, который предполагает тестирование всех учащихся (например, на предмет одаренности), а не тестирование только некоторых учащихся на основе рекомендаций учителей или родителей. Всеобщий скрининг приводит к значительному увеличению числа традиционно недостаточно обслуживаемых групп (таких как чернокожие, латиноамериканцы, бедные, женщины и ELL), отобранных для участия в программах для одаренных людей, без какого-либо изменения стандартов идентификации. ^[48]

См. также

Оценка академической эквивалентности
Компьютерная оценка
Инвентаризация концепций
Обучение, основанное на доверии, точно измеряет качество знаний учащегося, измеряя как правильность его или ее знаний, так и уверенность человека в этих знаниях.
E-scape — технология и подход, ориентированные конкретно на оценку творчества и сотрудничества.
Образовательные цели и задачи
Образовательная оценка касается конкретно оценки применительно к образовательной среде. В качестве примера его можно использовать в правительственной программе «Ни один ребенок не останется без внимания» (NCLB), учрежденной правительством США .
Электронное портфолио — это личная цифровая запись, содержащая такую информацию, как коллекция артефактов или доказательств, демонстрирующих то, что человек знает и умеет.
Оценка – это процесс рассмотрения того, что оценивается, чтобы убедиться, что рассматриваются правильные области.
Выставление оценок — это процесс присвоения учащимся (возможно, взаимоисключающего) рейтинга.
Оценка воздействия на здоровье рассматривает потенциальное воздействие политики, программ и проектов на здоровье.
Мрачная константа — это теоретическая предвзятость в оценке образования.
Измерение образования — это процесс оценки или оценки, целью которого является количественная оценка уровня достижений или компетентности в определенной области. См. модель измерения Раша для более подробной информации о концептуальных требованиях таких процессов, в том числе относящихся к выставлению оценок и использованию исходных оценок по итогам оценок.
Оценка программы — это, по сути, набор философий и методов, позволяющих определить, «работает» ли программа.
Прогресс тестирования
Психометрия — наука об измерении психологических характеристик.
Психологическое тестирование
Рубрики для оценки
Образование в области науки, технологий, общества и окружающей среды
Оценка социального воздействия рассматривает возможные социальные последствия предлагаемых новых инфраструктурных проектов, проектов в области природных ресурсов или деятельности по развитию.
Стандартизированное тестирование — это любой тест, который используется в различных школах или других ситуациях.
Оценка на основе стандартов
Роберт Э. Стейк — исследователь образования в области оценки учебных программ.
Письменная оценка
Метрическая фиксация

Ссылки

^ Некоторые преподаватели и теоретики образования используют термины «оценка» и «оценка» для обозначения различных концепций тестирования во время процесса обучения с целью его улучшения (для чего предпочтительны одинаково однозначные термины «формирующая оценка» или «формирующая оценка» ) и тестирования после завершения обучения. одинаково однозначные термины суммативное оценивание или суммативное оценивание процесс (для которого предпочтительнее ), но на самом деле они являются синонимами и по своей сути не означают разные вещи. Большинство словарей не только говорят, что эти термины являются синонимами, но и используют их для определения друг друга. Если термины используются для разных понятий, тщательное редактирование требует как пояснения того, что они обычно являются синонимами, так и пояснения того, что они используются для обозначения разных понятий в текущем тексте.
^ Аллен, MJ (2004). Оценка академических программ высшего образования . Сан-Франциско: Джосси-Басс.
^ Кух, ГД; Янковский, Н.; Икенберри, Т.О. (2014). Знание того, что знают и могут делать студенты: текущее состояние оценки результатов обучения в колледжах и университетах США (PDF) . Урбана: Университет Иллинойса и Университет Индианы, Национальный институт оценки результатов обучения.
^ Национальный совет по измерению в образовании http://www.ncme.org/ncme/NCME/Resource_Center/Glossary/NCME/Resource_Center/Glossary1.aspx?hkey=4bb87415-44dc-4088-9ed9-e8515326a061#anchorA . Архивировано 2017–07. -22 в Wayback Machine
^ Нельсон, Роберт; Доусон, Филипп (2014). «Вклад в историю оценивания: как симулятор разговора искупает сократический метод». Оценка и оценка в высшем образовании . 39 (2): 195–204. дои : 10.1080/02602938.2013.798394 . S2CID 56445840 .
^ Саски, Линда (2004). Оценка обучения учащихся . Болтон, Массачусетс: Анкер.
^ Оксфордский университет Брукса. «Цели и принципы оценивания» . www.brookes.ac.uk . Архивировано из оригинала 9 октября 2018 г. Проверено 9 октября 2018 г.
^ Блэк, Пол, и Уильям, Дилан (октябрь 1998 г.). «Внутри черного ящика: повышение стандартов посредством оценки в классе». Фи Бета Каппан. Доступно по адресу http://www.pdkmembers.org/members_online/members/orders.asp?action=results&t=A&desc=Inside+the+Black+Box%3A+Raising+Standards+Through+Classroom+Assessment&text=&lname_1=&fname_1= &lname_2=&fname_2=&kw_1=&kw_2=&kw_3=&kw_4=&mn1=&yr1=&mn2=&yr2=&c1= ^{[ постоянная мертвая ссылка ]} PDKintl.org]. Проверено 28 января 2009 г.
^ Мадаус, Джордж Ф.; Айразиан, Питер В. (30 ноября 1969 г.). «Размещение, формативная, диагностическая и итоговая оценка обучения в классе» . {{cite journal}}: Для цитирования журнала требуется |journal= ( помощь )
^ Перейти обратно: ^а ^б ^с ^д Мактай, Джей; О'Коннор, Кен (ноябрь 2005 г.). «Семь практик эффективного обучения» . Образовательное лидерство . 63 (3): 10–17. Архивировано из оригинала 6 октября 2019 года . Проверено 3 марта 2017 г.
^ Хартелт, Т. и Мартенс, Х. (2024). Влияние самооценки и условных метаконцептуальных знаний на саморегуляцию у студентов интуитивных и научных представлений об эволюции. Журнал исследований в области преподавания естественных наук, 61 (5), 1134–1180. https://doi.org/10.1002/tea.21938
^ Андраде, HL (2019). Критический обзор исследований по самооценке учащихся. Границы в образовании, 4, статья 87. https://doi.org/10.3389/feduc.2019.00087.
^ «Роберт Э. Стейк, директор» . Архивировано из оригинала 8 февраля 2009 г. Проверено 29 января 2009 г.
^ Скривен, М. (1991). Оценочный тезаурус. 4-е изд. Ньюбери-Парк, Калифорния: Публикации SAGE . ISBN 0-8039-4364-4 .
^ Эрл, Лорна (2003). Оценка как обучение: использование оценки в классе для максимизации обучения учащихся. Таузенд-Оукс, Калифорния, Corwin Press. ISBN 0-7619-4626-8
^ Рид, Дэниел. «Диагностическая оценка в преподавании и изучении языка». Центр языкового образования и исследований, доступен на Google.com. Архивировано 14 сентября 2011 г. на Wayback Machine . Проверено 28 января 2009 г.
^ Объединенный комитет информационных систем (JISC). «Что мы подразумеваем под электронной оценкой?» JISC InfoNet. Получено 29 января 2009 г. с http://tools.jiscinfonet.ac.uk/downloads/vle/eassessment-printable.pdf. Архивировано 16 января 2017 г. на Wayback Machine.
^ Образовательные технологии в Технологическом институте Вирджинии. «Цели оценки». VirginiaTech DesignShop: Уроки эффективного преподавания, доступно на Edtech.vt.edu. Архивировано 26 февраля 2009 г. в Wayback Machine . Проверено 29 января 2009 г.
^ Валенсия, Шейла В. «Каковы различные формы подлинной оценки?» Понимание подлинной оценки грамотности в классе (1997), доступно на Eduplace.com . Архивировано 28 октября 2019 г. на Wayback Machine . Проверено 29 января 2009 г.
^ Перейти обратно: ^а ^б ^с ^д ^и ^ж Браун, Дуглас; Абейвикрама, Приянвада (2010). Языковая оценка, принципы и практика занятий в классе . Соединенные Штаты Америки: Пирсон Лонгман. ISBN 978-0-13-814931-4 .
^ Оксфордский университет Брукса. «Принципы оценивания» . www.brookes.ac.uk . Проверено 9 октября 2018 г.
^ Ю, Чонг Хо (2005). «Надежность и валидность». Образовательная оценка. Доступно на Creative-wisdom.com . Проверено 29 января 2009 г.
^ Перейти обратно: ^а ^б Фосетт, Элисон (2013). Принципы оценки и измерения результатов для эрготерапевтов и физиотерапевтов: теория, навыки и применение . Джон Уайли и сыновья. ISBN 9781118709696 .
^ Перейти обратно: ^а ^б «Надежность, достоверность и практичность | Учите английский | Englishpost.org» . Englishpost.org . 26 июня 2012 г. Проверено 30 октября 2018 г.
^ Москаль, Барбара; Лейденс, Джон (23 ноября 2019 г.). «Разработка рубрики оценки: достоверность и надежность». Практическая оценка, исследования и оценка . 7 (1). дои : 10.7275/q7rm-gg74 .
^ «Понимание оценки: возврат и планирование обучения» . www.cal.org . Проверено 29 октября 2018 г.
^ Объединенный комитет по стандартам оценки образования. (1988). «Стандарты оценки персонала: как оценивать системы оценки преподавателей». Ньюбери-Парк, Калифорния: Публикации SAGE
^ Объединенный комитет по стандартам оценки образования. (1994). Стандарты оценки программ , 2-е издание. Ньюбери-Парк, Калифорния: Публикации SAGE
^ Комитет по стандартам оценки образования. (2003). Стандарты оценки учащихся: как улучшить оценки учащихся . Ньюбери-Парк, Калифорния: Corwin Press
^ City & Guilds, Понимание принципов и практики оценки: информационный бюллетень о квалификациях , по состоянию на 26 февраля 2020 г.
^ Перейти обратно: ^а ^б Аренсон, Карен В. (18 апреля 2004 г.). «Это завышение оценок или студенты просто умнее?» . Нью-Йорк Таймс . Проверено 6 декабря 2015 г.
^ Гурвиц, Майкл и Джейсон Ли. «Инфляция оценок и роль стандартизированного тестирования». Измерение успеха: тестирование, оценки и будущее поступления в колледжи (2018 г.): 64–93.
^ Деннинг, Джеффри Т. и др. Почему возросло количество выпускников колледжей? Анализ повышения оценок. № w28710. Национальное бюро экономических исследований, 2021.
^ Американская психологическая ассоциация. «Соответствующее использование тщательного тестирования в школах нашей страны». APA Online, доступно на APA.org , дата обращения 24 января 2010 г.
^ (nd) Повторная авторизация NCLB . Департамент образования. Проверено 29 января 2009 г.
^ (nd) Что не так со стандартизированным тестированием? FairTest.org. Проверено 29 января 2009 г.
^ Данг, Ник (18 марта 2003 г.). «Реформировать образование, а не выпускные экзамены» . Ежедневный Брюин . Одна из распространенных жалоб со стороны тех, кто не сдал экзамен, заключается в том, что им не преподавали тестируемый материал в школе. Здесь виновато неадекватное обучение, а не тесты. Обвинять тест в своей неудаче — все равно, что обвинять станцию технического обслуживания в неудавшейся проверке смога; он игнорирует основные проблемы внутри «учебной машины». ^{[ постоянная мертвая ссылка ]}
^ Вайнкопф, Крис (2002). «Во всем виноват тест: LAUSD отрицает ответственность за низкие оценки» . Ежедневные новости . Архивировано из оригинала 2 февраля 2017 г. Проверено 4 мая 2010 г. Вина лежит на «тестах с высокими ставками», таких как Стэнфордский девятый выпускной экзамен и выпускной экзамен в средней школе Калифорнии. Комиссия ворчит, что использование таких тестов «несправедливо наказывает студентов, которым не предоставлены академические инструменты, позволяющие максимально раскрыть свой потенциал на этих тестах».
^ «Обвинение теста» . Деловая газета инвестора . 11 мая 2006 г. Судья в Калифорнии собирается отменить выпускной экзамен в средней школе этого штата. Почему? Потому что это работает. Это говорит студентам, что им нужно учиться больше. Мы называем это полезной информацией. Для истцов, которые подают в суд с требованием прекратить использование теста в качестве требования к выпускному экзамену, это нечто иное: доказательства неравного обращения... выпускной экзамен был признан несправедливым, потому что у слишком многих студентов, проваливших тест, было слишком мало дипломированных учителей. Ну, возможно, так и было, но выдача им диплома, когда у них нет необходимых знаний, только усугубляет несправедливость, оставляя им бесполезный клочок бумаги». ^{[ постоянная мертвая ссылка ]}
^ «ASD.wednet.edu» . Архивировано из оригинала 25 февраля 2007 г. Проверено 22 сентября 2006 г.
^ Перейти обратно: ^а ^б Бах, Дебора и Бланшар, Джессика (19 апреля 2005 г.). «WASL беспокоится о стрессе у детей и школ». Сиэтлский пост-разведчик. Получено 30 января 2009 г. с сайта Seattlepi.nwsource.com .
↑ Фадель, Чарльз, Хани, Маргарет и Пасник, Шелли (18 мая 2007 г.). «Оценка в эпоху инноваций». Неделя образования. Получено 29 января 2009 г. с http://www.edweek.org/ew/articles/2007/05/23/38fadel.h26.html.
^ ЮНЕСКО (2019). Перспективы крупномасштабных оценок обучения: признание ограничений для раскрытия возможностей . ЮНЕСКО. ISBN 978-92-3-100333-2 .
^ Гринберг, Д. (2000). Школы 21-го века, отредактированная стенограмма выступления, прозвучавшего на Международной конференции по обучению в 21-м веке в апреле 2000 г.
^ Гринберг, Д. (1987). Глава 20. Оценка, наконец-то бесплатно — Школа Садбери-Вэлли.
^ Порядок написания дипломной работы , Школа Маунтин-Лорел Садбери.
^ Перейти обратно: ^а ^б ^с ^д ^и «Архивная копия» (PDF) . Архивировано из оригинала (PDF) 29 мая 2012 г. Проверено 11 апреля 2012 г. {{cite web}}: CS1 maint: архивная копия в заголовке ( ссылка )
^ Кард Д. и Джулиано Л. (2015). Может ли всеобщий скрининг увеличить долю учащихся с низкими доходами и представителей меньшинств в системе образования для одаренных детей? (Рабочий документ № 21519). Кембридж, Массачусетс: Национальное бюро экономических исследований. Получено с www.nber.org/papers/w21519.

Источники

В эту статью включен текст из бесплатного контента . Лицензия CC BY-SA 3.0 IGO. Текст взят из «Обещание широкомасштабных оценок обучения: признание ограничений для раскрытия возможностей» , ЮНЕСКО, ЮНЕСКО. ЮНЕСКО.

Дальнейшее чтение

Американская ассоциация исследований в области образования, Американская психологическая ассоциация и Национальный совет по измерениям в образовании. (2014). Стандарты образовательного и психологического тестирования. Вашингтон, округ Колумбия: Американская ассоциация исследований в области образования.
Беннетт, Рэнди Эллиот (март 2015 г.). «Изменяющаяся природа оценки образования». Обзор исследований в области образования . 39 (1): 370–407. дои : 10.3102/0091732x14554179 . S2CID 145592665 .
Браун, GTL (2018). Оценка достижений учащихся. Нью-Йорк: Рутледж.
Карлесс, Дэвид. Превосходство в университетской оценке: обучение на отмеченной наградами практике . Лондон: Рутледж, 2015.
Клингер Д., МакДивитт П., Ховард Б., Роджерс Т., Муньос М. и Уайли К. (2015). Стандарты оценки в классе для учителей дошкольных учреждений до 12 лет: Объединенный комитет по стандартам оценки образования.
Кубишин Т. и Борич Г.Д. (2012). Образовательное тестирование и измерение: применение и практика в классе (10-е изд.). Нью-Йорк: Джон Уайли и сыновья.
Миллер, Д.М., Линн, Р.Л., и Гронлунд, штат Невада (2013). Измерение и оценка в преподавании (11-е изд.). Бостон, Массачусетс: Пирсон.
Национальный исследовательский совет. (2001). Знать то, что знают учащиеся: наука и дизайн оценки образования. Вашингтон, округ Колумбия: Издательство Национальной академии.
Нитко, Эй Джей (2001). Образовательная оценка учащихся (3-е изд.). Река Аппер-Седл, Нью-Джерси: Меррилл.
Фелпс, Ричард П., изд. Исправление заблуждений относительно образовательных и психологических тестов . Вашингтон, округ Колумбия: Американская психологическая ассоциация, 2008.
Фелпс, Ричард П., Учебник по стандартизированному тестированию . Нью-Йорк: Питер Лэнг, 2007.
Рассел, М.К., и Айразиан, П.В. (2012). Оценка в классе: концепции и приложения (7-е изд.). Нью-Йорк: МакГроу Хилл.
Шепард, Луизиана (2006). Оценка класса. В Р. Л. Бреннане (ред.), «Измерение образования» (4-е изд., стр. 623–646). Вестпорт, Коннектикут: Прегер.

[1] Некоторые преподаватели и теоретики образования используют термины «оценка» и «оценка» для обозначения различных концепций тестирования во время процесса обучения с целью его улучшения (для чего предпочтительны одинаково однозначные термины «формирующая оценка» или «формирующая оценка» ) и тестирования после завершения обучения. одинаково однозначные термины суммативное оценивание или суммативное оценивание процесс (для которого предпочтительнее ), но на самом деле они являются синонимами и по своей сути не означают разные вещи. Большинство словарей не только говорят, что эти термины являются синонимами, но и используют их для определения друг друга. Если термины используются для разных понятий, тщательное редактирование требует как пояснения того, что они обычно являются синонимами, так и пояснения того, что они используются для обозначения разных понятий в текущем тексте.

[2] Аллен, MJ (2004). Оценка академических программ высшего образования . Сан-Франциско: Джосси-Басс.

[3] Кух, ГД; Янковский, Н.; Икенберри, Т.О. (2014). Знание того, что знают и могут делать студенты: текущее состояние оценки результатов обучения в колледжах и университетах США (PDF) . Урбана: Университет Иллинойса и Университет Индианы, Национальный институт оценки результатов обучения.

[4] Национальный совет по измерению в образовании http://www.ncme.org/ncme/NCME/Resource_Center/Glossary/NCME/Resource_Center/Glossary1.aspx?hkey=4bb87415-44dc-4088-9ed9-e8515326a061#anchorA . Архивировано 2017–07. -22 в Wayback Machine

[5] Нельсон, Роберт; Доусон, Филипп (2014). «Вклад в историю оценивания: как симулятор разговора искупает сократический метод». Оценка и оценка в высшем образовании . 39 (2): 195–204. дои : 10.1080/02602938.2013.798394 . S2CID 56445840 .

[6] Саски, Линда (2004). Оценка обучения учащихся . Болтон, Массачусетс: Анкер.

[7] Оксфордский университет Брукса. «Цели и принципы оценивания» . www.brookes.ac.uk . Архивировано из оригинала 9 октября 2018 г. Проверено 9 октября 2018 г.

[Black_Box-8] Блэк, Пол, и Уильям, Дилан (октябрь 1998 г.). «Внутри черного ящика: повышение стандартов посредством оценки в классе». Фи Бета Каппан. Доступно по адресу http://www.pdkmembers.org/members_online/members/orders.asp?action=results&t=A&desc=Inside+the+Black+Box%3A+Raising+Standards+Through+Classroom+Assessment&text=&lname_1=&fname_1= &lname_2=&fname_2=&kw_1=&kw_2=&kw_3=&kw_4=&mn1=&yr1=&mn2=&yr2=&c1= ^{[ постоянная мертвая ссылка ]} PDKintl.org]. Проверено 28 января 2009 г.

[9] Мадаус, Джордж Ф.; Айразиан, Питер В. (30 ноября 1969 г.). «Размещение, формативная, диагностическая и итоговая оценка обучения в классе» . {{cite journal}}: Для цитирования журнала требуется |journal= ( помощь )

[ReferenceA-10] Перейти обратно: ^а ^б ^с ^д Мактай, Джей; О'Коннор, Кен (ноябрь 2005 г.). «Семь практик эффективного обучения» . Образовательное лидерство . 63 (3): 10–17. Архивировано из оригинала 6 октября 2019 года . Проверено 3 марта 2017 г.

[11] Хартелт, Т. и Мартенс, Х. (2024). Влияние самооценки и условных метаконцептуальных знаний на саморегуляцию у студентов интуитивных и научных представлений об эволюции. Журнал исследований в области преподавания естественных наук, 61 (5), 1134–1180. https://doi.org/10.1002/tea.21938

[12] Андраде, HL (2019). Критический обзор исследований по самооценке учащихся. Границы в образовании, 4, статья 87. https://doi.org/10.3389/feduc.2019.00087.

[13] «Роберт Э. Стейк, директор» . Архивировано из оригинала 8 февраля 2009 г. Проверено 29 января 2009 г.

[Stake_in_Scriven-14] Скривен, М. (1991). Оценочный тезаурус. 4-е изд. Ньюбери-Парк, Калифорния: Публикации SAGE . ISBN 0-8039-4364-4 .

[Earl,_Lorna-15] Эрл, Лорна (2003). Оценка как обучение: использование оценки в классе для максимизации обучения учащихся. Таузенд-Оукс, Калифорния, Corwin Press. ISBN 0-7619-4626-8

[Diagnostic_assessment-16] Рид, Дэниел. «Диагностическая оценка в преподавании и изучении языка». Центр языкового образования и исследований, доступен на Google.com. Архивировано 14 сентября 2011 г. на Wayback Machine . Проверено 28 января 2009 г.

[Joint_Information_Systems_Committee_(JISC)-17] Объединенный комитет информационных систем (JISC). «Что мы подразумеваем под электронной оценкой?» JISC InfoNet. Получено 29 января 2009 г. с http://tools.jiscinfonet.ac.uk/downloads/vle/eassessment-printable.pdf. Архивировано 16 января 2017 г. на Wayback Machine.

[VirginiaTech-18] Образовательные технологии в Технологическом институте Вирджинии. «Цели оценки». VirginiaTech DesignShop: Уроки эффективного преподавания, доступно на Edtech.vt.edu. Архивировано 26 февраля 2009 г. в Wayback Machine . Проверено 29 января 2009 г.

[Valencia,_Sheila_W-19] Валенсия, Шейла В. «Каковы различные формы подлинной оценки?» Понимание подлинной оценки грамотности в классе (1997), доступно на Eduplace.com . Архивировано 28 октября 2019 г. на Wayback Machine . Проверено 29 января 2009 г.

[:0a-20] Перейти обратно: ^а ^б ^с ^д ^и ^ж Браун, Дуглас; Абейвикрама, Приянвада (2010). Языковая оценка, принципы и практика занятий в классе . Соединенные Штаты Америки: Пирсон Лонгман. ISBN 978-0-13-814931-4 .

[21] Оксфордский университет Брукса. «Принципы оценивания» . www.brookes.ac.uk . Проверено 9 октября 2018 г.

[Yu,_Chong_Ho-22] Ю, Чонг Хо (2005). «Надежность и валидность». Образовательная оценка. Доступно на Creative-wisdom.com . Проверено 29 января 2009 г.

[:1-23] Перейти обратно: ^а ^б Фосетт, Элисон (2013). Принципы оценки и измерения результатов для эрготерапевтов и физиотерапевтов: теория, навыки и применение . Джон Уайли и сыновья. ISBN 9781118709696 .

[:2-24] Перейти обратно: ^а ^б «Надежность, достоверность и практичность | Учите английский | Englishpost.org» . Englishpost.org . 26 июня 2012 г. Проверено 30 октября 2018 г.

[Moskal,_Barbara_M.,_&_Leydens,_Jon_A-25] Москаль, Барбара; Лейденс, Джон (23 ноября 2019 г.). «Разработка рубрики оценки: достоверность и надежность». Практическая оценка, исследования и оценка . 7 (1). дои : 10.7275/q7rm-gg74 .

[26] «Понимание оценки: возврат и планирование обучения» . www.cal.org . Проверено 29 октября 2018 г.

[27] Объединенный комитет по стандартам оценки образования. (1988). «Стандарты оценки персонала: как оценивать системы оценки преподавателей». Ньюбери-Парк, Калифорния: Публикации SAGE

[28] Объединенный комитет по стандартам оценки образования. (1994). Стандарты оценки программ , 2-е издание. Ньюбери-Парк, Калифорния: Публикации SAGE

[29] Комитет по стандартам оценки образования. (2003). Стандарты оценки учащихся: как улучшить оценки учащихся . Ньюбери-Парк, Калифорния: Corwin Press

[30] City & Guilds, Понимание принципов и практики оценки: информационный бюллетень о квалификациях , по состоянию на 26 февраля 2020 г.

[Grade_inflation_Arenson_2004-31] Перейти обратно: ^а ^б Аренсон, Карен В. (18 апреля 2004 г.). «Это завышение оценок или студенты просто умнее?» . Нью-Йорк Таймс . Проверено 6 декабря 2015 г.

[32] Гурвиц, Майкл и Джейсон Ли. «Инфляция оценок и роль стандартизированного тестирования». Измерение успеха: тестирование, оценки и будущее поступления в колледжи (2018 г.): 64–93.

[33] Деннинг, Джеффри Т. и др. Почему возросло количество выпускников колледжей? Анализ повышения оценок. № w28710. Национальное бюро экономических исследований, 2021.

[APA-34] Американская психологическая ассоциация. «Соответствующее использование тщательного тестирования в школах нашей страны». APA Online, доступно на APA.org , дата обращения 24 января 2010 г.

[35] (nd) Повторная авторизация NCLB . Департамент образования. Проверено 29 января 2009 г.

[36] (nd) Что не так со стандартизированным тестированием? FairTest.org. Проверено 29 января 2009 г.

[37] Данг, Ник (18 марта 2003 г.). «Реформировать образование, а не выпускные экзамены» . Ежедневный Брюин . Одна из распространенных жалоб со стороны тех, кто не сдал экзамен, заключается в том, что им не преподавали тестируемый материал в школе. Здесь виновато неадекватное обучение, а не тесты. Обвинять тест в своей неудаче — все равно, что обвинять станцию технического обслуживания в неудавшейся проверке смога; он игнорирует основные проблемы внутри «учебной машины». ^{[ постоянная мертвая ссылка ]}

[38] Вайнкопф, Крис (2002). «Во всем виноват тест: LAUSD отрицает ответственность за низкие оценки» . Ежедневные новости . Архивировано из оригинала 2 февраля 2017 г. Проверено 4 мая 2010 г. Вина лежит на «тестах с высокими ставками», таких как Стэнфордский девятый выпускной экзамен и выпускной экзамен в средней школе Калифорнии. Комиссия ворчит, что использование таких тестов «несправедливо наказывает студентов, которым не предоставлены академические инструменты, позволяющие максимально раскрыть свой потенциал на этих тестах».

[IBD-39] «Обвинение теста» . Деловая газета инвестора . 11 мая 2006 г. Судья в Калифорнии собирается отменить выпускной экзамен в средней школе этого штата. Почему? Потому что это работает. Это говорит студентам, что им нужно учиться больше. Мы называем это полезной информацией. Для истцов, которые подают в суд с требованием прекратить использование теста в качестве требования к выпускному экзамену, это нечто иное: доказательства неравного обращения... выпускной экзамен был признан несправедливым, потому что у слишком многих студентов, проваливших тест, было слишком мало дипломированных учителей. Ну, возможно, так и было, но выдача им диплома, когда у них нет необходимых знаний, только усугубляет несправедливость, оставляя им бесполезный клочок бумаги». ^{[ постоянная мертвая ссылка ]}

[40] «ASD.wednet.edu» . Архивировано из оригинала 25 февраля 2007 г. Проверено 22 сентября 2006 г.

[Bach,_Deborah,_&_Blanchard,_Jessica-41] Перейти обратно: ^а ^б Бах, Дебора и Бланшар, Джессика (19 апреля 2005 г.). «WASL беспокоится о стрессе у детей и школ». Сиэтлский пост-разведчик. Получено 30 января 2009 г. с сайта Seattlepi.nwsource.com .

[Fadel,_Charles,_Honey,_Margaret,_&_Pasnik,_Shelley-42] Фадель, Чарльз, Хани, Маргарет и Пасник, Шелли (18 мая 2007 г.). «Оценка в эпоху инноваций». Неделя образования. Получено 29 января 2009 г. с http://www.edweek.org/ew/articles/2007/05/23/38fadel.h26.html.

[:0-43] ЮНЕСКО (2019). Перспективы крупномасштабных оценок обучения: признание ограничений для раскрытия возможностей . ЮНЕСКО. ISBN 978-92-3-100333-2 .

[44] Гринберг, Д. (2000). Школы 21-го века, отредактированная стенограмма выступления, прозвучавшего на Международной конференции по обучению в 21-м веке в апреле 2000 г.

[45] Гринберг, Д. (1987). Глава 20. Оценка, наконец-то бесплатно — Школа Садбери-Вэлли.

[46] Порядок написания дипломной работы , Школа Маунтин-Лорел Садбери.

[nasponline.org-47] Перейти обратно: ^а ^б ^с ^д ^и «Архивная копия» (PDF) . Архивировано из оригинала (PDF) 29 мая 2012 г. Проверено 11 апреля 2012 г. {{cite web}}: CS1 maint: архивная копия в заголовке ( ссылка )

[48] Кард Д. и Джулиано Л. (2015). Может ли всеобщий скрининг увеличить долю учащихся с низкими доходами и представителей меньшинств в системе образования для одаренных детей? (Рабочий документ № 21519). Кембридж, Массачусетс: Национальное бюро экономических исследований. Получено с www.nber.org/papers/w21519.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[22]

[23]

[24]

[25]

[26]

[27]

[28]

[29]

[30]

[31]

[32]

[33]

[34]

[35]

[36]

[37]

[38]

[39]

[40]

[41]

[42]

[43]

[44]

[45]

[46]

[47]

[48]