Стандартизированный тест
![]() | Эта статья может потребовать редактирования копий для письма, станет немного неформальным, а в некоторых разделах похожа на эссе. Полем ( Сентябрь 2023 г. ) |

Стандартизированный тест - это тест , который вводится и набирается в последовательном или «стандартном», способ. Стандартизированные тесты разработаны таким образом, чтобы вопросы и интерпретации были последовательны и вводились и оцениваются в заранее определенном, стандартном образом. [ 1 ]
Любой тест, в котором один и тот же тест проводится таким же образом для всех тестирующих, и оценивается таким же образом для всех, является стандартизированным тестом. Стандартизированные тесты не должны быть тестами с высокими ставками , ограниченными по времени тестами, тестами с множественным выбором , академическими тестами или тестами, проведенными большим количеству тестовых участников. Стандартизированным тестом может быть любой тип теста: письменный тест, пероральный тест или тест на практические навыки . Вопросы могут быть простыми или сложными. Предмет среди учеников школьного возраста часто заключается в академических навыках, но стандартизированный тест может быть проведен практически на любую тему, включая тесты вождения , творческий потенциал , атлетизм , личность , профессиональную этику или другие атрибуты.
The opposite of standardized testing is non-standardized testing, in which either significantly different tests are given to different test takers, or the same test is assigned under significantly different conditions (e.g., one group is permitted far less time to complete the test than the next group) or evaluated differently (e.g., the same answer is counted right for one student, but wrong for another student).
Most everyday quizzes and tests taken by students during school meet the definition of a standardized test: everyone in the class takes the same test, at the same time, under the same circumstances, and all of the students are graded by their teacher in the same way. However, the term standardized test is most commonly used to refer to tests that are given to larger groups, such as a test taken by all adults who wish to acquire a license to have a particular kind of job, or by all students of a certain age. Most standardized tests are forms of summative assessments (assessments that measure the learning of the participants at the end of an instructional unit).
Because everyone gets the same test and the same grading system, standardized tests are often perceived as being fairer than non-standardized tests. Such tests are often thought of as fairer and more objective than a system in which some students get an easier test and others get a more difficult test. Standardized tests are designed to permit reliable comparison of outcomes across all test takers, because everyone is taking the same test.[2]
Definition
[edit]
The definition of a standardized test has changed somewhat over time.[3] In 1960, standardized tests were defined as those in which the conditions and content were equal for everyone taking the test, regardless of when, where, or by whom the test was given or graded. Standardized tests have a consistent, uniform method for scoring.[4] This means that all students who answer a test question in the same way will get the same score for that question. The purpose of this standardization is to make sure that the scores reliably indicate the abilities or skills being measured, and not other things, such as different instructions about what to do if the test taker does not know the answer to a question.[3]
By the beginning of the 21st century, the focus shifted away from a strict sameness of conditions towards equal fairness of testing conditions.[3] For example, a test taker with a broken wrist might write more slowly because of the injury, and it would be more equitable, and produce a more reliable understanding of the test taker's actual knowledge, if that person were given a few more minutes to write down the answers to a time-limited test. Changing the testing conditions in a way that improves fairness with respect to a permanent or temporary disability, but without undermining the main point of the assessment, is called accommodation. However, if the purpose of the test were to see how quickly the student could write, then giving the test taker extra time would become a modification of the content, and no longer a standardized test.
Subject | Format | Standardized test | Non-standardized test | |
---|---|---|---|---|
History | Oral | ![]() |
Each student is given the same questions, and their answers are scored in the same way. | The teacher asks each student a different question. Some questions are harder than others. |
Driving | Practical skills | ![]() |
Each driving student is asked to do the same things, and they are all evaluated by the same standards. | Some driving students have to drive on a highway, but others only have to drive slowly around the block. One employee takes points off for "bad attitude". |
Mathematics | Written | ![]() |
Each student is given the same questions, and their answers are scored in the same way. | The teacher gives different questions to different students: an easy test for poor students, another test for most students, and a difficult test for the best students. |
Music | Audition | ![]() |
All musicians play the same piece of music. The judges agreed in advance how much factors such as timing, expression, and musicality count for. | Each musician chooses a different piece of music to play. Judges choose the musician they like best. One judge gives extra points to musicians who wear a costume. |
History
[edit]China
[edit]The earliest evidence of standardized testing was in China, during the Han dynasty,[5] where the imperial examinations covered the Six Arts which included music, archery, horsemanship, arithmetic, writing, and knowledge of the rituals and ceremonies of both public and private parts. These exams were used to select employees for the state bureaucracy.
Later, sections on military strategies, civil law, revenue and taxation, agriculture and geography were added to the testing. In this form, the examinations were institutionalized for more than a millennium.
Today, standardized testing remains widely used, most famously in the Gaokao system.
UK
[edit]Standardized testing was introduced into Europe in the early 19th century, modeled on the Chinese mandarin examinations,[6] through the advocacy of British colonial administrators, the most "persistent" of which was Britain's consul in Guangzhou, China, Thomas Taylor Meadows.[6] Meadows warned of the collapse of the British Empire if standardized testing was not implemented throughout the empire immediately.[6]
Prior to their adoption, standardized testing was not traditionally a part of Western pedagogy. Based on the skeptical and open-ended tradition of debate inherited from Ancient Greece, Western academia favored non-standardized assessments using essays written by students. It is because of this, that the first European implementation of standardized testing did not occur in Europe proper, but in British India.[7] Inspired by the Chinese use of standardized testing, in the early 19th century, British "company managers hired and promoted employees based on competitive examinations in order to prevent corruption and favoritism."[7] This practice of standardized testing was later adopted in the late 19th century by the British mainland. The parliamentary debates that ensued made many references to the "Chinese mandarin system".[6]
It was from Britain that standardized testing spread, not only throughout the British Commonwealth, but to Europe and then America.[6] Its spread was fueled by the Industrial Revolution. The increase in number of school students during and after the Industrial Revolution, as a result of compulsory education laws, decreased the use of open-ended assessment, which was harder to mass-produce and assess objectively due to its intrinsically subjective nature.

Standardized tests such as the War Office Selection Boards were developed for the British Army during World War II to choose candidates for officer training and other tasks.[8] The tests looked at soldiers' mental abilities, mechanical skills, ability to work with others, and other qualities. Previous methods had suffered from bias and resulted in choosing the wrong soldiers for officer training.[8]
United States
[edit]Standardized testing has been a part of United States education since the 19th century, but the widespread reliance on standardized testing in schools in the US is largely a 20th-century phenomenon.
Immigration in the mid-19th century contributed to the growth of standardized tests in the United States.[9] Standardized tests were used when people first entered the US to test social roles and find social power and status.[10]
The College Entrance Examination Board began offering standardized testing for university and college admission in 1901, covering nine subjects. This test was implemented with the idea of creating standardized admissions for the United States in northeastern elite universities. Originally, the test was also meant for top boarding schools, in order to align the curriculum between schools.[11] Originally the standardized test was made of essays and was not intended for widespread testing.[11]
During World War I, the Army Alpha and Beta tests were developed to help place new recruits in appropriate assignments based upon their assessed intelligence levels.[12] The first edition of a modern standardized test for IQ, the Stanford–Binet Intelligence Test, appeared in 1916. The College Board then designed the SAT (Scholar Aptitude Test) in 1926. The first SAT test was based on the Army IQ tests, with the goal of determining the test taker's intelligence, problem-solving skills, and critical thinking.[13] In 1959, Everett Lindquist offered the ACT (American College Testing) for the first time.[14] As of 2020, the ACT includes four main sections with multiple-choice questions to test English, mathematics, reading, and science, plus an optional writing section.[15]
Individual states began testing large numbers of children and teenagers through the public school systems in the 1970s. By the 1980s, American schools were assessing nationally.[16] In 2012, 45 states paid an average of $27 per student, and $669 million overall, on large-scale annual academic tests.[17] However, indirect costs, such as paying teachers to prepare students for the tests and for class time spent administering the tests, significantly exceed the direct cost of the test itself.[17]
The need for the federal government to make meaningful comparisons across a highly de-centralized (locally controlled) public education system encouraged the use of large-scale standardized testing. The Elementary and Secondary Education Act of 1965 required some standardized testing in public schools. The No Child Left Behind Act of 2001 further tied some types of public school funding to the results of standardized testing. Under these federal laws, the school curriculum was still set by each state, but the federal government required states to assess how well schools and teachers were teaching the state-chosen material with standardized tests.[18] Students' results on large-scale standardized tests were used to allocate funds and other resources to schools, and to close poorly performing schools. The Every Student Succeeds Act replaced the NCLB at the end of 2015.[19] By that point, these large-scale standardized tests had become controversial in the United States not necessarily because all the students were taking the same tests and being scored the same way, but because they had become high-stakes tests for the school systems and teachers.[20]
In recent years, many US universities and colleges have abandoned the requirement of standardized test scores by applicants.[21]
Australia
[edit]The Australian National Assessment Program – Literacy and Numeracy (NAPLAN) standardized testing was commenced in 2008 by the Australian Curriculum, Assessment and Reporting Authority, an independent authority "responsible for the development of a national curriculum, a national assessment program and a national data collection and reporting program that supports 21st century learning for all Australian students".[22]
The testing includes all students in Years 3, 5, 7 and 9 in Australian schools to be assessed using national tests. The subjects covered in these tests include Reading, Writing, Language Conventions (Spelling, Grammar and Punctuation) and Numeracy.
The program presents students level reports designed to enable parents to see their child's progress over the course of their schooling life, and help teachers to improve individual learning opportunities for their students. Students and school level data are also provided to the appropriate school system on the understanding that they can be used to target specific supports and resources to schools that need them most. Teachers and schools use this information, in conjunction with other information, to determine how well their students are performing and to identify any areas of need requiring assistance.
The concept of testing student achievement is not new, although the current Australian approach may be said to have its origins in current educational policy structures in both the US and the UK. There are several key differences between the Australian NAPLAN and the UK and USA strategies. Schools that are found to be under-performing in the Australian context will be offered financial assistance under the current federal government policy.
Colombia
[edit]In 1968 the Colombian Institute for the Evaluation of Education (ICFES) was born to regulate higher education. The previous public evaluation system for the authorization of operation and legal recognition for institutions and university programs was implemented.
Colombia has several standardized tests that assess the level of education in the country. These exams are performed by the ICFES.
Students in third grade, fifth grade and ninth grade take the "Saber 3°5°9°" exam. This test is currently presented on a computer in controlled and census samples.
Upon leaving high school students present the "Saber 11" that allows them to enter different universities in the country. Students studying at home can take this exam to graduate from high school and get their degree certificate and diploma.
Students leaving university must take the "Saber Pro" exam.
Canada
[edit]Canada leaves education, and standardized testing as result, under the jurisdiction of the provinces. Each province has its own province-wide standardized testing regime, ranging from no required standardized tests for students in Saskatchewan to exams worth 40% of final high school grades in Newfoundland and Labrador.[23]
Design and scoring
[edit]Design
[edit]Most commonly, a major academic test includes both human-scored and computer-scored sections.
A standardized test can be composed of multiple-choice questions, true-false questions, essay questions, authentic assessments, or nearly any other form of assessment. Multiple-choice and true-false items are often chosen for tests that are taken by thousands of people because they can be given and scored inexpensively, quickly, and reliably through using special answer sheets that can be read by a computer or via computer-adaptive testing. Some standardized tests have short-answer or essay writing components that are assigned a score by independent evaluators who use rubrics (rules or guidelines) and benchmark papers (examples of papers for each possible score) to determine the grade to be given to a response.
Any subject matter
[edit]
Not all standardized tests involve answering questions. An authentic assessment for athletic skills could take the form of running for a set amount of time or dribbling a ball for a certain distance. Healthcare professionals must pass tests proving that they can perform medical procedures. Candidates for driver's licenses must pass a standardized test showing that they can drive a car. The Canadian Standardized Test of Fitness has been used in medical research, to determine how physically fit the test takers are.[24][25]
Machine and human scoring
[edit]Since the latter part of the 20th century, large-scale standardized testing has been shaped in part, by the ease and low cost of grading of multiple-choice tests by computer. Most national and international assessments are not fully evaluated by people.
People are used to score items that are not able to be scored easily by computer (such as essays). For example, the Graduate Record Exam is a computer-adaptive assessment that requires no scoring by people except for the writing portion.[26]
Human scoring is relatively expensive and often variable, which is why computer scoring is preferred when feasible. For example, some critics say that poorly paid employees will score tests badly.[27] Agreement between scorers can vary between 60 and 85 percent, depending on the test and the scoring session. For large-scale tests in schools, some test-givers pay to have two or more scorers read each paper; if their scores do not agree, then the paper is passed to additional scorers.[27]
Though the process is more difficult than grading multiple-choice tests electronically, essays can also be graded by computer. In other instances, essays and other open-ended responses are graded according to a pre-determined assessment rubric by trained graders. For example, at Pearson, all essay graders have four-year university degrees, and a majority are current or former classroom teachers.[28]
Use of rubrics for fairness
[edit]Использование рубрики предназначено для повышения справедливости при оценке успеваемости студента. В стандартизированном тестировании ошибка измерения (последовательная структура ошибок и смещений при оценке теста) легко определить при стандартизированном тестировании. Когда оценка зависит от индивидуальных предпочтений грейдеров, то оценки студентов зависят от того, кто оценивает тест.
Стандартизированные тесты также удаляют смещение класса в оценке. Исследования показывают, что учителя создают своего рода самоисполняющееся пророчество в своей оценке студентов, предоставляя тем, кто они ожидают, достигнет более высоких результатов и предоставят тем, кто, как они ожидают, потерпят неудачу в более низких классах. [ 29 ] В нестандартной оценке грейдеры имеют больше индивидуального усмотрения и, следовательно, с большей вероятностью дают несправедливые результаты посредством бессознательного предвзятости .
Студент Ответы | Стандартизированная оценка | Нестандартная оценка |
---|---|---|
Оценка рубрика: Ответы должны быть отмечены правильными, если они упоминают хотя бы одну из следующих: вторжение Германии в Польшу, вторжение Японии в Китай или экономические проблемы. | Нет стандартов оценки. Каждый учитель оценивает, однако он или она хочет, учитывая любые факторы, которые учитель выбирает, например, ответ, количество усилий, академическое образование ученика, языковые способности или отношение. | |
Студент № 1: Вторая мировая война была вызвана Гитлером и Германией, вторгшимися в Польшу. |
Учитель № 1: В этом ответе упоминается один из необходимых предметов, так что это правильно. |
Учитель № 1: Я чувствую, что этот ответ достаточно хорош, поэтому я отмечу его правильно. |
Студент № 2: Вторая мировая война была вызвана множественными факторами, включая Великую депрессию и общую экономическую ситуацию, рост национального социализма, фашизма и империалистического экспансионизма, а также неразрешенные обиды, связанные с Первой мировой войной. Война в Европе началась с немецкого вторжения в Польшу. |
Учитель № 1: В этом ответе упоминается один из необходимых предметов, так что это правильно. |
Учитель № 1: Я чувствую, что этот ответ правильный и полный, поэтому я отдам полную кредит. |
Студент № 3: Вторая мировая война была вызвана убийством эрцгерцога Фердинанда в 1914 году. |
Учитель № 1: В этом ответе не упоминается ни один из необходимых предметов. Нет очков. |
Учитель № 1: Этот ответ неверен. Нет очков. |
Использование результатов для сравнений
[ редактировать ]Существует два типа интерпретаций баллов теста : с нормой интерпретация упоминавшаяся по критерию . , или интерпретация, [ 4 ]
- Нормальные интерпретации оценки сравнивают тестируемых с образцом сверстников . [ 4 ] Цель состоит в том, чтобы оценить студентов как лучше или хуже, чем другие студенты. Интерпретации тестов, упоминавшихся от норм, связаны с традиционным образованием . Студенты, которые работают лучше, чем другие, проходят тест, и студенты, которые работают хуже, чем другие, проваливают тест.
- Критерийные интерпретации оценки сравнивают тестирующих с критерием (формальное определение содержания), независимо от баллов других исследований. [ 4 ] Они также могут быть описаны как оценки на основе стандартов , так как они соответствуют движению реформы на основе стандартов . [ 30 ] Критерийные интерпретации, связанные с оценками, касаются исключительно того, является ли ответ этого конкретного студента правильным и полным. В соответствии с критериями систем, все студенты могут пройти тест, или всем учащимся провалить тест.
Любая из этих систем может использоваться в стандартизированном тестировании. Что важно для стандартизированного тестирования, так это то, задают ли все учащиеся эквивалентные вопросы при разумно равных обстоятельствах и оцениваются в соответствии с теми же стандартами.

Нормативная оценка сравнивает каждую тестирующие с другими тестирующими. Тест на норму (NRT)-это тип теста, оценки или оценки , которая дает оценку позиции проверенного человека в предопределенной популяции. Оценка получена из анализа результатов тестов и других соответствующих данных из выборки, взятой из популяции. Этот тип теста определяет, выступил ли тест -продавец лучше или хуже, чем другие студенты, которые проходили этот тест.
Сравнение с другими делает стандартизированные тесты с нормой, полезные для приема в высшее образование, где школа пытается сравнивать учащихся со всей страны или во всем мире. Стандартизация гарантирует, что все учащиеся тестируются одинаково, а норм-ссылка идентифицирует, что лучше или хуже. Примеры таких международных контрольных тестов включают тенденции в международном исследовании математики и науки ( TIMMS ) и прогресс в международном исследовании грамотности чтения ( Pirls ).

Критерийный тест (CRT)-это стиль теста, который использует результаты тестов, чтобы показать, насколько хорошо тестирующие выполняются на данной задаче, а не о том, насколько хорошо они выполнялись по сравнению с другими тестирующими. Большинство тестов и тестов, которые написаны школьными учителями, являются критериями тестов. В этом случае цель состоит в том, чтобы просто увидеть, может ли студент правильно ответить на вопросы. Учитель обычно не пытается сравнить результат каждого студента с другими учениками.
Стандарты
[ редактировать ]Соображения достоверности и надежности обычно рассматриваются как важные элементы для определения качества любого стандартизированного теста. Тем не менее, профессиональные ассоциации и практикующие ассоциации часто ставят эти проблемы в более широкие контексты при разработке стандартов и выводя общие суждения о качестве любого стандартизированного теста в целом в данном контексте.
Стандарты оценки
[ редактировать ]В области оценки и, в частности, оценки образования , Объединенный комитет по стандартам для оценки образования [ 31 ] опубликовал три набора стандартов для оценки. Стандарты оценки персонала [ 32 ] был опубликован в 1988 году, стандарты оценки программы (2 -е издание) [ 33 ] был опубликован в 1994 году, и стандарты оценки студентов [ 34 ] был опубликован в 2003 году.
Каждая публикация представляет и разрабатывает набор стандартов для использования в различных образовательных условиях. Стандарты предоставляют руководящие принципы для проектирования, реализации, оценки и улучшения идентифицированной формы оценки. Каждый из стандартов был поставлен в одну из четырех фундаментальных категорий для содействия образовательной оценке, которые являются правильными, полезными, осуществимыми и точными. В этих наборах стандартов соображения достоверности и надежности охватываются по теме точности. Тесты направлены на обеспечение того, чтобы оценки учащихся предоставили надежную, точную и достоверную информацию о обучении и производительности учащихся; Стандартизированные тесты предлагают узкую информацию о многих формах интеллекта и полагаясь на то, что они наносят ущерб учащимся, потому что они неточно измеряют потенциал студента для успеха. [ 35 ]
Стандарты тестирования
[ редактировать ]
В области психометрии стандарты для образовательного и психологического тестирования [ 36 ] Поместите стандарты о достоверности и надежности, наряду с ошибками измерения и вопросами, связанными с размещением людей с ограниченными возможностями . Третья и последняя основная тема охватывает стандарты, связанные с приложениями для тестирования, учетными средствами , а также тестированием в оценке программ и государственной политике .
Статистическая достоверность
[ редактировать ]Одним из основных преимуществ более масштабного стандартизированного тестирования является то, что результаты могут быть эмпирически документированы; Следовательно, можно показать, что результаты тестов имеют относительную степень достоверности и надежности , а также результаты, которые являются обобщенными и воспроизводимыми. [ 37 ] Это часто контрастирует с оценками по школьной стенограмме, которые назначаются отдельными учителями. При рассмотрении индивидуально назначенных оценок, может быть трудно объяснить различия в образовательной культуре в разных школах, сложность заданий данного учителя, различия в стиле преподавания, давление на инфляцию оценки , а также другие методы и предубеждения, которые влияют на оценку.
Другим преимуществом является агрегация. Хорошо разработанный стандартизированный тест обеспечивает оценку мастерства человека в области знаний или навыков, которые на некотором уровне агрегации предоставит полезную информацию. То есть, хотя индивидуальные оценки могут быть недостаточно точными для практических целей, средние оценки классов, школ, филиалов компании или других групп вполне могут предоставить полезную информацию из -за сокращения ошибки, совершенной путем увеличения размера выборки.
Ежегодные стандартизированные тесты в школе
[ редактировать ]Стандартизированное тестирование - очень распространенный способ определения прошлых академических достижений и будущего студента.
Достоверность, качество или использование тестов, особенно годовые стандартизированные тесты, распространенные в образовании, по -прежнему широко поддерживаются или подвергаются критике. Как и сами тесты, поддержка и критика тестов часто варьируются и могут происходить из различных источников, таких как родители, тестирующие, инструкторы, бизнес -группы, университеты или государственные наблюдатели.
Сторонники крупномасштабных стандартизированных тестов в образовании часто дают следующие причины для продвижения тестирования в образовании:
- Обратная связь или диагноз результатов тестового такера: [ 38 ] Стандартизированные тесты позволяют учителям видеть, как работают их ученики по сравнению с другими в стране. Это поможет им пересмотреть свои методы преподавания, если это необходимо, чтобы помочь своим ученикам соответствовать стандартам. [ 39 ] Студентам предоставляется возможность подумать о своих оценках и увидеть, где находятся их сильные и слабые стороны. [ 39 ] Оценки могут позволить родителям получить представление о том, как у их ребенка дела в академическом порядке. [ 40 ]
- Справедливо и эффективно [ 41 ]
- Способствует подотчетности: [ 38 ] [ 41 ] Стандартизированное тестирование используется в качестве стратегии государственной политики для установления более строгих мер по подотчетности для государственного образования . Идея, лежащая в основе стандартизированного движения политики тестирования, заключается в том, что тестирование является первым шагом к улучшению школ, практики преподавания и образовательных методов с помощью сбора данных. Сторонники утверждают, что данные, генерируемые стандартизированными тестами, действуют как таковая карта сообщества, демонстрируя, насколько хорошо работают местные школы. Критики движения, однако, указывают на различные несоответствия, которые возникают в результате современных стандартизированных методов тестирования, включая проблемы с достоверностью теста и надежностью и ложными корреляциями (см. Парадокс Симпсона ).
- Прогноз и выбор [ 38 ]
- Улучшает производительность [ 38 ]
Критики стандартизированных тестов в образовании часто дают следующие причины пересмотра или удаления стандартизированных тестов в образовании:
- Плохое предиктивное качество. [ 42 ] [ 43 ]
- Оценка инфляция тестов или оценки. [ 44 ] [ 45 ] [ 46 ]
- Культурно или социально -экономически предвзятый. [ 47 ] [ 48 ]
- Психологически разрушительный. [ 49 ]
- Плохой индикатор интеллекта или способности. [ 50 ] [ 51 ] [ 52 ] [ 53 ]

Кроме того, успех ученика отслеживается до относительного успеваемости учителя, что делает преподавательский прогресс, зависящий от успеха учителя с успеваемостью ученика. Этические и экономичные вопросы возникают для учителей, когда они сталкиваются с явно недостаточными или недостаточными учениками и стандартизированным тестом.
В своей книге, теперь вы видите это , Кэти Дэвидсон критикует стандартизированные тесты. Она описывает молодежь как «Ассамблежные дети на модели сборки», что означает использование стандартизированного теста в качестве части однократной образовательной модели. Она также критикует узость тестируемых навыков и маркировки детей без этих навыков как неудач или студентов с ограниченными возможностями. [ 54 ] Широко распространенное и организованное мошенничество было растущей культурой. [ 55 ]
Существует три показателя, с помощью которых измеряются лучшие страны в Тимме («А+ страны»): фокусировка, когерентность и строгость. Фокус определяется как количество тем, представленных в каждом классе; Идея состоит в том, что чем меньше тем, представленных в каждом классе, тем больше фокуса может быть уделено каждой теме. Определение когерентности придерживается последовательности охватываемых тем, которые следует за естественной прогрессией или логической структурой математики. CCSSM . сравнивался как с текущими стандартами состояния, так и с стандартами A+ страны С наибольшим количеством тем, охватываемых в среднем, текущие стандарты состояния были самыми низкими. [ 56 ] Стандарты Common Core направлены на то, чтобы исправить это несоответствие, помогая преподавателям сосредоточиться на том, что студенты должны учиться, вместо того, чтобы отвлекаться от посторонних тем. Они поощряют образовательные материалы к неглубокому покрытию на несколько тем, до нескольких тем на гораздо большей глубине. [ 57 ]
Время и деньги
[ редактировать ]Стандартизированные тесты - это способ измерить уровень образования учащихся и школ в широком масштабе. От детского сада до 12 -го класса большинство американских студентов участвуют в ежегодных стандартизированных тестах. Средний студент проходит около 10 из этих тестов в год (например, один или два теста на понимание прочитанного, один или два математических теста, письменный тест, научный тест и т. Д.). [ 58 ] Средняя сумма тестирования занимает около 2,3% от общего времени класса (равна примерно четырем школьным дням в году). [ 59 ]
Стандартизированные тесты дороги для администрирования. Сообщалось, что Соединенные Штаты ежегодно тратят около 1,7 миллиарда долларов США на эти тесты. [ 60 ] В 2001 году также сообщалось, что только три компании (Harcourt образовательные измерения, CTB McGraw-Hill and Riverside Publishing) проектируют 96% тестов, пройденных на уровне штата. [ 61 ]
Образовательные решения
[ редактировать ]Национальная академия наук рекомендует, чтобы основные образовательные решения не были основаны исключительно на одном результате теста. [ 62 ] Использование минимальных сокращений для входа или выпуска не подразумевает ни одного стандарта, поскольку результаты тестов почти всегда сочетаются с другими минимальными критериями, такими как количество кредитов, предпосылки, курсы, посещаемость и т. Д. Единственные критерии «просто потому, что они наиболее сложные, или выполнение других критериев автоматически предполагается. Единственным исключением из этого правила является GED , который позволил многим людям признавать свои навыки, даже если они не соответствовали традиционным критериям. [ Цитация необходима ]
Некоторые учителя утверждают, что единственный стандартизированный тест измеряет только текущие знания студента, и он не отражает прогресс учащихся с начала года. [ 63 ] Результат, созданный людьми, которые не являются частью регулярного обучения студента, а профессионалами, которые определяют, что студенты должны знать в разных возрастах. Кроме того, учителя согласны с тем, что лучшие тестовые создатели и фасилитатор сами. Они утверждают, что они наиболее осведомлены о способностях студентов, возможностях и потребностях, которые позволили бы им продолжать продолжать предметы или продолжить регулярную учебную программу.
Влияние на обездоленные студентов
[ редактировать ]Монти Нил, директор Национального центра справедливого и открытого тестирования, утверждает, что студентам, которые говорят по-английски как на втором языке, у которых есть инвалидность, или которые приходят из семей с низким доходом, непропорционально отрицают диплом из-за результата теста, что несправедливо и вредно. Например, в конце 1970 -х годов начался выпускной тест в Соединенных Штатах, в иске утверждалось, что многие чернокожие ученики не имели справедливой возможности для материала, которые они были проверены на выпускном тесте, поскольку они посещали школы, разделенные по закону. «Взаимодействие школ с низким разрешением и тестирование наиболее сильно поражает цветных учеников», как утверждает Нил,-они непропорционально отказаны Санкции, такие как реструктуризация ». [ 64 ]
В журнале «Прогрессивный» Барбара Майнер объясняет недостатки стандартизированного тестирования, анализируя три разные книги. Будучи со-директором Центра образования в Университете Райс и профессором образования, Линда М. Макнейл в своей книге противоречия школьной реформе: расходы на образование стандартизированного тестирования пишет: «Образовательная стандартизация наносит ущерб преподаванию и обучению и в долгосрочной перспективе , переопределяет образование по расу и классам ». Макнил считает, что реформа образования, основанная на тестировании, устанавливает более высокие стандарты для студентов цветных. По словам Майнера, Макнейл «показывает, как реформа, основанная на тестировании, централизует власть в руках корпоративной и политической элиты-особенно пугающее развитие в это время растущего корпоративного и консервативного влияния на реформу образования». Такая тестовая реформа запустила обучение, особенно для цветных студентов. [ 65 ]
Fairtest говорит, что негативные последствия злоупотребления тестированием включают в себя толкание учеников из школы, изгнание учителей из профессии и подрывать вовлечение учащихся и школьное климат. [ 66 ]
Использование стандартизированных тестов при поступлении в университет
[ редактировать ]Стандартизированные тесты рассматриваются университетами в рамках заявления, наряду с другими подтверждающими доказательствами, такими как личные заявления , оценки средней школы , предыдущая курсовая работа и рекомендательные письма . [ 67 ] В разных странах есть разные тесты, такие как SAT в США, Гаокао в Китае, и совместный вступительный экзамен в Индии.
Натан Кунсель, ученый из высшего образования, говорит, что поступление в колледж и другие стандартизированные тесты »Помощь перегружена офицеры. Это, но школы серьезно относятся к тестам ». [ 68 ]
Исследования показывают, что тесты предсказывают больше, чем просто первокурсники и уровень курсов, который может пройти студент. Продольные исследования, проведенные учеными, показывают, что студенты с высокими результатами тестов с большей вероятностью проведут сложный путь через колледж. [ 69 ] Тесты также могут указывать на результаты студентов за пределами колледжа, включая оценки преподавателей, достижения в области исследований, достижение степени, результаты комплексных экзаменов и профессиональное лицензирование. [ 70 ]
Поскольку оценка варьируется в разных школах, и даже для двух учеников в одной школе, общая мера, предоставляемая баллом теста, более полезна как способ сравнения учащихся.
Однако в апреле 1995 года «Мета-анализ», опубликованный в Журнале образовательных и психологических измерений , Тодд Моррисон и Мелани Моррисон изучили два десятка исследования валидности теста, необходимых для попадания в любую магистратуру или докторскую программу в Америке: выпускник Записывающие экзамены (GRE). Это исследование охватывало более 5000 тестирующих за последние 30 лет. Авторы обнаружили, что оценки GRE составляли всего 6 процентов от вариаций в аспирантуре. GRE, по -видимому, «практически бесполезен с точки зрения прогнозирования», написал авторы. Повторные исследования теста на приема юридической школы (LSAT) находят то же самое.
Существует дискуссия, будет ли тест указывать долгосрочный успех в работе и жизни, поскольку существует много других факторов, но фундаментальные навыки, такие как чтение, письмо и математика, связаны с работой.
Продольное исследование в 2007 году продемонстрировало, что крупные жизненные достижения, такие как публикация новой или патентной технологии, также связаны с результатами тестов, даже после учета возможностей образования. Существует даже значительное количество доказательств того, что эти навыки связаны с эффективными лидерством и творческими достижениями на работе. Возможность читать тексты и размышлять над ними и иметь сильные количественные рассуждения, имеют решающее значение в современной информационной экономике . [ 70 ]
Многие аргументы предполагают, что навыки из тестов полезны, но только до определенного момента.
Тем не менее, замечательное продольное исследование, опубликованное в 2008 году в журнале «Психологическая наука», исследовали студентов, которые забили в первую очередь в возрасте 13 лет. Двадцать лет спустя они были в среднем очень высоко, с высокими доходами, крупными наградами и наградами и наградами и наградами. карьерные достижения, которые заставили бы любого родителя гордиться. [ 71 ]
Существует корреляция между результатами тестов и социальным классом, но успех в стандартизированных тестах и в колледже не просто зависит от класса. Исследования показывают, что «тесты были действительными, даже когда контролировали социально-экономический класс. Независимо от их семейного происхождения, студенты с хорошими результатами тестов и высокими оценками в колледже лучше, чем студенты с более низкими оценками и более слабыми стенограммами». [ 72 ]
Другая критика, касающаяся социального класса и стандартизированного тестирования, заключается в том, что только богатые люди получают подготовку к тестам и коучинг. Однако »исследователи провели сочетание экспериментальных исследований и контролируемых полевых исследований, чтобы проверить этот вопрос. Они, как правило, пришли к выводу, что выгоды из -за подготовки к тестированию более от 5 до 20 баллов, а не от 100 до 200 баллов, заявленных Некоторые тестовые подготовительные компании. " [ 73 ]
Что еще более важно, многие люди придерживаются мнения, что тесты предотвращают разнообразие приема, поскольку меньшинства имеют более низкие оценки в тестах по сравнению с другими представленными группами. [ 74 ] В исследовании 2012 года рассматривались школы, в которых тесты на прием, обязательны для кандидатов и сравнивали их со школами, которые используют тесты, и результат показывает, что «недавние исследования демонстрируют, что школы-тестирование в школах зачисляют все более разнообразные студенческие органы. Но то же самое и правда. школ, которые требуют тестирования ». [ 75 ]
Оппоненты утверждают, что стандартизированные тесты являются неправильными и некритическими суждениями об интеллекте и производительности, но сторонники утверждают, что это не негативы стандартизированных тестов, а критика плохо спроектированных режимов тестирования. Они утверждают, что тестирование должно и фокусируют образовательные ресурсы на наиболее важных аспектах образования-с учетом заранее определенного набора знаний и навыков-и что другие аспекты либо менее важны, либо должны быть добавлены в схему тестирования.
Данные показывают, что чернокожие и латиноамериканские студенты в среднем набирают ниже, чем белые и азиаты. Таким образом, стандартные тесты математики и чтения, такие как SAT, столкнулись с эскалационными атаками от прогрессивных. Тем не менее, исчерпывающий отчет Сената факультета Калифорнийского университета, по заказу Джанет Наполитано и опубликованный в 2020 году, обнаружил, что тесты не являются дискриминационными и играют важную роль в защите качества образования. [ 76 ]
В отчете предполагается, что ухудшение инфляции класса , особенно в богатых средних школах, делает стандартную оценку особенно важной. [ 76 ]
Что касается намерения UC школ в сбросе стандартных тестов, таких как SAT и ACT при поступлении в колледж, субъективные и индивидуальные тесты, такие как эссе и внеклассные науки, могут быть легко адаптированы и вредны для учащихся, которые не знакомы с процессом. Прием без тестирования может быть еще более наклоненным в пользу хорошо связанных. [ 77 ]
В январе 2020 года сенат факультета в Калифорнийском университете рекомендовал, чтобы система UC провела стандартизированные тесты в качестве требований к приеме. [ 76 ] В отчете говорится, что стандартизированные тесты по математике и чтению полезны для прогнозирования успеваемости в колледже. Основываясь на данных от учащихся в системе UC, в отчете делается вывод о том, что «оценки тестов в настоящее время являются лучшими предикторами среднего балла первого года, чем в среднем по баллам средней школы». [ 76 ] Отчет продолжается: баллы также хороши в прогнозировании общего среднего балла в колледже и возможности, которую студент закончит. В то время как «прогнозирующая сила результатов тестовых результатов выросла, - добавляет отчет, - прогнозирующая сила оценки средней школы снизилась». [ 76 ]
Результаты тестов позволяют школам UC «выбирать этих учеников из недопредставленных групп , которые с большей вероятностью получат более высокие оценки и заканчиваются вовремя». [ 76 ] «Первоначальным намерением SAT было выявление студентов, которые пришли из -за пределов относительно привилегированных кругов, которые могут добиться успеха в университете», - говорится в отчете. [ 76 ] Создатель SAT, Служба образовательных тестирования (ETS), теперь утверждает, что SAT не является тестом «способности», а скорее оценкой «развитых способностей». [ 78 ]
Проблемы тестирования, не специфичные для стандартизации
[ редактировать ]Большинство тестов можно классифицировать по нескольким категориям. Например, тест может быть как стандартизирован, а также тест с высокими ставками, или стандартизированный, а также тест с множественным выбором. Жалобы на «стандартизированные тесты» (все тестируемые проводят один и тот же тест, в разумно схожих условиях, оцененных одинаково) часто сосредоточены на опасениях, не связанных с стандартизацией и в равной степени применяются к нестандартным тестам. Например, критик может жаловаться на то, что «стандартизированные тесты-это все ограниченные по времени тесты», но в центре внимания критики сосредоточено на сроке, а не на всех, проходящих один и тот же тест и оценивали свои ответы одинаково.
Тесты с высокими ставками
[ редактировать ]Тест низких ставок | Тест высоких ставок | |
---|---|---|
Стандартизированный тест | на Личность викторины веб -сайте | Образовательный вступительный экзамен для определения поступления в университет |
Нестандартный тест | Учитель просит каждого ученика поделиться тем, что они помнят из своей домашней работы. | Театр проводит прослушивание , чтобы определить, кто получит главную роль. |
Тест с высокими ставками -это тест с желаемой наградой за хорошую производительность. [ 4 ] Некоторые стандартизированные тесты, в том числе многие тесты, используемые для поступления в университет по всему миру, являются тестами с высокими ставками. Наиболее стандартизированные тесты, такие как обычные тесты в классе, представляют собой тесты с низкими ставками. [ 4 ]
Тяжелая зависимость от стандартизированных тестов с высокими ставками для принятия решений часто является спорной. Общая проблема с тестами с высокими ставками заключается в том, что они измеряют производительность во время одного события, когда критики считают, что более целостная оценка будет подходящей. Критики часто предлагают подчеркнуть совокупные или даже нечетные меры, такие как классные оценки или краткие индивидуальные оценки (написанные в прозе) от учителей. Сторонники утверждают, что результаты тестов обеспечивают четкий, объективный стандарт, который служит ценной проверкой на инфляцию оценки . [ 79 ]
Нормальные тесты
[ редактировать ]
Тест, упомянутый на норме, является разработанным и забитым таким образом, чтобы некоторые испытатели занимали лучшее или хуже, чем другие. [ 4 ] Рейтинг предоставляет информацию об относительном рейтинге, что полезно, когда цель состоит в том, чтобы определить, кто лучше (например, в поступлении в элитные университеты). [ 4 ]
Разногласия с образовательными стандартами
[ редактировать ]Тест , упомянутый критерием, является более распространенным и более практичным, когда цель состоит в том, чтобы узнать, изучили ли тестовые участники необходимый материал. [ 4 ]
Тем не менее, некоторые критики возражают против «стандартизированных тестов» не потому, что они возражают против того, чтобы дать учащимся один и тот же тест при разумно схожих условиях и оценку ответов одинаково, потому что они возражают против типа материала, который обычно проверяется школами. Хотя стандартизированные тесты для неакадемических атрибутов, таких как тесты Торранса творческого мышления , существуют, школы редко дают стандартизированные тесты для измерения «Инициатива, творчество, воображение ... любопытство ... добрая воля, этическая рефлексия или множество других ценных расположение и атрибуты ». [ 80 ] [ 81 ] Вместо этого тесты, представленные школами, имеют тенденцию сосредотачиваться меньше на развитии морали или характера, а также на индивидуальных идентифицируемых академических навыках, таких как понимание прочитанного и арифметика .
В своей книге «Стыд нации » Джонатан Козол утверждает, что студенты, подчиненные стандартизированному тестированию, являются жертвами «когнитивного обезглавливания». Козол приходит к этому осознанию после разговора со многими детьми в городских школах, которые не имеют пространственного воспоминания о времени, периодах времени и исторических мероприятиях. Это особенно относится к школам, где из -за нехватки финансирования и строгой политики подотчетности школы покончили с такими предметами, как искусство, история и география; Чтобы сосредоточиться на содержании обязательных тестов. [ 82 ]
Тестовая тревога
[ редактировать ]Некоторые люди становятся обеспокоенными при прохождении теста. Это явление чаще встречается для тестов с высокими ставками, чем для тестов с низкими ставками. Тесты с высокими ставками (будь то стандартизированные или нестандартные) могут вызвать беспокойство.
Существует критика со стороны самих студентов, что тесты, хотя и стандартизированы, несправедливы по отношению к отдельному студенту. Некоторые студенты утверждают, что это «плохие тестирующие», что означает, что они нервничают и не сфокусированы на тестах. Следовательно, хотя тест является стандартным и должен предоставить справедливые результаты, тестируемые утверждают, что они находятся в невыгодном положении и не имеют возможности доказать свои знания в противном случае, так как нет другой альтернативы тестирования, которая позволяет студентам доказать свои знания и проблемы. Решение навыков.
Некоторые студенты испытывают тревогу . От десяти до сорока процентов студентов испытывают этот тип беспокойства. [ 83 ] Дети, живущие в бедности, наиболее поражены тестированием тревоги. [ 84 ] Тестирование тревоги применяется как к стандартизированным, так и к нестандартным тестам.
Испытания с несколькими вариантами выбора и форматы тестирования
[ редактировать ]
Тест с несколькими вариантами выбора предоставляет тестовому заряду вопросы в сочетании с заранее определенным списком возможных ответов. Это тип закрытого вопроса . Тест -брак выбирает правильный ответ из списка.
Многие критики стандартизированного объекта тестирования в формате с множественным выбором, который обычно используется для недорогого, крупномасштабного тестирования и который не подходит для некоторых целей, например, видя, может ли тестовый писатель написать абзац. Тем не менее, стандартизированное тестирование может использовать любой тестовый формат, включая открытые вопросы , при условии, что все тестирующие проводят один и тот же тест, в разумно схожих условиях и оцениваются так же.
Обучение испытанию
[ редактировать ]Преподавание в тесте - это процесс преднамеренного сужения инструкций, чтобы сосредоточиться только на материале, который будет измерен на тесте. Например, если учитель знает, что предстоящий исторический тест не будет включать какие -либо вопросы об истории музыки или искусства, то учитель может «преподавать тест», пропустив материал в учебнике о музыке и искусстве. Критики также обвиняют, что стандартизированные тесты поощряют « преподавание в испытании » за счет творчества и углубленного охвата субъектов, не входящих в тест. Критики говорят, что преподавание испытаний преодолевает обучение высшего порядка; Он трансформирует то, что учителям разрешено преподавать, и в значительной степени ограничивает объем другой информации, который студенты изучают на протяжении многих лет. [ 85 ] Хотя можно использовать стандартизированный тест, не позволяя его содержимому определять учебную программу и инструкции, часто, что не тестируется, не преподается, и как тестируется субъект, часто становится моделью для обучения субъекта.
Внешне навязанные тесты, такие как тесты, созданные Департаментом образования для учащихся в их регионе, поощряют учителей сузить формат учебного плана и преподавать в тесте. [ 86 ]
Заработная плата на основе эффективности -это идея о том, что учителям следует платить больше, если ученики хорошо выполняют тесты, и меньше, если они работают плохо. [ 85 ] Когда учителя или школы получают вознаграждение за лучшую работу в тестах, эти вознаграждения побуждают учителей « преподавать тест » вместо того, чтобы предоставлять богатую и широкую учебную программу. В 2007 году качественное исследование, проведенное Au Wayne, продемонстрировало, что стандартизированное тестирование сужает учебную программу и поощряет обучение, ориентированное на учителя, вместо обучения, ориентированного на учащихся . [ 87 ] Губернатор Нью -Джерси Крис Кристи предложил образовательную реформу в Нью -Джерси, которая дает учителей не только «преподавать тестирование», но и за тем, как их ученики выступают за потенциальную стоимость их зарплаты и обеспечения работы. Реформа требовала заработной платы на основе эффективности, которая зависит от выступлений студентов по стандартизированным тестам и их обучения. [ 88 ]
Критики утверждают, что чрезмерное использование и неправильное использование этих тестов наносят ущерб преподаванию и обучению, сузив учебную программу. Согласно группе Fairtest , когда стандартизированные тесты являются основным фактором подотчетности, школы используют тесты, чтобы узко определить учебную программу и инструкции по фокусировке. Ответственность создает огромное давление для выполнения, и это может привести к неправильному использованию и неверному толкованию стандартизированных тестов. [ 66 ]
Смотрите также
[ редактировать ]Основные темы
[ редактировать ]- Тест достижений
- Концепция инвентаризации - инструмент оценки знаний
- Оценка образования - метод оценки образования
- Оценка - систематическое определение заслуг, ценности и значимости субъекта
- Список стандартизированных тестов в Соединенных Штатах
- Психометрика - теория и техника психологического измерения
- Теория ответа предмета - парадигма для проектирования, анализа и оценки тестов
- Оценка на основе стандартов -оценка на основе указанных стандартов
- Тест (оценка) -
Другие темы
[ редактировать ]- Альтернативная оценка
- Закон Кэмпбелла - поговорка о извращенных стимулах
- Выпускной экзамен в старшей школе - Страницы экзаменов в старшей школе,
- IBM 805 Test Scoring Machine - Электромеханическая тестовая машина, представленная IBM на
- Реформа образования на основе стандартов -система образования, основанная на желаемых
- Эффект Volvo - термин для критики стандартизированного тестирования
Ссылки
[ редактировать ]- ^ Popham, WJ (1999). «Почему стандартизированные тесты не измеряют качество образования». Образовательное лидерство . 56 (6): 8–15.
- ^ Фелпс, Ричард П. «Роль и важность тестирования» . nonpartisaneducation.org . Получено 2016-05-17 .
- ^ Jump up to: а беременный в Олсон, Эми М.; Сабли, Даррелл (октябрь 2008 г.). «Стандартизированные тесты» . В хорошем, Томас Л. (ред.). Образование 21 -го века: справочный справочник . SAGE Publications. С. 423–430. doi : 10.4135/9781412964012.n46 . ISBN 9781452265995 Полем S2CID 241229809 .
- ^ Jump up to: а беременный в дюймовый и фон глин час я Аллен, Дж. Дональд; Росс, Аманда (2017-11-10). «Тесты с низкими ставками и этикетки» . Педагогика и содержание в математике средней и средней школы . Спрингер. ISBN 978-94-6351-137-7 .
- ^ «Китайская государственная служба» . Encyclopædia Britannica . Получено 2 мая 2015 года .
- ^ Jump up to: а беременный в дюймовый и Марк и Бойер (1996), 9–10.
- ^ Jump up to: а беременный Казин, Эдвардс и Ротман (2010), 142.
- ^ Jump up to: а беременный Trahair, Richard (2015-06-01). Поведение, технологии и организационное развитие: Эрик Трист и Институт Тавистока . ПРИБОРЫ Издатели. ISBN 9781412855495 .
- ^ Джонсон, Роберт. «Стандартизированные тесты». Энциклопедия образовательной реформы и инакомыслия. Sage Publications, Inc. 2010. 853–856.Web.
- ^ Гаррисон, Марк Дж. Мера неудачи: политическое происхождение стандартизированного тестирования. Олбани: Государственный университет Нью -Йорка, 2009. Печать.
- ^ Jump up to: а беременный Моллер, Стефани; Potochnick, Stephanie (2008). «Стандартизированные тесты». В Darity, Уильям -младший (ред.). Международная энциклопедия социальных наук . Gale Cengage Learning .
- ^ Гулд, SJ, «Нация дебил», новый ученый (6 мая 1982 г.), 349–352.
- ^ Дарти, Уильям -младший «Международная энциклопедия социальных наук» . Энциклопедии для справочной информации . Gale Cengage Learning . Получено 25 января 2017 года .
- ^ Флетчер, Дэн. «Стандартизированное тестирование». Время. Time Inc., 11 декабря 2009 года. Web. 09 марта 2014 года.
- ^ «Что на акте». ACT -тестовые разделы. NP, ND Web. 05 мая 2014 года
- ^ Стиггинс, Ричард (2002). «Кризис оценки: отсутствие оценки для обучения» (PDF) . Пхи Дельта Каппан . 83 (10): 758–765. doi : 10.1177/003172170208301010 . S2CID 145683785 .
- ^ Jump up to: а беременный Штраус, Валери (11 марта 2015 г.). «Пять причин стандартизированное тестирование не сдаст» . The Washington Post . The Washington Post . Получено 26 января 2017 года .
- ^ «История и опыт не оставшегося ребенка». Bright Hub Education9 июня 2015 года. Веб. 12 октября 2015 года .
- ^ «Каждый студент добивается успеха (ESSA) | Департамент образования США» .
- ^ Клэйборн, Чарльз. «Высокие ставки». Энциклопедия одаренности, творчества и таланта. Sage Publications, 2009. 9 апреля 2014 года.
- ^ Валери, Штраус (21 июня 2020 г.). «Похоже, начало окончания одержимости Америки становятся стандартизированными студенческими тестами» . The Washington Post .
- ^ «Дом - Австралийская учебная программа v8.1» . www.australiancurriculum.edu.au . Получено 2016-05-17 .
- ^ Коули, Питер; Макферсон, Пейдж (2022). Тестирование канадских студентов K-12: региональная изменчивость, место для улучшения (PDF) . Фрейзер Институт. ISBN 978-0-88975-694-6 Полем Получено 19 декабря 2023 года .
- ^ Горовиц, MR; Монтгомери, Д.Л. (январь 1993 г.). «Физиологический профиль пожарных по сравнению с нормами для канадской популяции». Канадский журнал общественного здравоохранения . 84 (1): 50–52. ISSN 0008-4263 . PMID 8500058 .
- ^ Канадская ассоциация спортивных наук; Программа сертификации и аккредитации по оценке фитнеса; Канадское общество физиологии упражнений; Fitness Canada (1987). Канадский стандартизированный тест пригодности (CSTF): в возрасте от 15 до 69 лет: Руководство по интерпретации и консультированию . Глостер, Онтарио: Канадское общество физиологии упражнений. ISBN 0-662-15736-2 Полем OCLC 16048356 .
- ^ Ets Webage Archived 2009-06-18 на The Wayback Machine о забитии GRE.
- ^ Jump up to: а беременный HOUTZ, Джолайн (27 августа 2000 г.) «Тримпейт потратьте всего минуты, чтобы забить государственный тест. 1 № 2 минуты " Архивировано 2007-03-10 на машине Wayback . Seattle Times " За считанные минуты температура за 10 долларов за час назначает оценку теста вашего ребенка "
- ^ Rich, Motoko (2015-06-22). «Оценка общего ядра: опыт преподавания не требуется» . New York Times . ISSN 0362-4331 . Получено 2015-10-06 .
- ^ Ли, Юссим (1989). «Ожидания учителя: самоисполняющие пророчества, смещение восприятия и точность». Журнал личности и социальной психологии . 57 (3): 469–480. doi : 10.1037/0022-3514.57.3.469 .
- ^ Там, где мы стоим: оценка и ответственность на основе стандартов (Американская федерация учителей) [1] Архивировано 24 августа 2006 г., на машине Wayback
- ^ «Совместный комитет по стандартам для оценки образования» . Архивировано из оригинала 15 октября 2009 года . Получено 2 мая 2015 года .
- ^ Совместный комитет по стандартам для оценки образования. (1988). Стандарты оценки персонала: как оценить системы для оценки педагогов. Архивированный 2005-12-12 в машине Wayback Newbury Park, CA: Sage Publications.
- ^ Совместный комитет по стандартам для оценки образования. (1994). Стандарты оценки программы, 2 -е издание. Архивированный 2006-02-22 в машине Wayback Newbury Park, CA: Sage Publications.
- ^ Комитет по стандартам для оценки образования. (2003). Стандарты оценки студентов: как улучшить оценки студентов. Архивированный 2006-05-24 в машине Wayback Newbury Park, CA: Corwin Press.
- ^ Морган, Хани (2016). «Опираясь на стандартизированные тесты с высокими ставками для оценки школ и учителей: плохая идея». Клярный дом: журнал образовательных стратегий, проблем и идей . 89 (2): 67–72. doi : 10.1080/00098655.2016.1156628 . S2CID 148015644 .
- ^ «Стандарты для образовательного и психологического тестирования» . www.apa.org . Получено 2 мая 2015 года .
- ^ Кунсель, NR; Hezlett, SA (2007). «Оценка: стандартизированные тесты предсказывают успех аспирантов». Наука . 315 (5815): 1080–81. doi : 10.1126/science.1136618 . PMID 17322046 . S2CID 143260128 .
- ^ Jump up to: а беременный в дюймовый Фелпс, Ричард (2005). Защита стандартизированного тестирования . Лондон: Psychology Press. ISBN 978-0-8058-4912-7 .
- ^ Jump up to: а беременный «Плюсы и минусы стандартизированных тестов» . Оксфордское обучение . 2014-10-29 . Получено 2018-02-19 .
- ^ «Плюсы и минусы стандартизированного тестирования» (PDF) . Колумбийский университет . Весна 2013. Архивировано из оригинала (PDF) 2018-01-27 . Получено 19 февраля 2018 года .
- ^ Jump up to: а беременный Хирш, Эрик -младший (1999). Школы, которые нам нужны: и почему у нас их нет . Нью -Йорк: якорь. ISBN 978-0-385-49524-0 .
- ^ «Справедливая критика SAT» . fairtest.org. 20 августа 2007 г.
- ^ «Стандартизированные тесты не всегда лучший показатель успеха» . 20 августа 2007 г.
- ^ Патон, Грэм (6 июля 2010 г.). «Университеты критикуют экзамен« инфляция оценки » . Ежедневный телеграф . Лондон Архивировано из оригинала 2022-01-12.
- ^ Васагар, Дживан (2 августа 2010 г.). «Опасения за государственных учеников, поскольку лучшие университеты настаивают на* на уровне A» . Хранитель . Лондон
- ^ Финч, Джулия (10 марта 2010 г.). «Они не могут читать, не могут писать, сохранить время или быть аккуратными: вердикт директора Tesco о школьных лидерах» . Хранитель . Лондон
- ^ Хеджес, Ларри В.; Лейн, Ричард Д.; Гринвальд, Роб (1994). «Хеджес Л.В. (1994). Обмен: часть I*: Деньги имеют значение? Метаанализ исследований влияния дифференциальных школьных ресурсов на результаты учащихся». Образовательный исследователь . 23 (3): 5–14. doi : 10.3102/0013189x023003005 . S2CID 36771659 .
- ^ Кафлан, Шон. Яркий бедный «сдерживается на протяжении десятилетий» , Би -би -си , 16 октября 2013 года. Получено 17 октября 2013 года.
- ^ «Нейробиология стандартизированного тестирования» .
- ^ «Стандартизированные тесты не показывают, что знают дети» . 10 июля 2017 года.
- ^ «Стандартизированные тесты не являются хорошими показателями интеллекта жидкости в соответствии с новым исследованием» . 11 января 2014 года.
- ^ «Стандартизированные тесты не измеряют интеллект или способность» . 27 сентября 2016 года.
- ^ «Наблюдения: стандартизированные результаты тестов не отражают способности учащихся» .
- ^ Дэвидсон, Кэти (2011). Теперь вы видите это: как наука о мозге внимания изменит способ, которым мы живем, работаем и учимся . Нью -Йорк: викинг.
- ^ Американские новости (2 мая 2015 г.). «Скандал с мошенничеством: федералы говорят, что учителя наняли, чтобы сдать свои сертификационные тесты» . NBC News . Получено 2 мая 2015 года .
- ^ Шмидт, Уильям Х.; Houang, Richard T. (2012). «Учебная когерентность и общие основные стандарты для математики». Образовательный исследователь . 41 (8): 294–308. doi : 10.3102/0013189x12464517 . S2CID 121779439 .
- ^ Портер, а.; McMaken, J.; Hwang, J.; Ян Р. (2011). «Common Core Standards: новая американская учебная программа». Образовательный исследователь . 40 (7): 103–116. doi : 10.3102/0013189x11405038 . S2CID 51453603 .
- ^ Лейтон, Линдси (24 октября 2015 г.). «Исследование говорит, что стандартизированное тестирование является подавляющим государственными школами страны» . The Washington Post . Получено 26 июля 2015 года .
- ^ Доринг, Кристофер (25 октября 2015 г.). «План Обамы ограничивает стандартизированное тестирование не более чем на 2% времени класса» . USA сегодня . Получено 26 июля 2016 года .
- ^ Кучински-Браун, Алекс. «Стандартизированные затраты на тестирование составляют 1,7 миллиарда долларов в год, обнаруживает исследование». Huffington Post. Thehuffingtonpost.com, 29 ноября 2012 года. Веб. 7 апреля 2014 года.
- ^ «Большая четверка индустрии тестирования» . PBS Frontline . Пбс. 2001 . Получено 2015-01-21 .
- ^ «Просмотрите все темы - национальная пресса академий» . Архивировано из оригинала 2008-04-18 . Получено 2 мая 2015 года .
- ^ «Плюсы и минусы стандартизированного тестирования» (PDF) . Колумбийский университет. 21 ноября 2017 года.
- ^ Нил, Монти (осень 2009 г.). Стандартизированные тесты несправедливы и вредны . Детройт: Фармингтон -Хиллз, Мичиган: Greenhaven Press. С. 28–35. ISBN 9780737747812 Полем Получено 4 декабря 2016 года .
- ^ Шахтер, Барбара (август 2000). «Стандартизированные умы: высокая цена культуры тестирования Америки и то, что мы можем сделать, чтобы изменить ее / противоречия школьной реформы: затраты на образование стандартизированного тестирования». Прогрессивный . 64 : 40–43. ProQuest 231959849 .
- ^ Jump up to: а беременный Holloway, JH (2001). «Использование и неправильное использование стандартизированных тестов». Образовательное лидерство . 59 (1): 77.
- ^ Мерфи, Сара С; Клигер, Дэвид М; Борнман, Мэтью Дж; Кунсель, Натан Р. (2009). «Предсказательная сила личных заявлений в приемных комиссиях: метаанализ и предостерегающий рассказ» . Колледж и университет . 84 : 83–86, 88.
- ^ Кунсель, Натан; Сакетт, Пол (8 марта 2018 г.). «Правда о SAT и ACT» . Wall Street Journal .
- ^ Кунсель, Натан; Хезлетт, Сара А. (2007). «Стандартизированные тесты предсказывают успех аспирантов» . Наука . 315 (5815): 1080–1. doi : 10.1126/science.1136618 . PMID 17322046 . S2CID 143260128 .
- ^ Jump up to: а беременный Кунсель, Натан; Хезлетт, Сара А. (2007). «Стандартизированные тесты предсказывают успех аспирантов» . Наука . 315 (5815): 1080–1081. doi : 10.1126/science.1136618 . PMID 17322046 . S2CID 143260128 .
- ^ Парк, Грегори; Любинский, Дэвид; Бенбоу, Камилла П. (1 октября 2008 г.). «Различия способностей среди людей, имеющих соразмерность степени для научного творчества». Психологическая наука . 19 (10): 957–961. doi : 10.1111/j.1467-9280.2008.02182.x . PMID 19000201 . S2CID 6443429 .
- ^ Кунсель, Натан; Арнесон (2009). «Объясняет ли социально-экономический статус взаимосвязь между тестами на прием и успешной успеваемостью?» Полем Психологический бюллетень : 1–22.
- ^ Коннелли, Брайан С.; Кунсель, Натан (3 ноября 2012 г.). «Балансировка лечебных и контрольных групп в квазиэкспериментах: введение в оценку склонности». Персональная психология . 66 (2): 407–442. doi : 10.1111/peps.12020 .
- ^ Couch, Майкл; Мороз, Маркиша; Сантьяго, Дж.; Хилтон, Адриэль (2021-09-09). «Переосмысление стандартизированного тестирования с точки зрения доступа, справедливости и достижений: что -то изменилось для афроамериканских студентов?» Полем Журнал исследовательских инициатив . 5 (3). ISSN 2168-9083 .
- ^ Кунсель, Натан; Сакетт, Пол; Битти, Адам С. (2 августа 2012 г.). «Роль социально-экономического статуса в отношениях SAT и в принятии колледжа». Психологическая наука . 23 (9): 1000–7. doi : 10.1177/0956797612438732 . PMID 22858524 . S2CID 22703783 .
- ^ Jump up to: а беременный в дюймовый и фон глин Калифорнийский университет, Академический Сенат (январь 2020 г.). «Отчет о стандартизированной целевой группе тестирования Академического совета UC» (PDF) .
- ^ Редакция (17 мая 2020 года). «Калифорния определяет тестирование» . Wall Street Journal .
- ^ Тодд Моррисон и Мелани Моррисон. «Метааналитическая оценка прогнозной достоверности ...» Журнал образовательного и психологического измерения. 1995. ComponentShttp: //epm.sagepub.com/content/55/2/309.abstract.
- ^ Бакли, Джек; Летукас, Линн; Wildavsky, Ben (2017), Измерение успеха: тестирование, оценки и будущее поступления в колледж , Балтимор: издательство Джона Хопкинса, с. 344, ISBN 9781421424965
- ^ Кон, Альфи (2000). Дело против стандартизированного тестирования: повышение баллов, разрушая школы . Портсмут, NH: Heinemann. ISBN 978-0325003252 .
- ^ Преподавать: Путешествие учителя, Уильям Айерс, Pecsemers College Press, 1993, ISBN 0-8077-3985-5 , ISBN 978-0-8077-3985-3 , стр. 116
- ^ Козол, Джонатан (2005). Стыд нации: восстановление апартеидского обучения в Америке . Печать: случайный дом. С. 118–119. ISBN 9781415924167 .
- ^ Древесина; Харт; Маленький; Филлипс (2016). «Тестовая тревога и стандартный тест на понимание чтения с высокими ставками: перспектива поведенческой генетики» . Merrill-Palmer Quarterly . 62 (3): 233–251. doi : 10.13110/merrpalmquar1982.62.3.0233 . ISSN 0272-930X . PMC 5487000 . PMID 28674461 .
- ^ «Тесты и предвзятость стресса» . Гарвардская аспирантура образования . 12 февраля 2019 года . Получено 2022-10-27 .
- ^ Jump up to: а беременный Уильямс, Мэри (2015). «Стандартизированное тестирование наносит ущерб обучению студентов» . go.galegroup.com . Получено 28 марта 2018 года .
- ^ «Госвами У (1991). Проверьте: влияние внешнего тестирования на учителей. Исследователь образования 20: 8-11» . Архивировано с оригинала 2013-02-02.
- ^ AU, Wayne (2007-06-01). «Тестирование с высокими ставками и контроль учебных программ: качественный метасинтез». Образовательный исследователь . 36 (5): 258–267. doi : 10.3102/0013189x07306523 . ISSN 0013-189X . S2CID 507582 .
- ^ Арко, Мэтт (12 июня 2015 г.). «Речь в образовании Christie в Айове» . Nj.com . Получено 25 июля 2016 года .
96.) Теста 2
Дальнейшее чтение
[ редактировать ]- Справедливый, «Что не так со стандартизированными тестами», архивировано 2019-10-18 в информационном бюллетене Wayback Machine . (Нью -Йорк: Основные книги, 1985), с. 172–181.
- Харрис, Смит и Харрис Мифы о стандартизированных тестах: почему они не говорят вам, что, по вашему мнению, они делают, Rowman & Littlefield 2011* Huddleston, Mark W. Boyer, William W. Высшая государственная служба в Соединенных Штатах: поиск к реформа (Университет Питтсбург Пресс, 1996)
- Фелпс, Ричард П. Влияние тестирования на успеваемость учащихся, 1910–2010 , Международный журнал тестирования, 10 (1), 2012.
- Фелпс, Ричард П., изд. Исправление ошибок в образовании и психологическом тестировании . (Вашингтон, округ Колумбия: Американская психологическая ассоциация, 2008)
- Фелпс, Ричард П., Стандартизированное тестирование праймер. (Нью -Йорк, Нью -Йорк: Питер Ланг, 2007)
- Фелпс, Ричард П. Роль и важность стандартизированного тестирования в мире преподавания и обучения
- Равич, Дайан , «Использование и неправомерность испытаний» архивировали 2017-10-18 на машине Wayback , в школах, которые мы заслуживаем * Штраус, Валери. Подтверждено: стандартизированное тестирование захватило наши школы. Но кто виноват?