Статистическое предположение
Статистика , как и все математические дисциплины, не делает обоснованных выводов из ничего. Чтобы сделать интересные выводы о реальных статистических популяциях, почти всегда требуются некоторые исходные предположения. Эти предположения должны быть сделаны осторожно, потому что неправильные предположения могут привести к совершенно неверным выводам.
Вот несколько примеров статистических предположений:
- Независимость наблюдений друг от друга (это предположение является особенно распространенной ошибкой [1] ).
- Независимость ошибки наблюдения от потенциальных мешающих эффектов.
- Точная или приблизительная нормальность наблюдений (или ошибок).
- Линейность градуированных ответов на количественные стимулы, например, в линейной регрессии .
Классы предположений
[ редактировать ]Существует два подхода к статистическому выводу : вывод на основе модели и вывод на основе дизайна . [2] [3] [4] Оба подхода полагаются на некоторую статистическую модель для представления процесса генерации данных. В модельном подходе модель считается изначально неизвестной, и одной из целей является выбор подходящей модели для вывода. В подходе, основанном на дизайне, модель считается известной, и одна из целей состоит в том, чтобы гарантировать, что выборочные данные выбираются достаточно случайным образом для вывода.
Статистические предположения можно разделить на два класса, в зависимости от того, какой подход к выводу используется.
- Предположения, основанные на модели. К ним относятся следующие три типа:
- Распределительные предположения. Если статистическая модель включает в себя термины, относящиеся к случайным ошибкам , можно сделать предположения о распределении вероятностей этих ошибок. [5] В некоторых случаях предположение о распределении относится к самим наблюдениям.
- Структурные предположения. Статистические отношения между переменными часто моделируются путем приравнивания одной переменной к функции другой (или нескольких других) плюс случайной ошибки . Модели часто включают в себя структурные предположения о форме функциональной зависимости, например, как в линейной регрессии . Это можно обобщить на модели, включающие отношения между лежащими в основе ненаблюдаемыми скрытыми переменными .
- Предположения о перекрестных вариациях. Эти предположения включают совместное распределение вероятностей либо самих наблюдений, либо случайных ошибок в модели. Простые модели могут включать предположение о том, что наблюдения или ошибки статистически независимы .
- Предположения, основанные на проектировании. Они связаны со способом сбора данных и часто предполагают рандомизацию во время выборки . [6] [7]
Подход, основанный на моделях, наиболее часто используется для статистических выводов; подход, основанный на дизайне, используется в основном при выборке обследований . При подходе, основанном на модели, все предположения эффективно закодированы в модели.
Проверка предположений
[ редактировать ]Учитывая, что обоснованность любого вывода, сделанного на основе статистических выводов, зависит от обоснованности сделанных предположений, очевидно, что эти предположения следует пересмотреть на каком-то этапе. В некоторых случаях (например, при отсутствии данных ) исследователям может потребоваться оценить, является ли предположение разумным. Исследователи могут несколько расширить это, чтобы рассмотреть, какой эффект может произвести отклонение от предположений. При наличии более обширных данных различные типы процедур проверки статистической модели доступны , например, проверка регрессионной модели .
Пример: Независимость наблюдений
[ редактировать ]Сценарий:Представьте себе исследование, оценивающее эффективность нового метода обучения в нескольких классах. Если классы рассматриваются не как независимые объекты, а как единое целое, предположение о независимости нарушается. Учащиеся в одном классе могут иметь общие характеристики или опыт, что приводит к коррелирующим наблюдениям.
Последствие:Неспособность учесть это отсутствие независимости может привести к завышению воспринимаемого воздействия метода обучения, поскольку результаты в классе могут оказаться более похожими, чем предполагалось. Это может привести к переоценке возможности обобщения метода на различные образовательные учреждения.
См. также
[ редактировать ]- Неправильное использование статистики
- Надежная статистика
- Статистическая проверка гипотез
- Статистическая теория
Примечания
[ редактировать ]- ^ Краскалл, 1988
- ^ Кох Г.Г., Гиллингс Д.Б. (2006), «Выводы, основанные на дизайне и на основе моделей», Энциклопедия статистических наук (редактор - Коц С.), Wiley-Interscience .
- ^ Кокс, 2006, глава 9.
- ^ де Грюйтер и др., 2006, §2.2.
- ^ Макферсон, 1990, §3.4.1
- ^ Макферсон, 1990, §3.3
- ^ де Грюйтер и др., 2006, §2.2.1
Эта статья включает список общих ссылок , но в ней отсутствуют достаточные соответствующие встроенные цитаты . ( февраль 2010 г. ) |
Ссылки
[ редактировать ]- Кокс Д.Р. (2006), Принципы статистического вывода , издательство Кембриджского университета .
- де Грюйтер Дж., Брус Д., Биркенс М., Ноттерс М. (2006), Отбор проб для мониторинга природных ресурсов , Springer-Verlag .
- Краскал, Уильям (декабрь 1988 г.). «Чудеса и статистика: случайное обретение независимости (послание президента АСА)» . Журнал Американской статистической ассоциации . 83 (404): 929–940. дои : 10.2307/2290117 . JSTOR 2290117 .
- Макферсон, Г. (1990), Статистика в научных исследованиях: ее основа, применение и интерпретация , Springer-Verlag . ISBN 0-387-97137-8