Параметрическая статистика
Параметрическая статистика — это раздел статистики, в котором используются модели, основанные на фиксированном (конечном) наборе параметров . [1] И наоборот, непараметрическая статистика не предполагает явных (конечно-параметрических) математических форм распределений при моделировании данных. Однако он может делать некоторые предположения об этом распределении, такие как непрерывность или симметрия, или даже явную математическую форму, но иметь модель для параметра распределения, которая сама по себе не является конечно-параметрической.
Большинство известных статистических методов являются параметрическими. [2] Что касается непараметрических (и полупараметрических) моделей, сэр Дэвид Кокс сказал: «Они обычно включают меньше предположений о структуре и форме распределения, но обычно содержат сильные предположения о независимости». [3]
Пример [ править ]
Все нормальное семейство распределений имеют одинаковую общую форму и параметризуются средним значением и стандартным отклонением . Это означает, что если известны среднее значение и стандартное отклонение и если распределение нормальное, известна вероятность того, что любое будущее наблюдение окажется в заданном диапазоне.
Предположим, что у нас есть выборка из 99 результатов тестов со средним значением 100 и стандартным отклонением 1. Если мы предположим, что все 99 результатов тестов являются случайными наблюдениями из нормального распределения, то мы прогнозируем, что существует 1% вероятность того, что 100-й тест Оценка будет выше 102,33 (то есть среднее значение плюс 2,33 стандартных отклонения), если предположить, что 100-я оценка теста происходит из того же распределения, что и остальные. Параметрические статистические методы используются для вычисления значения 2,33, указанного выше, с учетом 99 независимых наблюдений из одного и того же нормального распределения.
Непараметрическая оценка того же самого предмета — это максимум первых 99 баллов. Нам не нужно ничего предполагать о распределении результатов тестов, чтобы понять, что до того, как мы провели тест, с равной вероятностью наивысший результат будет любым из первых 100. Таким образом, существует вероятность 1%, что 100-й балл будет выше, чем любой из 99, которые ему предшествовали.
История [ править ]
Параметрическая статистика была упомянута Р. А. Фишером в его работе «Статистические методы для научных работников» в 1925, заложившей основу современной статистики.
См. также [ править ]
- Агрегированное распределение
- Все модели неправильные
- Обратная задача
- Параметрическая модель
- Достаточная статистика
Ссылки [ править ]
- ^ Гейссер, С. (2006), Способы параметрического статистического вывода , John Wiley & Sons
- ^ Кокс, Д.Р. (2006), Принципы статистического вывода , издательство Кембриджского университета.
- ^ Кокс 2006 , с. 2