Хорошая статистика
Эта статья написана как личное размышление, личное эссе или аргументативное эссе , в котором излагаются личные чувства редактора Википедии или представлен оригинальный аргумент по определенной теме. ( сентябрь 2009 г. ) |
Эта статья включает список общих ссылок , но в ней отсутствуют достаточные соответствующие встроенные цитаты . ( Ноябрь 2010 г. ) |
Хотя термин «хорошая статистика» часто используется в научной литературе примерно так же, как термин « хорошая статистика » в математике (то есть в значении «непатологический » ) . [1] [2] ) ему также можно придать точное математическое значение, причем несколькими способами. В первом случае значение этого термина будет варьироваться от контекста к контексту. В последнем случае математические условия можно использовать для вывода классов комбинаций распределений со статистикой, которые являются хорошими во всех смыслах.
Первое определение: дисперсия является то , корректной статистической оценки конечна, и одним из условий ее среднего что она дифференцируема по оцениваемому параметру. [3]
Второе определение: статистика монотонна, четко определена и локально достаточна. [4]
корректной статистики: определение Условия первое
Более формально условия можно выразить таким образом. это статистика для это функция выборки, . Для Чтобы вести себя хорошо, нам необходимо:
: Условие 1
дифференцируемый в , а производная удовлетворяет:
: Условие 2
хорошего поведения статистики: определение Условия второе
Чтобы вывести закон распределения параметра T , совместимый с , статистика должна подчиняться некоторым техническим свойствам. А именно, статистика s называется « хорошей», если она удовлетворяет следующим трем утверждениям:
- монотонность . существует равномерно монотонная связь Между s и ? . для любого фиксированного семени – так, чтобы иметь единственное решение задачи (1);
- четко определенный . Для каждого наблюдаемого s статистика четко определена для каждого значения ?, т. е. для любой спецификации выборки. такой, что имеет плотность вероятности, отличную от 0, чтобы избежать рассмотрения несюръективного отображения из к , т.е. связывание через к образцу а? что не удалось сгенерировать сам образец;
- местная достаточность . представляет собой истинную выборку T для наблюдаемого s , так что каждому выбранному значению можно приписать одно и то же распределение вероятностей. Сейчас, является решением (1) с затравкой . Поскольку семена распределены поровну, единственное предостережение связано с их независимостью или, наоборот, с их зависимостью от ? сам. Эту проверку можно ограничить начальными числами, участвующими в s , т.е. этого недостатка можно избежать, потребовав, чтобы распределение не зависит от ?. Простой способ проверить это свойство — сопоставить начальные характеристики с характеристики. Отображение, конечно, зависит от ?, но распределение не будет зависеть от ?, если сохраняется указанная выше независимость от начального числа – условие, которое выглядит как локальная достаточность статистики S .
Оставшаяся часть настоящей статьи в основном посвящена контексту процедур интеллектуального анализа данных , применяемых для статистического вывода и, в частности, к группе трудоемких процедур, которые называются алгоритмическим выводом .
Алгоритмический вывод [ править ]
В алгоритмическом выводе наиболее важным свойством статистики является поворотный шаг, который позволяет перенести соображения вероятности с выборочного распределения на распределение параметров, представляющих распределение совокупности, таким образом, что вывод этого статистического вывода Шаг вывода совместим с фактически наблюдаемой выборкой.
По умолчанию заглавные буквы (например, U , X ) обозначают случайные величины, а строчные буквы ( u , x ) — их соответствующие реализации, а также готические буквы (например, ) область, в которой переменная принимает спецификации. Перед образцом , учитывая механизм выборки , с скаляр, для случайной величины X мы имеем
Механизм выборки , статистики s , как функция ? из со спецификациями в , имеет объясняющую функцию, определяемую основным уравнением:
для подходящих семян и параметр?
Пример [ править ]
Например, как для распределения Бернулли с параметром p, так и для экспоненциального распределения с параметром ? статистика хорошо себя ведет. Удовлетворение трех вышеупомянутых свойств является очевидным, если рассматривать обе объясняющие функции: если , 0 в противном случае в случае случайной величины Бернулли и для экспоненциальной случайной величины, что приводит к статистике
и
И наоборот , в случае X, следующего за непрерывным равномерным распределением на та же статистика не отвечает второму требованию. Например, наблюдаемый образец дает . этого X Но объясняющая функция .Следовательно, основное уравнение будет производить собразец U и решение . Это противоречит наблюдаемому образцу, поскольку первое наблюдаемое значение должно превышать правый крайний предел X. диапазона Статистика в данном случае ведет себя хорошо.
Аналогично, для случайной величины X, следующей за распределением Парето с параметрами K и A ( см. в примере Парето подробнее об этом случае ):
и
могут использоваться в качестве совместной статистики для этих параметров.
В качестве общего утверждения, справедливого в слабых условиях, достаточная статистика хорошо себя ведет по отношению к соответствующим параметрам. В таблице ниже приведены достаточные/хорошие статистические данные для параметров некоторых наиболее часто используемых распределений вероятностей.
Распределение | Определение функции плотности | Достаточная/хорошая статистика |
---|---|---|
Равномерный дискретный | ||
Бернулли | ||
Биномиальный | ||
Геометрический | ||
Пуассон | ||
Равномерное непрерывное | ||
Отрицательная экспонента | ||
Парето | ||
Гауссовский | ||
Гамма |
Ссылки [ править ]
- ^ Дон Якобуччи. «Анализ посредничества и категориальные переменные: последний рубеж» (PDF) . Проверено 7 февраля 2017 г.
- ^ Джон Динардо; Джейсон Уинфри. «Закон гениальности и хоум-ранов опровергнут» (PDF) . Проверено 7 февраля 2017 г.
- ^ ДасГупта. «(без названия)» (PDF) . Проверено 7 февраля 2017 г.
{{cite web}}
: Cite использует общий заголовок ( справка ) - ^ Аполлони, Б; Бассис, С.; Мальчиоди, Д.; Витольд, П. (2008). Загадка гранулярных вычислений . Исследования в области вычислительного интеллекта. Том. 138. Берлин: Шпрингер.
- Бахадур, РР ; Леманн, Э.Л. (1955). «Два комментария о достаточности и статистических функциях принятия решений» . Анналы математической статистики . 26 : 139–142. дои : 10.1214/aoms/1177728604 .