Jump to content

Информант (статистика)

(Перенаправлено из Оценка (статистика) )

В статистике оценка информатор или ( [1] ) — градиент логарифмической функции правдоподобия относительно вектора параметров . Оценка, оцениваемая в конкретной точке вектора параметров, указывает на крутизну функции логарифмического правдоподобия и, следовательно, на чувствительность к бесконечно малым изменениям значений параметров. Если функция логарифмического правдоподобия непрерывна в пространстве параметров , оценка будет равна нулю при локальном максимуме или минимуме ; этот факт используется при оценке максимального правдоподобия , чтобы найти значения параметров, которые максимизируют функцию правдоподобия.

Поскольку оценка является функцией наблюдений , которые подвержены ошибкам выборки , она поддается тестовой статистике, известной как тест оценки , в которой параметр удерживается на определенном значении. Кроме того, отношение двух функций правдоподобия , оцененных при двух различных значениях параметров, можно понимать как определенный интеграл оценочной функции. [2]

Определение

[ редактировать ]

Оценка представляет собой градиент (вектор частных производных ) , натуральный логарифм по функции правдоподобия отношению к m -мерному вектору параметров .

Эта дифференциация дает вектор-строка для каждого значения и , и указывает чувствительность вероятности (ее производная, нормированная по ее значению).

В древней литературе [ нужна ссылка ] «линейная оценка» может относиться к оценке относительно бесконечно малого перемещения заданной плотности. Это соглашение возникло в то время, когда основным интересующим параметром было среднее или медиана распределения. В этом случае вероятность наблюдения определяется плотностью вида [ нужны разъяснения ] . «Линейная оценка» тогда определяется как

Характеристики

[ редактировать ]

Иметь в виду

[ редактировать ]

Хотя оценка является функцией , это тоже зависит от наблюдений на котором оценивается функция правдоподобия, и ввиду случайного характера выборки можно взять ее ожидаемое значение по выборочному пространству . При определенных условиях регулярности функций плотности случайных величин [3] [4] ожидаемое значение оценки, оцененное по истинному значению параметра , равен нулю. Чтобы увидеть это, перепишем функцию правдоподобия как функция плотности вероятности и обозначим пространство выборки . Затем:

Предполагаемые условия регулярности допускают замену производной и интеграла (см. правило интеграла Лейбница ), поэтому приведенное выше выражение можно переписать как [ нужны разъяснения ]

Стоит переформулировать приведенный выше результат словами: ожидаемое значение оценки при истинном значении параметра. равен нулю. Таким образом, если бы кто-то неоднократно производил выборку из некоторого распределения и неоднократно вычислял оценку, то среднее значение оценок асимптотически стремилось бы к нулю .

Дисперсия

[ редактировать ]

Разница в счете, , может быть получено из приведенного выше выражения для ожидаемого значения.

Следовательно, дисперсия оценки равна отрицательному ожидаемому значению матрицы Гессе логарифмического правдоподобия. [5]

Последняя известна как информация Фишера и записывается . Обратите внимание, что информация Фишера не является функцией какого-либо конкретного наблюдения, поскольку случайная величина было усреднено. Эта концепция информации полезна при сравнении двух методов наблюдения за некоторым случайным процессом .

Процесс Бернулли

[ редактировать ]

Представьте себе, что вы наблюдаете за первыми n попытками процесса Бернулли и видите, что A из них являются успешными, а остальные B — неудачными, где вероятность успеха равна θ .

Тогда вероятность является

так что оценка s равна

Теперь мы можем убедиться, что математическое ожидание оценки равно нулю. Отмечая, что математическое ожидание A равно , а математическое ожидание B равно n (1 − θ ) (напомним, что A и B — случайные величины), мы видим, что математическое ожидание s равно

Мы также можем проверить дисперсию . Мы знаем, что A + B = n (поэтому B = n A ), а дисперсия A равна (1 − θ ), поэтому дисперсия s равна

Модель двоичного результата

[ редактировать ]

Для моделей с двоичными результатами ( Y = 1 или 0) модель можно оценить с помощью логарифма прогнозов.

где p — вероятность в оцениваемой модели, а S — оценка. [6]

Приложения

[ редактировать ]

Алгоритм подсчета очков

[ редактировать ]

Алгоритм оценки представляет собой итерационный метод численного определения максимального правдоподобия оценки .

Оценка теста

[ редактировать ]

Обратите внимание, что является функцией и наблюдение , так что, в общем-то, это не статистика . Однако в некоторых приложениях, таких как тест на оценку , оценка оценивается по определенному значению (например, значение нулевой гипотезы), и в этом случае результатом является статистика. Интуитивно понятно, что если ограниченная оценка близка к максимуму функции правдоподобия, оценка не должна отличаться от нуля более чем на ошибку выборки . В 1948 году Ч.Р. Рао впервые доказал, что квадрат результата, разделенный информационной матрицей, подчиняется асимптотике χ 2 -распределение при нулевой гипотезе. [7]

Также обратите внимание, что критерий отношения правдоподобия определяется выражением

что означает, что тест отношения правдоподобия можно понимать как область под оценочной функцией между и . [8]

Сопоставление оценок (машинное обучение)

[ редактировать ]

Сопоставление оценок описывает процесс применения алгоритмов машинного обучения (обычно нейронных сетей ) для аппроксимации функции оценки. неизвестного дистрибутива из конечных выборок. Изученная функция затем можно использовать в генеративном моделировании для получения новых образцов из . [9]

Может показаться странным, что слово «оценка» использовалось для обозначения , поскольку это не функция правдоподобия и не имеет производной по параметрам. Дополнительную информацию об этом определении см. в указанном документе. [10]

Термин «оценочная функция» на первый взгляд может показаться несвязанным с его современным значением, которое сосредоточено вокруг производной логарифмической функции правдоподобия в статистических моделях. Это кажущееся несоответствие можно проследить до исторического происхождения этого термина. Понятие «оценочной функции» было впервые введено британским статистиком Рональдом Фишером в его статье 1935 года под названием «Обнаружение связи с «доминантными» аномалиями». [11] Фишер использовал этот термин в контексте генетического анализа, особенно для семей, где у одного из родителей была доминирующая генетическая аномалия. Со временем применение и значение «оценочной функции» изменились, отклонившись от первоначального контекста, но сохранив свои основополагающие принципы. [12] [13]

Первоначально Фишер использовал этот термин в контексте анализа генетических признаков в семьях, где один из родителей обладал генетической аномалией. Он разделил детей таких родителей на четыре класса на основе двух бинарных признаков: унаследовали ли они аномалию или нет, а также их зиготного статуса как гомозиготного или гетерозиготного. Фишер разработал метод присвоения каждой семье «балла», рассчитанного на основе количества детей, попадающих в каждую из четырех категорий. Этот показатель использовался для оценки того, что он называл «параметром сцепления», который описывал вероятность наследования генетической аномалии. Фишер оценил эффективность своего правила оценки, сравнив его с альтернативным правилом и с тем, что он назвал «идеальным результатом». Идеальная оценка определялась как производная логарифма плотности выборки, как упоминалось на странице 193 его работы. [11]

Термин «оценка» позже развился в ходе последующих исследований, заметно выйдя за рамки конкретного применения в генетике, к которому первоначально обращался Фишер. Различные авторы адаптировали оригинальную методологию Фишера к более обобщенному статистическому контексту. В этих более широких приложениях термин «оценка» или «эффективная оценка» стал чаще относиться к производной логарифмической функции правдоподобия рассматриваемой статистической модели. На это концептуальное расширение значительное влияние оказала статья Ч.Р. Рао 1948 года, в которой были представлены «эффективные тесты оценки», в которых использовалась производная логарифмической функции правдоподобия. [14]

Таким образом, то, что начиналось как специальный термин в области генетической статистики, превратилось в фундаментальную концепцию более широкой статистической теории, часто связанную с производной логарифмической функции правдоподобия.


См. также

[ редактировать ]
  • Информация Фишера - понятие в статистике
  • Теория информации - Научное исследование цифровой информации.
  • Тест на оценку - статистический тест, основанный на градиенте функции правдоподобия.
  • Алгоритм оценки - форма метода Ньютона, используемая в статистике.
  • Стандартная оценка – сколько стандартных отклонений от среднего значения имеет наблюдаемый показатель.
  • Кривая поддержки — функция, связанная со статистикой и теорией вероятностей.

Примечания

[ редактировать ]
  1. ^ Информатор в математической энциклопедии
  2. ^ Пиклз, Эндрю (1985). Введение в анализ правдоподобия . Норидж: WH Hutchins & Sons. стр. 24–29 . ISBN  0-86094-190-6 .
  3. ^ Серфлинг, Роберт Дж. (1980). Аппроксимационные теоремы математической статистики . Нью-Йорк: Джон Уайли и сыновья. п. 145 . ISBN  0-471-02403-1 .
  4. ^ Гринберг, Эдвард; Вебстер, Чарльз Э. младший (1983). Продвинутая эконометрика: мост к литературе . Нью-Йорк: Джон Уайли и сыновья. п. 25. ISBN  0-471-09077-8 .
  5. ^ Сарган, Денис (1988). Лекции по углубленной эконометрике . Оксфорд: Бэзил Блэквелл. стр. 16–18. ISBN  0-631-14956-2 .
  6. ^ Штайерберг, EW; Викерс, Эй Джей; Кук, Северная Каролина; Гердс, Т.; Гонен, М.; Обуховский, Н. ; Пенчина, MJ; Каттан, Миссури (2010). «Оценка эффективности моделей прогнозирования. Основа для традиционных и новых мер» . Эпидемиология . 21 (1): 128–138. дои : 10.1097/EDE.0b013e3181c30fb2 . ПМЦ   3575184 . ПМИД   20010215 .
  7. ^ Рао, К. Радхакришна (1948). «Большие выборочные проверки статистических гипотез, касающихся нескольких параметров, с применением к задачам оценки». Математические труды Кембриджского философского общества . 44 (1): 50–57. Бибкод : 1948PCPS...44...50R . дои : 10.1017/S0305004100023987 . S2CID   122382660 .
  8. ^ Бусе, А. (1982). «Отношение правдоподобия, тесты Вальда и множителей Лагранжа: пояснительная записка». Американский статистик . 36 (3а): 153–157. дои : 10.1080/00031305.1982.10482817 .
  9. ^ Ян Сун; Яша Золь-Дикштейн; Дидерик П. Кингма; Абхишек Кумар; Стефано Эрмон; Бен Пул (2020). «Генераторное моделирование на основе оценок с помощью стохастических дифференциальных уравнений». arXiv : 2011.13456 [ cs.LG ].
  10. ^ https://www.jmlr.org/papers/volume6/hyvarinen05a/hyvarinen05a.pdf
  11. ^ Jump up to: а б Фишер, Рональд Эйлмер. «Обнаружение связи с «доминирующими» аномалиями». Анналы евгеники 6.2 (1935): 187–201.
  12. ^ Бен ( https://stats.stackexchange.com/users/173082/ben ), Интерпретация «оценки», URL (версия: 17 апреля 2019 г.): https://stats.stackexchange.com/q/342374
  13. ^ Миллер, Джефф. «Самые ранние известные варианты использования некоторых математических слов (S)». Заметки по истории математики. Последняя редакция: 14 апреля 2020 г. https://mathshistory.st-andrews.ac.uk/Miller/mathword/s/.
  14. ^ Радхакришна Рао, К. (1948). Большие выборочные проверки статистических гипотез, касающихся нескольких параметров, с применением к задачам оценки. Математические труды Кембриджского философского общества, 44 (1), 50-57. doi:10.1017/S0305004100023987
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: e9f35daae2ef7d80f13bd496a403d395__1716760320
URL1:https://arc.ask3.ru/arc/aa/e9/95/e9f35daae2ef7d80f13bd496a403d395.html
Заголовок, (Title) документа по адресу, URL1:
Informant (statistics) - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)