Jump to content

Начальная загрузка популяций

Начальная загрузка совокупностей в статистике и математике начинается с выборки наблюдается по случайной величине .

Когда X имеет заданный закон распределения с набором нефиксированных параметров, мы обозначаем вектором Задача параметрического вывода состоит в вычислении подходящих значений (назовем их оценками ) этих параметров именно на основе выборки. Оценка подходит, если замена ее неизвестным параметром не приведет к серьезным повреждениям в следующих вычислениях. В алгоритмическом выводе пригодность оценки определяется с точки зрения совместимости с наблюдаемой выборкой.

В этой структуре методы повторной выборки направлены на генерацию набора значений-кандидатов для замены неизвестных параметров, которые мы считываем как их совместимые копии. Они представляют собой совокупность спецификаций случайного вектора. [1] совместим с наблюдаемой выборкой, где совместимость ее значений имеет свойства распределения вероятностей. Подключая параметры к выражению рассматриваемого закона распределения, мы загружаем целые совокупности случайных величин, совместимых с наблюдаемой выборкой.

Смысл алгоритмов вычисления реплик, которые мы обозначаем процедурами начальной загрузки населения , состоит в том, чтобы идентифицировать набор статистических данных. проявляющие определенные свойства, обозначающие поведение скважины относительно неизвестных параметров. Статистика выражается как функция наблюдаемых значений. , по определению. может быть выражено как функция неизвестных параметров и случайной спецификации начального числа. через механизм выборки , по очереди. Тогда, подставив второе выражение в первое, получим выражения как функции начальных чисел и параметров – основные уравнения – которые мы инвертируем, чтобы найти значения последних как функцию: i) статистики, значения которой, в свою очередь, фиксируются на наблюдаемых; и ii) начальные числа, которые являются случайными в соответствии с их собственным распределением. Следовательно, из набора образцов семян мы получаем набор реплик параметров.

Учитывая случайной величины X и механизма выборки для X реализация x определяется выражением , с . Ориентируясь на хорошую статистику ,

  

для их параметров основные уравнения гласят:

  (1)

Для каждого образца семян вектор параметров получается из решения приведенной выше системы с зафиксировано на наблюдаемых значениях.Вычислив огромный набор совместимых векторов, скажем N , эмпирическое предельное распределение получается путем:

(2)

где – j-я компонента общего решения уравнения (1), где индикаторная функция в интервале Некоторые неопределенности остаются, если X дискретно, и это мы вскоре рассмотрим.Всю процедуру можно резюмировать в виде следующего алгоритма, где индекс из обозначает вектор параметров, из которого получается вектор статистики.

Алгоритм

[ редактировать ]
Генерация совокупности параметров с помощью начальной загрузки
Учитывая образец от случайной величины с вектором параметров неизвестный,
  1. Определить вектор хорошей статистики для ;
  2. вычислить спецификацию из из образца;
  3. повторите для удовлетворительного количества N итераций:
    • нарисовать образец семени размера m из исходной случайной величины;
    • получать как решение (1) по θ с и ;
    • добавлять к ; население.
Кумулятивная функция распределения параметра Λ экспоненциальной случайной величины при статистике
Кумулятивная функция распределения параметра A однородной непрерывной случайной величины при статистике

вы можете легко увидеть Из таблицы достаточной статистики , что мы получаем кривую на рисунке слева, вычисляя эмпирическое распределение (2) для совокупности, полученное с помощью вышеуказанного алгоритма, когда: i) X является экспоненциальной случайной величиной, ii) , и

,

и кривая на рисунке справа, когда: i) X — однородная случайная величина в , ii) , и

.

Примечание

[ редактировать ]

Отметим, что точность определения закона распределения параметровПолучение популяций, совместимых с выборкой, не является функцией размера выборки. Вместо этого это функция количества семян, которые мы рисуем. В свою очередь, это число является чисто вопросом вычислительного времени, но не требует какого-либо расширения наблюдаемых данных. При использовании других методов начальной загрузки, ориентированных на создание реплик выборки (например, предложенных ( Efron & Tibshirani 1993 )), точность оценочных распределений зависит от размера выборки.

Для ожидается, что оно будет представлять распределение Парето , спецификация которого требует значений параметров и к , [2] мы имеем, что кумулятивная функция распределения выглядит следующим образом:

Совместная эмпирическая кумулятивная функция распределения параметров случайной величины Парето, когда и на основе 5000 реплик.
.

Механизм выборки имеет однородное семя U и объясняющая функция описано:

Соответствующая статистика представляет собой пару совместных достаточных статистик для и К соответственно .Основные уравнения читаются

с .

На рисунке справа показан трехмерный график эмпирической кумулятивной функции распределения (2) .

Примечания

[ редактировать ]
  1. ^ По умолчанию заглавные буквы (например, U , X ) обозначают случайные величины, а маленькие буквы ( u , x ) — их соответствующие реализации.
  2. ^ Здесь мы обозначаем символами a и k параметры Парето, обозначенные в других местах через k и .
  • Эфрон Б. и Тибширани Р. (1993). Введение в Bootsrap . Фриман, Нью-Йорк: Чепмен и Холл.
  • Аполлони, Б.; Мальчиоди, Д.; Гайто, С. (2006). Алгоритмический вывод в машинном обучении . Международная серия по передовому интеллекту. Том. 5 (2-е изд.). Аделаида: Мэгилл. Передовые знания Международные
  • Аполлони, Б.; Бассис, С.; Гайто. С.; Мальчиоди, Д. (2007). «Оценка медицинского лечения путем изучения основных функций с хорошей уверенностью». Текущий фармацевтический дизайн . 13 (15): 1545–1570. дои : 10.2174/138161207780765891 . ПМИД   17504150 .
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 963086485461654c32f97981ae7cc02f__1661237520
URL1:https://arc.ask3.ru/arc/aa/96/2f/963086485461654c32f97981ae7cc02f.html
Заголовок, (Title) документа по адресу, URL1:
Bootstrapping populations - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)