Jump to content

Статистический вывод

(Перенаправлено из Непараметрического вывода )

Статистический вывод — это процесс использования анализа данных для вывода свойств основного распределения вероятностей . [1] Инференциальный статистический анализ выводит свойства популяции , например, путем проверки гипотез и получения оценок. Предполагается, что наблюдаемый набор данных выбран из более крупной совокупности.

Инференциальную статистику можно противопоставить описательной статистике . Описательная статистика занимается исключительно свойствами наблюдаемых данных и не основывается на предположении, что данные поступают из более крупной совокупности. В машинном обучении вместо этого иногда используется термин «вывод» для обозначения «сделать прогноз путем оценки уже обученной модели»; [2] в этом контексте вывод о свойствах модели называется обучением или обучением (а не выводом ), а использование модели для прогнозирования называется выводом (вместо предсказания ); см. также прогнозирующий вывод .

Введение

[ редактировать ]

Статистический вывод делает предположения о совокупности, используя данные, полученные от совокупности с помощью той или иной формы выборки . Учитывая гипотезу о популяции, для которой мы хотим сделать выводы, статистический вывод состоит из (во-первых) выбора статистической модели процесса, который генерирует данные, и (во-вторых) вывода предложений из модели. [3]

Кониси и Китагава утверждают: «Большинство проблем статистического вывода можно считать проблемами, связанными со статистическим моделированием». [4] В связи с этим сэр Дэвид Кокс сказал: «Как осуществляется перевод предметной задачи в статистическую модель, часто является наиболее важной частью анализа». [5]

Заключение статистическим статистического вывода является утверждением . [6] Некоторые распространенные формы статистических предположений следующие:

Модели и предположения

[ редактировать ]

Любой статистический вывод требует некоторых предположений. Статистическая модель — это набор предположений, касающихся формирования наблюдаемых данных и аналогичных данных. В описаниях статистических моделей обычно подчеркивается роль интересующих нас величин населения, о которых мы хотим сделать выводы. [7] Описательная статистика обычно используется в качестве предварительного шага перед тем, как будут сделаны более формальные выводы. [8]

Степень моделей/предположений

[ редактировать ]

Статистики различают три уровня допущений моделирования;

  • Полностью параметрический : предполагается, что распределения вероятностей, описывающие процесс генерации данных, полностью описываются семейством распределений вероятностей, включающих только конечное число неизвестных параметров. [7] Например, можно предположить, что распределение значений совокупности действительно нормальное, с неизвестными средним значением и дисперсией, и что наборы данных генерируются путем «простой» случайной выборки . Семейство обобщенных линейных моделей представляет собой широко используемый и гибкий класс параметрических моделей.
  • Непараметрический : предположения, сделанные в отношении процесса генерации данных, гораздо меньше, чем в параметрической статистике, и могут быть минимальными. [9] Например, каждое непрерывное распределение вероятностей имеет медиану, которую можно оценить с помощью выборочной медианы или оценщика Ходжеса-Лемана-Сена , который имеет хорошие свойства, когда данные получены в результате простой случайной выборки.
  • Полупараметрический : этот термин обычно подразумевает предположения «промежуточные» полностью и непараметрические подходы. Например, можно предположить, что распределение населения имеет конечное среднее значение. Более того, можно предположить, что средний уровень ответа в популяции действительно линейно зависит от некоторой ковариаты (параметрическое предположение), но не делать никаких параметрических предположений, описывающих дисперсию вокруг этого среднего значения (т. е. о наличии или возможной форме какой-либо гетероскедастичности ). ). В более общем плане полупараметрические модели часто можно разделить на компоненты «структурных» и «случайных вариаций». Один компонент обрабатывается параметрически, а другой непараметрически. Известная модель Кокса представляет собой набор полупараметрических предположений. [ нужна ссылка ]

Важность действительных моделей/предположений

[ редактировать ]
На изображении выше показана гистограмма, оценивающая предположение о нормальности, которую можно проиллюстрировать равномерным разбросом под колоколообразной кривой.

Какой бы уровень предположений ни был сделан, правильно калиброванный вывод, как правило, требует, чтобы эти предположения были правильными; то есть, что механизмы генерации данных действительно были правильно определены.

Неправильные предположения о «простой» случайной выборке могут сделать статистические выводы недействительными. [10] Более сложные полу- и полностью параметрические предположения также вызывают беспокойство. Например, неправильное предположение о модели Кокса может в некоторых случаях привести к ошибочным выводам. [11] Неправильные предположения о нормальности популяции также делают недействительными некоторые формы выводов, основанных на регрессии. [12] Использование любой параметрической модели рассматривается скептически большинством экспертов по выборке человеческих популяций: «большинство статистиков, занимающихся выборкой, когда они вообще имеют дело с доверительными интервалами, ограничиваются утверждениями об [оценщиках], основанных на очень больших выборках, где центральная предельная теорема гарантирует, что эти [оценщики] будут иметь почти нормальное распределение». [13] В частности, нормальное распределение «было бы совершенно нереалистичным и катастрофически неразумным предположением, если бы мы имели дело с каким-либо экономическим населением». [13] Здесь центральная предельная теорема утверждает, что распределение выборочного среднего «для очень больших выборок» имеет приблизительно нормальное распределение, если распределение не имеет «тяжелого хвоста».

Приблизительные распределения

[ редактировать ]

Учитывая сложность определения точных распределений выборочной статистики, было разработано множество методов их аппроксимации.

При использовании конечных выборок результаты аппроксимации статистики измеряют, насколько близко предельное распределение приближается к выборочному распределению : например, при 10 000 независимых выборках нормальное распределение аппроксимирует (с точностью до двух цифр) распределение выборочного среднего для многих распределений совокупности по методу Берри . – Теорема Эссеена . [14] Тем не менее, согласно исследованиям моделирования и опыту статистиков, для многих практических целей нормальное приближение обеспечивает хорошее приближение к распределению выборочного среднего, когда имеется 10 (или более) независимых выборок. [14] Следуя работам Колмогорова 1950-х годов, передовая статистика использует теорию аппроксимации и функциональный анализ для количественной оценки ошибки аппроксимации. В этом подходе метрическая геометрия вероятностных распределений изучается ; этот подход количественно определяет ошибку аппроксимации, например, с помощью дивергенции Кульбака-Лейблера , дивергенции Брегмана и расстояния Хеллингера . [15] [16] [17]

В случае неопределенно больших выборок предельные результаты , такие как центральная предельная теорема, описывают предельное распределение выборочной статистики, если таковое существует. Ограничивающие результаты не являются утверждениями о конечных выборках и действительно не имеют отношения к конечным выборкам. [18] [19] [20] Однако асимптотическая теория предельных распределений часто используется для работы с конечными выборками. Например, предельные результаты часто используются для обоснования обобщенного метода моментов и использования обобщенных оценочных уравнений , которые популярны в эконометрике и биостатистике . Величину разницы между предельным распределением и истинным распределением (формально «ошибка» аппроксимации) можно оценить с помощью моделирования. [21] Эвристическое применение ограничения результатов конечными выборками является обычной практикой во многих приложениях, особенно с низкоразмерными моделями с логарифмически вогнутыми правдоподобиями (например, с однопараметрическими экспоненциальными семействами ).

Модели на основе рандомизации

[ редактировать ]

Для данного набора данных, созданного с помощью схемы рандомизации, распределение рандомизации статистики (при нулевой гипотезе) определяется путем оценки тестовой статистики для всех планов, которые могли быть созданы с помощью схемы рандомизации. При частотном выводе рандомизация позволяет делать выводы на основе рандомизированного распределения, а не на субъективной модели, и это особенно важно при выборке опросов и планировании экспериментов. [22] [23] Статистические выводы из рандомизированных исследований также более просты, чем во многих других ситуациях. [24] [25] [26] В байесовском выводе рандомизация также имеет важное значение: при опросной выборке использование выборки без замещения обеспечивает возможность обмена выборки с населением; в рандомизированных экспериментах рандомизация гарантирует отсутствие случайного предположения о ковариатной информации. [27]

Объективная рандомизация позволяет правильно проводить индуктивные процедуры. [28] [29] [30] [31] [32] Многие статистики предпочитают анализ данных, основанный на рандомизации, который был получен с помощью четко определенных процедур рандомизации. [33] (Однако верно и то, что в областях науки с развитыми теоретическими знаниями и экспериментальным контролем рандомизированные эксперименты могут увеличить затраты на экспериментирование без улучшения качества выводов. [34] [35] результаты рандомизированных экспериментов как позволяющие сделать выводы с большей надежностью, чем результаты наблюдательных исследований тех же явлений. ) Точно так же ведущие статистические органы рекомендуют [36] Однако хорошее обсервационное исследование может быть лучше, чем плохой рандомизированный эксперимент.

Статистический анализ рандомизированного эксперимента может быть основан на схеме рандомизации, указанной в протоколе эксперимента, и не требует субъективной модели. [37] [38]

Однако в любой момент некоторые гипотезы невозможно проверить с помощью объективных статистических моделей, которые точно описывают рандомизированные эксперименты или случайные выборки. В некоторых случаях такие рандомизированные исследования неэкономичны или неэтичны.

Модельный анализ рандомизированных экспериментов

[ редактировать ]

Стандартной практикой является обращение к статистической модели, например, к линейной или логистической модели, при анализе данных рандомизированных экспериментов. [39] Однако схема рандомизации определяет выбор статистической модели. Невозможно выбрать подходящую модель, не зная схемы рандомизации. [23] Серьезно вводящие в заблуждение результаты можно получить, анализируя данные рандомизированных экспериментов, игнорируя протокол эксперимента; распространенные ошибки включают забывание блокировки, использованной в эксперименте, и путаницу повторных измерений на одной и той же экспериментальной установке с независимыми повторами лечения, примененного к различным экспериментальным единицам. [40]

Вывод рандомизации без модели

[ редактировать ]

Безмодельные методы дополняют методы, основанные на моделях, которые используют редукционистские стратегии упрощения реальности. Первые объединяют, развивают, группируют и обучают алгоритмы, динамически адаптирующиеся к контекстуальным особенностям процесса и изучающие внутренние характеристики наблюдений. [41] [42]

Например, простая линейная регрессия без модели основана либо на

  • случайный план , где пары наблюдений независимы и одинаково распределены (iid), или
  • детерминированный дизайн , где переменные детерминированы, но соответствующие переменные отклика случайны и независимы с общим условным распределением, т. е. , который не зависит от индекса .

В любом случае, вывод о рандомизации без модели для особенностей общего условного распределения опирается на некоторые условия регулярности, например функциональную гладкость. Например, немодальный вывод рандомизации для условного среднего признака совокупности , , можно последовательно оценить с помощью локального усреднения или аппроксимации локальным полиномом в предположении, что гладкий. Кроме того, опираясь на асимптотическую нормальность или повторную выборку, мы можем построить доверительные интервалы для генерального признака, в данном случае условного среднего , . [43]

Парадигмы вывода

[ редактировать ]

Сложились различные школы статистических выводов. Эти школы — или «парадигмы» — не являются взаимоисключающими, и методы, которые хорошо работают в одной парадигме, часто имеют привлекательные интерпретации в других парадигмах.

Бандиопадхай и Форстер описывают четыре парадигмы: классическую (или частотную ) парадигму, байесовскую парадигму, правдоподобную парадигму и парадигму, основанную на информационном критерии Акаике . [44]

Частотный вывод

[ редактировать ]

Эта парадигма калибрует правдоподобие предположений, рассматривая (условную) повторную выборку распределения населения для получения наборов данных, аналогичных имеющемуся. Рассматривая характеристики набора данных при повторной выборке, можно количественно оценить частотные свойства статистического предположения, хотя на практике эта количественная оценка может быть сложной.

Примеры частотного вывода

[ редактировать ]

Частотный вывод, объективность и теория принятия решений

[ редактировать ]

Одна из интерпретаций частотного вывода (или классического вывода) заключается в том, что он применим только с точки зрения частотной вероятности ; то есть с точки зрения повторной выборки из совокупности. Однако подход Неймана [45] разрабатывает эти процедуры с точки зрения предэкспериментальных вероятностей. То есть, прежде чем приступить к эксперименту, необходимо определить правило, по которому можно прийти к такому выводу, чтобы вероятность его правильности контролировалась подходящим способом: такая вероятность не должна иметь частотную интерпретацию или интерпретацию повторной выборки. Напротив, байесовский вывод работает с точки зрения условных вероятностей (т. е. вероятностей, зависящих от наблюдаемых данных) по сравнению с маргинальными (но обусловленными неизвестными параметрами) вероятностями, используемыми в частотном подходе.

Частотные процедуры проверки значимости и доверительные интервалы могут быть построены без учета функций полезности . Однако некоторые элементы частотной статистики, такие как теория статистических решений , действительно включают функции полезности . [ нужна ссылка ] В частности, частотные разработки оптимального вывода (такие как несмещенные оценки с минимальной дисперсией или равномерно наиболее мощное тестирование ) используют функции потерь , которые играют роль (отрицательных) функций полезности. Функции потерь не обязательно указывать явно, чтобы теоретики статистики могли доказать, что статистическая процедура обладает свойством оптимальности. [46] Однако функции потерь часто полезны для определения свойств оптимальности: например, несмещенные по медиане оценки оптимальны для функций потерь по абсолютным значениям , поскольку они минимизируют ожидаемые потери, а оценки методом наименьших квадратов оптимальны для функций потерь, возведенных в квадрат, поскольку они минимизировать ожидаемые потери.

В то время как статистики, использующие частотный вывод, должны сами выбирать интересующие параметры, а также оценщики / тестовые статистические данные , которые будут использоваться, отсутствие явно явных полезностей и предшествующих распределений помогло частотным процедурам широко рассматриваться как «объективные». [47]

Байесовский вывод

[ редактировать ]

Байесовское исчисление описывает степени уверенности, используя «язык» вероятности; убеждения положительны, интегрируются в одно целое и подчиняются аксиомам вероятности. Байесовский вывод использует доступные апостериорные убеждения в качестве основы для создания статистических предположений. [48] Существует несколько различных обоснований использования байесовского подхода.

Примеры байесовского вывода

[ редактировать ]

Байесовский вывод, субъективность и теория принятия решений

[ редактировать ]

Многие неформальные байесовские выводы основаны на «интуитивно разумных» обобщениях апостериорных явлений. Например, таким образом можно мотивировать апостериорное среднее значение, медиану и моду, интервалы максимальной апостериорной плотности и факторы Байеса. пользователя Хотя для такого рода выводов не обязательно указывать функцию полезности , все эти сводки зависят (в некоторой степени) от заявленных предшествующих убеждений и обычно рассматриваются как субъективные выводы. (Методы предварительного строительства, не требующие внешнего вмешательства, были предложены , но еще не полностью разработаны.)

Формально байесовский вывод калибруется со ссылкой на явно заявленную полезность или функцию потерь; «Правило Байеса» — это правило, которое максимизирует ожидаемую полезность, усредненную по апостериорной неопределенности. Таким образом, формальный байесовский вывод автоматически обеспечивает оптимальные решения в теоретическом смысле решений. Учитывая предположения, данные и полезность, байесовский вывод может быть сделан практически для любой проблемы, хотя не каждый статистический вывод нуждается в байесовской интерпретации. Анализ, который формально не является байесовским, может быть (логически) бессвязным ; Особенностью байесовских процедур, использующих правильные априорные значения (т.е. интегрируемые до единицы), является то, что они гарантированно когерентны . Некоторые сторонники байесовского вывода утверждают, что вывод должен происходить в рамках теории принятия решений и что байесовский вывод не должен завершаться оценкой и обобщением апостериорных убеждений.

Вывод, основанный на правдоподобии

[ редактировать ]

Вывод на основе правдоподобия — это парадигма, используемая для оценки параметров статистической модели на основе наблюдаемых данных. Правдоподобие приближается к статистике, используя функцию правдоподобия , обозначаемую как , количественно определяет вероятность наблюдения заданных данных , предполагая определенный набор значений параметров . В выводе на основе правдоподобия цель состоит в том, чтобы найти набор значений параметров, который максимизирует функцию правдоподобия или, что то же самое, максимизирует вероятность наблюдения заданных данных.

Процесс вывода на основе правдоподобия обычно включает в себя следующие этапы:

  1. Формулирование статистической модели: Статистическая модель определяется на основе рассматриваемой проблемы с указанием предположений о распределении и взаимосвязи между наблюдаемыми данными и неизвестными параметрами. Модель может быть простой, например нормальное распределение с известной дисперсией, или сложной, например иерархическая модель с несколькими уровнями случайных эффектов.
  2. Построение функции правдоподобия. Учитывая статистическую модель, функция правдоподобия строится путем оценки совместной плотности вероятности или функции массы наблюдаемых данных как функции неизвестных параметров. Эта функция представляет вероятность наблюдения данных для разных значений параметров.
  3. Максимизация функции правдоподобия. Следующий шаг — найти набор значений параметров, который максимизирует функцию правдоподобия. Этого можно достичь с помощью методов оптимизации, таких как алгоритмы численной оптимизации. Оценочные значения параметров, часто обозначаемые как , являются оценками максимального правдоподобия (MLE).
  4. Оценка неопределенности. После получения MLE крайне важно количественно оценить неопределенность, связанную с оценками параметров. Это можно сделать путем расчета стандартных ошибок , доверительных интервалов или проведения проверки гипотез на основе асимптотической теории или методов моделирования, таких как бутстрэппинг .
  5. Проверка модели: после получения оценок параметров и оценки их неопределенности важно оценить адекватность статистической модели. Это включает в себя проверку допущений, сделанных в модели, и оценку соответствия модели данным с использованием критериев согласия, остаточного анализа или графической диагностики.
  6. Вывод и интерпретация. Наконец, на основе предполагаемых параметров и оценки модели можно сделать статистический вывод. Это включает в себя получение выводов о параметрах популяции, составление прогнозов или проверку гипотез на основе оцененной модели.

Вывод на основе AIC

[ редактировать ]

( Информационный критерий Акаике AIC) представляет собой оценку относительного качества статистических моделей для заданного набора данных. Учитывая набор моделей данных, AIC оценивает качество каждой модели по сравнению с каждой из других моделей. Таким образом, AIC предоставляет средства выбора модели .

AIC основан на теории информации : он предлагает оценку относительной потери информации, когда данная модель используется для представления процесса, в результате которого были сгенерированы данные. (При этом речь идет о компромиссе между степенью соответствия модели и ее простотой.)

Другие парадигмы вывода

[ редактировать ]

Минимальная длина описания

[ редактировать ]

Принцип минимальной длины описания (MDL) был разработан на основе идей теории информации. [49] и теория колмогоровской сложности . [50] Принцип (MDL) выбирает статистические модели, которые максимально сжимают данные; вывод происходит без предположения контрфактических или нефальсифицируемых «механизмов генерации данных» или вероятностных моделей для данных, как это могло бы быть сделано в частотных или байесовских подходах.

Однако если «механизм генерации данных» действительно существует, то согласно о теореме Шеннона кодировании источника он обеспечивает MDL-описание данных в среднем и асимптотически. [51] В плане минимизации длины описания (или описательной сложности) оценка MDL аналогична оценке максимального правдоподобия и максимальной апостериорной оценке (с использованием с максимальной энтропией байесовских априорных значений ). Однако MDL избегает предположения, что основная вероятностная модель известна; принцип MDL также может применяться без предположений о том, что, например, данные получены в результате независимой выборки. [51] [52]

Принцип MDL применялся в теории коммуникации-кодирования , в теории информации , в линейной регрессии , [52] и в интеллектуальном анализе данных . [50]

Для оценки процедур вывода на основе MDL часто используются методы или критерии теории сложности вычислений . [53]

Фидуциальный вывод

[ редактировать ]

Фидуциальный вывод — это подход к статистическому выводу, основанный на фидуциальной вероятности , также известный как «фидуциальное распределение». В последующих работах этот подход был назван нечетким, крайне ограниченным в применимости и даже ошибочным. [54] [55] Однако этот аргумент такой же, как и тот, который показывает [56] что так называемое доверительное распределение не является действительным распределением вероятностей , и, поскольку это не лишило законной силы применение доверительных интервалов , оно не обязательно лишает законной силы выводы, сделанные на основе фидуциальных аргументов. Была предпринята попытка переосмыслить раннюю работу фидуциального аргумента Фишера как частный случай теории вывода с использованием верхних и нижних вероятностей . [57]

Структурный вывод

[ редактировать ]

Развивая идеи Фишера и Питмана с 1938 по 1939 год, [58] Джордж А. Барнард разработал «структурный вывод» или «основной вывод». [59] подход, использующий инвариантные вероятности в семействах групп . Барнард переформулировал аргументы в пользу фидуциального вывода для ограниченного класса моделей, на которых «фидуциальные» процедуры были бы четко определены и полезны. Дональд А.С. Фрейзер разработал общую теорию структурного вывода. [60] на основе теории групп и применил ее к линейным моделям. [61] Теория, сформулированная Фрейзером, тесно связана с теорией принятия решений и байесовской статистикой и может обеспечить оптимальные частотные правила принятия решений, если они существуют. [62]

Темы вывода

[ редактировать ]

Приведенные ниже темы обычно относятся к области статистических выводов .

  1. Статистические предположения
  2. Статистическая теория принятия решений
  3. Теория оценки
  4. Статистическая проверка гипотез
  5. Пересмотр мнений в статистике
  6. Планирование экспериментов , дисперсионный анализ и регрессия.
  7. Выборка опроса
  8. Обобщение статистических данных

Прогнозирующий вывод

[ редактировать ]

Прогнозирующий вывод — это подход к статистическому выводу, который делает упор на предсказание будущих наблюдений на основе прошлых наблюдений.

Первоначально прогнозирующий вывод был основан на наблюдаемых параметрах и был основной целью изучения вероятности . [ нужна ссылка ] но в 20 веке он вышел из моды из-за нового параметрического подхода, впервые предложенного Бруно де Финетти . Этот подход моделировал явления как физическую систему, наблюдаемую с ошибкой (например, небесная механика ). Идея де Финетти о взаимозаменяемости — что будущие наблюдения должны вести себя так же, как прошлые наблюдения — привлекла внимание англоязычного мира после перевода с французского в 1974 году его статьи 1937 года: [63] и с тех пор его предлагали такие статистики, как Сеймур Гейссер . [64]

См. также

[ редактировать ]

Примечания

[ редактировать ]
  1. По мнению Пирса, принятие означает, что расследование по этому вопросу на данный момент прекращается. В науке все научные теории подлежат пересмотру.
  1. ^ Аптон, Г., Кук, И. (2008) Оксфордский статистический словарь , OUP. ISBN   978-0-19-954145-4 .
  2. ^ «Вывод TensorFlow Lite» . Термин «вывод» относится к процессу выполнения модели TensorFlow Lite на устройстве с целью сделать прогнозы на основе входных данных.
  3. ^ Джонсон, Ричард (12 марта 2016 г.). «Статистический вывод» . Энциклопедия математики . Спрингер: Европейское математическое общество . Проверено 26 октября 2022 г.
  4. ^ Кониси и Китагава (2008), стр. 75.
  5. ^ Кокс (2006), с. 197.
  6. ^ «Статистический вывод — Математическая энциклопедия» . www.энциклопедияofmath.org . Проверено 23 января 2019 г.
  7. ^ Перейти обратно: а б Кокс (2006), стр. 2
  8. ^ Эванс, Майкл; и др. (2004). Вероятность и статистика: наука о неопределенности . Фримен и компания. п. 267. ИСБН  9780716747420 .
  9. ^ ван дер Ваарт, AW (1998) Асимптотическая статистика Издательство Кембриджского университета. ISBN   0-521-78450-6 (стр. 341)
  10. ^ Краскал 1988
  11. ^ Фридман, Д.А. (2008) «Анализ выживания: эпидемиологическая опасность?». Американский статистик (2008) 62: 110–119. (Перепечатано как глава 11 (стр. 169–192) книги Freedman (2010)).
  12. ^ Берк, Р. (2003) Регрессионный анализ: конструктивная критика (передовые количественные методы в социальных науках) (т. 11) Sage Publications. ISBN   0-7619-2904-5
  13. ^ Перейти обратно: а б Брюэр, Кен (2002). Выводы по выборке комбинированного обследования: взвешивание слонов Басу . Ходдер Арнольд. п. 6. ISBN  978-0340692295 .
  14. ^ Перейти обратно: а б Вероятность Йоргена Хоффмана-Йоргенсена с точки зрения статистики , Том I. Страница 399 [ нужна полная цитата ]
  15. ^ Ле Кам (1986) [ нужна страница ]
  16. ^ Эрик Торгерсон (1991) Сравнение статистических экспериментов , том 36 Энциклопедии математики. Издательство Кембриджского университета. [ нужна полная цитата ]
  17. ^ Лизе, Фридрих и Миске, Клаус-Дж. (2008). Статистическая теория принятия решений: оценка, тестирование и отбор . Спрингер. ISBN  978-0-387-73193-3 .
  18. ^ Колмогоров (1963, стр.369): «Понятие частоты, основанное на понятии предельной частоты при увеличении числа испытаний до бесконечности, не дает ничего для обоснования применимости результатов теории вероятностей к реальным практическим задачам, где нам всегда приходится иметь дело с конечным числом испытаний».
  19. ^ "Действительно, предельные теоремы 'как стремится к бесконечности», логически лишены содержания о том, что происходит в любой конкретный момент. . Все, что они могут сделать, — это предложить определенные подходы, эффективность которых затем необходимо проверить в конкретном случае». — Ле Кам (1986) (стр. xiv)
  20. ^ Пфанзагль (1994): «Важнейший недостаток асимптотической теории: то, что мы ожидаем от асимптотической теории, - это результаты, которые верны приблизительно... Асимптотическая теория может предложить предельные теоремы». (стр. ix) «Что важно для приложений, так это приближения, а не пределы». (стр. 188)
  21. ^ Пфанзагль (1994): «Принимая предельную теорему как приблизительно верную для больших размеров выборки, мы допускаем ошибку, размер которой неизвестен. [...] Реалистичная информация об остальных ошибках может быть получена путем моделирования». (страница ix)
  22. ^ Нейман, Дж. (1934) «О двух различных аспектах репрезентативного метода: метод стратифицированной выборки и метод целенаправленного отбора», Журнал Королевского статистического общества , 97 (4), 557–625 JSTOR   2342192.
  23. ^ Перейти обратно: а б Хинкельманн и Кемпторн (2008) [ нужна страница ]
  24. ^ Рекомендации ASA для первого курса статистики для нестатистиков. (доступно на сайте АСА)
  25. ^ Дэвида А. Фридмана и других Статистика .
  26. ^ Мур и др. (2015).
  27. ^ Гельман А. и др. (2013). Байесовский анализ данных ( Чепмен и Холл ).
  28. ^ Пирс (1877-1878)
  29. ^ Пирс (1883)
  30. ^ Фридман, Пизани и Первс, 1978 .
  31. ^ Дэвида А. Фридмана Статистические модели .
  32. ^ Рао, CR (1997) Статистика и истина: шанс на работу , World Scientific. ISBN   981-02-3111-3
  33. ^ Пирс; Вольноотпущенник; Мур и др. (2015). [ нужна ссылка ]
  34. ^ Box, GEP и друзья (2006) Улучшение почти всего: идеи и эссе, исправленное издание , Wiley. ISBN   978-0-471-72755-2
  35. ^ Кокс (2006), с. 196.
  36. ^ Рекомендации ASA для первого курса статистики для нестатистов. (доступно на сайте АСА)
    • Дэвид А. Фридман и его псевдоним «Статистика» .
    • Мур и др. (2015).
  37. ^ Нейман, Ежи. 1923 [1990]. «О применении теории вероятностей к сельскохозяйственным экспериментам. Очерк принципов. Раздел 9». Статистическая наука 5 (4): 465–472. Пер. Дорота М. Дабровска и Теренс П. Спид.
  38. ^ Хинкельманн и Кемпторн (2008) [ нужна страница ]
  39. ^ Динов, Иво; Паланималай, Сельвам; Харе, Ашвини; Кристу, Николя (2018). «Статистический вывод на основе рандомизации: инфраструктура повторной выборки и моделирования» . Преподавание статистики . 40 (2): 64–73. дои : 10.1111/test.12156 . ПМК   6155997 . ПМИД   30270947 .
  40. ^ Хинкельманн и Кемпторн (2008) Глава 6.
  41. ^ Динов, Иво; Паланималай, Сельвам; Харе, Ашвини; Кристу, Николя (2018). «Статистический вывод на основе рандомизации: инфраструктура повторной выборки и моделирования» . Преподавание статистики . 40 (2): 64–73. дои : 10.1111/test.12156 . ПМК   6155997 . ПМИД   30270947 .
  42. ^ Тан, Мин; Гао, Чао; Гутман, Стивен; Калинин Александр; Мукерджи, Бхрамар; Гуань, Юаньфан; Динов, Иво (2019). «Методические и безмодельные методы прогнозирования диагностики бокового амиотрофического склероза и кластеризации пациентов» . Нейроинформатика . 17 (3): 407–421. дои : 10.1007/s12021-018-9406-9 . ПМК   6527505 . ПМИД   30460455 .
  43. ^ Политис, Д.Н. (2019). «Безмодельный вывод в статистике: как и почему» . Бюллетень ИМС . 48 .
  44. ^ Bandyopadhyay & Forster (2011). См. Введение к книге (стр. 3) и «Раздел III: Четыре парадигмы статистики».
  45. ^ Нейман, Дж. (1937). «Очерк теории статистического оценивания, основанной на классической теории вероятностей» . Философские труды Лондонского королевского общества А. 236 (767): 333–380. Бибкод : 1937RSPTA.236..333N . дои : 10.1098/rsta.1937.0005 . JSTOR   91337 .
  46. ^ Предисловие к Пфанцаглю.
  47. ^ Литтл, Родерик Дж. (2006). «Калиброванный Байес: дорожная карта Байеса/частотника». Американский статистик . 60 (3): 213–223. дои : 10.1198/000313006X117837 . ISSN   0003-1305 . JSTOR   27643780 . S2CID   53505632 .
  48. ^ Ли, Се Юн (2021). «Сэмплер Гиббса и вариационный вывод по координатному восхождению: теоретико-множественный обзор». Коммуникации в статистике - теория и методы . 51 (6): 1549–1568. arXiv : 2008.01006 . дои : 10.1080/03610926.2021.1921214 . S2CID   220935477 .
  49. ^ Суфи (2000)
  50. ^ Перейти обратно: а б Hansen & Yu (2001)
  51. ^ Перейти обратно: а б Хансен и Ю (2001), стр. 747.
  52. ^ Перейти обратно: а б Риссанен (1989), стр. 84.
  53. ^ Джозеф Ф. Трауб, Г.В. Васильковски и Х. Возняковски. (1988) [ нужна страница ]
  54. ^ Нейман (1956)
  55. ^ Забелл (1992)
  56. ^ Кокс (2006), стр. 66
  57. ^ Хампель 2003 .
  58. ^ Дэвисон, страница 12. [ нужна полная цитата ]
  59. ^ Барнард, Джорджия (1995) «Основные модели и фидуциальный аргумент», International Statistical Review, 63 (3), 309–323. JSTOR   1403482
  60. ^ Фрейзер, DAS (1968). Структура вывода . Нью-Йорк: Уайли. ISBN  0-471-27548-4 . OCLC   440926 .
  61. ^ Фрейзер, DAS (1979). Вывод и линейные модели . Лондон: МакГроу-Хилл. ISBN  0-07-021910-9 . ОСЛК   3559629 .
  62. ^ Таральдсен, Гуннар; Линдквист, Бо Генри (01 февраля 2013 г.). «Фидуциальная теория и оптимальный вывод» . Анналы статистики . 41 (1). arXiv : 1301.1717 . дои : 10.1214/13-AOS1083 . ISSN   0090-5364 . S2CID   88520957 .
  63. ^ Де Финетти, Бруно (1937). «Прогнозирование: его логические законы, его субъективные источники». Анналы Института Анри Пуанкаре . 7 (1): 1–68. ISSN   0365-320X . Переведено на Де Финетти, Бруно (1992). «Форсайт: его логические законы, его субъективные источники». Прорывы в статистике . Серия Спрингера по статистике. стр. 134–174. дои : 10.1007/978-1-4612-0919-5_10 . ISBN  978-0-387-94037-3 .
  64. ^ Гейссер, Сеймур (1993) Прогнозирующий вывод: Введение , CRC Press. ISBN   0-412-03471-9

Источники

[ редактировать ]

Дальнейшее чтение

[ редактировать ]
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 66a2426efec3d798c68fdf34ba3729ad__1721717280
URL1:https://arc.ask3.ru/arc/aa/66/ad/66a2426efec3d798c68fdf34ba3729ad.html
Заголовок, (Title) документа по адресу, URL1:
Statistical inference - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)