Статистический вывод
Часть серии о |
Исследовать |
---|
Философский портал |
Статистический вывод — это процесс использования анализа данных для вывода свойств основного распределения вероятностей . [1] Инференциальный статистический анализ выводит свойства популяции , например, путем проверки гипотез и получения оценок. Предполагается, что наблюдаемый набор данных выбран из более крупной совокупности.
Инференциальную статистику можно противопоставить описательной статистике . Описательная статистика занимается исключительно свойствами наблюдаемых данных и не основывается на предположении, что данные поступают из более крупной совокупности. В машинном обучении вместо этого иногда используется термин «вывод» для обозначения «сделать прогноз путем оценки уже обученной модели»; [2] в этом контексте вывод о свойствах модели называется обучением или обучением (а не выводом ), а использование модели для прогнозирования называется выводом (вместо предсказания ); см. также прогнозирующий вывод .
Введение
[ редактировать ]Статистический вывод делает предположения о совокупности, используя данные, полученные от совокупности с помощью той или иной формы выборки . Учитывая гипотезу о популяции, для которой мы хотим сделать выводы, статистический вывод состоит из (во-первых) выбора статистической модели процесса, который генерирует данные, и (во-вторых) вывода предложений из модели. [3]
Кониси и Китагава утверждают: «Большинство проблем статистического вывода можно считать проблемами, связанными со статистическим моделированием». [4] В связи с этим сэр Дэвид Кокс сказал: «Как осуществляется перевод предметной задачи в статистическую модель, часто является наиболее важной частью анализа». [5]
Заключение статистическим статистического вывода является утверждением . [6] Некоторые распространенные формы статистических предположений следующие:
- точечная оценка , т.е. конкретное значение, которое наилучшим образом аппроксимирует некоторый интересующий параметр;
- интервальная оценка , например, доверительный интервал (или установленная оценка), т.е. интервал, построенный с использованием набора данных, полученного из совокупности, так, чтобы при повторной выборке таких наборов данных такие интервалы содержали истинное значение параметра с вероятностью при заявленной достоверности уровень ;
- , доверительный интервал т.е. набор значений, содержащий, например, 95% апостериорного доверия;
- отказ от гипотезы ; [примечание 1]
- кластеризация или классификация точек данных в группы.
Модели и предположения
[ редактировать ]Любой статистический вывод требует некоторых предположений. Статистическая модель — это набор предположений, касающихся генерации наблюдаемых данных и аналогичных данных. В описаниях статистических моделей обычно подчеркивается роль интересующих нас величин населения, о которых мы хотим сделать выводы. [7] Описательная статистика обычно используется в качестве предварительного шага перед тем, как будут сделаны более формальные выводы. [8]
Степень моделей/предположений
[ редактировать ]Статистики различают три уровня допущений моделирования;
- Полностью параметрический : предполагается, что распределения вероятностей, описывающие процесс генерации данных, полностью описываются семейством распределений вероятностей, включающих только конечное число неизвестных параметров. [7] Например, можно предположить, что распределение значений совокупности действительно нормальное, с неизвестными средним значением и дисперсией, и что наборы данных генерируются путем «простой» случайной выборки . Семейство обобщенных линейных моделей представляет собой широко используемый и гибкий класс параметрических моделей.
- Непараметрический : предположения, сделанные в отношении процесса генерации данных, намного меньше, чем в параметрической статистике, и могут быть минимальными. [9] Например, каждое непрерывное распределение вероятностей имеет медиану, которую можно оценить с помощью выборочной медианы или оценщика Ходжеса-Лемана-Сена , который имеет хорошие свойства, когда данные получены в результате простой случайной выборки.
- Полупараметрический : этот термин обычно подразумевает предположения «промежуточные» полностью и непараметрические подходы. Например, можно предположить, что распределение населения имеет конечное среднее значение. Более того, можно предположить, что средний уровень ответа в популяции действительно линейно зависит от некоторой ковариаты (параметрическое предположение), но не делать никаких параметрических предположений, описывающих дисперсию вокруг этого среднего значения (т. е. о наличии или возможной форме какой-либо гетероскедастичности ). ). В более общем плане полупараметрические модели часто можно разделить на компоненты «структурных» и «случайных вариаций». Один компонент обрабатывается параметрически, а другой непараметрически. Известная модель Кокса представляет собой набор полупараметрических предположений. [ нужна ссылка ]
Важность действительных моделей/предположений
[ редактировать ]Какой бы уровень предположений ни был сделан, правильно калиброванный вывод, как правило, требует, чтобы эти предположения были правильными; то есть, что механизмы генерации данных действительно были правильно определены.
Неправильные предположения о «простой» случайной выборке могут сделать статистические выводы недействительными. [10] Более сложные полу- и полностью параметрические предположения также вызывают беспокойство. Например, неправильное предположение о модели Кокса может в некоторых случаях привести к ошибочным выводам. [11] Неправильные предположения о нормальности популяции также делают недействительными некоторые формы выводов, основанных на регрессии. [12] Использование любой параметрической модели рассматривается скептически большинством экспертов по выборке человеческих популяций: «большинство статистиков, занимающихся выборкой, когда они вообще имеют дело с доверительными интервалами, ограничиваются утверждениями об [оценщиках], основанных на очень больших выборках, где центральная предельная теорема гарантирует, что эти [оценщики] будут иметь почти нормальное распределение». [13] В частности, нормальное распределение «было бы совершенно нереалистичным и катастрофически неразумным предположением, если бы мы имели дело с каким-либо экономическим населением». [13] Здесь центральная предельная теорема утверждает, что распределение выборочного среднего «для очень больших выборок» имеет приблизительно нормальное распределение, если распределение не имеет «тяжелого хвоста».
Приблизительные распределения
[ редактировать ]Учитывая сложность определения точных распределений выборочной статистики, было разработано множество методов их аппроксимации.
При использовании конечных выборок результаты аппроксимации статистики измеряют, насколько близко предельное распределение приближается к выборочному распределению : например, при 10 000 независимых выборках нормальное распределение аппроксимирует (с точностью до двух цифр) распределение выборочного среднего для многих распределений совокупности по методу Берри . – Теорема Эссеена . [14] Тем не менее, согласно исследованиям моделирования и опыту статистиков, для многих практических целей нормальное приближение обеспечивает хорошее приближение к распределению выборочного среднего, когда имеется 10 (или более) независимых выборок. [14] Следуя работам Колмогорова 1950-х годов, передовая статистика использует теорию аппроксимации и функциональный анализ для количественной оценки ошибки аппроксимации. В этом подходе метрическая геометрия вероятностных распределений изучается ; этот подход количественно определяет ошибку аппроксимации, например, с помощью дивергенции Кульбака-Лейблера , дивергенции Брегмана и расстояния Хеллингера . [15] [16] [17]
При неопределенно больших выборках предельные результаты , такие как центральная предельная теорема, описывают предельное распределение выборочной статистики, если таковое существует. Ограничивающие результаты не являются утверждениями о конечных выборках и действительно не имеют отношения к конечным выборкам. [18] [19] [20] Однако асимптотическая теория предельных распределений часто используется для работы с конечными выборками. Например, предельные результаты часто используются для обоснования обобщенного метода моментов и использования обобщенных оценочных уравнений , которые популярны в эконометрике и биостатистике . Величину разницы между предельным распределением и истинным распределением (формально «ошибка» аппроксимации) можно оценить с помощью моделирования. [21] Эвристическое применение ограничения результатов конечными выборками является обычной практикой во многих приложениях, особенно с низкоразмерными моделями с логарифмически вогнутыми правдоподобиями (например, с однопараметрическими экспоненциальными семействами ).
Модели на основе рандомизации
[ редактировать ]Для данного набора данных, созданного с помощью схемы рандомизации, распределение рандомизации статистики (при нулевой гипотезе) определяется путем оценки тестовой статистики для всех планов, которые могли быть созданы с помощью схемы рандомизации. При частотном выводе рандомизация позволяет делать выводы на основе рандомизированного распределения, а не на субъективной модели, и это особенно важно при выборке опросов и планировании экспериментов. [22] [23] Статистические выводы из рандомизированных исследований также более просты, чем во многих других ситуациях. [24] [25] [26] В байесовском выводе рандомизация также имеет важное значение: при опросной выборке использование выборки без замещения обеспечивает возможность обмена выборки с населением; в рандомизированных экспериментах рандомизация гарантирует отсутствие случайного предположения о ковариатной информации. [27]
Объективная рандомизация позволяет правильно проводить индуктивные процедуры. [28] [29] [30] [31] [32] Многие статистики предпочитают анализ данных, основанный на рандомизации, который был получен с помощью четко определенных процедур рандомизации. [33] (Однако верно и то, что в областях науки с развитыми теоретическими знаниями и экспериментальным контролем рандомизированные эксперименты могут увеличить затраты на экспериментирование без улучшения качества выводов. [34] [35] результаты рандомизированных экспериментов как позволяющие сделать выводы с большей надежностью, чем результаты наблюдательных исследований тех же явлений. ) Точно так же ведущие статистические органы рекомендуют [36] Однако хорошее обсервационное исследование может быть лучше, чем плохой рандомизированный эксперимент.
Статистический анализ рандомизированного эксперимента может быть основан на схеме рандомизации, указанной в протоколе эксперимента, и не требует субъективной модели. [37] [38]
Однако в любой момент некоторые гипотезы невозможно проверить с помощью объективных статистических моделей, которые точно описывают рандомизированные эксперименты или случайные выборки. В некоторых случаях такие рандомизированные исследования неэкономичны или неэтичны.
Модельный анализ рандомизированных экспериментов
[ редактировать ]Стандартной практикой является обращение к статистической модели, например, к линейной или логистической модели, при анализе данных рандомизированных экспериментов. [39] Однако схема рандомизации определяет выбор статистической модели. Невозможно выбрать подходящую модель, не зная схемы рандомизации. [23] Серьезно вводящие в заблуждение результаты можно получить, анализируя данные рандомизированных экспериментов, игнорируя протокол эксперимента; распространенные ошибки включают в себя забвение блокировки, использованной в эксперименте, и путаницу повторных измерений на одной и той же экспериментальной установке с независимыми повторами лечения, примененного к различным экспериментальным единицам. [40]
Вывод рандомизации без модели
[ редактировать ]Безмодельные методы дополняют методы, основанные на моделях, которые используют редукционистские стратегии упрощения реальности. Первые объединяют, развивают, группируют и обучают алгоритмы, динамически адаптирующиеся к контекстуальным особенностям процесса и изучающие внутренние характеристики наблюдений. [41] [42]
Например, простая линейная регрессия без модели основана либо на
- случайный план , где пары наблюдений независимы и одинаково распределены (iid), или
- детерминированный дизайн , где переменные детерминированы, но соответствующие переменные отклика случайны и независимы с общим условным распределением, т. е. , который не зависит от индекса .
В любом случае, вывод о рандомизации без модели для особенностей общего условного распределения опирается на некоторые условия регулярности, например функциональную гладкость. Например, немодальный вывод рандомизации для условного среднего признака совокупности , , можно последовательно оценить с помощью локального усреднения или аппроксимации локальным полиномом в предположении, что гладкий. Кроме того, опираясь на асимптотическую нормальность или повторную выборку, мы можем построить доверительные интервалы для генерального признака, в данном случае условного среднего , . [43]
Парадигмы вывода
[ редактировать ]Сложились различные школы статистических выводов. Эти школы – или «парадигмы» – не являются взаимоисключающими, и методы, которые хорошо работают в одной парадигме, часто имеют привлекательные интерпретации в других парадигмах.
Бандиопадхай и Форстер описывают четыре парадигмы: классическую (или частотную ) парадигму, байесовскую парадигму, правдоподобную парадигму и парадигму, основанную на информационном критерии Акаике . [44]
Частотный вывод
[ редактировать ]Эта парадигма калибрует правдоподобие предположений, рассматривая (условную) повторную выборку распределения населения для получения наборов данных, аналогичных имеющемуся. Рассматривая характеристики набора данных при повторной выборке, можно количественно оценить частотные свойства статистического предположения, хотя на практике эта количественная оценка может быть сложной.
Примеры частотного вывода
[ редактировать ]- р -значение
- Доверительный интервал
- нулевой гипотезы Проверка значимости
Частотный вывод, объективность и теория принятия решений
[ редактировать ]Одна из интерпретаций частотного вывода (или классического вывода) заключается в том, что он применим только с точки зрения частотной вероятности ; то есть с точки зрения повторной выборки из совокупности. Однако подход Неймана [45] разрабатывает эти процедуры с точки зрения предэкспериментальных вероятностей. То есть, прежде чем приступить к эксперименту, необходимо определить правило, по которому можно прийти к такому выводу, чтобы вероятность его правильности контролировалась подходящим способом: такая вероятность не должна иметь частотную или повторяющуюся интерпретацию выборки. Напротив, байесовский вывод работает с точки зрения условных вероятностей (т. е. вероятностей, зависящих от наблюдаемых данных) по сравнению с маргинальными (но обусловленными неизвестными параметрами) вероятностями, используемыми в частотном подходе.
Частотные процедуры проверки значимости и доверительные интервалы могут быть построены без учета функций полезности . Однако некоторые элементы частотной статистики, такие как теория статистических решений , действительно включают функции полезности . [ нужна ссылка ] В частности, частотные разработки оптимального вывода (такие как несмещенные оценки с минимальной дисперсией или равномерно наиболее мощное тестирование ) используют функции потерь , которые играют роль (отрицательных) функций полезности. Функции потерь не обязательно указывать явно, чтобы теоретики статистики могли доказать, что статистическая процедура обладает свойством оптимальности. [46] Однако функции потерь часто полезны для определения свойств оптимальности: например, несмещенные по медиане оценки оптимальны для функций потерь по абсолютным значениям , поскольку они минимизируют ожидаемые потери, а оценки методом наименьших квадратов оптимальны для функций потерь, возведенных в квадрат, поскольку они минимизировать ожидаемые потери.
В то время как статистики, использующие частотный вывод, должны сами выбирать интересующие параметры, а также оценщики / тестовые статистические данные , которые будут использоваться, отсутствие явно явных полезностей и предшествующих распределений помогло частотным процедурам широко рассматриваться как «объективные». [47]
Байесовский вывод
[ редактировать ]Байесовское исчисление описывает степени уверенности, используя «язык» вероятности; убеждения положительны, интегрируются в одно целое и подчиняются аксиомам вероятности. Байесовский вывод использует доступные апостериорные убеждения в качестве основы для создания статистических предположений. [48] Существует несколько различных обоснований использования байесовского подхода.
Примеры байесовского вывода
[ редактировать ]- Достоверный интервал для интервальной оценки
- Факторы Байеса для сравнения моделей
Байесовский вывод, субъективность и теория принятия решений
[ редактировать ]Многие неформальные байесовские выводы основаны на «интуитивно разумных» обобщениях апостериорных явлений. Например, таким образом можно мотивировать апостериорное среднее значение, медиану и моду, интервалы максимальной апостериорной плотности и факторы Байеса. пользователя Хотя для такого рода выводов не обязательно указывать функцию полезности , все эти сводки зависят (в некоторой степени) от заявленных предшествующих убеждений и обычно рассматриваются как субъективные выводы. (Методы предварительного строительства, не требующие внешнего вмешательства, были предложены , но еще не полностью разработаны.)
Формально байесовский вывод калибруется со ссылкой на явно заявленную полезность или функцию потерь; «Правило Байеса» — это правило, которое максимизирует ожидаемую полезность, усредненную по апостериорной неопределенности. Таким образом, формальный байесовский вывод автоматически обеспечивает оптимальные решения в теоретическом смысле решений. Учитывая предположения, данные и полезность, байесовский вывод может быть сделан практически для любой проблемы, хотя не каждый статистический вывод нуждается в байесовской интерпретации. Анализ, который формально не является байесовским, может быть (логически) бессвязным ; Особенностью байесовских процедур, использующих правильные априорные значения (т. е. интегрируемые до единицы), является то, что они гарантированно когерентны . Некоторые сторонники байесовского вывода утверждают, что вывод должен происходить в рамках теории принятия решений и что байесовский вывод не должен завершаться оценкой и обобщением апостериорных убеждений.
Вывод, основанный на правдоподобии
[ редактировать ]Вывод на основе правдоподобия — это парадигма, используемая для оценки параметров статистической модели на основе наблюдаемых данных. Правдоподобие приближается к статистике, используя функцию правдоподобия , обозначаемую как , количественно определяет вероятность наблюдения заданных данных , предполагая определенный набор значений параметров . В выводе на основе правдоподобия цель состоит в том, чтобы найти набор значений параметров, который максимизирует функцию правдоподобия или, что то же самое, максимизирует вероятность наблюдения заданных данных.
Процесс вывода на основе правдоподобия обычно включает в себя следующие этапы:
- Формулирование статистической модели: Статистическая модель определяется на основе рассматриваемой проблемы с указанием предположений о распределении и взаимосвязи между наблюдаемыми данными и неизвестными параметрами. Модель может быть простой, например нормальное распределение с известной дисперсией, или сложной, например иерархическая модель с несколькими уровнями случайных эффектов.
- Построение функции правдоподобия. Учитывая статистическую модель, функция правдоподобия строится путем оценки совместной плотности вероятности или функции массы наблюдаемых данных как функции неизвестных параметров. Эта функция представляет вероятность наблюдения данных для разных значений параметров.
- Максимизация функции правдоподобия. Следующий шаг — найти набор значений параметров, который максимизирует функцию правдоподобия. Этого можно достичь с помощью методов оптимизации, таких как алгоритмы численной оптимизации. Оценочные значения параметров, часто обозначаемые как , являются оценками максимального правдоподобия (MLE).
- Оценка неопределенности. После получения MLE крайне важно количественно оценить неопределенность, связанную с оценками параметров. Это можно сделать путем расчета стандартных ошибок , доверительных интервалов или проведения проверки гипотез на основе асимптотической теории или методов моделирования, таких как бутстрэппинг .
- Проверка модели: после получения оценок параметров и оценки их неопределенности важно оценить адекватность статистической модели. Это включает в себя проверку допущений, сделанных в модели, и оценку соответствия модели данным с использованием критериев согласия, остаточного анализа или графической диагностики.
- Вывод и интерпретация. Наконец, на основе предполагаемых параметров и оценки модели можно сделать статистический вывод. Это включает в себя получение выводов о параметрах популяции, составление прогнозов или проверку гипотез на основе оцененной модели.
Вывод на основе AIC
[ редактировать ]Этот раздел нуждается в расширении . Вы можете помочь, добавив к нему . ( ноябрь 2017 г. ) |
( Информационный критерий Акаике AIC) представляет собой оценку относительного качества статистических моделей для заданного набора данных. Учитывая набор моделей данных, AIC оценивает качество каждой модели по сравнению с каждой из других моделей. Таким образом, AIC предоставляет средства выбора модели .
AIC основан на теории информации : он предлагает оценку относительной потери информации, когда данная модель используется для представления процесса, в результате которого были сгенерированы данные. (При этом речь идет о компромиссе между степенью соответствия модели и ее простотой.)
Другие парадигмы вывода
[ редактировать ]Минимальная длина описания
[ редактировать ]Принцип минимальной длины описания (MDL) был разработан на основе идей теории информации. [49] и теория колмогоровской сложности . [50] Принцип (MDL) выбирает статистические модели, которые максимально сжимают данные; вывод происходит без предположения контрфактических или нефальсифицируемых «механизмов генерации данных» или вероятностных моделей для данных, как это могло бы быть сделано в частотных или байесовских подходах.
Однако если «механизм генерации данных» действительно существует, то согласно о теореме Шеннона кодировании источника он обеспечивает MDL-описание данных в среднем и асимптотически. [51] В плане минимизации длины описания (или описательной сложности) оценка MDL аналогична оценке максимального правдоподобия и максимальной апостериорной оценке (с использованием с максимальной энтропией байесовских априорных значений ). Однако MDL избегает предположения, что основная вероятностная модель известна; принцип MDL также может применяться без предположений о том, что, например, данные получены в результате независимой выборки. [51] [52]
Принцип MDL применялся в теории коммуникации-кодирования , в теории информации , в линейной регрессии , [52] и в интеллектуальном анализе данных . [50]
Для оценки процедур вывода на основе MDL часто используются методы или критерии теории сложности вычислений . [53]
Фидуциальный вывод
[ редактировать ]Фидуциальный вывод — это подход к статистическому выводу, основанный на фидуциальной вероятности , также известный как «фидуциальное распределение». В последующих работах этот подход был назван нечетким, крайне ограниченным в применимости и даже ошибочным. [54] [55] Однако этот аргумент такой же, как и тот, который показывает [56] что так называемое доверительное распределение не является действительным распределением вероятностей , и, поскольку это не лишило законной силы применение доверительных интервалов , оно не обязательно лишает законной силы выводы, сделанные на основе фидуциальных аргументов. Была предпринята попытка переосмыслить раннюю работу фидуциального аргумента Фишера как частный случай теории вывода с использованием верхних и нижних вероятностей . [57]
Структурный вывод
[ редактировать ]Развивая идеи Фишера и Питмана с 1938 по 1939 год, [58] Джордж А. Барнард разработал «структурный вывод» или «основной вывод». [59] подход, использующий инвариантные вероятности в семействах групп . Барнард переформулировал аргументы в пользу фидуциального вывода для ограниченного класса моделей, на которых «фидуциальные» процедуры были бы четко определены и полезны. Дональд А.С. Фрейзер разработал общую теорию структурного вывода. [60] на основе теории групп и применил ее к линейным моделям. [61] Теория, сформулированная Фрейзером, тесно связана с теорией принятия решений и байесовской статистикой и может обеспечить оптимальные частотные правила принятия решений, если они существуют. [62]
Темы вывода
[ редактировать ]Приведенные ниже темы обычно относятся к области статистических выводов .
- Статистические предположения
- Статистическая теория принятия решений
- Теория оценки
- Статистическая проверка гипотез
- Пересмотр мнений в статистике
- Планирование экспериментов , дисперсионный анализ и регрессия.
- Выборка опроса
- Обобщение статистических данных
Прогнозирующий вывод
[ редактировать ]Прогнозирующий вывод — это подход к статистическому выводу, который делает упор на предсказание будущих наблюдений на основе прошлых наблюдений.
Первоначально прогнозирующий вывод был основан на наблюдаемых параметрах и был основной целью изучения вероятности . [ нужна ссылка ] но он потерял популярность в 20 веке из-за нового параметрического подхода, впервые предложенного Бруно де Финетти . Этот подход моделировал явления как физическую систему, наблюдаемую с ошибкой (например, небесная механика ). Идея де Финетти о взаимозаменяемости — о том, что будущие наблюдения должны вести себя так же, как прошлые наблюдения — привлекла внимание англоязычного мира после перевода с французского в 1974 году его статьи 1937 года: [63] и с тех пор его предлагали такие статистики, как Сеймур Гейссер . [64]
См. также
[ редактировать ]- Алгоритмический вывод
- Индукция (философия)
- Неформальные логические рассуждения
- Теория информационного поля
- Доля населения
- Философия статистики
- Интервал прогнозирования
- Прогнозная аналитика
- Прогнозное моделирование
- Стилометрия
Примечания
[ редактировать ]- ↑ По мнению Пирса, принятие означает, что расследование по этому вопросу на данный момент прекращается. В науке все научные теории подлежат пересмотру.
Ссылки
[ редактировать ]Цитаты
[ редактировать ]- ^ Аптон, Г., Кук, И. (2008) Оксфордский статистический словарь , OUP. ISBN 978-0-19-954145-4 .
- ^ «Вывод TensorFlow Lite» .
Термин «вывод» относится к процессу выполнения модели TensorFlow Lite на устройстве с целью сделать прогнозы на основе входных данных.
- ^ Джонсон, Ричард (12 марта 2016 г.). «Статистический вывод» . Энциклопедия математики . Спрингер: Европейское математическое общество . Проверено 26 октября 2022 г.
- ^ Кониси и Китагава (2008), стр. 75.
- ^ Кокс (2006), с. 197.
- ^ «Статистический вывод — Математическая энциклопедия» . www.энциклопедияofmath.org . Проверено 23 января 2019 г.
- ^ Jump up to: а б Кокс (2006), стр. 2
- ^ Эванс, Майкл; и др. (2004). Вероятность и статистика: наука о неопределенности . Фримен и компания. п. 267. ИСБН 9780716747420 .
- ^ ван дер Ваарт, AW (1998) Асимптотическая статистика Издательство Кембриджского университета. ISBN 0-521-78450-6 (стр. 341)
- ^ Краскал 1988
- ^ Фридман, Д.А. (2008) «Анализ выживания: эпидемиологическая опасность?». Американский статистик (2008) 62: 110–119. (Перепечатано как глава 11 (стр. 169–192) книги Freedman (2010)).
- ^ Берк, Р. (2003) Регрессионный анализ: конструктивная критика (передовые количественные методы в социальных науках) (т. 11) Sage Publications. ISBN 0-7619-2904-5
- ^ Jump up to: а б Брюэр, Кен (2002). Выводы по выборке комбинированного обследования: взвешивание слонов Басу . Ходдер Арнольд. п. 6. ISBN 978-0340692295 .
- ^ Jump up to: а б Вероятность Йоргена Хоффмана-Йёргенсена с точки зрения статистики , том I. Страница 399 [ нужна полная цитата ]
- ^ Ле Кам (1986) [ нужна страница ]
- ^ Эрик Торгерсон (1991) Сравнение статистических экспериментов , том 36 Энциклопедии математики. Издательство Кембриджского университета. [ нужна полная цитата ]
- ^ Лизе, Фридрих и Миске, Клаус-Дж. (2008). Статистическая теория принятия решений: оценка, тестирование и отбор . Спрингер. ISBN 978-0-387-73193-3 .
- ^ Колмогоров (1963, стр.369): «Понятие частоты, основанное на понятии предельной частоты при увеличении числа испытаний до бесконечности, не дает ничего для обоснования применимости результатов теории вероятностей к реальным практическим задачам, где нам всегда приходится иметь дело с конечным числом испытаний».
- ^ "Действительно, предельные теоремы 'как стремится к бесконечности», логически лишены содержания о том, что происходит в любой конкретный момент. . Все, что они могут сделать, — это предложить определенные подходы, эффективность которых затем необходимо проверить в конкретном случае». — Ле Кам (1986) (стр. xiv)
- ^ Пфанзагль (1994): «Важнейший недостаток асимптотической теории: то, что мы ожидаем от асимптотической теории, - это результаты, которые верны приблизительно... Асимптотическая теория может предложить предельные теоремы». (стр. ix) «Что важно для приложений, так это приближения, а не пределы». (стр. 188)
- ^ Пфанзагль (1994): «Принимая предельную теорему как приблизительно верную для больших размеров выборки, мы допускаем ошибку, размер которой неизвестен. [...] Реалистичная информация об остальных ошибках может быть получена путем моделирования». (страница ix)
- ^ Нейман, Дж. (1934) «О двух различных аспектах репрезентативного метода: метод стратифицированной выборки и метод целенаправленного отбора», Журнал Королевского статистического общества , 97 (4), 557–625 JSTOR 2342192.
- ^ Jump up to: а б Хинкельманн и Кемпторн (2008) [ нужна страница ]
- ^ Рекомендации ASA для первого курса статистики для нестатистиков. (доступно на сайте АСА)
- ^ Дэвида А. Фридмана и других Статистика .
- ^ Мур и др. (2015).
- ^ Гельман А. и др. (2013). Байесовский анализ данных ( Чепмен и Холл ).
- ^ Пирс (1877-1878)
- ^ Пирс (1883)
- ^ Фридман, Пизани и Первс, 1978 .
- ^ Дэвида А. Фридмана Статистические модели .
- ^ Рао, CR (1997) Статистика и истина: шанс на работу , World Scientific. ISBN 981-02-3111-3
- ^ Пирс; Вольноотпущенник; Мур и др. (2015). [ нужна ссылка ]
- ^ Box, GEP и друзья (2006) Улучшение почти всего: идеи и эссе, исправленное издание , Wiley. ISBN 978-0-471-72755-2
- ^ Кокс (2006), с. 196.
- ^ Рекомендации ASA для первого курса статистики для нестатистиков. (доступно на сайте АСА)
- Дэвид А. Фридман и его псевдоним «Статистика» .
- Мур и др. (2015).
- ^ Нейман, Ежи. 1923 [1990]. «О применении теории вероятностей к сельскохозяйственным экспериментам. Очерк принципов. Раздел 9». Статистическая наука 5 (4): 465–472. Пер. Дорота М. Дабровска и Теренс П. Спид.
- ^ Хинкельманн и Кемпторн (2008) [ нужна страница ]
- ^ Динов, Иво; Паланималай, Сельвам; Харе, Ашвини; Кристу, Николя (2018). «Статистический вывод на основе рандомизации: инфраструктура повторной выборки и моделирования» . Преподавание статистики . 40 (2): 64–73. дои : 10.1111/test.12156 . ПМК 6155997 . ПМИД 30270947 .
- ^ Хинкельманн и Кемпторн (2008) Глава 6.
- ^ Динов, Иво; Паланималай, Сельвам; Харе, Ашвини; Кристу, Николя (2018). «Статистический вывод на основе рандомизации: инфраструктура повторной выборки и моделирования» . Преподавание статистики . 40 (2): 64–73. дои : 10.1111/test.12156 . ПМК 6155997 . ПМИД 30270947 .
- ^ Тан, Мин; Гао, Чао; Гутман, Стивен; Калинин Александр; Мукерджи, Бхрамар; Гуань, Юаньфан; Динов, Иво (2019). «Методические и безмодельные методы прогнозирования диагностики бокового амиотрофического склероза и кластеризации пациентов» . Нейроинформатика . 17 (3): 407–421. дои : 10.1007/s12021-018-9406-9 . ПМК 6527505 . ПМИД 30460455 .
- ^ Политис, Д.Н. (2019). «Безмодельный вывод в статистике: как и почему» . Бюллетень ИМС . 48 .
- ^ Bandyopadhyay & Forster (2011). См. Введение к книге (стр. 3) и «Раздел III: Четыре парадигмы статистики».
- ^ Нейман, Дж. (1937). «Очерк теории статистического оценивания, основанной на классической теории вероятностей» . Философские труды Лондонского королевского общества А. 236 (767): 333–380. Бибкод : 1937RSPTA.236..333N . дои : 10.1098/rsta.1937.0005 . JSTOR 91337 .
- ^ Предисловие к Пфанцаглю.
- ^ Литтл, Родерик Дж. (2006). «Калиброванный Байес: дорожная карта Байеса/частотника». Американский статистик . 60 (3): 213–223. дои : 10.1198/000313006X117837 . ISSN 0003-1305 . JSTOR 27643780 . S2CID 53505632 .
- ^ Ли, Се Юн (2021). «Сэмплер Гиббса и вариационный вывод по координатному восхождению: теоретико-множественный обзор». Коммуникации в статистике - теория и методы . 51 (6): 1549–1568. arXiv : 2008.01006 . дои : 10.1080/03610926.2021.1921214 . S2CID 220935477 .
- ^ Суфи (2000)
- ^ Jump up to: а б Хансен и Ю (2001)
- ^ Jump up to: а б Хансен и Ю (2001), стр. 747.
- ^ Jump up to: а б Риссанен (1989), стр. 84.
- ^ Джозеф Ф. Трауб, Г.В. Васильковски и Х. Возняковски. (1988) [ нужна страница ]
- ^ Нейман (1956)
- ^ Забелл (1992)
- ^ Кокс (2006), стр. 66
- ^ Хампель 2003 .
- ^ Дэвисон, страница 12. [ нужна полная цитата ]
- ^ Барнард, Джорджия (1995) «Основные модели и фидуциальный аргумент», International Statistical Review, 63 (3), 309–323. JSTOR 1403482
- ^ Фрейзер, DAS (1968). Структура вывода . Нью-Йорк: Уайли. ISBN 0-471-27548-4 . OCLC 440926 .
- ^ Фрейзер, DAS (1979). Вывод и линейные модели . Лондон: МакГроу-Хилл. ISBN 0-07-021910-9 . ОСЛК 3559629 .
- ^ Таральдсен, Гуннар; Линдквист, Бо Генри (01 февраля 2013 г.). «Фидуциальная теория и оптимальный вывод» . Анналы статистики . 41 (1). arXiv : 1301.1717 . дои : 10.1214/13-AOS1083 . ISSN 0090-5364 . S2CID 88520957 .
- ^ Де Финетти, Бруно (1937). «Прогнозирование: его логические законы, его субъективные источники». Анналы Института Анри Пуанкаре . 7 (1): 1–68. ISSN 0365-320X . Переведено на Де Финетти, Бруно (1992). «Форсайт: его логические законы, его субъективные источники». Прорывы в статистике . Серия Спрингера по статистике. стр. 134–174. дои : 10.1007/978-1-4612-0919-5_10 . ISBN 978-0-387-94037-3 .
- ^ Гейссер, Сеймур (1993) Прогнозирующий вывод: введение , CRC Press. ISBN 0-412-03471-9
Источники
[ редактировать ]- Бандиопадхьяй, PS; Форстер, MR, ред. (2011), Философия статистики , Elsevier .
- Бикель, Питер Дж.; Доксум, Кьелл А. (2001). Математическая статистика: Основные и избранные темы . Том. 1 (Второе (обновленное издание 2007 г.) изд.). Прентис Холл . ISBN 978-0-13-850363-5 . МР 0443141 .
- Кокс, Д.Р. (2006). Принципы статистического вывода , Издательство Кембриджского университета . ISBN 0-521-68567-2 .
- Фишер, Р.А. (1955), «Статистические методы и научная индукция», Журнал Королевского статистического общества , серия B , 17, 69–78. (критика статистических теорий Ежи Неймана и Абрахама Вальда )
- Фридман, Д.А. (2009). Статистические модели: теория и практика (переработанная ред.). Издательство Кембриджского университета . стр. xiv+442 стр. ISBN 978-0-521-74385-3 . МР 2489600 .
- Фридман, Д.А. (2010). Статистические модели и причинные выводы: диалог с социальными науками (под редакцией Дэвида Коллиера , Джасджита Сехона и Филипа Б. Старка), Cambridge University Press .
- Хэмпель, Фрэнк Р. (февраль 2003 г.). «Правильный фидуциальный аргумент». Семинар по статистике, Швейцарский федеральный технологический институт (ETH) . 114 . doi : 10.3929/ethz-a-004526011 .
- Хансен, Марк Х.; Ю, Бин (июнь 2001 г.). «Выбор модели и принцип минимальной длины описания: обзорная статья» . Журнал Американской статистической ассоциации . 96 (454): 746–774. CiteSeerX 10.1.1.43.6581 . дои : 10.1198/016214501753168398 . JSTOR 2670311 . МР 1939352 . S2CID 14460386 . Архивировано из оригинала 16 ноября 2004 г.
- Хинкельманн, Клаус; Кемпторн, Оскар (2008). Введение в экспериментальный дизайн (второе изд.). Уайли. ISBN 978-0-471-72756-9 .
- Колмогоров, Андрей Н. (1963). «О таблицах случайных чисел». Санкхья Сер. А. 25 : 369–375. МР 0178484 . Перепечатано как Колмогоров, Андрей Н. (1998). «О таблицах случайных чисел» . Теоретическая информатика . 207 (2): 387–395. дои : 10.1016/S0304-3975(98)00075-9 . МР 1643414 .
- Кониси С., Китагава Г. (2008), Информационные критерии и статистическое моделирование , Springer.
- Краскал, Уильям (декабрь 1988 г.). «Чудеса и статистика: случайное принятие независимости (послание президента АСА)» . Журнал Американской статистической ассоциации . 83 (404): 929–940. дои : 10.2307/2290117 . JSTOR 2290117 .
- Ле Кам, Люциан . (1986) Асимптотические методы статистической теории принятия решений , Springer. ISBN 0-387-96307-3
- Мур, Д.С. ; Маккейб, врач общей практики; Крейг, BA (2015), Введение в практику статистики , восьмое издание, Macmillan.
- Нейман, Ежи (1956). «Примечание к статье сэра Рональда Фишера». Журнал Королевского статистического общества, серия B. 18 (2): 288–294. дои : 10.1111/j.2517-6161.1956.tb00236.x . JSTOR 2983716 . (ответ Фишеру, 1955 г.)
- Пирс, CS (1877–1878), «Иллюстрации логики науки» (серия), Popular Science Monthly , тт. 12–13. Соответствующие отдельные документы:
- (Март 1878 г.), «Доктрина шансов», Popular Science Monthly , т. 12, мартовский выпуск, стр. 604–615 . Интернет-архив Эпринт .
- (Апрель 1878 г.), «Вероятность индукции», Popular Science Monthly , т. 12, стр. 705–718 . Интернет-архив Эпринт .
- (июнь 1878 г.), «Порядок природы», Popular Science Monthly , т. 13, стр. 203–217 . Интернет-архив Эпринт .
- (август 1878 г.), «Дедукция, индукция и гипотеза», Popular Science Monthly , т. 13, стр. 470–482 . Интернет-архив Эпринт .
- Пирс, CS (1883), «Теория вероятного вывода», Исследования по логике , стр. 126–181 , Little, Brown and Company. (Перепечатано в 1983 году, издательство John Benjamins Publishing Company , ISBN 90-272-3271-7 )
- Фридман, Д.А. ; Пизани, Р.; Пурвес, Р.А. (1978). Статистика . Нью-Йорк: WW Norton & Company .
- Пфанцагль, Иоганн; при содействии Р. Хамбокера (1994). Параметрическая статистическая теория . Берлин: Вальтер де Грюйтер . ISBN 978-3-11-013863-4 . МР 1291393 .
- Риссанен, Йорма (1989). Стохастическая сложность в статистических исследованиях . Серия по информатике. Том. 15. Сингапур: World Scientific . ISBN 978-9971-5-0859-3 . МР 1082556 .
- Суфи, Эхсан С. (декабрь 2000 г.). «Основные теоретико-информационные подходы (Виньетки за 2000 год: теория и методы, под ред. Джорджа Казеллы)». Журнал Американской статистической ассоциации . 95 (452): 1349–1353. дои : 10.1080/01621459.2000.10474346 . JSTOR 2669786 . МР 1825292 . S2CID 120143121 .
- Трауб, Джозеф Ф .; Васильковски, Г.В.; Возняковский, Х. (1988). Информационная сложность . Академическая пресса. ISBN 978-0-12-697545-1 .
- Забелл, С.Л. (август 1992 г.). «РА Фишер и фидуциальный аргумент» . Статистическая наука . 7 (3): 369–387. дои : 10.1214/ss/1177011233 . JSTOR 2246073 .
Дальнейшее чтение
[ редактировать ]- Казелла, Г. , Бергер, Р.Л. (2002). Статистический вывод . Даксбери Пресс. ISBN 0-534-24312-6
- Фридман, Д.А. (1991). «Статистические модели и обувная кожа». Социологическая методология . 21 : 291–313. дои : 10.2307/270939 . JSTOR 270939 .
- Хелд Л., Бове Д.С. (2014). Прикладной статистический вывод — метод правдоподобия и Байес (Спрингер).
- Ленхард, Йоханнес (2006). «Модели и статистические выводы: полемика между Фишером и Нейманом-Пирсоном» (PDF) . Британский журнал философии науки . 57 : 69–91. дои : 10.1093/bjps/axi152 . S2CID 14136146 .
- Линдли, Д. (1958). «Фидуциальное распределение и теорема Байеса». Журнал Королевского статистического общества, серия B. 20 : 102–7. дои : 10.1111/j.2517-6161.1958.tb00278.x .
- Ральф, Томас (2014). «Статистический вывод», в Клоде Диболте и Михаэле Хауперте (ред.), «Справочник по клиометрике (справочная серия Springer)», Берлин / Гейдельберг: Springer.
- Рид, Н.; Кокс, Д.Р. (2014). «О некоторых принципах статистического вывода». Международный статистический обзор . 83 (2): 293–308. дои : 10.1111/insr.12067 . hdl : 10.1111/insr.12067 . S2CID 17410547 .
- Сагитов, Серик (2022). «Статистический вывод». Викикниги. http://upload.wikimedia.org/wikipedia/commons/f/f9/Statistical_Inference.pdf
- Янг, Джорджия, Смит, Р.Л. (2005). Основы статистического вывода , CUP. ISBN 0-521-83971-8
Внешние ссылки
[ редактировать ]- Статистический вывод – лекция на MIT OpenCourseWare платформе
- Статистический вывод - лекция Национальной программы по технологическому обучению
- Онлайн-версия байесовского демо-калькулятора (MCMC) доступна на сайте causaScientia.