Jump to content

Вычислительная статистика

Студенты работают в статистическом машинном зале Лондонской школы экономики в 1964 году.

Вычислительная статистика или статистические вычисления — это исследование, которое является пересечением статистики и информатики и относится к статистическим методам, которые становятся возможными благодаря использованию вычислительных методов. Это область вычислительной науки (или научных вычислений), специфичная для математической науки статистики . Эта сфера быстро развивается. Мнение о том, что более широкая концепция вычислений должна преподаваться как часть общего статистического образования, набирает силу. [1]

Как и в традиционной статистике, цель состоит в том, чтобы превратить необработанные данные в знания . [2] но основное внимание уделяется компьютерным статистическим методам , таким как случаи с очень большим размером выборки и неоднородными наборами данных . [2]

Термины «вычислительная статистика» и «статистические вычисления» часто используются как синонимы, хотя Карло Лауро (бывший президент Международной ассоциации статистических вычислений ) предложил провести различие, определив «статистические вычисления» как «применение информатики к статистике». ",и «вычислительная статистика» как «направленная на разработку алгоритма реализациистатистические методы на ЭВМ, в том числе немыслимые до появления ЭВМвозраста (например, бутстрап , моделирование ), а также справляться с аналитически трудноразрешимыми задачами» [ sic ]. [3]

Термин «вычислительная статистика» также может использоваться для обозначения статистических методов, требующих большого объема вычислений, включая повторной выборки методы Монте-Карло с цепями Маркова , методы , локальную регрессию , оценку плотности ядра , искусственные нейронные сети и обобщенные аддитивные модели .

История [ править ]

Хотя вычислительная статистика сегодня широко используется, на самом деле она имеет относительно короткую историю признания в статистическом сообществе. По большей части основатели области статистики полагались на математику и асимптотические приближения при разработке методологии вычислительной статистики. [4]

В 1908 году Уильям Сили Госсет выполнил свое ныне известное моделирование методом Монте-Карло , которое привело к открытию t-распределения Стьюдента . [5] С помощью вычислительных методов он также имеет графики эмпирических распределений, наложенные на соответствующие теоретические распределения. Компьютер произвел революцию в моделировании и сделал повторение эксперимента Госсета не более чем упражнением. [6] [7]

Позже ученые предложили вычислительные способы генерации псевдослучайных отклонений, реализовали методы преобразования равномерных отклонений в другие формы распределения с использованием обратной кумулятивной функции распределения или методов принятия-отклонения, а также разработали методологию пространства состояний для цепи Маркова Монте-Карло . [8] Одна из первых попыток генерировать случайные цифры полностью автоматическим способом была предпринята корпорацией RAND в 1947 году. Полученные таблицы были опубликованы в виде книги в 1955 году , а также в виде серии перфокарт.

К середине 1950-х годов было предложено несколько статей и патентов на устройства для генераторов случайных чисел . [9] Разработка этих устройств была мотивирована необходимостью использовать случайные цифры для моделирования и других фундаментальных компонентов статистического анализа. Одним из наиболее известных таких устройств является ERNIE, которое генерирует случайные числа, которые определяют победителей Premium Bond , лотерейных облигаций, выпущенных в Соединенном Королевстве. В 1958 году Джон Тьюки разработал нож складной . Это метод уменьшения систематической ошибки оценок параметров в выборках в нестандартных условиях. [10] Для практической реализации этого необходимы компьютеры. К этому моменту компьютеры сделали возможным проведение многих утомительных статистических исследований. [11]

Методы [ править ]

максимального правдоподобия Оценка

Оценка максимального правдоподобия используется для оценки параметров с учетом предполагаемого распределения вероятностей некоторых наблюдаемых данных. Это достигается путем максимизации функции правдоподобия так, чтобы наблюдаемые данные были наиболее вероятными в рамках принятой статистической модели .

Метод Монте-Карло [ править ]

Монте-Карло — это статистический метод, основанный на повторной случайной выборке для получения численных результатов. Идея состоит в том, чтобы использовать случайность для решения проблем, которые в принципе могут быть детерминированными . Они часто используются в физических и математических задачах и наиболее полезны, когда трудно использовать другие подходы. Методы Монте-Карло в основном используются в трех классах задач: оптимизация , численное интегрирование и генерация результатов из распределения вероятностей .

Цепь Маркова Карло Монте -

Метод Монте-Карло цепи Маркова создает выборки из непрерывной случайной величины с плотностью вероятности , пропорциональной известной функции. Эти выборки можно использовать для оценки интеграла по этой переменной, например ее ожидаемого значения или дисперсии . Чем больше шагов включено, тем точнее распределение выборки соответствует фактическому желаемому распределению.


Начальная загрузка

Бутстрап эмпирического — это метод повторной выборки, используемый для создания выборок из распределения вероятностей, определенного исходной выборкой совокупности. Его можно использовать для поиска предварительной оценки параметра совокупности. Его также можно использовать для оценки стандартной ошибки оценщика, а также для создания доверительных интервалов с начальной загрузкой. - Складной нож родственная техника. [12] .

Приложения [ править ]

Журналы вычислительной статистики

Ассоциации [ править ]

См. также [ править ]

Ссылки [ править ]

  1. ^ Нолан, Д. и Темпл Лэнг, Д. (2010). «Вычисления в учебной программе по статистике», The American Statistician 64 (2), стр. 97–107.
  2. Перейти обратно: Перейти обратно: а б Вегман, Эдвард Дж. « Вычислительная статистика: новая программа статистической теории и практики». Журнал Вашингтонской академии наук , вып. 78, нет. 4, 1988, стр. 310–322. ДЖСТОР
  3. ^ Лауро, Карло (1996), «Вычислительная статистика или статистические вычисления, в этом вопрос?», Вычислительная статистика и анализ данных , 23 (1): 191–193, doi : 10.1016/0167-9473(96)88920-1
  4. ^ Ватник, Митчелл (2011). «Ранняя вычислительная статистика» . Журнал вычислительной и графической статистики . 20 (4): 811–817. дои : 10.1198/jcgs.2011.204b . ISSN   1061-8600 . S2CID   120111510 .
  5. ^ «Студент» [ Уильям Сили Госсет ] (1908). «Вероятная ошибка среднего» (PDF) . Биометрика . 6 (1): 1–25. дои : 10.1093/биомет/6.1.1 . hdl : 10338.dmlcz/143545 . JSTOR   2331554 . {{cite journal}}: CS1 maint: числовые имена: список авторов ( ссылка )
  6. ^ Трэхан, Трэвис Джон (3 октября 2019 г.). Последние достижения в методах Монте-Карло в Национальной лаборатории Лос-Аламоса (Отчет). дои : 10.2172/1569710 . ОСТИ   1569710 .
  7. ^ Метрополис, Николай; Улам, С. (1949). «Метод Монте-Карло» . Журнал Американской статистической ассоциации . 44 (247): 335–341. дои : 10.1080/01621459.1949.10483310 . ISSN   0162-1459 . ПМИД   18139350 .
  8. ^ Роберт, Кристиан; Казелла, Джордж (01 февраля 2011 г.). «Краткая история цепи Маркова Монте-Карло: субъективные воспоминания на основе неполных данных» . Статистическая наука . 26 (1). arXiv : 0808.2902 . дои : 10.1214/10-стс351 . ISSN   0883-4237 . S2CID   2806098 .
  9. ^ Пьер Л'Экуйер (2017). «История генерации равномерных случайных чисел» (PDF) . Зимняя конференция по моделированию (WSC) 2017 . стр. 202–230. дои : 10.1109/WSC.2017.8247790 . ISBN  978-1-5386-3428-8 . S2CID   4567651 .
  10. ^ КВЕНУЙ, МЗ (1956). «Заметки о предвзятости в оценке» . Биометрика . 43 (3–4): 353–360. дои : 10.1093/biomet/43.3-4.353 . ISSN   0006-3444 .
  11. ^ Тейхроу, Дэниел (1965). «История выборки распределения до эры компьютеров и ее значение для моделирования» . Журнал Американской статистической ассоциации . 60 (309): 27–49. дои : 10.1080/01621459.1965.10480773 . ISSN   0162-1459 .
  12. ^ Риццо, Мария. Статистические вычисления с помощью R . ISBN  9781420010718 .

Дальнейшее чтение [ править ]

Статьи [ править ]

  • Альберт, Дж. Х.; Джентл, Дж. Э. (2004), Альберт, Джеймс Х; Джентл, Джеймс Э. (ред.), «Специальный раздел: Обучение вычислительной статистике», Американский статистик , 58 : 1, doi : 10.1198/0003130042872 , S2CID   219596225
  • Уилкинсон, Лиланд (2008), «Будущее статистических вычислений (с обсуждением)», Technometrics , 50 (4): 418–435, doi : 10.1198/004017008000000460 , S2CID   3521989

Книги [ править ]

  • Дрю, Джон Х.; Эванс, Дайан Л .; Глен, Эндрю Г.; Лемис, Лоуренс М. (2007), Вычислительная вероятность: алгоритмы и приложения в математических науках , Международная серия Springer по исследованию операций и науке управления, Springer, ISBN  978-0-387-74675-3
  • Джентл, Джеймс Э. (2002), Элементы вычислительной статистики , Springer, ISBN  0-387-95489-9
  • Нежный, Джеймс Э.; Хердле, Вольфганг; Мори, Юичи, ред. (2004), Справочник по вычислительной статистике: концепции и методы , Springer, ISBN  3-540-40464-3
  • Гивенс, Джефф Х.; Хоетинг, Дженнифер А. (2005), Вычислительная статистика , Серия Уайли по вероятности и статистике, Wiley-Interscience, ISBN  978-0-471-46124-1
  • Клеменс, Бен (2008), Моделирование с данными: инструменты и методы статистических вычислений , Princeton University Press, ISBN  978-0-691-13314-0
  • Монахан, Джон (2001), Численные методы статистики , издательство Кембриджского университета, ISBN  978-0-521-79168-7
  • Роуз, Колин; Смит, Мюррей Д. (2002), Математическая статистика с Mathematica , Тексты Springer в статистике, Springer, ISBN  0-387-95234-9
  • Тистед, Рональд Аарон (1988), Элементы статистических вычислений: численные вычисления , CRC Press, ISBN  0-412-01371-1
  • Гариб, Реда. Р. (2017), Наука о данных: научные и статистические вычисления , Noor Publishing, ISBN  978-3-330-97256-8

Внешние ссылки [ править ]

Ассоциации [ править ]

Журналы [ править ]

Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 6a404728920351faf01d966642b95118__1716780780
URL1:https://arc.ask3.ru/arc/aa/6a/18/6a404728920351faf01d966642b95118.html
Заголовок, (Title) документа по адресу, URL1:
Computational statistics - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)