Вычислительная статистика

Вычислительная статистика или статистические вычисления — это исследование, которое является пересечением статистики и информатики и относится к статистическим методам, которые становятся возможными благодаря использованию вычислительных методов. Это область вычислительной науки (или научных вычислений), специфичная для математической науки статистики . Эта сфера быстро развивается. Мнение о том, что более широкая концепция вычислений должна преподаваться как часть общего статистического образования, набирает силу. [1]
Как и в традиционной статистике, цель состоит в том, чтобы превратить необработанные данные в знания . [2] но основное внимание уделяется компьютерным статистическим методам , таким как случаи с очень большим размером выборки и неоднородными наборами данных . [2]
Термины «вычислительная статистика» и «статистические вычисления» часто используются как синонимы, хотя Карло Лауро (бывший президент Международной ассоциации статистических вычислений ) предложил провести различие, определив «статистические вычисления» как «применение информатики к статистике». ",и «вычислительная статистика» как «направленная на разработку алгоритма реализациистатистические методы на ЭВМ, в том числе немыслимые до появления ЭВМвозраста (например, бутстрап , моделирование ), а также справляться с аналитически трудноразрешимыми задачами» [ sic ]. [3]
Термин «вычислительная статистика» также может использоваться для обозначения статистических методов, требующих большого объема вычислений, включая повторной выборки методы Монте-Карло с цепями Маркова , методы , локальную регрессию , оценку плотности ядра , искусственные нейронные сети и обобщенные аддитивные модели .
История [ править ]
Хотя вычислительная статистика сегодня широко используется, на самом деле она имеет относительно короткую историю признания в статистическом сообществе. По большей части основатели области статистики полагались на математику и асимптотические приближения при разработке методологии вычислительной статистики. [4]
В 1908 году Уильям Сили Госсет выполнил свое ныне известное моделирование методом Монте-Карло , которое привело к открытию t-распределения Стьюдента . [5] С помощью вычислительных методов он также имеет графики эмпирических распределений, наложенные на соответствующие теоретические распределения. Компьютер произвел революцию в моделировании и сделал повторение эксперимента Госсета не более чем упражнением. [6] [7]
Позже ученые предложили вычислительные способы генерации псевдослучайных отклонений, реализовали методы преобразования равномерных отклонений в другие формы распределения с использованием обратной кумулятивной функции распределения или методов принятия-отклонения, а также разработали методологию пространства состояний для цепи Маркова Монте-Карло . [8] Одна из первых попыток генерировать случайные цифры полностью автоматическим способом была предпринята корпорацией RAND в 1947 году. Полученные таблицы были опубликованы в виде книги в 1955 году , а также в виде серии перфокарт.
К середине 1950-х годов было предложено несколько статей и патентов на устройства для генераторов случайных чисел . [9] Разработка этих устройств была мотивирована необходимостью использовать случайные цифры для моделирования и других фундаментальных компонентов статистического анализа. Одним из наиболее известных таких устройств является ERNIE, которое генерирует случайные числа, которые определяют победителей Premium Bond , лотерейных облигаций, выпущенных в Соединенном Королевстве. В 1958 году Джон Тьюки разработал нож складной . Это метод уменьшения систематической ошибки оценок параметров в выборках в нестандартных условиях. [10] Для практической реализации этого необходимы компьютеры. К этому моменту компьютеры сделали возможным проведение многих утомительных статистических исследований. [11]
Методы [ править ]
максимального правдоподобия Оценка
Оценка максимального правдоподобия используется для оценки параметров с учетом предполагаемого распределения вероятностей некоторых наблюдаемых данных. Это достигается путем максимизации функции правдоподобия так, чтобы наблюдаемые данные были наиболее вероятными в рамках принятой статистической модели .
Метод Монте-Карло [ править ]
Монте-Карло — это статистический метод, основанный на повторной случайной выборке для получения численных результатов. Идея состоит в том, чтобы использовать случайность для решения проблем, которые в принципе могут быть детерминированными . Они часто используются в физических и математических задачах и наиболее полезны, когда трудно использовать другие подходы. Методы Монте-Карло в основном используются в трех классах задач: оптимизация , численное интегрирование и генерация результатов из распределения вероятностей .
Цепь Маркова Карло Монте -
Метод Монте-Карло цепи Маркова создает выборки из непрерывной случайной величины с плотностью вероятности , пропорциональной известной функции. Эти выборки можно использовать для оценки интеграла по этой переменной, например ее ожидаемого значения или дисперсии . Чем больше шагов включено, тем точнее распределение выборки соответствует фактическому желаемому распределению.
Начальная загрузка
Бутстрап эмпирического — это метод повторной выборки, используемый для создания выборок из распределения вероятностей, определенного исходной выборкой совокупности. Его можно использовать для поиска предварительной оценки параметра совокупности. Его также можно использовать для оценки стандартной ошибки оценщика, а также для создания доверительных интервалов с начальной загрузкой. - Складной нож родственная техника. [12] .
Приложения [ править ]
- Вычислительная биология
- Компьютерная лингвистика
- Вычислительная физика
- Вычислительная математика
- Вычислительное материаловедение
- Машинное обучение
Журналы вычислительной статистики
- Коммуникации в статистике — моделирование и вычисления
- Вычислительная статистика
- Вычислительная статистика и анализ данных
- Журнал вычислительной и графической статистики
- Журнал статистических вычислений и моделирования
- Журнал статистического программного обеспечения
- Журнал R
- Стата Журнал
- Статистика и вычисления
- Междисциплинарные обзоры Wiley: вычислительная статистика
Ассоциации [ править ]
См. также [ править ]
- Алгоритмы статистической классификации
- Наука о данных
- Статистические методы в искусственном интеллекте
- Бесплатное статистическое программное обеспечение
- Список статистических алгоритмов
- Список статистических пакетов
- Машинное обучение
Ссылки [ править ]
- ^ Нолан, Д. и Темпл Лэнг, Д. (2010). «Вычисления в учебной программе по статистике», The American Statistician 64 (2), стр. 97–107.
- ↑ Перейти обратно: Перейти обратно: а б Вегман, Эдвард Дж. « Вычислительная статистика: новая программа статистической теории и практики». Журнал Вашингтонской академии наук , вып. 78, нет. 4, 1988, стр. 310–322. ДЖСТОР
- ^ Лауро, Карло (1996), «Вычислительная статистика или статистические вычисления, в этом вопрос?», Вычислительная статистика и анализ данных , 23 (1): 191–193, doi : 10.1016/0167-9473(96)88920-1
- ^ Ватник, Митчелл (2011). «Ранняя вычислительная статистика» . Журнал вычислительной и графической статистики . 20 (4): 811–817. дои : 10.1198/jcgs.2011.204b . ISSN 1061-8600 . S2CID 120111510 .
- ^ «Студент» [ Уильям Сили Госсет ] (1908). «Вероятная ошибка среднего» (PDF) . Биометрика . 6 (1): 1–25. дои : 10.1093/биомет/6.1.1 . hdl : 10338.dmlcz/143545 . JSTOR 2331554 .
{{cite journal}}
: CS1 maint: числовые имена: список авторов ( ссылка ) - ^ Трэхан, Трэвис Джон (3 октября 2019 г.). Последние достижения в методах Монте-Карло в Национальной лаборатории Лос-Аламоса (Отчет). дои : 10.2172/1569710 . ОСТИ 1569710 .
- ^ Метрополис, Николай; Улам, С. (1949). «Метод Монте-Карло» . Журнал Американской статистической ассоциации . 44 (247): 335–341. дои : 10.1080/01621459.1949.10483310 . ISSN 0162-1459 . ПМИД 18139350 .
- ^ Роберт, Кристиан; Казелла, Джордж (01 февраля 2011 г.). «Краткая история цепи Маркова Монте-Карло: субъективные воспоминания на основе неполных данных» . Статистическая наука . 26 (1). arXiv : 0808.2902 . дои : 10.1214/10-стс351 . ISSN 0883-4237 . S2CID 2806098 .
- ^ Пьер Л'Экуйер (2017). «История генерации равномерных случайных чисел» (PDF) . Зимняя конференция по моделированию (WSC) 2017 . стр. 202–230. дои : 10.1109/WSC.2017.8247790 . ISBN 978-1-5386-3428-8 . S2CID 4567651 .
- ^ КВЕНУЙ, МЗ (1956). «Заметки о предвзятости в оценке» . Биометрика . 43 (3–4): 353–360. дои : 10.1093/biomet/43.3-4.353 . ISSN 0006-3444 .
- ^ Тейхроу, Дэниел (1965). «История выборки распределения до эры компьютеров и ее значение для моделирования» . Журнал Американской статистической ассоциации . 60 (309): 27–49. дои : 10.1080/01621459.1965.10480773 . ISSN 0162-1459 .
- ^ Риццо, Мария. Статистические вычисления с помощью R . ISBN 9781420010718 .
Дальнейшее чтение [ править ]
Статьи [ править ]
- Альберт, Дж. Х.; Джентл, Дж. Э. (2004), Альберт, Джеймс Х; Джентл, Джеймс Э. (ред.), «Специальный раздел: Обучение вычислительной статистике», Американский статистик , 58 : 1, doi : 10.1198/0003130042872 , S2CID 219596225
- Уилкинсон, Лиланд (2008), «Будущее статистических вычислений (с обсуждением)», Technometrics , 50 (4): 418–435, doi : 10.1198/004017008000000460 , S2CID 3521989
Книги [ править ]
- Дрю, Джон Х.; Эванс, Дайан Л .; Глен, Эндрю Г.; Лемис, Лоуренс М. (2007), Вычислительная вероятность: алгоритмы и приложения в математических науках , Международная серия Springer по исследованию операций и науке управления, Springer, ISBN 978-0-387-74675-3
- Джентл, Джеймс Э. (2002), Элементы вычислительной статистики , Springer, ISBN 0-387-95489-9
- Нежный, Джеймс Э.; Хердле, Вольфганг; Мори, Юичи, ред. (2004), Справочник по вычислительной статистике: концепции и методы , Springer, ISBN 3-540-40464-3
- Гивенс, Джефф Х.; Хоетинг, Дженнифер А. (2005), Вычислительная статистика , Серия Уайли по вероятности и статистике, Wiley-Interscience, ISBN 978-0-471-46124-1
- Клеменс, Бен (2008), Моделирование с данными: инструменты и методы статистических вычислений , Princeton University Press, ISBN 978-0-691-13314-0
- Монахан, Джон (2001), Численные методы статистики , издательство Кембриджского университета, ISBN 978-0-521-79168-7
- Роуз, Колин; Смит, Мюррей Д. (2002), Математическая статистика с Mathematica , Тексты Springer в статистике, Springer, ISBN 0-387-95234-9
- Тистед, Рональд Аарон (1988), Элементы статистических вычислений: численные вычисления , CRC Press, ISBN 0-412-01371-1
- Гариб, Реда. Р. (2017), Наука о данных: научные и статистические вычисления , Noor Publishing, ISBN 978-3-330-97256-8
Внешние ссылки [ править ]
Ассоциации [ править ]
- Международная ассоциация статистических вычислений
- Секция статистических вычислений Американской статистической ассоциации