Jump to content

Все модели неправильные

Все модели неверны – распространенный афоризм и анаподотон в статистике ; его часто расширяют как «Все модели неверны, но некоторые полезны». В афоризме признается, что статистические модели всегда не отражают сложности реальности, но, тем не менее, могут быть полезны. Первоначально этот афоризм относился только к статистическим моделям, но теперь его иногда используют и к научным моделям в целом. [1]

Афоризм обычно приписывают Джорджу Э.П. Боксу , британскому статистику , хотя основная концепция возникла еще до работ Бокса.

Цитаты Джорджа Бокса

[ редактировать ]
Джордж Бокс

Первое заявление Бокса о том, что «все модели неверны», содержится в статье 1976 года, опубликованной в Журнале Американской статистической ассоциации . [2] В статье 1976 года этот афоризм встречается дважды. В двух разделах статьи, содержащих афоризм, говорится:

2.3 Экономия
Поскольку все модели неверны, ученый не может получить «правильную» модель путем чрезмерной разработки. Напротив, вслед за Уильямом Оккамом он должен стремиться к экономичному описанию природных явлений. Подобно тому, как способность разрабатывать простые, но запоминающиеся модели является отличительной чертой великого ученого, так и чрезмерная проработка и параметризация часто являются признаком посредственности.
2.4 Беспокойство выборочное

Поскольку все модели неверны, учёный должен быть в курсе того, что является неправильным. Неуместно беспокоиться о безопасности от мышей, когда за границей есть тигры.

Бокс повторил этот афоризм в статье, опубликованной в материалах статистического семинара 1978 года. [3] В документе есть раздел под названием «Все модели неверны, но некоторые полезны». В разделе говорится (стр. 202-3):

Было бы очень замечательно, если бы любую систему, существующую в реальном мире, можно было точно представить с помощью какой-либо простой модели. Однако хитро выбранные экономные модели часто действительно дают удивительно полезные приближения. Например, закон PV = nRT, связывающий давление P, объем V и температуру T «идеального» газа через константу R, не совсем верен для любого реального газа, но он часто дает полезное приближение, и, кроме того, его структура информативна, поскольку оно вытекает из физического взгляда на поведение молекул газа. Для такой модели нет необходимости задавать вопрос «Истинна ли модель?». Если «правда» должна быть «вся правдой», ответ должен быть «Нет». Единственный вопрос, который интересует: «Является ли модель наглядной и полезной?».

Бокс повторил этот афоризм еще дважды в своей книге 1987 года « Построение эмпирических моделей и поверхности отклика» (в соавторстве с Норманом Дрейпером). [4] Первое повторение – на стр. 74: «Помните, что все модели неверны; практический вопрос заключается в том, насколько они должны быть неправильными, чтобы не быть полезными». Второе повторение – на стр. 424, отрывок из которого приведен ниже.

... все модели являются приблизительными. По сути, все модели неверны, но некоторые из них полезны. Однако всегда следует иметь в виду приблизительный характер модели...

Второе издание книги было опубликовано в 2007 году под названием « Поверхности отклика, смеси и анализ хребтов» . Во втором издании афоризм также повторяется дважды, в контекстах, идентичных первому изданию (на стр. 63 и стр. 414). [5]

Бокс повторил этот афоризм еще два раза в своей книге 1997 года « Статистический контроль: посредством мониторинга и корректировки обратной связи» (в соавторстве с Альберто Лусеньо). [6] Первое повторение – на стр. 6, отрывок из которого приведен ниже.

Говорят, что «все модели неверны, но некоторые модели полезны». Другими словами, любая модель — это в лучшем случае полезная выдумка: никогда не было и никогда не будет абсолютно нормального распределения или точной линейной зависимости. Тем не менее, был достигнут огромный прогресс в использовании таких вымыслов и их приближений.

Второе повторение – на стр. 9: «Итак, поскольку все модели ошибочны, очень важно знать, о чем беспокоиться;или, другими словами, какие модели могут создать процедуры, работающие на практике (где точные предположения никогда не верны)».

Второе издание книги было опубликовано в 2009 году под названием « Статистический контроль посредством мониторинга и корректировки» (в соавторстве с Альберто Лусеньо и Марией дель Кармен Паниагуа-Киньонес). Во втором издании афоризм также повторяется дважды. [7] Первое повторение – на стр. 61, отрывок из которого приведен ниже.

Все модели являются приблизительными. Предположения, подразумеваемые или явно сформулированные, никогда не бывают полностью верными. Все модели неверны, но некоторые модели полезны. Поэтому вопрос, который вам нужно задать, заключается не в том, «Правильна ли модель?» (это никогда не бывает), но «Достаточно ли хороша модель для этого конкретного приложения?»

Второе повторение – на стр. 63; его контекст по существу такой же, как и во втором повторении первого издания.

Широко цитируемая книга Бокса «Статистика для экспериментаторов» (в соавторстве с Уильямом Хантером ) не включает этот афоризм в свое первое издание (опубликованное в 1978 году). [8] Во второе издание (опубликовано в 2005 г., в соавторстве с Уильямом Хантером и Дж. Стюартом Хантером) афоризм включен трижды: на стр. 208, с. 384 и с. 440. [9] На стр. 440, соответствующее предложение таково: «Максимальное, чего можно ожидать от любой модели, — это то, что она может обеспечить полезное приближение к реальности: все модели неверны; некоторые модели полезны».

Помимо дословного изложения афоризма, Бокс иногда излагал суть афоризма разными словами. Один из примеров относится к 1978 году, когда Бокс был президентом Американской статистической ассоциации . На ежегодном собрании Ассоциации Бокс выступил с президентским обращением, в котором заявил следующее: «Модели, конечно, никогда не бывают верными, но, к счастью, необходимо лишь, чтобы они были полезными». [10]

Обсуждения

[ редактировать ]

Об этом афоризме ведутся различные дискуссии. Некоторые из этих обсуждений представлены ниже.

В 1983 году статистики Питер МакКаллах и Джон Нелдер опубликовали свою широко цитируемую книгу об обобщенных линейных моделях . В книгу включено краткое обсуждение афоризма (правда, без ссылки на Бокса). [11] Второе издание книги, опубликованное в 1989 году, содержит очень похожее обсуждение афоризма. [12] Обсуждение первого издания следующее.

Моделирование в науке остается, по крайней мере частично, искусством. Однако существуют некоторые принципы, которыми можно руководствоваться при моделировании. Во-первых, все модели неверны ; однако некоторые из них лучше других, и мы можем искать лучшие. В то же время мы должны признать, что вечная истина находится вне нашей досягаемости.

В 1995 году статистик Дэвид Кокс прокомментировал это следующим образом. [13]

... просто сказать, что все модели неверны, бесполезно. Само слово «модель» подразумевает упрощение и идеализацию. Идея о том, что сложные физические, биологические или социологические системы могут быть точно описаны несколькими формулами, является явно абсурдной. Однако построение идеализированных представлений, отражающих важные стабильные аспекты таких систем, является жизненно важной частью общенаучного анализа, и статистические модели, особенно содержательные, не кажутся существенно отличающимися от других типов моделей.

В 1996 году MRNester предложил «Кредо прикладного статистика». [14] Символ веры включает в себя в своей основной части афоризм.

В 2002 году К. П. Бёрнем и Д. Р. Андерсон опубликовали свою широко цитируемую книгу о выборе статистических моделей . В книге говорится следующее. [15]

Модель представляет собой упрощение или приближение реальности и, следовательно, не отражает всю реальность. ... Бокс отметил, что «все модели неверны, но некоторые полезны». Хотя модель никогда не может быть «истиной», ее можно ранжировать от очень полезной до полезной, от некоторой полезной до, наконец, по существу бесполезной.

Статистик Дж. Майкл Стил так прокомментировал афоризм. [16]

...есть замечательные модели — например, карты городов....

Если я говорю, что карта неправильная, это означает, что здание названо неправильно или направление улицы с односторонним движением указано неправильно. Я никогда не ожидал, что моя карта воссоздает всю физическую реальность, и я чувствую себя обманутым только в том случае, если моя карта не отвечает правильно на вопросы, на которые она якобы отвечает.

Мои карты Филадельфии пригодятся. Более того, за исключением некоторых устаревших, они не ошибаются .

Итак, вы говорите: «Да, карту можно рассматривать как модель, но, конечно, точнее было бы сказать, что карта — это «визуально расширенная база данных». Такие базы данных могут быть правильными. Это не те модели, которые имел в виду Бокс».

Я согласен. ...

В 2008 году на это ответил статистик Эндрю Гельман , в частности, заявивший следующее. [17]

Я понимаю его общую точку зрения, заключающуюся в том, что карта улиц может быть абсолютно правильной в зависимости от разрешения карты.

... Поговорка «все модели неверны» полезна, потому что она не совсем очевидна....

Это простая мысль, и я понимаю, как Стила могут раздражать люди, подчеркивающие это. Но беда в том, что многие люди не осознают, что все модели ошибочны.

В 2013 году философ науки Питер Труран опубликовал эссе, связанное с афоризмом. [18] В очерке отмечается, в частности, следующее.

... казалось бы, несовместимые модели могут использоваться для прогнозирования одного и того же явления. ... Мы можем полагать, что для каждой модели ее предсказательная сила является показателем того, что она хотя бы приблизительно верна. Но если обе модели успешны в предсказаниях, но при этом взаимно несовместимы, как они могут быть верными? Давайте рассмотрим простую иллюстрацию. Два наблюдателя смотрят на физический объект. Один может сообщить, что видит круглый диск, а другой может сообщить, что видит прямоугольник. Оба будут правильными, но один будет смотреть на объект (цилиндрическую банку) сверху, а другой — сбоку. Обе модели представляют разные аспекты одной и той же реальности.

В эссе Трурана далее отмечается, что теория гравитации Ньютона была вытеснена теорией относительности Эйнштейна , и тем не менее теория Ньютона в целом остается «эмпирически адекватной». Действительно, теория Ньютона в целом обладает превосходной предсказательной силой. Однако теория Ньютона не является приближением теории Эйнштейна. В качестве иллюстрации рассмотрим яблоко, падающее с дерева. Согласно теории Ньютона, яблоко падает, потому что Земля оказывает на яблоко силу, называемую «силой гравитации». Согласно теории Эйнштейна, Земля не оказывает никакого воздействия на яблоко. [19] Следовательно, теорию Ньютона можно считать в некотором смысле совершенно неверной, но чрезвычайно полезной. (Полезность теории Ньютона частично объясняется тем, что она значительно проще, как математически, так и вычислительно, чем теория Эйнштейна.)

В 2014 году статистик Дэвид Хэнд сделал следующее заявление. [20]

В общем, при построении статистических моделей нельзя забывать, что цель — понять что-то о реальном мире. Или предсказать, выбрать действие, принять решение, обобщить данные и т. д., но всегда о реальном мире, а не об абстрактном математическом мире: наши модели не являются реальностью – это хорошо высказал Джордж Бокс в своей часто цитируемой книге заметить, что «все модели неверны, но некоторые полезны».

В 2016 году П. Дж. Бикель и К. А. Доксум опубликовали второй том своей книги по математической статистике . В том включена цитата из президентского послания Бокса, приведенная выше. В нем говорится, что эта цитата является лучшей формулировкой «руководящего принципа современной статистики». [21]

Исторические предшественники

[ редактировать ]

Хотя этот афоризм, похоже, принадлежит Джорджу Боксу, его основная концепция уходит корнями в десятилетия, а возможно и столетия. Некоторые примеры этого приведены ниже.

В 1960 году Георг Раш сказал следующее.

... никакие модели не являются [истинными] — даже законы Ньютона. Когда вы строите модель, вы упускаете из виду все детали, которые вы, обладая имеющимися в вашем распоряжении знаниями, считаете несущественным... Модели не должны быть правдивыми, но важно, чтобы они были применимы и применимы ли они для каких-либо данных. Цель, конечно, должна быть исследована. Это также означает, что модель никогда не принимается окончательно, а только на испытаниях.

—  Раш, Г. (1960), Вероятностные модели для некоторых тестов интеллекта и достижений , Копенгаген: Датский педагогический институт, стр. 37–38 ; переиздано в 1980 году издательством Чикагского университета.

В 1947 году математик Джон фон Нейман сказал, что «истина… слишком сложна, чтобы допускать что-либо, кроме приближений». [22]

В 1942 году французский философ-поэт Поль Валери сказал следующее. [23]

В 1939 году основатель управления процессами статистического Уолтер Шухарт сказал следующее. [25]

...ни одна модель не может быть теоретически достижима, которая бы полностью и однозначно характеризовала бесконечно расширяемую концепцию состояния статистического контроля. Что, возможно, еще более важно, на основе конечной части последовательности [ X 1 , X 2 , X 3 , ...] — а мы никогда не можем иметь больше, чем конечную часть — мы не можем разумно надеяться построить модель, которая будет представлять в точности любую конкретную характеристику конкретного состояния контроля, даже если такое состояние действительно существует. Здесь ситуация очень похожа на ту, что наблюдается в физической науке, где мы находим модель молекулы; любая модель всегда представляет собой неполную, хотя и полезную картину предполагаемой физической вещи, называемой молекулой.

—  Шухарт, Вашингтон (1939), Статистический метод с точки зрения контроля качества , Министерство сельского хозяйства США , с. 19

В 1923 году схожую идею озвучил художник Пабло Пикассо .

Мы все знаем, что искусство — это не истина. Искусство — это ложь, которая заставляет нас осознать истину, по крайней мере, ту истину, которую нам дано понять. Художник должен знать, как убедить других в правдивости своей лжи.

—  Пикассо, Пабло (1923), «Пикассо говорит», The Arts , 3 : 315–326 ; [26] перепечатано в Барр, Альфред Х. младший (1939), Пикассо: сорок лет его искусства (PDF) , Музей современного искусства , стр. 9–12.

См. также

[ редактировать ]

Примечания

[ редактировать ]
  1. ^ Скоген, доктор медицины; Джи, Р.; Акимова А.; Дэуэл, У.; и одиннадцать других (2021 г.), «Раскрытие правды: модели лучше наблюдений?» (PDF) , Серия достижений в области морской экологии , 680 : 7–13, Bibcode : 2021MEPS..680....7S , doi : 10.3354/meps13574 , S2CID   229617529 .
  2. ^ Бокс, Джордж Э.П. (1976), «Наука и статистика» (PDF) , Журнал Американской статистической ассоциации , 71 (356): 791–799, doi : 10.1080/01621459.1976.10480949 .
  3. ^ Бокс, GEP (1979), «Надежность стратегии построения научных моделей», в Launer, RL; Уилкинсон, Дж.Н. (ред.), Устойчивость в статистике , Academic Press , стр. 201–236, doi : 10.1016/B978-0-12-438150-6.50018-2 , ISBN  978-1-4832-6336-6
  4. ^ Коробка, ГЭП; Дрейпер, Н.Р. (1987), Построение эмпирических моделей и поверхности отклика , John Wiley & Sons .
  5. ^ Коробка, ГЭП; Дрейпер, Н.Р. (2007), Поверхности отклика, смеси и анализ гребней , John Wiley & Sons .
  6. ^ Коробка, ГЭП; Лусеньо, А. (1997), Статистический контроль: путем мониторинга и корректировки обратной связи , John Wiley & Sons .
  7. ^ Коробка, ГЭП; Лусеньо, А.; Паниагуа-Киньонес, М. дель Кармен (2009), Статистический контроль посредством мониторинга и корректировки , John Wiley & Sons .
  8. ^ Коробка, ГЭП; Хантер, WG (1978), Статистика для экспериментаторов , John Wiley & Sons .
  9. ^ Коробка, ГЭП; Хантер, Дж. С.; Хантер, WG (2005), Статистика для экспериментаторов (2-е изд.), John Wiley & Sons .
  10. ^ Бокс, GEP (1979), «Некоторые проблемы статистики и повседневной жизни», Журнал Американской статистической ассоциации , 74 (365): 1–4, doi : 10.2307/2286713 , JSTOR   2286713 .
  11. ^ МакКаллах, П.; Нелдер, Дж. А. (1983), Обобщенные линейные модели , Чепмен и Холл , §1.1.4 .
  12. ^ МакКаллах, П.; Нелдер, Дж. А. (1989), Обобщенные линейные модели (второе изд.), Чепмен и Холл , §1.1.4 .
  13. ^ Кокс, Д.Р. (1995), «Комментарий к статье «Неопределенность модели, интеллектуальный анализ данных и статистические выводы» », Журнал Королевского статистического общества, серия A , 158 : 455–456 .
  14. ^ Нестер, MR (1996), «Кредо прикладного статистика» (PDF) , Журнал Королевского статистического общества, серия C , 45 (4): 401–410, doi : 10.2307/2986064 , JSTOR   2986064 .
  15. ^ Бернэм, КП; Андерсон, Д.Р. (2002), Выбор модели и мультимодельный вывод: практический информационно-теоретический подход (2-е изд.), Springer-Verlag , §1.2.5 . [По состоянию на февраль 2022 г. объединенные издания этой книги имеют более 60 000 цитирований в Google Scholar .]
  16. ^ Стил, Дж. М., « Модели: шедевры и неубедительные оправдания ».
  17. ^ Гельман, А. (12 июня 2008 г.), « Некоторые мысли по поводу поговорки: «Все модели неверны, но некоторые полезны» ».
  18. ^ Труран, П. (2013), «Модели: полезны, но неверны», «Практическое применение философии науки» , SpringerBriefs in Philosophy, Springer , стр. 61–67, doi : 10.1007/978-3-319-00452-5_10 , ISBN  978-3-319-00451-8 .
  19. ^ Согласно теории относительности Эйнштейна , основная причина падения яблока заключается в том, что Земля искажает время, поэтому часы у основания дерева идут медленнее, чем часы высоко на дереве; есть еще и вторичная причина: Земля искажает пространство. Эмпирические доказательства теории Эйнштейна чрезвычайно сильны – например, GPS опирается на теорию Эйнштейна, и она не работала бы, если бы опиралась на теорию Ньютона ( Эшби 2002 ).
  20. ^ Хэнд, DJ (2014), «Замечательные примеры, но давайте не закрывать глаза», Statistical Science , 29 : 98–100, arXiv : 1405.4986 , doi : 10.1214/13-STS446 .
  21. ^ Бикель, П.Дж.; Доксум, К.А. (2016), Математическая статистика , том. II, Чепмен и Холл , с. 2 .
  22. ^ фон Нейман, Дж. (1947), «Математик», в Хейвуде, Р.Б. (ред.), « Труды разума» , University of Chicago Press , стр. 180–196 ; переиздано в 1995 году Броуди Ф., Вамосом Т. (редакторы), The Neumann Compendium , World Scientific , стр. 618–626.
  23. ^ Связь цитаты Валери с афоризмом «все модели неверны» отмечалась различными авторами, например Ванкатом (2013 , §1.7).
  24. ^ Некоторые авторы дали разные английские переводы, например Валери (1970 , стр. 466), Вольфсон и Мерфи (1998) и Ванкат (2013 , §1.7). Представленный здесь перевод был предоставлен Google Translate ; в нем есть только одно слово, отличное от перевода Вольфсона и Мерфи: «Что» вместо «Что угодно» (оба случая).
  25. Связь цитаты Шухарта с афоризмом «все модели неверны» отмечена Fricker & Woodall (2016) .
  26. ^ Цитата первоначально была дана на испанском языке (во время интервью Мариуса де Зайаса ); цитируемая публикация на английском языке.

Дальнейшее чтение

[ редактировать ]
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 767f61b84f68c06b765fd31d1f601e21__1713805320
URL1:https://arc.ask3.ru/arc/aa/76/21/767f61b84f68c06b765fd31d1f601e21.html
Заголовок, (Title) документа по адресу, URL1:
All models are wrong - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)