Jump to content

Парадокс Симпсона

Парадокс Симпсона для количественных данных: положительная тенденция (   ,   ) проявляется для двух отдельных групп, тогда как отрицательная тенденция (   ) появляется при объединении групп.
Визуализация парадокса Симпсона на данных, напоминающих изменчивость в реальном мире, указывает на то, что риск неправильной оценки истинной причинно-следственной связи может быть трудно обнаружить.

Парадокс Симпсона — это явление в области вероятности и статистики , при котором тенденция появляется в нескольких группах данных, но исчезает или меняется на противоположную при объединении групп. Этот результат часто встречается в статистике социальных и медицинских наук. [ 1 ] [ 2 ] [ 3 ] и это особенно проблематично, когда данным о частоте необоснованно придается причинно-следственная интерпретация. [ 4 ] Парадокс можно разрешить, если смешивающие переменные и причинно-следственные связи. при статистическом моделировании соответствующим образом учитывать [ 4 ] [ 5 ] (например, посредством кластерного анализа [ 6 ] ).

Парадокс Симпсона использовался для иллюстрации того, какие вводящие в заблуждение результаты может привести к неправильному использованию статистики . [ 7 ] [ 8 ]

Эдвард Х. Симпсон впервые описал это явление в технической статье в 1951 году. [ 9 ] но статистики Карл Пирсон (в 1899 г. [ 10 ] ) и Удный Юл (в 1903 г. [ 11 ] ) уже упоминал подобные эффекты ранее. Название « Парадокс Симпсона» было введено Колином Р. Блитом в 1972 году. [ 12 ] Его также называют инверсией Симпсона , эффектом Юла-Симпсона , парадоксом слияния или парадоксом реверсии . [ 13 ]

Математик Джордан Элленберг утверждает, что парадокс Симпсона ошибочно назван тем, что «здесь нет никакого противоречия, есть только два разных способа думать об одних и тех же данных», и предполагает, что его урок «на самом деле не в том, чтобы сказать нам, какую точку зрения принять, а в том, чтобы настаивать на том, чтобы мы придерживались и части, и целое в уме одновременно». [ 14 ]

Гендерная предвзятость Калифорнийского университета в Беркли

[ редактировать ]

Один из самых известных примеров парадокса Симпсона связан с исследованием гендерных предубеждений среди поступающих в аспирантуру Калифорнийского университета в Беркли . Данные о приеме на осень 1973 года показали, что мужчины, подавшие заявления, были приняты с большей вероятностью, чем женщины, и разница была настолько велика, что вряд ли она была случайной. [ 15 ] [ 16 ]

Все Мужчины Женщины
Кандидаты Допущенный Кандидаты Допущенный Кандидаты Допущенный
Общий 12,763 41% 8,442 44% 4,321 35%

Однако при учете информации о факультетах, на которые подаются заявления, разный процент отказов свидетельствует о разной сложности поступления на факультет, и в то же время это показало, что женщины, как правило, обращались на более конкурентоспособные факультеты с более низкими показателями приема. даже среди квалифицированных абитуриентов (например, на факультете английского языка), тогда как мужчины, как правило, подавались на менее конкурентоспособные факультеты с более высокими показателями поступления (например, на инженерный факультет). Объединенные и скорректированные данные показали «небольшую, но статистически значимую предвзятость в пользу женщин». [ 16 ]

Данные шести крупнейших ведомств приведены ниже:

Отделение Все Мужчины Женщины
Кандидаты Допущенный Кандидаты Допущенный Кандидаты Допущенный
А 933 64% 825 62% 108 82%
Б 585 63% 560 63% 25 68%
С 918 35% 325 37% 593 34%
Д 792 34% 417 33% 375 35%
И 584 25% 191 28% 393 24%
Ф 714 6% 373 6% 341 7%
Общий 4526 39% 2691 45% 1835 30%

Легенда:

  больший процент успешных кандидатов, чем представители другого пола
  большее количество претендентов, чем представители другого пола

жирный шрифт — два факультета, на которые чаще всего обращаются заявки, для каждого пола.

Все данные показали, что в общей сложности 4 из 85 департаментов имеют значительную предвзятость по отношению к женщинам, а 6 - к мужчинам (не все представлены в таблице «шесть крупнейших департаментов» выше). Примечательно, что основанием для такого вывода было не количество предвзятых факультетов, а скорее гендерные показатели приема, объединенные по всем факультетам, с учетом доли отказов каждого факультета среди всех его претендентов. [ 16 ]

Лечение камней в почках

[ редактировать ]

Другой пример взят из реального медицинского исследования. [ 17 ] сравнение показателей успеха двух методов лечения камней в почках . [ 18 ] В таблице ниже показаны показатели успеха (термин « показатель успеха » здесь фактически означает долю успеха) и количество курсов лечения как небольших, так и крупных камней в почках, где лечение А включает открытые хирургические процедуры, а лечение Б включает закрытые хирургические процедуры. Цифры в скобках указывают количество успешных случаев по отношению к общему размеру группы.

Уход
Размер камня
Лечение А Лечение Б
Мелкие камни Группа 1
93% (81/87)
Группа 2
87% (234/270)
Большие камни Группа 3
73% (192/263)
Группа 4
69% (55/80)
Оба 78% (273/350) 83% (289/350)

Парадоксальный вывод заключается в том, что метод А более эффективен при использовании с камнями небольшого размера, а также при использовании с камнями большого размера, однако метод Б оказывается более эффективным при одновременном рассмотрении обоих размеров. В этом примере «скрытой» переменной (или мешающей переменной ), вызывающей парадокс, является размер камней, который ранее не был известен исследователям как важный, пока не были учтены его эффекты. [ нужна ссылка ]

Какое лечение считается лучшим, определяется тем, какой коэффициент успеха (успехов/общее количество) выше. Изменение неравенства между двумя соотношениями при рассмотрении объединенных данных, что создает парадокс Симпсона, происходит потому, что два эффекта происходят одновременно: [ нужна ссылка ]

  1. Размеры групп, которые объединяются при игнорировании скрытой переменной, сильно различаются. Врачи склонны назначать пациентам с крупными камнями лучшее лечение А, а случаям с мелкими камнями — худшее лечение B. Таким образом, в общих показателях преобладают группы 3 и 2, а не две гораздо меньшие группы 1 и 4.
  2. Скрытая переменная, размер камня, оказывает большое влияние на соотношение; т.е. на вероятность успеха больше влияет тяжесть случая, чем выбор лечения. Таким образом, группа пациентов с крупными камнями, использующая лечение А (группа 3), чувствует себя хуже, чем группа с мелкими камнями, даже если последние использовали худшее лечение Б (группа 2).

На основании этих эффектов видно, что возникает парадоксальный результат, поскольку влияние размера камней превосходит преимущества лучшего лечения (А). Короче говоря, менее эффективное лечение B оказалось более эффективным, поскольку его чаще применяли к случаям небольших камней, которые легче лечить. [ 18 ]

Джейнс утверждает, что правильный вывод состоит в том, что, хотя лечение А остается заметно лучше, чем лечение Б, размер камня в почках более важен. [ 19 ]

Средние показатели ударов

[ редактировать ]

Типичным примером парадокса Симпсона являются средние показатели ударов игроков в профессиональном бейсболе . Один игрок может иметь более высокий средний показатель результативности, чем другой игрок, каждый год в течение ряда лет, но иметь более низкий средний показатель за все эти годы. Это явление может возникнуть, когда существуют большие различия в численности летучих мышей в разные годы. Математик Кен Росс продемонстрировал это, используя средние показатели двух бейсболистов, Дерека Джетера и Дэвида Джастиса , в 1995 и 1996 годах: [ 20 ] [ 21 ]

Год
тесто
1995 1996 Комбинированный
Дерек Джетер 12/48 .250 183/582 .314 195/630 .310
Дэвид Джастис 104/411 .253 45/140 .321 149/551 .270

И в 1995, и в 1996 году у Джастиса был более высокий средний показатель (выделено жирным шрифтом), чем у Джетера. Однако, если объединить два бейсбольных сезона, Джетер показывает более высокий средний показатель, чем Джастис. По словам Росса, такое явление среди возможных пар игроков будет наблюдаться примерно раз в год. [ 20 ]

Векторная интерпретация

[ редактировать ]
Векторная интерпретация парадокса Симпсона

Парадокс Симпсона также можно проиллюстрировать с помощью двумерного векторного пространства . [ 22 ] Уровень успеха (т. е. успехи/попытки ) могут быть представлены вектором с уклоном , . Тогда более крутой вектор означает более высокий уровень успеха. Если две ставки и объединяются, как в приведенных выше примерах, результат можно представить суммой векторов и , который по правилу параллелограмма является вектором , с уклоном .

Парадокс Симпсона гласит, что даже если вектор (на рисунке оранжевым цветом) имеет меньший наклон, чем другой вектор (синим цветом) и имеет меньший наклон, чем , сумма двух векторов потенциально все еще может иметь больший наклон, чем сумма двух векторов , как показано в примере. Чтобы это произошло, один из оранжевых векторов должен иметь больший наклон, чем один из синих векторов (здесь и ), и они обычно будут длиннее векторов с альтернативными индексами, что будет доминировать в общем сравнении.

Корреляция между переменными

[ редактировать ]

Разворот Симпсона может также возникнуть в корреляциях , в которых две переменные кажутся имеющими (скажем) положительную корреляцию друг с другом, хотя на самом деле они имеют отрицательную корреляцию, причем разворот был вызван «скрытым» искажающим фактором. Берман и др. [ 23 ] приведите пример из экономики, где набор данных предполагает, что общий спрос положительно коррелирует с ценой (то есть более высокие цены приводят к большему спросу), что противоречит ожиданиям. Анализ показывает, что время является смешанной переменной: отображение цены и спроса в зависимости от времени показывает ожидаемую отрицательную корреляцию за различные периоды, которая затем меняется на обратную и становится положительной, если влияние времени игнорируется путем простого построения графика спроса в зависимости от цены.

Психология

[ редактировать ]

Психологический интерес к парадоксу Симпсона пытается объяснить, почему люди [ ВОЗ? ] поначалу считают изменение знака невозможным. [ нужны разъяснения ] Вопрос в том, откуда у людей такая сильная интуиция и как она закодирована в сознании .

Парадокс Симпсона демонстрирует, что эту интуицию нельзя вывести ни из классической логики , ни из исчисления вероятностей , и, таким образом, побудил философов предположить, что она поддерживается врожденной причинной логикой, которая направляет людей в рассуждениях о действиях и их последствиях. [ 4 ] Сэвиджа Принцип уверенности [ 12 ] является примером того, что может повлечь за собой такая логика. Уточненная версия принципа уверенности Сэвиджа действительно может быть получена из исчисления Перла . [ 4 ] и гласит: «Действие A , которое увеличивает вероятность события B в каждой субпопуляции C i из C, должно также увеличить вероятность B в популяции в целом, при условии, что действие не меняет распределение субпопуляций». Это говорит о том, что знания о действиях и последствиях хранятся в форме, напоминающей причинные байесовские сети .

Вероятность

[ редактировать ]

В статье Павлидеса и Перлмана Хаджикостаса представлено доказательство того, что в случайной таблице 2 × 2 × 2 с равномерным распределением парадокс Симпсона произойдет с вероятностью ровно 1 60 . [ 24 ] Исследование Кока предполагает, что вероятность того, что парадокс Симпсона возникнет случайно в моделях путей (т. е. моделях, созданных путем анализа путей ) с двумя предикторами и одной критериальной переменной, составляет примерно 12,8 процента; немного выше, чем 1 случай на 8-путевые модели. [ 25 ]

Второй парадокс Симпсона

[ редактировать ]

Второй, менее известный парадокс также обсуждался в статье Симпсона 1951 года. Это может произойти, когда «разумная интерпретация» не обязательно находится в отдельных данных, как в примере с камнями в почках, а вместо этого может находиться в объединенных данных. Следует ли использовать секционированную или комбинированную форму данных, зависит от процесса, в результате которого возникли данные, а это означает, что правильную интерпретацию данных не всегда можно определить, просто наблюдая за таблицами. [ 26 ]

Джудея Перл показала, что для того, чтобы секционированные данные представляли правильные причинно-следственные связи между любыми двумя переменными, и , переменные разделения должны удовлетворять графическому условию, называемому «критерий черного хода»: [ 27 ] [ 28 ]

  1. Они должны блокировать все ложные пути между и
  2. Никакая переменная не может быть затронута

Этот критерий обеспечивает алгоритмическое решение второго парадокса Симпсона и объясняет, почему правильная интерпретация не может быть определена только на основе данных; два разных графика, оба совместимых с данными, могут диктовать два разных критерия «черного хода».

Когда критерию «черной двери» удовлетворяет набор Z ковариат, формула корректировки (см. Смешение» ) дает правильное причинное влияние X на Y. « -исчисление Перла, Если такого набора не существует, можно использовать do чтобы найти другие способы оценки причинного эффекта. [ 4 ] [ 29 ] Полнота до -исчисления [ 30 ] [ 29 ] можно рассматривать как предложение полного разрешения парадокса Симпсона.

Одна из критических замечаний заключается в том, что этот парадокс на самом деле вовсе не парадокс, а скорее неспособность должным образом объяснить мешающие переменные или рассмотреть причинно-следственные связи между переменными. [ 31 ]

Другая критика очевидного парадокса Симпсона заключается в том, что он может быть результатом особого способа стратификации или группировки данных. Это явление может исчезнуть или даже обратить вспять, если данные стратифицированы по-другому или если учитывать разные мешающие переменные. Пример Симпсона фактически высветил явление, называемое несжимаемостью. [ 32 ] это происходит, когда подгруппы с высокими долями не дают простых средних значений при объединении. Это говорит о том, что парадокс может быть не универсальным явлением, а скорее конкретным примером более общей статистической проблемы.

Критики очевидного парадокса Симпсона также утверждают, что внимание к парадоксу может отвлечь от более важных статистических проблем, таких как необходимость тщательного рассмотрения мешающих переменных и причинно-следственных связей при интерпретации данных. [ 33 ]

Несмотря на эту критику, очевидный парадокс Симпсона остается популярной и интригующей темой в статистике и анализе данных. Его продолжают изучать и обсуждать исследователи и практики в самых разных областях, и он служит ценным напоминанием о важности тщательного статистического анализа и потенциальных ошибках упрощенной интерпретации данных.

См. также

[ редактировать ]
  1. ^ Клиффорд Х. Вагнер (февраль 1982 г.). «Парадокс Симпсона в реальной жизни». Американский статистик . 36 (1): 46–48. дои : 10.2307/2684093 . JSTOR   2684093 .
  2. ^ Холт, Великобритания (2016). Потенциальный парадокс Симпсона в многоцентровом исследовании внутрибрюшинной химиотерапии рака яичников. Журнал клинической онкологии, 34 (9), 1016–1016.
  3. ^ Фрэнкс, Александр; Айролди, Эдоардо ; Славов, Николай (2017). «Посттранскрипционная регуляция в тканях человека» . PLOS Вычислительная биология . 13 (5): e1005535. arXiv : 1506.00219 . Бибкод : 2017PLSCB..13E5535F . дои : 10.1371/journal.pcbi.1005535 . ISSN   1553-7358 . ПМК   5440056 . ПМИД   28481885 .
  4. ^ Jump up to: а б с д и Иудейская Перл . Причинность: модели, рассуждения и выводы , Cambridge University Press (2000, 2-е издание, 2009 г.). ISBN   0-521-77362-8 .
  5. ^ Кок, Н., и Гаскинс, Л. (2016). Парадокс Симпсона, умеренность и появление квадратичных отношений в моделях путей: иллюстрация информационных систем. Международный журнал прикладной нелинейной науки, 2 (3), 200–234.
  6. ^ Рожье А. Киевит, Виллем Э. Франкенхейс, Лоренс Дж. Уолдорп и Денни Борсбум, Парадокс Симпсона в психологической науке: практическое руководство https://doi.org/10.3389/fpsyg.2013.00513
  7. ^ Роберт Л. Уордроп (февраль 1995 г.). «Парадокс Симпсона и горячая рука в баскетболе». Американский статистик , 49 (1) : стр. 24–28.
  8. ^ Алан Агрести (2002). «Категорный анализ данных» (второе издание). Джон Уайли и сыновья ISBN   0-471-36093-7
  9. ^ Симпсон, Эдвард Х. (1951). «Интерпретация взаимодействия в таблицах сопряженности». Журнал Королевского статистического общества, серия B. 13 : 238–241.
  10. ^ Пирсон, Карл ; Ли, Алиса; Брэмли-Мур, Лесли (1899). «Генетический (репродуктивный) отбор: наследование фертильности у человека и плодовитости у чистокровных скаковых лошадей» . Философские труды Королевского общества А. 192 : 257–330. дои : 10.1098/rsta.1899.0006 .
  11. ^ ГУ Юле (1903). «Заметки по теории ассоциации атрибутов в статистике» . Биометрика . 2 (2): 121–134. дои : 10.1093/биомет/2.2.121 .
  12. ^ Jump up to: а б Колин Р. Блит (июнь 1972 г.). «О парадоксе Симпсона и принципе уверенности». Журнал Американской статистической ассоциации . 67 (338): 364–366. дои : 10.2307/2284382 . JSTOR   2284382 .
  13. ^ И. Дж. Гуд , Ю. Миттал (июнь 1987 г.). «Объединение и геометрия таблиц сопряженности два на два» . Анналы статистики . 15 (2): 694–711. дои : 10.1214/aos/1176350369 . ISSN   0090-5364 . JSTOR   2241334 .
  14. ^ Элленберг, Иордания (25 мая 2021 г.). Форма: скрытая геометрия информации, биологии, стратегии, демократии и всего остального . Нью-Йорк: Пингвин Пресс . п. 228. ИСБН  978-1-9848-7905-9 . OCLC   1226171979 .
  15. ^ Дэвид Фридман , Роберт Пизани и Роджер Первс (2007), Статистика (4-е издание), WW Norton . ISBN   0-393-92972-8 .
  16. ^ Jump up to: а б с П. Дж. Бикель , Э. А. Хаммел и Дж. В. О'Коннелл (1975). «Половая предвзятость при поступлении в аспирантуру: данные Беркли» (PDF) . Наука . 187 (4175): 398–404. Бибкод : 1975Sci...187..398B . дои : 10.1126/science.187.4175.398 . ПМИД   17835295 . S2CID   15278703 . Архивировано (PDF) из оригинала 4 июня 2016 г.
  17. ^ Ч.Р. Чариг; Д.Р. Уэбб; С.Р. Пейн; Дж. Э. Уикхэм (29 марта 1986 г.). «Сравнение лечения камней в почках открытым хирургическим путем, чрескожной нефролитотомией и экстракорпоральной ударно-волновой литотрипсией» . Br Med J (Clin Res Ed) . 292 (6524): 879–882. дои : 10.1136/bmj.292.6524.879 . ПМЦ   1339981 . ПМИД   3083922 .
  18. ^ Jump up to: а б Стивен А. Джулиус; Марк А. Малли (3 декабря 1994 г.). «Смешение и парадокс Симпсона» . БМЖ . 309 (6967): 1480–1481. дои : 10.1136/bmj.309.6967.1480 . ПМК   2541623 . ПМИД   7804052 .
  19. ^ Джейнс, ET; Бретхорст, Г. Ларри (2003). «8.10 Объединение данных». Теория вероятностей: логика науки . Кембридж, Великобритания ; Нью-Йорк, штат Нью-Йорк: Издательство Кембриджского университета. ISBN  978-0-521-59271-0 .
  20. ^ Jump up to: а б Кен Росс. « Математик на стадионе: шансы и вероятности для любителей бейсбола (мягкая обложка) » Pi Press, 2004. ISBN   0-13-147990-3 . 12–13
  21. ^ Статистические данные доступны на сайте Baseball-Reference.com : данные по Дереку Джетеру ; Данные для Дэвида Джастиса .
  22. ^ Коцик Ежи (2001). «Доказательства без слов: парадокс Симпсона» (PDF) . Журнал «Математика» . 74 (5): 399. дои : 10.2307/2691038 . JSTOR   2691038 . Архивировано (PDF) из оригинала 12 июня 2010 г.
  23. ^ Берман, С. ДаллеМул, Л. Грин, М., Лакер, Дж. (2012), « Парадокс Симпсона: поучительная история в области расширенной аналитики. Архивировано 10 мая 2020 г. в Wayback Machine », Значение .
  24. ^ Мариос Г. Павлидес и Майкл Д. Перлман (август 2009 г.). «Насколько вероятен парадокс Симпсона?». Американский статистик . 63 (3): 226–233. дои : 10.1198/tast.2009.09007 . S2CID   17481510 .
  25. ^ Кок, Н. (2015). Насколько вероятен парадокс Симпсона в моделях путей? Международный журнал электронного сотрудничества, 11 (1), 1–7.
  26. ^ Нортон, Х. Джеймс; Дивайн, Джордж (август 2015 г.). «Парадокс Симпсона… и как его избежать» . Значение . 12 (4): 40–43. дои : 10.1111/j.1740-9713.2015.00844.x .
  27. ^ Перл, Иудея (2014). «Понимание парадокса Симпсона». Американский статистик . 68 (1): 8–13. дои : 10.2139/ssrn.2343788 . S2CID   2626833 .
  28. ^ Перл, Иудея (1993). «Графические модели, причинно-следственная связь и вмешательство» . Статистическая наука . 8 (3): 266–269. дои : 10.1214/ss/1177010894 .
  29. ^ Jump up to: а б Перл, Дж.; Маккензи, Д. (2018). Книга «Почему: новая наука о причине и следствии» . Нью-Йорк, штат Нью-Йорк: Основные книги.
  30. ^ Шпицер И.; Перл, Дж. (2006). Дектер, Р.; Ричардсон, Т.С. (ред.). «Идентификация условных интервенционных распределений». Материалы двадцать второй конференции по неопределенности в искусственном интеллекте . Корваллис, Орегон: AUAI Press: 437–444.
  31. ^ Блит, Колин Р. (июнь 1972 г.). «О парадоксе Симпсона и принципе уверенности» . Журнал Американской статистической ассоциации . 67 (338): 364–366. дои : 10.1080/01621459.1972.10482387 . ISSN   0162-1459 .
  32. ^ Гренландия, Сандер (01 ноября 2021 г.). «Неколлапсируемость, путаница и предвзятость из-за скудности данных. Часть 2: Что следует делать исследователям из постоянных споров по поводу отношения шансов?» . Журнал клинической эпидемиологии . 139 : 264–268. дои : 10.1016/j.jclinepi.2021.06.004 . ISSN   0895-4356 . ПМИД   34119647 .
  33. ^ Эрнан, Майкл А.; Клейтон, Дэвид; Кейдинг, Нильс (июнь 2011 г.). «Разгадка парадокса Симпсонов» . Международный журнал эпидемиологии . 40 (3): 780–785. дои : 10.1093/ije/animal041 . ISSN   1464-3685 . ПМК   3147074 . ПМИД   21454324 .

Библиография

[ редактировать ]
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 37f6ac7aecb626bc5a79141f29c420a8__1723619580
URL1:https://arc.ask3.ru/arc/aa/37/a8/37f6ac7aecb626bc5a79141f29c420a8.html
Заголовок, (Title) документа по адресу, URL1:
Simpson's paradox - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)