Парадокс Симпсона


Парадокс Симпсона — это явление в области вероятности и статистики , при котором тенденция появляется в нескольких группах данных, но исчезает или меняется на противоположную при объединении групп. Этот результат часто встречается в статистике социальных и медицинских наук. [ 1 ] [ 2 ] [ 3 ] и это особенно проблематично, когда данным о частоте необоснованно придается причинно-следственная интерпретация. [ 4 ] Парадокс можно разрешить, если смешивающие переменные и причинно-следственные связи. при статистическом моделировании соответствующим образом учитывать [ 4 ] [ 5 ] (например, посредством кластерного анализа [ 6 ] ).
Парадокс Симпсона использовался для иллюстрации того, какие вводящие в заблуждение результаты может привести к неправильному использованию статистики . [ 7 ] [ 8 ]
Эдвард Х. Симпсон впервые описал это явление в технической статье в 1951 году. [ 9 ] но статистики Карл Пирсон (в 1899 г. [ 10 ] ) и Удный Юл (в 1903 г. [ 11 ] ) уже упоминал подобные эффекты ранее. Название « Парадокс Симпсона» было введено Колином Р. Блитом в 1972 году. [ 12 ] Его также называют инверсией Симпсона , эффектом Юла-Симпсона , парадоксом слияния или парадоксом реверсии . [ 13 ]
Математик Джордан Элленберг утверждает, что парадокс Симпсона ошибочно назван тем, что «здесь нет никакого противоречия, есть только два разных способа думать об одних и тех же данных», и предполагает, что его урок «на самом деле не в том, чтобы сказать нам, какую точку зрения принять, а в том, чтобы настаивать на том, чтобы мы придерживались и части, и целое в уме одновременно». [ 14 ]
Примеры
[ редактировать ]Гендерная предвзятость Калифорнийского университета в Беркли
[ редактировать ]Один из самых известных примеров парадокса Симпсона связан с исследованием гендерных предубеждений среди поступающих в аспирантуру Калифорнийского университета в Беркли . Данные о приеме на осень 1973 года показали, что мужчины, подавшие заявления, были приняты с большей вероятностью, чем женщины, и разница была настолько велика, что вряд ли она была случайной. [ 15 ] [ 16 ]
Все | Мужчины | Женщины | ||||
---|---|---|---|---|---|---|
Кандидаты | Допущенный | Кандидаты | Допущенный | Кандидаты | Допущенный | |
Общий | 12,763 | 41% | 8,442 | 44% | 4,321 | 35% |
Однако при учете информации о факультетах, на которые подаются заявления, разный процент отказов свидетельствует о разной сложности поступления на факультет, и в то же время это показало, что женщины, как правило, обращались на более конкурентоспособные факультеты с более низкими показателями приема. даже среди квалифицированных абитуриентов (например, на факультете английского языка), тогда как мужчины, как правило, подавались на менее конкурентоспособные факультеты с более высокими показателями поступления (например, на инженерный факультет). Объединенные и скорректированные данные показали «небольшую, но статистически значимую предвзятость в пользу женщин». [ 16 ]
Данные шести крупнейших ведомств приведены ниже:
Отделение | Все | Мужчины | Женщины | |||
---|---|---|---|---|---|---|
Кандидаты | Допущенный | Кандидаты | Допущенный | Кандидаты | Допущенный | |
А | 933 | 64% | 825 | 62% | 108 | 82% |
Б | 585 | 63% | 560 | 63% | 25 | 68% |
С | 918 | 35% | 325 | 37% | 593 | 34% |
Д | 792 | 34% | 417 | 33% | 375 | 35% |
И | 584 | 25% | 191 | 28% | 393 | 24% |
Ф | 714 | 6% | 373 | 6% | 341 | 7% |
Общий | 4526 | 39% | 2691 | 45% | 1835 | 30% |
Легенда: больший процент успешных кандидатов, чем представители другого пола
большее количество претендентов, чем представители другого пола
жирный шрифт — два факультета, на которые чаще всего обращаются заявки, для каждого пола. |
Все данные показали, что в общей сложности 4 из 85 департаментов имеют значительную предвзятость по отношению к женщинам, а 6 - к мужчинам (не все представлены в таблице «шесть крупнейших департаментов» выше). Примечательно, что основанием для такого вывода было не количество предвзятых факультетов, а скорее гендерные показатели приема, объединенные по всем факультетам, с учетом доли отказов каждого факультета среди всех его претендентов. [ 16 ]
Лечение камней в почках
[ редактировать ]Другой пример взят из реального медицинского исследования. [ 17 ] сравнение показателей успеха двух методов лечения камней в почках . [ 18 ] В таблице ниже показаны показатели успеха (термин « показатель успеха » здесь фактически означает долю успеха) и количество курсов лечения как небольших, так и крупных камней в почках, где лечение А включает открытые хирургические процедуры, а лечение Б включает закрытые хирургические процедуры. Цифры в скобках указывают количество успешных случаев по отношению к общему размеру группы.
Уход Размер камня
|
Лечение А | Лечение Б |
---|---|---|
Мелкие камни | Группа 1 93% (81/87) |
Группа 2 87% (234/270) |
Большие камни | Группа 3 73% (192/263) |
Группа 4 69% (55/80) |
Оба | 78% (273/350) | 83% (289/350) |
Парадоксальный вывод заключается в том, что метод А более эффективен при использовании с камнями небольшого размера, а также при использовании с камнями большого размера, однако метод Б оказывается более эффективным при одновременном рассмотрении обоих размеров. В этом примере «скрытой» переменной (или мешающей переменной ), вызывающей парадокс, является размер камней, который ранее не был известен исследователям как важный, пока не были учтены его эффекты. [ нужна ссылка ]
Какое лечение считается лучшим, определяется тем, какой коэффициент успеха (успехов/общее количество) выше. Изменение неравенства между двумя соотношениями при рассмотрении объединенных данных, что создает парадокс Симпсона, происходит потому, что два эффекта происходят одновременно: [ нужна ссылка ]
- Размеры групп, которые объединяются при игнорировании скрытой переменной, сильно различаются. Врачи склонны назначать пациентам с крупными камнями лучшее лечение А, а случаям с мелкими камнями — худшее лечение B. Таким образом, в общих показателях преобладают группы 3 и 2, а не две гораздо меньшие группы 1 и 4.
- Скрытая переменная, размер камня, оказывает большое влияние на соотношение; т.е. на вероятность успеха больше влияет тяжесть случая, чем выбор лечения. Таким образом, группа пациентов с крупными камнями, использующая лечение А (группа 3), чувствует себя хуже, чем группа с мелкими камнями, даже если последние использовали худшее лечение Б (группа 2).
На основании этих эффектов видно, что возникает парадоксальный результат, поскольку влияние размера камней превосходит преимущества лучшего лечения (А). Короче говоря, менее эффективное лечение B оказалось более эффективным, поскольку его чаще применяли к случаям небольших камней, которые легче лечить. [ 18 ]
Джейнс утверждает, что правильный вывод состоит в том, что, хотя лечение А остается заметно лучше, чем лечение Б, размер камня в почках более важен. [ 19 ]
Средние показатели ударов
[ редактировать ]Типичным примером парадокса Симпсона являются средние показатели ударов игроков в профессиональном бейсболе . Один игрок может иметь более высокий средний показатель результативности, чем другой игрок, каждый год в течение ряда лет, но иметь более низкий средний показатель за все эти годы. Это явление может возникнуть, когда существуют большие различия в численности летучих мышей в разные годы. Математик Кен Росс продемонстрировал это, используя средние показатели двух бейсболистов, Дерека Джетера и Дэвида Джастиса , в 1995 и 1996 годах: [ 20 ] [ 21 ]
Год тесто
|
1995 | 1996 | Комбинированный | |||
---|---|---|---|---|---|---|
Дерек Джетер | 12/48 | .250 | 183/582 | .314 | 195/630 | .310 |
Дэвид Джастис | 104/411 | .253 | 45/140 | .321 | 149/551 | .270 |
И в 1995, и в 1996 году у Джастиса был более высокий средний показатель (выделено жирным шрифтом), чем у Джетера. Однако, если объединить два бейсбольных сезона, Джетер показывает более высокий средний показатель, чем Джастис. По словам Росса, такое явление среди возможных пар игроков будет наблюдаться примерно раз в год. [ 20 ]
Векторная интерпретация
[ редактировать ]
Парадокс Симпсона также можно проиллюстрировать с помощью двумерного векторного пространства . [ 22 ] Уровень успеха (т. е. успехи/попытки ) могут быть представлены вектором с уклоном , . Тогда более крутой вектор означает более высокий уровень успеха. Если две ставки и объединяются, как в приведенных выше примерах, результат можно представить суммой векторов и , который по правилу параллелограмма является вектором , с уклоном .
Парадокс Симпсона гласит, что даже если вектор (на рисунке оранжевым цветом) имеет меньший наклон, чем другой вектор (синим цветом) и имеет меньший наклон, чем , сумма двух векторов потенциально все еще может иметь больший наклон, чем сумма двух векторов , как показано в примере. Чтобы это произошло, один из оранжевых векторов должен иметь больший наклон, чем один из синих векторов (здесь и ), и они обычно будут длиннее векторов с альтернативными индексами, что будет доминировать в общем сравнении.
Корреляция между переменными
[ редактировать ]Разворот Симпсона может также возникнуть в корреляциях , в которых две переменные кажутся имеющими (скажем) положительную корреляцию друг с другом, хотя на самом деле они имеют отрицательную корреляцию, причем разворот был вызван «скрытым» искажающим фактором. Берман и др. [ 23 ] приведите пример из экономики, где набор данных предполагает, что общий спрос положительно коррелирует с ценой (то есть более высокие цены приводят к большему спросу), что противоречит ожиданиям. Анализ показывает, что время является смешанной переменной: отображение цены и спроса в зависимости от времени показывает ожидаемую отрицательную корреляцию за различные периоды, которая затем меняется на обратную и становится положительной, если влияние времени игнорируется путем простого построения графика спроса в зависимости от цены.
Психология
[ редактировать ]Психологический интерес к парадоксу Симпсона пытается объяснить, почему люди [ ВОЗ? ] поначалу считают изменение знака невозможным. [ нужны разъяснения ] Вопрос в том, откуда у людей такая сильная интуиция и как она закодирована в сознании .
Парадокс Симпсона демонстрирует, что эту интуицию нельзя вывести ни из классической логики , ни из исчисления вероятностей , и, таким образом, побудил философов предположить, что она поддерживается врожденной причинной логикой, которая направляет людей в рассуждениях о действиях и их последствиях. [ 4 ] Сэвиджа Принцип уверенности [ 12 ] является примером того, что может повлечь за собой такая логика. Уточненная версия принципа уверенности Сэвиджа действительно может быть получена из исчисления Перла . [ 4 ] и гласит: «Действие A , которое увеличивает вероятность события B в каждой субпопуляции C i из C, должно также увеличить вероятность B в популяции в целом, при условии, что действие не меняет распределение субпопуляций». Это говорит о том, что знания о действиях и последствиях хранятся в форме, напоминающей причинные байесовские сети .
Вероятность
[ редактировать ]В статье Павлидеса и Перлмана Хаджикостаса представлено доказательство того, что в случайной таблице 2 × 2 × 2 с равномерным распределением парадокс Симпсона произойдет с вероятностью ровно 1 ⁄ 60 . [ 24 ] Исследование Кока предполагает, что вероятность того, что парадокс Симпсона возникнет случайно в моделях путей (т. е. моделях, созданных путем анализа путей ) с двумя предикторами и одной критериальной переменной, составляет примерно 12,8 процента; немного выше, чем 1 случай на 8-путевые модели. [ 25 ]
Второй парадокс Симпсона
[ редактировать ]Второй, менее известный парадокс также обсуждался в статье Симпсона 1951 года. Это может произойти, когда «разумная интерпретация» не обязательно находится в отдельных данных, как в примере с камнями в почках, а вместо этого может находиться в объединенных данных. Следует ли использовать секционированную или комбинированную форму данных, зависит от процесса, в результате которого возникли данные, а это означает, что правильную интерпретацию данных не всегда можно определить, просто наблюдая за таблицами. [ 26 ]
Джудея Перл показала, что для того, чтобы секционированные данные представляли правильные причинно-следственные связи между любыми двумя переменными, и , переменные разделения должны удовлетворять графическому условию, называемому «критерий черного хода»: [ 27 ] [ 28 ]
- Они должны блокировать все ложные пути между и
- Никакая переменная не может быть затронута
Этот критерий обеспечивает алгоритмическое решение второго парадокса Симпсона и объясняет, почему правильная интерпретация не может быть определена только на основе данных; два разных графика, оба совместимых с данными, могут диктовать два разных критерия «черного хода».
Когда критерию «черной двери» удовлетворяет набор Z ковариат, формула корректировки (см. Смешение» ) дает правильное причинное влияние X на Y. « -исчисление Перла, Если такого набора не существует, можно использовать do чтобы найти другие способы оценки причинного эффекта. [ 4 ] [ 29 ] Полнота до -исчисления [ 30 ] [ 29 ] можно рассматривать как предложение полного разрешения парадокса Симпсона.
Критика
[ редактировать ]Одна из критических замечаний заключается в том, что этот парадокс на самом деле вовсе не парадокс, а скорее неспособность должным образом объяснить мешающие переменные или рассмотреть причинно-следственные связи между переменными. [ 31 ]
Другая критика очевидного парадокса Симпсона заключается в том, что он может быть результатом особого способа стратификации или группировки данных. Это явление может исчезнуть или даже обратить вспять, если данные стратифицированы по-другому или если учитывать разные мешающие переменные. Пример Симпсона фактически высветил явление, называемое несжимаемостью. [ 32 ] это происходит, когда подгруппы с высокими долями не дают простых средних значений при объединении. Это говорит о том, что парадокс может быть не универсальным явлением, а скорее конкретным примером более общей статистической проблемы.
Критики очевидного парадокса Симпсона также утверждают, что внимание к парадоксу может отвлечь от более важных статистических проблем, таких как необходимость тщательного рассмотрения мешающих переменных и причинно-следственных связей при интерпретации данных. [ 33 ]
Несмотря на эту критику, очевидный парадокс Симпсона остается популярной и интригующей темой в статистике и анализе данных. Его продолжают изучать и обсуждать исследователи и практики в самых разных областях, и он служит ценным напоминанием о важности тщательного статистического анализа и потенциальных ошибках упрощенной интерпретации данных.
См. также
[ редактировать ]- Псевдоним – эффект обработки сигнала
- Квартет Анскомба - четыре набора данных с одинаковой описательной статистикой, но с очень разными распределениями.
- Парадокс Берксона - тенденция неправильно интерпретировать статистические эксперименты, включающие условные вероятности.
- Сбор вишни – заблуждение неполных доказательств
- Парадокс Кондорсе - Внутреннее противоречие правления большинства
- Экологическая ошибка - логическая ошибка, возникающая, когда групповые характеристики применяются к отдельным людям.
- Джерримандеринг - форма политического манипулирования.
- Парадокс низкой массы тела при рождении - статистическая особенность веса детей при рождении
- Проблема с изменяемыми единицами площади – источник статистической погрешности
- Заблуждение прокурора – ошибка в мышлении, которая приводит к недооценке информации о базовой ставке.
- Феномен Уилла Роджерса – Статистический феномен и парадокс
- Ложная корреляция
- Смещение пропущенной переменной
Ссылки
[ редактировать ]- ^ Клиффорд Х. Вагнер (февраль 1982 г.). «Парадокс Симпсона в реальной жизни». Американский статистик . 36 (1): 46–48. дои : 10.2307/2684093 . JSTOR 2684093 .
- ^ Холт, Великобритания (2016). Потенциальный парадокс Симпсона в многоцентровом исследовании внутрибрюшинной химиотерапии рака яичников. Журнал клинической онкологии, 34 (9), 1016–1016.
- ^ Фрэнкс, Александр; Айролди, Эдоардо ; Славов, Николай (2017). «Посттранскрипционная регуляция в тканях человека» . PLOS Вычислительная биология . 13 (5): e1005535. arXiv : 1506.00219 . Бибкод : 2017PLSCB..13E5535F . дои : 10.1371/journal.pcbi.1005535 . ISSN 1553-7358 . ПМК 5440056 . ПМИД 28481885 .
- ^ Jump up to: а б с д и Иудейская Перл . Причинность: модели, рассуждения и выводы , Cambridge University Press (2000, 2-е издание, 2009 г.). ISBN 0-521-77362-8 .
- ^ Кок, Н., и Гаскинс, Л. (2016). Парадокс Симпсона, умеренность и появление квадратичных отношений в моделях путей: иллюстрация информационных систем. Международный журнал прикладной нелинейной науки, 2 (3), 200–234.
- ^ Рожье А. Киевит, Виллем Э. Франкенхейс, Лоренс Дж. Уолдорп и Денни Борсбум, Парадокс Симпсона в психологической науке: практическое руководство https://doi.org/10.3389/fpsyg.2013.00513
- ^ Роберт Л. Уордроп (февраль 1995 г.). «Парадокс Симпсона и горячая рука в баскетболе». Американский статистик , 49 (1) : стр. 24–28.
- ^ Алан Агрести (2002). «Категорный анализ данных» (второе издание). Джон Уайли и сыновья ISBN 0-471-36093-7
- ^ Симпсон, Эдвард Х. (1951). «Интерпретация взаимодействия в таблицах сопряженности». Журнал Королевского статистического общества, серия B. 13 : 238–241.
- ^ Пирсон, Карл ; Ли, Алиса; Брэмли-Мур, Лесли (1899). «Генетический (репродуктивный) отбор: наследование фертильности у человека и плодовитости у чистокровных скаковых лошадей» . Философские труды Королевского общества А. 192 : 257–330. дои : 10.1098/rsta.1899.0006 .
- ^ ГУ Юле (1903). «Заметки по теории ассоциации атрибутов в статистике» . Биометрика . 2 (2): 121–134. дои : 10.1093/биомет/2.2.121 .
- ^ Jump up to: а б Колин Р. Блит (июнь 1972 г.). «О парадоксе Симпсона и принципе уверенности». Журнал Американской статистической ассоциации . 67 (338): 364–366. дои : 10.2307/2284382 . JSTOR 2284382 .
- ^ И. Дж. Гуд , Ю. Миттал (июнь 1987 г.). «Объединение и геометрия таблиц сопряженности два на два» . Анналы статистики . 15 (2): 694–711. дои : 10.1214/aos/1176350369 . ISSN 0090-5364 . JSTOR 2241334 .
- ^ Элленберг, Иордания (25 мая 2021 г.). Форма: скрытая геометрия информации, биологии, стратегии, демократии и всего остального . Нью-Йорк: Пингвин Пресс . п. 228. ИСБН 978-1-9848-7905-9 . OCLC 1226171979 .
- ^ Дэвид Фридман , Роберт Пизани и Роджер Первс (2007), Статистика (4-е издание), WW Norton . ISBN 0-393-92972-8 .
- ^ Jump up to: а б с П. Дж. Бикель , Э. А. Хаммел и Дж. В. О'Коннелл (1975). «Половая предвзятость при поступлении в аспирантуру: данные Беркли» (PDF) . Наука . 187 (4175): 398–404. Бибкод : 1975Sci...187..398B . дои : 10.1126/science.187.4175.398 . ПМИД 17835295 . S2CID 15278703 . Архивировано (PDF) из оригинала 4 июня 2016 г.
- ^ Ч.Р. Чариг; Д.Р. Уэбб; С.Р. Пейн; Дж. Э. Уикхэм (29 марта 1986 г.). «Сравнение лечения камней в почках открытым хирургическим путем, чрескожной нефролитотомией и экстракорпоральной ударно-волновой литотрипсией» . Br Med J (Clin Res Ed) . 292 (6524): 879–882. дои : 10.1136/bmj.292.6524.879 . ПМЦ 1339981 . ПМИД 3083922 .
- ^ Jump up to: а б Стивен А. Джулиус; Марк А. Малли (3 декабря 1994 г.). «Смешение и парадокс Симпсона» . БМЖ . 309 (6967): 1480–1481. дои : 10.1136/bmj.309.6967.1480 . ПМК 2541623 . ПМИД 7804052 .
- ^ Джейнс, ET; Бретхорст, Г. Ларри (2003). «8.10 Объединение данных». Теория вероятностей: логика науки . Кембридж, Великобритания ; Нью-Йорк, штат Нью-Йорк: Издательство Кембриджского университета. ISBN 978-0-521-59271-0 .
- ^ Jump up to: а б Кен Росс. « Математик на стадионе: шансы и вероятности для любителей бейсбола (мягкая обложка) » Pi Press, 2004. ISBN 0-13-147990-3 . 12–13
- ^ Статистические данные доступны на сайте Baseball-Reference.com : данные по Дереку Джетеру ; Данные для Дэвида Джастиса .
- ^ Коцик Ежи (2001). «Доказательства без слов: парадокс Симпсона» (PDF) . Журнал «Математика» . 74 (5): 399. дои : 10.2307/2691038 . JSTOR 2691038 . Архивировано (PDF) из оригинала 12 июня 2010 г.
- ^ Берман, С. ДаллеМул, Л. Грин, М., Лакер, Дж. (2012), « Парадокс Симпсона: поучительная история в области расширенной аналитики. Архивировано 10 мая 2020 г. в Wayback Machine », Значение .
- ^ Мариос Г. Павлидес и Майкл Д. Перлман (август 2009 г.). «Насколько вероятен парадокс Симпсона?». Американский статистик . 63 (3): 226–233. дои : 10.1198/tast.2009.09007 . S2CID 17481510 .
- ^ Кок, Н. (2015). Насколько вероятен парадокс Симпсона в моделях путей? Международный журнал электронного сотрудничества, 11 (1), 1–7.
- ^ Нортон, Х. Джеймс; Дивайн, Джордж (август 2015 г.). «Парадокс Симпсона… и как его избежать» . Значение . 12 (4): 40–43. дои : 10.1111/j.1740-9713.2015.00844.x .
- ^ Перл, Иудея (2014). «Понимание парадокса Симпсона». Американский статистик . 68 (1): 8–13. дои : 10.2139/ssrn.2343788 . S2CID 2626833 .
- ^ Перл, Иудея (1993). «Графические модели, причинно-следственная связь и вмешательство» . Статистическая наука . 8 (3): 266–269. дои : 10.1214/ss/1177010894 .
- ^ Jump up to: а б Перл, Дж.; Маккензи, Д. (2018). Книга «Почему: новая наука о причине и следствии» . Нью-Йорк, штат Нью-Йорк: Основные книги.
- ^ Шпицер И.; Перл, Дж. (2006). Дектер, Р.; Ричардсон, Т.С. (ред.). «Идентификация условных интервенционных распределений». Материалы двадцать второй конференции по неопределенности в искусственном интеллекте . Корваллис, Орегон: AUAI Press: 437–444.
- ^ Блит, Колин Р. (июнь 1972 г.). «О парадоксе Симпсона и принципе уверенности» . Журнал Американской статистической ассоциации . 67 (338): 364–366. дои : 10.1080/01621459.1972.10482387 . ISSN 0162-1459 .
- ^ Гренландия, Сандер (01 ноября 2021 г.). «Неколлапсируемость, путаница и предвзятость из-за скудности данных. Часть 2: Что следует делать исследователям из постоянных споров по поводу отношения шансов?» . Журнал клинической эпидемиологии . 139 : 264–268. дои : 10.1016/j.jclinepi.2021.06.004 . ISSN 0895-4356 . ПМИД 34119647 .
- ^ Эрнан, Майкл А.; Клейтон, Дэвид; Кейдинг, Нильс (июнь 2011 г.). «Разгадка парадокса Симпсонов» . Международный журнал эпидемиологии . 40 (3): 780–785. дои : 10.1093/ije/animal041 . ISSN 1464-3685 . ПМК 3147074 . ПМИД 21454324 .
Библиография
[ редактировать ]- Лейла Шнепс и Корали Колмез , Математика на суде. Как числа используются и злоупотребляются в зале суда , Basic Books, 2013. ISBN 978-0-465-03292-1 . (Шестая глава: «Математическая ошибка номер 6: парадокс Симпсона. Дело о половой предвзятости в Беркли: обнаружение дискриминации»).
Внешние ссылки
[ редактировать ]
- Парадокс Симпсона в Стэнфордской энциклопедии философии , авторы Ян Шпренгер и Нафтали Вайнбергер.
- Как статистика может вводить в заблуждение – Марк Лидделл – видео и урок TED-Ed.
- Перл, Иудея , «Понимание парадокса Симпсона» (PDF)
- Парадокс Симпсона — небольшая статья Александра Богомольного о векторной интерпретации парадокса Симпсона.
- Колонка Wall Street Journal «Числа» от 2 декабря 2009 года была посвящена недавним случаям парадокса Симпсона в новостях. В частности, это парадокс Симпсона при сравнении уровня безработицы во время рецессии 2009 года с рецессией 1983 года.
- У тарелки, статистическая головоломка: понимание парадокса Симпсона , Артур Смит, 20 августа 2010 г.
- Парадокс Симпсона , видео Генри Райха из MinutePhysics