Корреляция не подразумевает причинно-следственную связь
Фраза « корреляция не подразумевает причинно-следственную связь » относится к неспособности законно вывести причинно-следственную связь между двумя событиями или переменными исключительно на основе наблюдаемой связи или корреляции между ними. [1] [2] Идея о том, что «корреляция подразумевает причинно-следственную связь», является примером сомнительной причины логической ошибки , при которой два события, происходящие вместе, считаются установленными причинно-следственной связью. Это заблуждение также известно под латинским выражением cum hoc ergo propter hoc («с этим, следовательно, из-за этого»). Это отличается от заблуждения, известного как post hoc ergo propter hoc («после этого, следовательно, из-за этого»), при котором событие, следующее за другим, рассматривается как необходимое следствие предыдущего события, и от смешения , ошибочного слияния двух событий. события, идеи, базы данных и т. д. в одном.
Как и в случае с любой логической ошибкой, выявление ошибочности рассуждений, лежащих в основе аргумента, не обязательно означает , что полученный вывод является ложным. статистические Были предложены методы, которые используют корреляцию в качестве основы для проверки гипотез на причинность, включая тест причинности Грейнджера и конвергентное перекрестное картирование . Критерии Брэдфорда Хилла , также известные как критерии причинно-следственной связи Хилла, представляют собой группу из девяти принципов, которые могут быть полезны при установлении эпидемиологических доказательств причинно-следственной связи.
Использование и значение терминов
[ редактировать ]"Подразумевать"
[ редактировать ]В повседневном использовании слово «подразумевается» означает скорее « предполагает », чем «требует» . Однако в логике техническое использование слова «подразумевается» означает «является достаточным условием для». [3] Именно это имеют в виду статистики, когда говорят, что причинно-следственная связь не определена. Действительно, p подразумевает, что q имеет технический смысл материального условного выражения : если p, то q, символизируемое как p → q . То есть «если обстоятельство p истинно, то следует и q ». В этом смысле всегда правильно сказать: «Корреляция не подразумевает причинно-следственную связь».
"Причина"
[ редактировать ]Слово « причина » (или «причинная связь») имеет в английском языке несколько значений. В философской терминологии «причина» может относиться к необходимым, достаточным или способствующим причинам. При изучении корреляции «причина» чаще всего используется для обозначения «одной способствующей причины» (но не обязательно единственной способствующей причины).
Причинно-следственный анализ
[ редактировать ]Примеры нелогичного вывода причинно-следственной связи из корреляции
[ редактировать ]B вызывает A (обратная причинность или обратная причинность)
[ редактировать ]Обратная причинно-следственная связь или обратная причинно-следственная связь или неправильное направление — это неформальная ошибка сомнительной причины , когда причина и следствие меняются местами. Говорят, что причина является следствием и наоборот.
- Пример 1
- Чем быстрее вращаются ветряные мельницы, тем сильнее наблюдается ветер.
- Следовательно, ветер возникает из-за вращения ветряных мельниц. (Или, проще говоря: ветряные мельницы, как следует из их названия, представляют собой машины, используемые для производства ветра.)
В этом примере корреляция (одновременность) между работой ветряных мельниц и скоростью ветра не означает, что ветер вызван ветряными мельницами. Скорее наоборот, о чем свидетельствует тот факт, что для существования ветра не нужны ветряные мельницы, в то время как ветряным мельницам для вращения нужен ветер. Ветер можно наблюдать там, где нет ветряных мельниц или невращающихся ветряных мельниц, и есть веские основания полагать, что ветер существовал до изобретения ветряных мельниц.
- Пример 2
- Субъекты с низким уровнем холестерина коррелируют с увеличением смертности.
- Таким образом, низкий уровень холестерина увеличивает риск смертности.
Все наоборот, поскольку такие заболевания, как рак, вызывают низкий уровень холестерина из-за множества факторов, таких как потеря веса и увеличение смертности. [6] Это также наблюдается у бывших курильщиков. Бывшие курильщики чаще умирают от рака легких, чем нынешние курильщики. [7] Когда курильщикам на протяжении всей жизни сообщают, что у них рак легких, многие бросают курить. Из-за этого изменения может сложиться впечатление, что бывшие курильщики чаще умирают от рака легких, чем нынешние курильщики. Это также можно наблюдать у алкоголиков. Когда у алкоголиков диагностируют цирроз печени, многие бросают пить. Однако они также испытывают повышенный риск смертности. В этих случаях именно болезни вызывают повышенный риск смертности, но повышенная смертность объясняется положительными эффектами, которые следуют за диагнозом, в результате чего здоровые изменения выглядят нездоровыми.
Пример 3
В других случаях может быть просто неясно, что является причиной, а что следствием. Например:
- Дети, которые много смотрят телевизор , самые жестокие. Очевидно, что телевидение делает детей более жестокими .
Это легко могло быть наоборот; то есть жестокие дети любят смотреть больше телевизора, чем менее жестокие.
Пример 4
Корреляция между употреблением рекреационных наркотиков и психическими расстройствами может быть любой: возможно, наркотики вызывают расстройства, или, возможно, люди используют наркотики для самолечения ранее существовавших состояний. Теория «воротных наркотиков» может утверждать, что употребление марихуаны приводит к употреблению более сильных наркотиков, но употребление тяжелых наркотиков может привести к употреблению марихуаны (см. Также путаницу в обратном порядке ). Действительно, в социальных науках , где контролируемые эксперименты часто не могут быть использованы для выявления направления причинно-следственной связи, это заблуждение может подпитывать давние научные аргументы. Один из таких примеров можно найти в экономике образования , между моделями скрининга / сигнализации и человеческим капиталом : это может быть либо то, что наличие врожденных способностей позволяет человеку завершить образование, либо что завершение образования укрепляет его способности.
Пример 5
Историческим примером этого является то, что европейцы в средние века считали, что вши полезны для здоровья, поскольку у больных людей вши редко встречаются. Аргументация заключалась в том, что люди заболели, потому что вши ушли. Однако настоящая причина в том, что вши чрезвычайно чувствительны к температуре тела . Небольшое повышение температуры тела, например, при лихорадке , заставляет вшей искать другого хозяина. Медицинский термометр еще не был изобретен, поэтому повышение температуры наблюдалось редко. Заметные симптомы появились позже, что создавало впечатление, что вши ушли до того, как человек заболел. [8]
В других случаях каждое из двух явлений может быть частичной причиной другого; рассмотрите бедность и отсутствие образования или прокрастинацию и низкую самооценку. Однако тот, кто выдвигает аргумент, основанный на этих двух явлениях, должен быть осторожен, чтобы избежать ошибки круговой причины и следствия . Бедность является причиной отсутствия образования, но не единственной причиной, и наоборот.
Третий фактор C (общая причинная переменная) вызывает как A, так и B.
[ редактировать ]Заблуждение третьей причины (также известное как игнорирование общей причины). [9] или сомнительная причина [9] ) является логической ошибкой , при которой ложную связь путают с причинно-следственной связью . Он утверждает, что X вызывает Y, хотя на самом деле и X, и Y вызваны Z. Это разновидность ошибки post hoc ergo propter hoc и член сомнительных причин группы заблуждений .
Во всех этих примерах речь идет о скрытой переменной , которая представляет собой просто скрытую третью переменную, влияющую на обе причины корреляции. Трудность часто возникает и тогда, когда третий фактор, хотя и принципиально отличается от А и В, настолько тесно связан с А и/или В, что его можно спутать с ними или очень трудно отделить от них с научной точки зрения (см. пример 4).
- Пример 1
- Сон в обуви тесно связан с пробуждением с головной болью.
- Поэтому сон в обуви вызывает головную боль.
Приведенный выше пример допускает ошибку «корреляция подразумевает причинно-следственную связь», поскольку из него преждевременно делается вывод о том, что сон в обуви вызывает головную боль. Более правдоподобное объяснение состоит в том, что оба они вызваны третьим фактором, в данном случае ложением спать пьяным , что, таким образом, приводит к корреляции. Так что вывод неверный.
- Пример 2
- У маленьких детей, которые спят с включенным светом, в дальнейшей жизни гораздо чаще развивается близорукость .
- Следовательно, сон с включенным светом вызывает близорукость.
Это научный пример, который стал результатом исследования в Пенсильванского университета Медицинском центре . Опубликовано в журнале Nature от 13 мая 1999 года . [10] В то время исследование получило широкое освещение в популярной прессе. [11] Однако более позднее исследование, проведенное в Университете штата Огайо, не выявило, что младенцы , спящие при включенном свете, вызывают развитие близорукости. Они обнаружили тесную связь между близорукостью родителей и развитием близорукости у детей, а также отметили, что родители с близорукостью чаще оставляли свет включенным в спальне своих детей. [12] [13] [14] [15] В данном случае причиной обоих состояний является близорукость родителей, и приведенный выше вывод является ложным.
- Пример 3
- По мере увеличения продаж мороженого резко возрастает количество смертей от утопления.
- Таким образом, употребление мороженого приводит к утоплению.
В этом примере не учитывается важность времени года и температуры для продаж мороженого. Мороженое продается в жаркие летние месяцы гораздо чаще, чем в холодное время, и именно в эти жаркие летние месяцы люди с большей вероятностью будут заниматься деятельностью, связанной с водой, например плаванием . Рост смертности от утопления вызван просто тем, что люди чаще занимаются водными видами спорта, а не мороженым. Изложенное заключение является ложным.
- Пример 4
- Гипотетическое исследование показывает взаимосвязь между показателями тестовой тревожности и показателями застенчивости со статистическим значением r (сила корреляции) +,59. [16]
- Таким образом, можно просто заключить, что застенчивость в некоторой степени причинно влияет на тестовую тревожность.
Однако, как было обнаружено во многих психологических исследованиях, была обнаружена еще одна переменная, «показатель застенчивости», которая имеет более резкую корреляцию (+,73) с застенчивостью. Это предполагает возможную проблему «третьей переменной», однако, когда обнаруживаются три таких тесно связанных показателя, это также предполагает, что каждый из них может иметь двунаправленные тенденции (см. « Двунаправленная переменная » выше), представляя собой кластер коррелирующих значений, каждое из которых влияет друг на друга. в некоторой степени. Следовательно, простой вывод, приведенный выше, может быть ошибочным.
- Пример 5
- С 1950-х годов CO 2 как уровень в атмосфере, так и уровень ожирения . резко возросли
- Следовательно, атмосферный CO 2 вызывает ожирение.
Более богатые слои населения, как правило, едят больше еды и производят больше CO 2 .
- Пример 6
- ЛПВП («хороший») Холестерин отрицательно коррелирует с частотой сердечных приступов.
- Таким образом, прием лекарств для повышения уровня ЛПВП снижает вероятность сердечного приступа.
Дальнейшие исследования [17] поставил этот вывод под сомнение. Вместо этого возможно, что другие основные факторы, такие как гены, диета и физические упражнения, влияют как на уровень ЛПВП, так и на вероятность сердечного приступа; вполне возможно, что лекарства могут влиять на непосредственно измеримый фактор — уровень ЛПВП, не влияя при этом на вероятность сердечного приступа.
Двунаправленная причинно-следственная связь: А вызывает Б, а Б вызывает А.
[ редактировать ]Причинность не обязательно односторонняя; [ сомнительно – обсудить ] В отношениях хищник-жертва численность хищников влияет на численность жертв, но численность жертв, то есть запас пищи, также влияет на численность хищников. Другой хорошо известный пример: индекс массы тела у велосипедистов ниже , чем у людей, которые не ездят на велосипеде. Это часто объясняют предположением, что езда на велосипеде повышает уровень физической активности и, следовательно, снижает ИМТ. Поскольку результаты проспективных исследований с участием людей, которые чаще используют велосипеды, показывают меньшее влияние на ИМТ, чем перекрестные исследования, может существовать и некоторая обратная причинно-следственная связь. Например, люди с более низким ИМТ могут с большей вероятностью в первую очередь захотеть ездить на велосипеде. [18]
Отношения между А и Б случайны.
[ редактировать ]Эти две переменные вообще не связаны между собой, а коррелируют случайно. Чем больше вещей исследуется, тем больше вероятность того, что две несвязанные переменные окажутся связанными. Например:
- Результат последней домашней игры « Вашингтон Коммандерс» перед президентскими выборами предсказал исход всех президентских выборов с 1936 по 2000 год включительно , несмотря на то, что результаты футбольных игр не имели ничего общего с исходом всенародных выборов. Эта полоса была окончательно прервана в 2004 году (или в 2012 году, если использовать альтернативную формулировку исходного правила).
- Закон Миршайда , который соотносит Социал-демократической партии Германии долю голосов избирателей с размером производства стали в Западной Германии.
- Чередование лысых и волосатых российских лидеров: лысый (или явно лысеющий) государственный лидер России сменял нелысого («волосатого»), и наоборот, на протяжении почти 200 лет.
- Библейский код , слова на иврите, предсказывающие исторические события, предположительно скрытые в Торе : огромное количество комбинаций букв делает появление любого слова в достаточно длинном тексте статистически незначимым.
Использование корреляции в качестве научного доказательства
[ редактировать ]Большая часть научных данных основана на корреляции переменных. [19] которые наблюдаются вместе. Ученые осторожно отмечают, что корреляция не обязательно означает причинно-следственную связь. Предположение о том, что А вызывает Б просто потому, что А коррелирует с Б, часто не принимается в качестве законной формы аргументации.
Однако иногда люди совершают противоположную ошибку, полностью игнорируя корреляцию. Это приведет к игнорированию большого количества важных научных данных. [19] Поскольку проведение контролируемых двойных слепых исследований может оказаться трудным или этически невозможным, корреляционные данные с нескольких разных точек зрения могут быть полезны для прогнозирования, несмотря на отсутствие доказательств причинно-следственной связи . Например, социальные работники могут быть заинтересованы в том, чтобы узнать, как жестокое обращение с детьми связано с успеваемостью. Хотя было бы неэтично проводить эксперимент, в котором детей случайным образом распределяли на тех, кто подвергался или не подвергался жестокому обращению, исследователи могут изучить существующие группы, используя неэкспериментальный корреляционный план. Если на самом деле существует отрицательная корреляция между жестоким обращением и успеваемостью, исследователи потенциально могли бы использовать эти знания о статистической корреляции, чтобы делать прогнозы о детях, не участвовавших в исследовании, которые подвергаются жестокому обращению, даже несмотря на то, что исследование не смогло предоставить причинно-следственных доказательств того, что жестокое обращение снижает успеваемость. [20] Сочетание ограниченных доступных методологий с ошибкой игнорирования корреляции иногда использовалось для противодействия научным открытиям. Например, табачная промышленность исторически полагалась на отказ от корреляционных данных, чтобы отвергнуть связь между табачным дымом и раком легких . [21] как и биолог и статистик Рональд Фишер (часто от имени отрасли). [список 1]
Корреляция — это ценный тип научных данных в таких областях, как медицина, психология и социология. Сначала необходимо подтвердить реальность корреляций, а затем систематически исследовать все возможные причинные связи. В конце концов, корреляция сама по себе не может использоваться в качестве доказательства причинно-следственной связи между лечением и пользой, фактором риска и заболеванием или социальным или экономическим фактором и различными исходами. Это один из наиболее часто злоупотребляемых типов доказательств, поскольку легко и даже соблазнительно прийти к преждевременным выводам, основанным на предварительном появлении корреляции. [21]
См. также
[ редактировать ]- Подтверждение следствия – тип ошибочного аргумента (логическая ошибка).
- Выравнивание случайных точек – явление в статистике.
- Неофициальные доказательства - доказательства, основанные на личных показаниях.
- Апофения – склонность воспринимать связи между несвязанными вещами.
- Апостериорный анализ - статистический анализ, который не был указан до того, как данные были просмотрены.
- Проблема множественных сравнений . Статистическая интерпретация с использованием множества тестов.
- Эффект поиска в другом месте - явление статистического анализа
- Сбор данных – неправильное использование анализа данных
- Проверка гипотез, предложенных данными - Проблема циклических рассуждений в статистике
- Библейский код - предполагаемый набор секретных сообщений, закодированных в еврейском тексте Торы.
- Критерии Брэдфорда Хилла
- Совпадение # Причинность - совпадение событий без связи.
- Смешение - переменная или фактор в причинно-следственной связи.
- Путаница обратного – Логическая ошибка
- Французский парадокс : количество сердечных заболеваний у французов намного меньше, чем ожидалось
- Дизайн экспериментов – Дизайн задач
- Совместный эффект – очевидная, но ложная корреляция между причинно-независимыми переменными.
- Посредничество (статистика) – Статистическая модель
- Нормально распределенные и некоррелированные не означают независимости.
- Пираты и глобальное потепление – Сатирическое божество.
- Воспроизводимость - аспект научных исследований
- Ложная связь - очевидная, но ложная корреляция между причинно-независимыми переменными.
- Телеология - мышление с точки зрения судьбы или цели.
Ссылки
[ редактировать ]- ^ Тафте 2006 , стр. 5.
- ^ Олдрич, Джон (1995). «Подлинные и ложные корреляции у Пирсона и Юла» (PDF) . Статистическая наука . 10 (4): 364–376. дои : 10.1214/ss/1177009870 . JSTOR 2246135 .
- ^ "Достаточный" . Вольфрам . 2019-12-02 . Проверено 3 декабря 2019 г.
- ^ Ролфинг, Инго; Шнайдер, Карстен К. (2018). «Объединяющая основа причинного анализа в теоретико-множественных многометодных исследованиях» (PDF) . Социологические методы и исследования . 47 (1): 37–63. дои : 10.1177/0049124115626170 . S2CID 124804330 . Проверено 29 февраля 2020 г.
- ^ Брэди, Генри Э. (7 июля 2011 г.). «Причинность и объяснение в социальных науках» . Оксфордский справочник по политологии . doi : 10.1093/oxfordhb/9780199604456.013.0049 . Проверено 29 февраля 2020 г.
- ^ Навид Саттар; Дэвид Прейсс (13 июня 2017 г.). «Обратная причинно-следственная связь в эпидемиологических исследованиях сердечно-сосудистой системы» . Тираж . 135 (24): 2369–2372. doi : 10.1161/CIRCULATIONAHA.117.028307 . ПМИД 28606949 .
- ^ Ричард Долл; Ричард Пето; Джиллиан Борэм; Изабель Сазерленд (24 июня 2004 г.). «Смертность, связанная с курением: 50-летние наблюдения за британскими врачами-мужчинами» . БМЖ . 328 (7455): 1239–49. дои : 10.1136/bmj.38142.554479.AE . ПМЦ 437139 . ПМИД 15213107 .
- ^ Уиллингем, Эмили. «О вшах и людях: зудящая история» . Сеть блогов Scientific American . Проверено 26 февраля 2019 г.
- ^ Перейти обратно: а б Лабоссьер, MC, Страницы философии доктора ЛаБоссьера, заархивированные 22 мая 2009 г. в Wayback Machine.
- ^ Куинн, Грэм Э.; Шин, Чай Х.; Магуайр, Морин Г.; Стоун, Ричард А. (май 1999 г.). «Близорукость и окружающее освещение в ночное время». Природа . 399 (6732): 113–114. Бибкод : 1999Natur.399..113Q . дои : 10.1038/20094 . ПМИД 10335839 . S2CID 4419645 .
- ↑ CNN , 13 мая 1999 г. Ночник может привести к близорукости.
- ^ Новости исследований Университета штата Огайо , 9 марта 2000 г. Ночной свет не приводит к близорукости, показывают исследования. Архивировано 1 сентября 2006 г. в Wayback Machine.
- ^ Задник, Карла; Джонс, Лиза А.; Ирвин, Бретт С.; Кляйнштейн, Роберт Н.; Мэнни, Рут Э.; Шин, Джули А.; Мутти, Дональд О. (2000). «Зрение: близорукость и окружающее ночное освещение». Природа . 404 (6774): 143–144. Бибкод : 2000Natur.404..143Z . дои : 10.1038/35004661 . ПМИД 10724157 . S2CID 4399332 .
- ^ Гвязда, Дж.; Онг, Э.; Хелд, Р.; Торн, Ф. (2000). «Зрение: близорукость и ночное освещение» . Природа . 404 (6774): 144. Бибкод : 2000Natur.404..144G . дои : 10.1038/35004663 . ПМИД 10724158 .
- ^ Стоун, Ричард А.; Магуайр, Морин Г.; Куинн, Грэм Э. (2000). «Зрение: ответ: близорукость и ночное освещение» . Природа . 404 (6774): 144. Бибкод : 2000Natur.404..144S . дои : 10.1038/35004665 . ПМИД 10724158 .
- ^ Кардуччи, Бернардо Дж. (2009). Психология личности: точки зрения, исследования и приложения (2-е изд.). Джон Уайли и сыновья. ISBN 978-1-4051-3635-8 .
- ^ Орниш, Дин. «Холестерин: хорошее, плохое и правда» [1] (получено 3 июня 2011 г.)
- ^ Донс, Э (2018). «Выбор режима транспорта и индекс массы тела: перекрестные и продольные данные общеевропейского исследования» (PDF) . Интернационал окружающей среды . 119 (119): 109–116. дои : 10.1016/j.envint.2018.06.023 . hdl : 10044/1/61061 . ПМИД 29957352 . S2CID 49607716 .
- ^ Перейти обратно: а б Новелла (18 ноября 2009 г.). «Доказательства в медицине: корреляция и причинно-следственная связь» . Наука и медицина . Научная медицина.
- ^ Нильсен, Майкл (23 января 2012 г.). «Если корреляция не подразумевает причинно-следственную связь, то что тогда? | DDI» . Michaelnielsen.org . Проверено 8 октября 2017 г.
- ^ Перейти обратно: а б «Доказательства в медицине: корреляция и причинно-следственная связь – научная медицина» . Sciencebasedmedicine.org. 18 ноября 2009 г. Проверено 8 октября 2017 г.
- ^ Сильвер, Нейт (2015), Сигнал и шум: почему так много прогнозов не работают, а некоторые нет (2-е изд.), Нью-Йорк : Penguin Books , стр. 254–255
- ^ Фишер, Рональд (6 июля 1957 г.), «Опасности курения сигарет», Британский медицинский журнал , 2 (5035), Лондон : Британская медицинская ассоциация : 43, номер документа : 10.1136/bmj.2.5035.43 , JSTOR 25383068 , PMC 1961750
- ^ Фишер, Рональд (3 августа 1957 г.), «Опасности курения сигарет», Британский медицинский журнал , 2 (5039), Лондон : Британская медицинская ассоциация : 297–298, doi : 10.1136/bmj.2.5039.297-b , JSTOR 25383439 , ЧВК 1961712
- ^ Фишер, Рональд (1958), «Сигареты, рак и статистика» (PDF) , The Centennial Review of Arts & Science , 2 , Ист-Лансинг, Мичиган : Издательство Мичиганского государственного университета : 151–166, в архиве (PDF) из оригинала 9 октября 2022 г.
- ^ Фишер, Рональд (1958), «Природа вероятности» (PDF) , The Centennial Review of Arts & Science , 2 , Ист-Лансинг, Мичиган : Издательство Мичиганского государственного университета : 261–274, в архиве (PDF) из оригинала в 2022 году. -10-09
- ^ Фишер, Рональд (12 июля 1958 г.), «Рак легких и сигареты» (PDF) , Nature , 182 (4628), Лондон : Nature Publishing Group : 108, Бибкод : 1958Natur.182..108F , doi : 10.1038/182108a0 , PMID 13566198 , заархивировано (PDF) из оригинала 9 октября 2022 г.
- ^ Фишер, Рональд (30 августа 1958 г.), «Рак и курение» (PDF) , Nature , 182 (4635), Лондон : Nature Publishing Group : 596, Бибкод : 1958Natur.182..596F , doi : 10.1038/182596a0 , PMID 13577916 , заархивировано (PDF) из оригинала 9 октября 2022 г.
- Ссылки в комплекте
Библиография
[ редактировать ]- Биби, Хелен; Хичкок, Кристофер; Мензис, Питер (2009). Оксфордский справочник причинно-следственной связи . Издательство Оксфордского университета. ISBN 978-0-19-162946-4 .
- Тафте, Эдвард Р. (2006). Когнитивный стиль PowerPoint: борьба с коррупцией внутри (2-е изд.). Чешир, Коннектикут : Graphics Press . ISBN 978-0-9613921-5-4 .