Jump to content

Эффект поиска в другом месте

Эффект поиска в другом месте — это явление в статистическом анализе научных экспериментов , когда кажущееся статистически значимое наблюдение могло на самом деле возникнуть случайно из-за огромного размера пространства параметров , подлежащего поиску. [1] [2] [3] [4] [5]

Как только возможность ошибки поиска в другом месте в анализе признана, ее можно компенсировать тщательным применением стандартных математических методов. [6] [7] [8]

Этот термин , более широко известный в статистике как проблема множественных сравнений , привлек некоторое внимание средств массовой информации в 2011 году в контексте поиска бозона Хиггса на Большом адронном коллайдере . [9]

Использовать

[ редактировать ]

Многие статистические тесты дают значение p — вероятность того, что данный результат может быть получен случайно, если предположить, что гипотеза, которую человек пытается доказать, на самом деле ложна. Когда спрашивают: « ли X Влияет на Y ?», обычно варьируют X и смотрят, есть ли значительные изменения в Y. в результате Если это значение p меньше некоторого заранее определенного статистической значимости порога α , результат считается «значимым».

Однако если кто-то выполняет несколько тестов («ищет где-нибудь в другом месте», если первый тест не пройден), то значение p , равное 1/ n, ожидается, что будет возникать один раз за n тестов. Например, при отсутствии реального эффекта событие с p < 0,05 все равно произойдет в среднем один раз на каждые 20 выполненных тестов. Чтобы компенсировать это, вы можете разделить пороговое значение α на количество тестов n , чтобы результат был значимым, когда p < α / n . Или, что то же самое, умножьте наблюдаемое значение p на количество тестов (значимо, когда np < α ).

Это упрощенный случай; число n на самом деле представляет собой количество степеней свободы в тестах или количество фактически независимых тестов. Если они не полностью независимы, их число может быть меньше количества тестов.

Эффект поиска в другом месте является частой причиной «инфляции значимости», когда количество независимых тестов n недооценивается, поскольку неудавшиеся тесты не публикуются. В одной статье могут не упоминаться рассматриваемые альтернативные гипотезы, или статья, не дающая никаких результатов, может просто не быть опубликована вообще, что приводит к тому, что в журналах доминируют статистические выбросы.

  • Шведское исследование 1992 года попыталось определить, вызывают ли линии электропередач какие-либо негативные последствия для здоровья. Исследователи опросили всех, кто жил в радиусе 300 м от высоковольтных линий электропередачи, в течение 25 лет и обнаружили статистически значимое увеличение заболеваемости более чем 800 заболеваниями. Исследование показало, что заболеваемость детской лейкемией была в четыре раза выше среди тех, кто жил ближе всего к линиям электропередачи, и это подстегнуло шведское правительство к действию. Однако проблема с выводом заключалась в том, что они не смогли компенсировать эффект поиска в другом месте; в любой коллекции из 800 случайных выборок вполне вероятно, что по крайней мере одна из них будет как минимум на 3 стандартных отклонения выше ожидаемого значения, только по случайности. Последующие исследования не смогли показать какой-либо связи между линиями электропередачи и детской лейкемией, ни причинно-следственной связи, ни даже корреляции. [10]
    Равноотстоящие последовательности букв «вики» и «Педия» встречаются в версии Книги Бытия короля Иакова (10:7-14).
  • Феномен «Библейский код» направлен на обнаружение нетипичных значительных групп слов, предсказывающих будущие события, скрытых в тексте еврейской Библии, взятой как необработанная последовательность букв без интервалов и организованных в различные сетки разных пропорций. Однако, как показала статья в Skeptical Inquirer , [11] это означает создание огромного количества сеток для проверки шаблонов или группировок путем разделения полной текстовой строки на ширины от нескольких до сотен тысяч букв, повторяя ширину для последующих строк. Затем в каждой из этих многочисленных сеток можно, в свою очередь, осуществлять дальнейший поиск по широкому кругу интересующих слов, пропуская через интервалы вперед или назад произвольные x букв в тексте (или x+1, x+2 и т. д.). ), в огромном перекрестном произведении параметризованных . возможностей, и связанное с ним совпадающее интересующее слово может быть любой ближайшей строкой в ​​произвольном пропуске букв x + k или y + k, вперед или назад, так что объемы перестановок становятся огромными Таким образом, оставляя в стороне связанные вопросы, такие как предвзятость подтверждения , даже если в первой сетке не было обнаружено группировок, представляющих интерес или значимость, следующая итерация может быть опробована компьютером и так далее в массовом порядке , пока наконец не будут получены «чудесные» или «невероятные» группы. в. По сути, это равносильно тому, чтобы иметь дело с неинтересным покерную комбинацию, продолжая делать это в любых необходимых количествах, пока не будет получен стрит-флеш , рояль или даже множество подобных событий подряд, и называя колоду вдохновленной для достижения такого результата. Таким образом, автор Skeptical Inquirer смог добиться идентичного эффекта, просто применив одни и те же алгоритмы поиска как к англоязычному тексту Библии короля Иакова вместо якобы вдохновленной Богом версии на иврите, а затем столь же эффективно к обыденному и произвольному примеру текста 1987 года Верховного суда США Решение «Эдвардс против Агиларда» .

См. также

[ редактировать ]
  1. ^ Лайонс, Л. (2008). «Открытые статистические вопросы физики элементарных частиц». Анналы прикладной статистики . 2 (3): 887. arXiv : 0811.1663 . дои : 10.1214/08-AOAS163 .
  2. ^ «Краткое содержание: контроль «эффекта поиска в другом месте» » . Американское физическое общество. 2011.
  3. ^ Лори Энн Уайт (12 августа 2011 г.). «Слово недели: эффект взгляда в другом месте» . Стэнфордская национальная ускорительная лаборатория. Архивировано из оригинала 19 апреля 2012 года.
  4. ^ Дориго, Томмазо (16 октября 2009 г.). «Сверхъестественные совпадения и эффект взгляда в другое место» . Проверено 17 октября 2012 г.
  5. ^ Дориго, Томмазо (19 августа 2011 г.). «Должны ли вас волновать ваши данные? Пусть решает эффект поиска в другом месте» . Сотрудничество с CMS.
  6. ^ Гросс, Э.; Вителлс, О. (2010). «Пробные факторы для поиска других эффектов в физике высоких энергий». Европейский физический журнал C . 70 : 525. arXiv : 1005.1891 . Бибкод : 2010EPJC...70..525G . doi : 10.1140/epjc/s10052-010-1470-8 .
  7. ^ Байер, Адриан Э.; Селяк, Урош (2020). «Эффект поиска в другом месте с единой байесовской и частотной точек зрения» . Журнал космологии и физики астрочастиц . 2020 (10): 009–009. arXiv : 2007.13821 . дои : 10.1088/1475-7516/2020/10/009 .
  8. ^ Байер, Адриан Э.; Селяк, Урош; Робник, Якоб (2021). «Самокалибровка эффекта взгляда в другое место: быстрая оценка статистической значимости с использованием пиковых высот» . Ежемесячные уведомления Королевского астрономического общества . 508 (1): 1346–1357. arXiv : 2108.06333 . дои : 10.1093/mnras/stab2331 .
  9. ^ Том Чиверс (13 декабря 2011 г.). «Неподтвержденное обнаружение неуловимого бозона Хиггса» . Дейли Телеграф. Архивировано из оригинала 17 декабря 2011 г.
  10. ^ Палфриман, Джон (13 июня 1995 г.), «Потоки страха» , Frontline , PBS , получено 1 июля 2012 г.
  11. ^ Томас, Дэйв (1 ноября 1997 г.), «Скрытые послания и библейский код» , Skeptical Inquirer , CSICOP , получено 19 апреля 2015 г.
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: aeccbb4979147f4da7caf09c66dedc97__1710949560
URL1:https://arc.ask3.ru/arc/aa/ae/97/aeccbb4979147f4da7caf09c66dedc97.html
Заголовок, (Title) документа по адресу, URL1:
Look-elsewhere effect - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)