Предвзятость выбора
Систематическая ошибка отбора — это систематическая ошибка, возникающая в результате отбора отдельных лиц, групп или данных для анализа таким образом, что не достигается надлежащая рандомизация и, таким образом, не удается гарантировать, что полученная выборка является репрезентативной для популяции, предназначенной для анализа. [1] Иногда его называют эффектом отбора . Фраза «систематическая ошибка отбора» чаще всего относится к искажению статистического анализа , возникающему в результате метода сбора выборок. Если не учитывать предвзятость отбора, то некоторые выводы исследования могут оказаться ложными.
Виды предвзятости
[ редактировать ]Смещение выборки
[ редактировать ]Смещение выборки – это систематическая ошибка, возникающая из-за неслучайной выборки генеральной совокупности. [2] в результате чего некоторые члены населения с меньшей вероятностью будут включены, чем другие, что приводит к выборке , определяемой как статистическая выборка населения предвзятой (или нечеловеческие факторы), в которой все участники не одинаково сбалансированы или объективно представлены. [3] Чаще всего его классифицируют как подтип систематической ошибки отбора. [4] иногда специально называют предвзятостью отбора выборки , [5] [6] [7] но некоторые классифицируют это как отдельный тип предвзятости. [8]
Отличие систематической ошибки выборки (хотя и не общепринятой) заключается в том, что она подрывает внешнюю валидность теста (способность обобщать его результаты на остальную часть населения), в то время как систематическая ошибка отбора в основном касается внутренней валидности различий или сходства, обнаруженные в рассматриваемом образце. В этом смысле ошибки, возникающие в процессе формирования выборки или когорты, вызывают смещение выборки, тогда как ошибки в любом последующем процессе вызывают смещение отбора.
Примеры систематической ошибки выборки включают самоотбор , предварительный отбор участников исследования, дисконтирование участников исследования/тестов, которые не были завершены до конца, а также ошибку миграции путем исключения участников, которые недавно переехали в или из области исследования, смещение по времени , где обнаруживается медленно развивающееся заболевание с лучшим прогнозом, и смещение времени выполнения , когда заболевание диагностируется раньше у участников, чем в сравниваемых популяциях, хотя среднее течение заболевания такое же.
Временной интервал
[ редактировать ]- Досрочное прекращение исследования в тот момент, когда его результаты подтверждают желаемый вывод.
- Исследование может быть прекращено досрочно при достижении экстремального значения (часто по этическим причинам), но экстремальное значение, скорее всего, будет достигнуто переменной с наибольшей дисперсией , даже если все переменные имеют одинаковое среднее значение .
Контакт
[ редактировать ]- Предвзятость восприимчивости
- Ошибка клинической восприимчивости , когда одно заболевание предрасполагает ко второму заболеванию, а лечение первого заболевания ошибочно предрасполагает ко второму заболеванию. Например, постменопаузальный синдром повышает вероятность развития рака эндометрия , поэтому эстрогены, назначаемые при постменопаузальном синдроме, могут получить более высокую, чем фактическую, вину за возникновение рака эндометрия. [9]
- Протопатическая предвзятость , когда лечение первых симптомов заболевания или другого результата, по-видимому, вызывает результат. Это потенциальная ошибка, когда между появлением первых симптомов и началом лечения до фактического диагноза проходит некоторое время. [9] Его можно смягчить за счет отставания , то есть исключения воздействий, произошедших в определенный период времени до постановки диагноза. [10]
- Смещение показаний , потенциальная путаница между причиной и следствием, когда воздействие зависит от показаний, например, лечение назначается людям с высоким риском заражения заболеванием, что потенциально приводит к преобладанию пролеченных людей среди тех, кто заразился заболеванием. Это может привести к ошибочному представлению о том, что лечение является причиной заболевания. [11]
Данные
[ редактировать ]- Партиционирование (разделение) данных со знанием содержимого разделов и последующий их анализ с помощью тестов, предназначенных для слепо выбранных разделов.
- Последующие изменения включения данных по произвольным или субъективным причинам, в том числе:
- Выбор вишни , который на самом деле является не предвзятостью выбора, а предвзятостью подтверждения , когда для подтверждения вывода выбираются определенные подмножества данных (например, приведение примеров авиакатастроф в качестве доказательства небезопасности полетов авиакомпаний, игнорируя при этом гораздо более распространенный пример полетов, которые завершить безопасно. См.: эвристика доступности ).
- Отклонение плохих данных на (1) произвольных основаниях вместо ранее установленных или общепринятых критериев или (2) отбрасывание « выбросов » на статистических основаниях, которые не принимают во внимание важную информацию, которая могла бы быть получена из «диких» наблюдений. [12]
Исследования
[ редактировать ]- Выбор исследований для включения в метаанализ (см. также комбинаторный метаанализ ).
- Проведение повторных экспериментов и сообщение только о наиболее благоприятных результатах, возможно, переименование лабораторных записей других экспериментов в «калибровочные тесты», «ошибки приборов» или «предварительные исследования».
- Представление наиболее значимого результата сбора данных , как если бы это был одиночный эксперимент (что логически аналогично предыдущему пункту, но считается гораздо менее нечестным).
Потертость
[ редактировать ]Систематическая ошибка истощения — это своего рода систематическая ошибка отбора, вызванная истощением (потерей участников). [13] дисконтирование субъектов испытаний/тестов, которые не были завершены. Оно тесно связано с предвзятостью выжившего , когда в анализ включаются только те субъекты, которые «пережили» процесс, или с предвзятостью неудачи , когда включаются только те субъекты, которые «провалили» процесс. Сюда входят отсев , отсутствие ответа (более низкий процент ответов ), отказ от участия и отклонения от протокола . Он дает необъективные результаты, если они неравны в отношении воздействия и/или результата. Например, при тестировании программы диеты исследователь может просто отклонить всех, кто выбывает из испытания, но большинство из тех, кто выбывает из исследования, — это те, для кого оно не сработало. Различная потеря субъектов в группе вмешательства и группе сравнения может изменить характеристики этих групп и результаты независимо от изучаемого вмешательства . [13]
Потеря для последующего наблюдения — это еще одна форма систематической ошибки истощения, которая в основном возникает в медицинских исследованиях в течение длительного периода времени. На ошибку отсутствия ответа или удержания может влиять ряд как материальных, так и нематериальных факторов, таких как; богатство, образование, альтруизм, первоначальное понимание учебы и ее требований. [14] Исследователи также могут быть не в состоянии осуществлять последующие контакты из-за недостаточной идентифицирующей информации и контактных данных, собранных на начальном этапе набора персонала и исследования. [15]
Выбор наблюдателя
[ редактировать ]Философ Ник Бостром утверждал, что данные фильтруются не только по дизайну и измерениям исследования, но и по необходимому предварительному условию: кто-то должен проводить исследование. В ситуациях, когда существование наблюдателя или исследование коррелирует с данными, возникают эффекты выбора наблюдения и антропное рассуждение . требуется [16]
Примером могут служить записи прошлых столкновений с Землей: если крупные столкновения вызывают массовые вымирания и экологические нарушения, исключающие эволюцию разумных наблюдателей на длительные периоды времени, никто не будет наблюдать никаких свидетельств крупных воздействий в недавнем прошлом (поскольку они бы помешали разумным наблюдателям). наблюдатели от эволюции). Следовательно, существует потенциальная погрешность в записях о столкновениях с Землей. [17] Астрономические экзистенциальные риски также могут быть недооценены из-за предвзятости отбора, и поэтому необходимо ввести антропную поправку. [18]
Предвзятость волонтеров
[ редактировать ]Предвзятость самоотбора или предвзятость добровольцев в исследованиях создают дополнительные угрозы достоверности исследования, поскольку эти участники могут иметь существенно отличающиеся характеристики от целевой группы исследования. [19] Исследования показали, что волонтеры, как правило, происходят из более высокого социального положения, чем из более низкого социально-экономического положения. [20] Более того, другое исследование показывает, что женщины с большей вероятностью будут добровольно участвовать в учебе, чем мужчины. Предвзятость добровольцев очевидна на протяжении всего жизненного цикла исследования, от набора участников до последующего наблюдения. В более общем плане реакцию волонтеров можно объяснить индивидуальным альтруизмом, желанием одобрения, личным отношением к теме исследования и другими причинами. [20] [14] Как и в большинстве случаев, в случае систематической ошибки добровольцев смягчением последствий может стать увеличение размера выборки. [ нужна ссылка ]
смягчение последствий
[ редактировать ]В общем случае ошибки отбора невозможно преодолеть только с помощью статистического анализа существующих данных, хотя поправку Хекмана в особых случаях можно использовать . Оценку степени систематической ошибки отбора можно произвести путем изучения корреляций между экзогенными (фоновыми) переменными и показателем лечения. Однако в регрессионных моделях именно корреляция между ненаблюдаемыми детерминантами результата и ненаблюдаемыми детерминантами отбора в выборку оценивает смещение, и эта корреляция между ненаблюдаемыми факторами не может быть напрямую оценена наблюдаемыми детерминантами лечения. [21]
Когда данные выбираются для целей подбора или прогнозирования, можно настроить коалиционную игру, чтобы функцию подбора или прогнозирования можно было определить для всех подмножеств переменных данных.
Связанные вопросы
[ редактировать ]Предвзятость отбора тесно связана с:
- предвзятость публикации или предвзятость сообщения , искажение, возникающее в восприятии сообщества или метаанализе из-за непубликации неинтересных (обычно отрицательных) результатов или результатов, которые идут вразрез с предрассудками экспериментатора, интересами спонсора или ожиданиями сообщества.
- предвзятость подтверждения , общая тенденция людей уделять больше внимания всему, что подтверждает нашу ранее существовавшую точку зрения; или, в частности, в экспериментальной науке, искажение, вызванное экспериментами, направленными на поиск подтверждающих доказательств, а не на попытку опровергнуть гипотезу.
- Систематическая ошибка исключения возникает в результате применения разных критериев к случаям и контроля в отношении права на участие в исследовании/различных переменных, служащих основанием для исключения.
См. также
[ редактировать ]- Парадокс Берксона - тенденция неправильно интерпретировать статистические эксперименты, включающие условные вероятности.
- Теория черного лебедя - Теория реагирования на неожиданные события.
- Сбор вишни – заблуждение неполных доказательств
- Иллюзия частоты – когнитивная предвзятость
- Предвзятость финансирования - тенденция научного исследования поддерживать интересы его спонсора.
- Список когнитивных предубеждений - Систематические закономерности отклонения от нормы или рациональности в суждениях.
- Предвзятость участия – Тип предвзятости
- Предвзятость публикации – более высокая вероятность публикации результатов, показывающих значимые результаты.
- Предвзятость в сообщении - предвзятость в сообщении информации.
- Смещение выборки - смещение в выборке населения.
- Вероятность выборки - Теория, касающаяся выборки из конечной совокупности.
- Теория выборочного воздействия - Теория в практике психологии
- Самоисполняющееся пророчество – предсказание, которое само сбывается.
- Предвзятость выжившего - логическая ошибка, форма предвзятости отбора.
Ссылки
[ редактировать ]- ^ Словарь терминов, посвященных раку → предвзятость выбора . Проверено 23 сентября 2009 г.
- ^ Медицинский словарь - «Смещение выборки», получено 23 сентября 2009 г.
- ^ TheFreeDictionary → предвзятая выборка . Проверено 23 сентября 2009 г. Сайт, в свою очередь, цитирует: Медицинский словарь Мосби, 8-е издание.
- ^ Словарь терминов, посвященных раку → Предвзятость выбора . Проверено 23 сентября 2009 г.
- ^ Ардс, Шейла; Чунг, Чанджин; Майерс, Сэмюэл Л. (1998). «Влияние предвзятости выборки на расовые различия в сообщениях о жестоком обращении с детьми» . Жестокое обращение с детьми и пренебрежение ими . 22 (2): 103–115. дои : 10.1016/S0145-2134(97)00131-2 . ПМИД 9504213 .
- ^ Кортес, Коринна; Мори, Мехриар; Райли, Майкл; Ростамизаде, Афшин (2008). «Теория коррекции систематической ошибки при выборе выборки». Алгоритмическая теория обучения (PDF) . Конспекты лекций по информатике. Том. 5254. стр. 38–53. arXiv : 0805.2775 . CiteSeerX 10.1.1.144.4478 . дои : 10.1007/978-3-540-87987-9_8 . ISBN 978-3-540-87986-2 . S2CID 842488 .
- ^ Кортес, Коринна; Мори, Мехриар (2014). «Теория адаптации предметной области и коррекции систематической ошибки выборки и алгоритм регрессии» (PDF) . Теоретическая информатика . 519 : 103–126. CiteSeerX 10.1.1.367.6899 . дои : 10.1016/j.tcs.2013.09.027 .
- ^ Фадем, Барбара (2009). Поведенческая наука . Липпинкотт Уильямс и Уилкинс. п. 262. ИСБН 978-0-7817-8257-9 .
- ^ Jump up to: а б Файнштейн А.Р.; Хорвиц Р.И. (ноябрь 1978 г.). «Критика статистических данных, связывающих эстрогены с раком эндометрия». Рак Рез . 38 (11, часть 2): 4001–5. ПМИД 698947 .
- ^ Тамим Х; Монфаред А.А.; ЛеЛорье Дж. (март 2007 г.). «Применение времени задержки в определениях воздействия для контроля протопатической предвзятости». Фармакоэпидемиоловый препарат Саф . 16 (3): 250–8. дои : 10.1002/pds.1360 . ПМИД 17245804 . S2CID 25648490 .
- ^ Мэтью Р. Вейр (2005). Гипертония (основные заболевания) (серия «Ключевые заболевания Acp») . Филадельфия, Пенсильвания: Американский колледж врачей. п. 159. ИСБН 978-1-930513-58-7 .
- ^ Краскал, Уильям Х. (1960). «Некоторые замечания по поводу диких наблюдений» . Технометрика . 2 (1): 1–3. дои : 10.1080/00401706.1960.10489875 .
- ^ Jump up to: а б Юни, П.; Эггер, Матиас (2005). «Эмпирические доказательства систематической ошибки отсева в клинических исследованиях» . Международный журнал эпидемиологии . 34 (1): 87–88. дои : 10.1093/ije/dyh406 . ПМИД 15649954 .
- ^ Jump up to: а б Джордан, Сью; Уоткинс, Алан; Стори, Мел; Аллен, Стивен Дж.; Брукс, Кэролайн Дж.; Гарайова, Ивета; Небеса, Мартин Л.; Джонс, Рут; Пламмер, Сью Ф.; Рассел, Ян Т.; Торнтон, Кэтрин А. (9 июля 2013 г.). «Предвзятость добровольцев при наборе, удержании и сдаче образцов крови в рандомизированном контролируемом исследовании с участием матерей и их детей в возрасте шести месяцев и двух лет: лонгитюдный анализ» . ПЛОС ОДИН . 8 (7): e67912. Бибкод : 2013PLoSO...867912J . дои : 10.1371/journal.pone.0067912 . ISSN 1932-6203 . ПМК 3706448 . ПМИД 23874465 .
- ^ Смолл, WP (6 мая 1967 г.). «Потерян для продолжения» . Ланцет . Первоначально опубликовано как Том 1, выпуск 7497. 289 (7497): 997–999. дои : 10.1016/S0140-6736(67)92377-X . ISSN 0140-6736 . ПМИД 4164620 . S2CID 27683727 .
- ^ Бостром, Ник (2002). Антропическая предвзятость: эффекты отбора наблюдений в науке и философии . Нью-Йорк: Рутледж. ISBN 978-0-415-93858-7 .
- ^ Чиркович, ММ; Сандберг, А.; Бостром, Н. (2010). «Антропная тень: эффекты отбора наблюдений и риски исчезновения человечества». Анализ рисков . 30 (10): 1495–506. Бибкод : 2010РискА..30.1495C . дои : 10.1111/j.1539-6924.2010.01460.x . ПМИД 20626690 . S2CID 6485564 .
- ^ Тегмарк, М.; Бостром, Н. (2005). «Астрофизика: вероятна ли катастрофа Судного дня?» . Природа . 438 (7069): 754. Бибкод : 2005Natur.438..754T . дои : 10.1038/438754a . ПМИД 16341005 . S2CID 4390013 .
- ^ Трипепи, Джованни; Джагер, Китти Дж.; Деккер, Фридо В.; Зоккали, Кармин (2010). «Предвзятость выбора и предвзятость информации в клинических исследованиях» . Клиническая практика Нефрона . 115 (2): с94–с99. дои : 10.1159/000312871 . ISSN 1660-2110 . ПМИД 20407272 .
- ^ Jump up to: а б «Волонтерская предвзятость» . Каталог смещений . 17.11.2017 . Проверено 29 октября 2020 г.
- ^ Хекман, Джей-Джей (1979). «Смещение выборки как ошибка спецификации». Эконометрика . 47 (1): 153–161. дои : 10.2307/1912352 . JSTOR 1912352 .