Круговой анализ
В статистике . циклический анализ — это выбор деталей анализа данных с использованием анализируемых данных Его часто называют двойным погружением , поскольку одни и те же данные используются дважды. Циклический анализ неоправданно преувеличивает кажущуюся статистическую достоверность любых сообщаемых результатов и, в самом крайнем случае, может привести к тому, что явно значимый результат будет обнаружен в данных, состоящих только из шума. В частности, когда эксперимент проводится для изучения постулируемого эффекта, это является неправильным использованием статистики для первоначального сокращения полного набора данных путем выбора подмножества данных способами, соответствующими изучаемым эффектам. Второе неправильное использование происходит, когда эффективность подобранной модели или правила классификации сообщается как необработанный результат без учета эффектов выбора модели и настройки параметров на основе анализируемых данных.
Примеры
[ редактировать ]В самом простом случае это может включать решение об удалении выбросов, если заметить, что это может помочь улучшить анализ эксперимента. Эффект может быть более тонким. для данных функциональной магнитно-резонансной томографии Например, (фМРТ) часто требуется значительный объем предварительной обработки. Их можно применять постепенно, пока анализ не «заработает». Аналогичным образом, классификаторы, используемые при анализе многовоксельных шаблонов данных фМРТ, требуют параметров, которые можно настроить для максимизации точности классификации.
В геологии отмечен потенциал кругового анализа. [1] в случае карт геологических разломов, если они могут быть составлены на основе предположения, что разломы развиваются и распространяются определенным образом, причем эти карты позже используются в качестве доказательства того, что разломы действительно развиваются таким образом.
Решения
[ редактировать ]Тщательная разработка анализа, который планируется провести до сбора данных, означает, что на выбор анализа не влияют собранные данные. В качестве альтернативы можно решить усовершенствовать классификацию по одному или двум участникам, а затем использовать анализ данных остальных участников. Что касается выбора параметров классификации, общий метод состоит в том, чтобы разделить данные на два набора и найти оптимальный параметр, используя один набор, а затем протестировать, используя значение этого параметра, во втором наборе. Это стандартная техника [ нужна ссылка ] используется (например) в Принстонской классификационной библиотеке MVPA. [2]
Примечания
[ редактировать ]- ^ Скотт, ДЛ; Браун, Дж.; Этеридж, Массачусетс (1994). «Анализ падения как инструмент оценки региональной кинематики террейнов растяжения». Журнал структурной геологии . 16 (3): 393. doi : 10.1016/0191-8141(94)90043-4 .
- ^ «Набор инструментов Принстонского многовоксельного анализа шаблонов (MVPA) | Неврология» . pni.princeton.edu . Проверено 23 июля 2019 г.
Ссылки
[ редактировать ]- Кригескорте, Н.; Симмонс, ВК; Беллгоуэн, PSF; Бейкер, CI (2009). «Циркулярный анализ в системной нейробиологии: опасность двойного погружения» . Природная неврология . 12 (5): 535–540. дои : 10.1038/nn.2303 . ПМЦ 2841687 . ПМИД 19396166 .
- Кригескорте, Н.; Линдквист, Массачусетс; Николс, Т.Э.; Полдрак, РА; Вул, Э. (2010). «Все, что вы никогда не хотели знать о круговом анализе, но боялись спросить» . Журнал церебрального кровотока и метаболизма . 30 (9): 1551–1557. дои : 10.1038/jcbfm.2010.86 . ПМЦ 2949251 . ПМИД 20571517 .
- Толструп, Н.; Рузе, П.; Брунак, С. (1997). «Консенсус по точкам ветвления Arabidopsis, обнаруженный с помощью нециркулярного анализа, позволяет лучше прогнозировать акцепторные сайты» . Исследования нуклеиновых кислот . 25 (15): 3159–3163. дои : 10.1093/нар/25.15.3159 . ПМК 146848 . ПМИД 9224618 .
- Оливетти, Э.; Моньон, А.; Грейнер, С.; Авесани, П. (2010). «Декодирование мозга: предвзятость в оценке ошибок». 2010 Первый семинар по декодированию мозга: проблемы распознавания образов в нейровизуализации . стр. 40–43. дои : 10.1109/WBD.2010.9 . ISBN 978-1-4244-8486-7 . S2CID 13024947 .