Пакетный эффект
В молекулярной биологии групповой эффект возникает, когда небиологические факторы эксперимента вызывают изменения в данных, полученных в результате эксперимента. Такие эффекты могут привести к неточным выводам, когда их причины коррелируют с одним или несколькими результатами эксперимента, представляющими интерес. Они распространены во многих типах высокопроизводительных экспериментов по секвенированию, в том числе с использованием микрочипов , масс-спектрометров , [1] и данные секвенирования одноклеточной РНК . [2] Чаще всего их обсуждают в контексте исследований в области геномики и высокопроизводительного секвенирования, но они существуют и в других областях науки. [1]
Определения
[ редактировать ]В литературе предложено множество определений термина «пакетный эффект». Лазар и др. (2013) отметили: «Предоставление полного и однозначного определения так называемого пакетного эффекта является сложной задачей, особенно потому, что его происхождение и то, как он проявляется в данных, полностью не известны или не зафиксированы». Сосредоточив внимание на экспериментах с микрочипами, они предлагают новое определение, основанное на нескольких предыдущих: «[T]эффект партии представляет собой систематические технические различия, когда образцы обрабатываются и измеряются в разных партиях и которые не связаны с какими-либо биологическими вариациями, зарегистрированными во время MAGE [ экспрессия генов на микрочипах] эксперимент». [3]
Причины
[ редактировать ]Многие потенциально переменные факторы были идентифицированы как потенциальные причины эффектов партии, в том числе следующие:
- Лабораторные условия [1]
- Выбор партии реагента или партии [1] [4]
- Кадровые различия [1]
- Время суток, когда проводился эксперимент [4]
- атмосферного озона Уровни [4]
- Приборы, использованные для проведения эксперимента
Коррекция
[ редактировать ]Были разработаны различные статистические методы, чтобы попытаться исправить пакетные эффекты в экспериментах с высокой производительностью. Эти методы предназначены для использования на этапах планирования эксперимента и анализа данных. Исторически они в основном сосредотачивались на экспериментах в области геномики и лишь недавно начали расширяться в другие научные области, такие как протеомика . [5] Одна из проблем, связанных с такими методами, заключается в том, что они могут непреднамеренно устранить реальные биологические вариации. [6] Некоторые методы, которые использовались для обнаружения и/или коррекции эффектов пакетной обработки, включают следующее:
- Для данных микрочипов линейные смешанные модели с искажающими факторами, включенными в качестве случайных точек пересечения. использовались [7]
- В 2007 году Джонсон и др. предложил эмпирический байесовский метод коррекции пакетных эффектов. Этот подход представляет собой улучшение по сравнению с предыдущими методами, поскольку его можно эффективно использовать при небольших размерах партий. [4]
- sva В 2012 году был представлен программный пакет . Он включает в себя множество функций для корректировки пакетных эффектов, включая использование оценки суррогатной переменной , которая, как ранее было показано, улучшает воспроизводимость и снижает зависимость в экспериментах с высокой производительностью.
- Ахверди и др. (2018) предложили метод, разработанный для данных секвенирования одноклеточной РНК, основанный на обнаружении общих ближайших соседей в данных. [2]
- Папьес и др. (2019) предложили алгоритм динамического программирования для выявления пакетных эффектов неизвестного значения в данных с высокой пропускной способностью. [8]
- Восс и др. (2022) предложили алгоритм под названием HarmonizR, который обеспечивает гармонизацию данных в независимых наборах протеомных данных с соответствующей обработкой пропущенных значений. [9]
Ссылки
[ редактировать ]- ^ Jump up to: а б с д и Лик, Джеффри Т .; Шарпф, Роберт Б.; Браво, Эктор Коррада; Симха, Дэвид; Лэнгмид, Бенджамин ; Джонсон, В. Эван; Геман, Дональд; Бэггерли, Кейт; Иризарри, Рафаэль А. (октябрь 2010 г.). «Решение широко распространенного и критического влияния пакетных эффектов на обработку данных с высокой пропускной способностью» . Обзоры природы Генетика . 11 (10): 733–739. дои : 10.1038/nrg2825 . ISSN 1471-0056 . ПМК 3880143 . ПМИД 20838408 .
- ^ Jump up to: а б Ахверди, Лалех ; Лун, Аарон Т.Л.; Морган, Майкл Д.; Мариони, Джон С. (май 2018 г.). «Пакетные эффекты в данных секвенирования одноклеточной РНК корректируются путем сопоставления взаимных ближайших соседей» . Природная биотехнология . 36 (5): 421–427. дои : 10.1038/nbt.4091 . ISSN 1087-0156 . ПМК 6152897 . ПМИД 29608177 .
- ^ Лик, Джеффри Т.; Джонсон, В. Эван; Паркер, Хилари С.; Яффе, Эндрю Э.; Стори, Джон Д. (15 марта 2012 г.). «Пакет sva для удаления пакетных эффектов и других нежелательных изменений в экспериментах с высокой пропускной способностью» . Биоинформатика . 28 (6): 882–883. doi : 10.1093/биоинформатика/bts034 . ISSN 1460-2059 . ПМК 3307112 . ПМИД 22257669 .
- ^ Jump up to: а б с д Джонсон, В. Эван; Ли, Ченг; Рабинович, Ариэль (1 января 2007 г.). «Корректировка пакетных эффектов в данных экспрессии микрочипов с использованием эмпирических методов Байеса» . Биостатистика . 8 (1): 118–127. doi : 10.1093/biostatistics/kxj037 . ISSN 1468-4357 . ПМИД 16632515 .
- ^ Чуклина, Елена; Педриоли, Патрик Джорджия; Эберсольд, Руди (2020). Обзор подходов к предотвращению, диагностике и коррекции пакетных эффектов . Методы молекулярной биологии. Том. 2051. стр. 373–387. дои : 10.1007/978-1-4939-9744-2_16 . ISBN 978-1-4939-9743-5 . ISSN 1940-6029 . ПМИД 31552638 . S2CID 202760910 .
- ^ Го, Уилсон Вен Бинь; Ван, Вэй; Вонг, Лимсун (июнь 2017 г.). «Почему пакетные эффекты имеют значение в данных Omics и как их избежать». Тенденции в биотехнологии . 35 (6): 498–507. дои : 10.1016/j.tibtech.2017.02.012 . ПМИД 28351613 .
- ^ Эспин-Перес, Альмудена; Портье, Крис; Шадо-Хьям, Марк; ван Вельдховен, Карин; Кляйнянс, Йос К.С.; де Кок, Тео МСМ (30 августа 2018 г.). Кришнан, Вишванатан В. (ред.). «Сравнение статистических методов и использование образцов контроля качества для коррекции пакетного эффекта в данных транскриптома человека» . ПЛОС ОДИН . 13 (8): e0202947. Бибкод : 2018PLoSO..1302947E . дои : 10.1371/journal.pone.0202947 . ISSN 1932-6203 . ПМК 6117018 . ПМИД 30161168 .
- ^ Папьес, Анна; Марчик, Михал; Поланска, Джоанна; Полански, Анджей (01.06.2019). Бергер, Бонни (ред.). «BatchI: Идентификация пакетного эффекта в данных высокопроизводительного скрининга с использованием алгоритма динамического программирования» . Биоинформатика . 35 (11): 1885–1892. doi : 10.1093/биоинформатика/bty900 . ISSN 1367-4803 . ПМК 6546123 . ПМИД 30357412 .
- ^ Восс, Ханна; Шлюмбом, Саймон; Барвиковски, Филип; Вурлитцер, Маркус; Желток Муш, Матиас; Нойманн, Филипп; Шлютер, Хартмут; Нойманн, Джулия Э.; Крисп, Кристоф (20 июня 2022 г.). «HarmonizR обеспечивает гармонизацию данных в независимых наборах протеомных данных с соответствующей обработкой пропущенных значений» . Природные коммуникации . 13 (1): 3523. doi : 10.1038/s41467-022-31007-x . ISSN 2041-1723 . ПМК 9209422 . ПМИД 35725563 .