Jump to content

Статистика сканирования

В статистике статистика сканирования или статистика окна — это проблема, связанная с кластеризацией случайно расположенных точек. Примером типичной проблемы является максимальный размер кластера точек на линии или самая длинная серия успехов, зафиксированная скользящим окном фиксированной длины. [ 1 ]

Джозеф Наус впервые опубликовал эту проблему в 1960-х годах. [ 2 ] и был назван «отцом статистики сканирования» в честь его раннего вклада. [ 3 ] Результаты могут быть применены в эпидемиологии , здравоохранении и астрономии для обнаружения необычных кластеров событий. [ 4 ]

расширил его Мартин Куллдорф для многомерных настроек и различных размеров окон в статье 1997 года. [ 5 ] что (по состоянию на 11 октября 2015 г. ) самая цитируемая статья в журнале «Коммуникации в статистике – теория и методы» . [ 6 ] Эта работа привела к созданию программного обеспечения SaTScan , программы, зарегистрированной под торговой маркой Мартина Куллдорфа, которая применяет его методы к данным.

Недавние результаты показали, что использование зависящих от масштаба критических значений для статистики сканирования позволяет достичь асимптотически оптимального обнаружения одновременно для всех длин сигналов, тем самым улучшая традиционное сканирование, но эту процедуру критиковали за слишком большую потерю мощности для коротких сигналов. Уолтер и Перри (2022) рассмотрели проблему обнаружения повышенного среднего значения на интервале с неизвестным местоположением и длиной в модели одномерной гауссовой последовательности. [ 7 ] Они объясняют это несоответствие, показывая, что эти результаты асимптотической оптимальности обязательно будут слишком неточными, чтобы практически значимо оценить эффективность статистики сканирования, даже в контексте большой выборки. Вместо этого они предлагают оценивать производительность с помощью нового критерия конечной выборки. Они представили три новых метода калибровки статистики сканирования, которые хорошо работают в диапазоне соответствующих длин сигналов и позволяют оптимально повысить производительность коротких сигналов.

Методы на основе статистики сканирования были специально разработаны для обнаружения редких вариантов ассоциаций в некодирующем геноме, особенно в межгенной области . По сравнению с анализом скользящего окна фиксированного размера, методы, основанные на статистике сканирования, используют динамическое окно размера, адаптируемого к данным, для непрерывного сканирования генома и увеличивают мощность анализа за счет гибкого выбора местоположения и размеров сигнальных областей. [ 8 ] Некоторыми примерами этих методов являются Q-SCAN, [ 9 ] СКАНГ, [ 10 ] WGScan. [ 11 ]

  1. ^ Наус, Дж.И. (1982). «Приближения распределения статистики сканирования». Журнал Американской статистической ассоциации . 77 (377): 177–183. дои : 10.1080/01621459.1982.10477783 . JSTOR   2287786 .
  2. ^ Наус, Джозеф Ирвин (1964). Кластеризация случайных точек на прямой и плоскости (доктор философии) . Проверено 6 января 2014 г.
  3. ^ Валленштейн, С. (2009). «Джозеф Наус: отец статистики сканирования». Статистика сканирования . стр. 1–25. дои : 10.1007/978-0-8176-4749-0_1 . ISBN  978-0-8176-4748-3 .
  4. ^ Глаз, Дж.; Наус, Дж.; Валленштейн, С. (2001). "Введение". Статистика сканирования . Серия Спрингера по статистике. стр. 3–9. дои : 10.1007/978-1-4757-3460-7_1 . ISBN  978-1-4419-3167-2 .
  5. ^ Куллдорф, Мартин (1997). «Статистика пространственного сканирования» (PDF) . Коммуникации в статистике – теория и методы . 26 (6): 1481–1496. дои : 10.1080/03610929708831995 .
  6. ^ «Самые цитируемые статьи» . Коммуникации в статистике – теория и методы . Проверено 11 октября 2015 г.
  7. ^ Вальтер, Гюнтер; Перри, Эндрю (ноябрь 2022 г.). «Калибровка статистики сканирования: производительность конечной выборки в сравнении с асимптотикой» . Журнал Королевского статистического общества, серия B (статистическая методология) . 84 (5): 1608–1639. дои : 10.1111/rssb.12549 . ISSN   1369-7412 . S2CID   221713232 .
  8. ^ Ли, Жилин; Ли, Сихао; Чжоу, Хуфэн; Гейнор, Шейла М.; Маргарет, Сунита Сельварадж; Арапоглу, Теодор; Кьюк, Корбин; Лю, Яову; Чен, Хан; Сан, Райан; День, Рунак; Арнетт, Донна К.; Ауэр, Пол Л.; Белак, Лоуренс Ф.; Бис, Джошуа К.; Блэквелл, Томас В.; Бланджеро, Джон; Бурвинкль, Эрик; Боуден, Дональд В.; Броуди, Дженнифер А.; Кейд, Брайан Э.; Кономос, Мэтью П.; Корреа, Адольфо; Капплс, Л. Адриенн; Карран, Джоан Э.; де Врис, Поль С.; Дуггирала, Равиндранат; Франческини, Нора; Фридман, Барри И.; Геринг, Харальд Х.Х.; Го, Сюцин; Кальяни, Рита Р.; Куперберг, Чарльз; Крал, Брайан Г.; Ланге, Лесли А.; Лин, Бриджит; Маничайкул, Ани; Мартин, Лиза В.; Матиас, Расика А.; Мейгс, Джеймс Б.; Митчелл, Брэкстон Д.; Митчелл, Брэкстон Д.; Монтассер, Мэй Э.; Моррисон, Аланна С.; Насери, Таке; О'Коннелл, Джеффри Р.; Палмер, Николетт Д.; Реупена, Муагутутиа Сефуива; Райс, Кеннет М.; Рич, Стивен С.; Смит, Дженнифер А.; Тейлор, Кент Д.; Тауб, Маргарет А.; Васан, Рамачандран С.; Уикс, Дэниел Э.; Уилсон, Джеймс Г.; Янек, Лиза Р.; Чжао, Вэй; Консорциум NHLBI Trans-Omics for Precision Medicine (TOPMed); Рабочая группа TOPMed по липидам; Роттер, Джером И.; Уиллер, Кристен; Натараджан, Прадип; Пелосо, Джина М.; Линь, Сихун (2022). «Система обнаружения некодирующих ассоциаций редких вариантов в крупномасштабных исследованиях полногеномного секвенирования» . Природные методы . 19 (12): 1599–1611. дои : 10.1038/s41592-022-01640-x . ПМЦ   10008172 . ПМИД   36303018 . S2CID   243873361 .
  9. ^ Ли, Жилин; Лю, Яову; Линь, Сихун (2022). «Одновременное обнаружение сигнальных областей с использованием статистики квадратичного сканирования с применением к исследованиям ассоциаций всего генома» . Журнал Американской статистической ассоциации . 117 (538): 823–834. дои : 10.1080/01621459.2020.1822849 . ПМЦ   9285665 . PMID   35845434 .
  10. ^ Ли, Жилин; Ли, Сихао; Лю, Яову; Шен, Цзиньчэн; Чен, Хан; Чжоу, Хуфэн; Моррисон, Аланна С.; Бурвинкль, Эрик; Линь, Сихун (2019). «Процедура динамического сканирования для обнаружения областей ассоциации редких вариантов в исследованиях полногеномного секвенирования» . Американский журнал генетики человека . 104 (5): 802–814. дои : 10.1016/j.ajhg.2019.03.002 . ПМК   6507043 . ПМИД   30982610 .
  11. ^ Он, Цзихуай; Сюй, Бин; Буксбаум, Джозеф; Ионита-Лаза, Юлиана (2019). «Статистическая система полногеномного сканирования для анализа данных последовательности всего генома» . Природные коммуникации . 10 (1): 3018. doi : 10.1038/s41467-019-11023-0 . ПМК   6616627 . ПМИД   31289270 .
[ редактировать ]


Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: f4cda1fe519bde6e11946ce600cf62d6__1708348440
URL1:https://arc.ask3.ru/arc/aa/f4/d6/f4cda1fe519bde6e11946ce600cf62d6.html
Заголовок, (Title) документа по адресу, URL1:
Scan statistic - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)