Обнаружение аномалий
Часть серии о |
Машинное обучение и интеллектуальный анализ данных |
---|
В данных анализе обнаружение аномалий (также называемое обнаружением выбросов , а иногда и обнаружением новизны ) обычно понимается как идентификация редких элементов, событий или наблюдений, которые значительно отклоняются от большинства данных и не соответствуют четко определенному стандарту. представление о нормальном поведении. [1] Подобные примеры могут вызвать подозрения в том, что они созданы другим механизмом. [2] или кажутся несовместимыми с остальной частью этого набора данных. [3]
Обнаружение аномалий находит применение во многих областях, включая кибербезопасность , медицину , машинное зрение , статистику , нейробиологию , правоохранительную деятельность и финансовое мошенничество , и это лишь некоторые из них. Первоначально аномалии искались на предмет явного отклонения или исключения из данных, чтобы облегчить статистический анализ, например, для расчета среднего или стандартного отклонения. Их также удалили для улучшения прогнозов из таких моделей, как линейная регрессия, а в последнее время их удаление повышает производительность алгоритмов машинного обучения. Однако во многих приложениях интерес представляют сами аномалии, которые являются наиболее желательными наблюдениями во всем наборе данных, которые необходимо идентифицировать и отделить от шума или нерелевантных выбросов.
Существуют три широкие категории методов обнаружения аномалий. [1] Методы контролируемого обнаружения аномалий требуют набора данных, помеченных как «нормальные» и «ненормальные», и включают обучение классификатора. Однако этот подход редко используется при обнаружении аномалий из-за общей недоступности размеченных данных и присущей классам несбалансированной природы. Методы полуконтролируемого обнаружения аномалий предполагают, что некоторая часть данных помечена. Это может быть любая комбинация нормальных или аномальных данных, но чаще всего методы создают модель, представляющую нормальное поведение, из данного нормального набора обучающих данных, а затем проверяют вероятность того, что моделью будет сгенерирован тестовый экземпляр. Методы неконтролируемого обнаружения аномалий предполагают, что данные не имеют меток, и на сегодняшний день они используются наиболее часто из-за их более широкого и актуального применения.
Определение [ править ]
В сообществах статистиков и информатиков было предпринято множество попыток определить аномалию. К наиболее распространенным из них относятся следующие, и их можно разделить на три группы: неоднозначные, специфичные для метода с заранее определенными пороговыми значениями, обычно выбираемыми эмпирическим путем, и формально определенные:
Плохо определено [ править ]
- Выброс — это наблюдение, которое настолько сильно отличается от других наблюдений, что вызывает подозрения, что оно было вызвано другим механизмом. [2]
- Аномалии — это экземпляры или наборы данных, которые встречаются в наборе данных очень редко и характеристики которых значительно отличаются от большинства данных.
- Выброс — это наблюдение (или подмножество наблюдений), которое кажется несовместимым с остальной частью этого набора данных. [3]
- Аномалия — это точка или совокупность точек, относительно удаленная от других точек в многомерном пространстве объектов.
- Аномалии — это закономерности в данных, которые не соответствуют четко определенному понятию нормального поведения. [1]
Конкретный [ править ]
- Пусть T — это наблюдения одномерного распределения Гаусса, а O — точка из T. Тогда z-показатель для O больше заранее выбранного порога тогда и только тогда, когда O является выбросом.
в многомерном контексте Определение аномалий
В эпоху больших данных все больше внимания уделяется методологиям, способным справиться со сложностью и масштабом данных, выходя за рамки традиционных подходов к определению и обнаружению аномалий таким образом, чтобы это было одновременно эффективно и действенно для современных процессов принятия решений, основанных на данных. [4]
- Аномалии в многомерных пространствах сложнее идентифицировать из-за разреженности данных и относительного расстояния между точками, которые становятся менее значимыми. [4]
- Традиционные пороговые методы становятся менее эффективными по мере увеличения размерности, часто требуя более сложных методов многомерного анализа. [4]
- Обнаружение аномалий большой размерности часто требует тщательного рассмотрения выбора признаков, чтобы уменьшить размерность и повысить чувствительность к истинным аномалиям. [4]
История [ править ]
Обнаружение вторжений [ править ]
Концепция обнаружения вторжений, важнейшего компонента обнаружения аномалий, со временем значительно изменилась. Первоначально это был ручной процесс, в ходе которого системные администраторы отслеживали необычные действия, такие как доступ к учетной записи пользователя, находящегося в отпуске, или непредвиденная активность принтера. Этот подход не поддавался масштабированию и вскоре был заменен анализом журналов аудита и системных журналов на наличие признаков вредоносного поведения. [5]
К концу 1970-х и началу 1980-х годов анализ этих журналов в основном использовался ретроспективно для расследования инцидентов, поскольку объем данных делал его непрактичным для мониторинга в реальном времени. Доступность цифрового хранилища в конечном итоге привела к тому, что журналы аудита стали анализироваться онлайн, а для анализа данных были разработаны специализированные программы. Однако эти программы обычно запускались в непиковые часы из-за их вычислительной интенсивности. [5]
В 1990-е годы появились системы обнаружения вторжений в режиме реального времени, способные анализировать данные аудита по мере их создания, что позволяет немедленно обнаруживать атаки и реагировать на них. Это ознаменовало значительный сдвиг в сторону превентивного обнаружения вторжений. [5]
Поскольку эта область продолжает развиваться, акцент сместился на создание решений, которые можно эффективно внедрить в больших и сложных сетевых средах, адаптируясь к постоянно растущему разнообразию угроз безопасности и динамическому характеру современных вычислительных инфраструктур. [5]
Приложения [ править ]
Обнаружение аномалий применимо в очень большом количестве и разнообразии областей и является важной областью машинного обучения без учителя. Таким образом, он имеет приложения в области кибербезопасности, обнаружения вторжений , обнаружения мошенничества , обнаружения неисправностей, мониторинга состояния системы, обнаружения событий в сенсорных сетях, обнаружения нарушений экосистемы, обнаружения дефектов в изображениях с использованием машинного зрения , медицинской диагностики и правоохранительной деятельности. [6]
Обнаружение вторжений [ править ]
Обнаружение аномалий было предложено для систем обнаружения вторжений (IDS) Дороти Деннинг в 1986 году. [7] Обнаружение аномалий для IDS обычно осуществляется с помощью пороговых значений и статистики, но также может быть выполнено с помощью мягких вычислений и индуктивного обучения. [8] Типы функций, предложенных в 1999 году, включали профили пользователей, рабочих станций, сетей, удаленных хостов, групп пользователей и программ, основанные на частотах, средних значениях, дисперсиях, ковариациях и стандартных отклонениях. [9] Аналогом обнаружения аномалий при обнаружении вторжений является обнаружение злоупотреблений .
Обнаружение мошенничества в сфере финансовых технологий [ править ]
Обнаружение аномалий жизненно важно в сфере финансовых технологий для предотвращения мошенничества . [10] [11]
Предварительная обработка [ править ]
Предварительная обработка данных для устранения аномалий может стать важным шагом в анализе данных и выполняется по ряду причин. Статистические данные, такие как среднее и стандартное отклонение, становятся более точными после удаления аномалий, а также можно улучшить визуализацию данных. При контролируемом обучении удаление аномальных данных из набора данных часто приводит к статистически значимому увеличению точности. [12] [13]
Видеонаблюдение [ править ]
Обнаружение аномалий становится все более важным в сфере видеонаблюдения для повышения безопасности и безопасности. [14] [15] С появлением технологий глубокого обучения методы, использующие сверточные нейронные сети (CNN) и простые рекуррентные единицы (SRU), показали значительные перспективы в выявлении необычных действий или поведения в видеоданных. [14] Эти модели могут обрабатывать и анализировать обширные видеопотоки в режиме реального времени, распознавая закономерности, которые отклоняются от нормы и могут указывать на потенциальные угрозы безопасности или нарушения безопасности. [14]
ИТ-инфраструктура [ править ]
В управлении ИТ-инфраструктурой обнаружение аномалий имеет решающее значение для обеспечения бесперебойной работы и надежности услуг. [16] Такие методы, как библиотека ИТ-инфраструктуры (ITIL) и платформы мониторинга, используются для отслеживания и управления производительностью системы и пользовательским опытом. [16] Обнаружение аномалий может помочь выявить и предотвратить потенциальное снижение производительности или сбои системы, тем самым поддерживая производительность и эффективность бизнес-процессов. [16]
Системы Интернета вещей [ править ]
Обнаружение аномалий имеет решающее значение для безопасности и эффективности систем Интернета вещей (IoT). [17] Это помогает выявлять системные сбои и нарушения безопасности в сложных сетях устройств IoT. [17] Эти методы должны управлять данными в реальном времени, различными типами устройств и эффективно масштабироваться. Гарбе и др. [18] представили многоэтапную систему обнаружения аномалий, которая совершенствует традиционные методы за счет включения пространственной кластеризации, кластеризации на основе плотности и хеширования с учетом местоположения. Этот индивидуальный подход предназначен для лучшей обработки огромного и разнообразного характера данных Интернета вещей, тем самым повышая безопасность и эксплуатационную надежность в интеллектуальной инфраструктуре и промышленных системах Интернета вещей. [18]
Нефтяная промышленность [ править ]
Обнаружение аномалий имеет решающее значение в нефтяной промышленности для мониторинга критически важного оборудования. [19] Марти и др. использовали новый алгоритм сегментации для анализа данных датчиков для обнаружения аномалий в реальном времени. [19] Такой подход помогает оперативно выявлять и устранять любые отклонения в показаниях датчиков, обеспечивая надежность и безопасность нефтяных операций. [19]
Мониторинг нефте- и газопроводов [ править ]
В нефтегазовом секторе обнаружение аномалий имеет решающее значение не только для технического обслуживания и безопасности, но и для защиты окружающей среды. [20] Альджамель и др. предложить усовершенствованную модель на основе машинного обучения для обнаружения небольших утечек в нефте- и газопроводах — задача, которую традиционные методы могут упустить. [20]
Методы [ править ]
В литературе предложено множество методов обнаружения аномалий. [1] [21] Производительность методов обычно зависит от наборов данных. Например, некоторые из них могут подходить для обнаружения локальных выбросов, тогда как другие являются глобальными, и методы имеют мало систематических преимуществ перед другими при сравнении многих наборов данных. [22] [23] Почти все алгоритмы также требуют установки неинтуитивных параметров, критически важных для производительности и обычно неизвестных перед применением. Некоторые из популярных методов упомянуты ниже и разбиты на категории:
Статистический [ править ]
Без параметров [ править ]
![]() | Этот раздел пуст. Вы можете помочь, добавив к нему . ( январь 2024 г. ) |
Параметрический [ править ]
Плотность [ править ]
- Методы на основе плотности ( k-ближайший сосед , [24] [25] [26] локальный фактор выброса , [27] изоляционные леса , [28] [29] и многие другие варианты этой концепции [30] )
- Подпространство-, [31] основанный на корреляции [32] и на основе тензоров [33] обнаружение выбросов для многомерных данных [34]
- Одноклассные машины опорных векторов [35]
Нейронные сети [ править ]
- Репликаторные нейронные сети , [36] автоэнкодеры , вариационные автоэнкодеры, [37] с длинной кратковременной памятью нейронные сети [38]
- Байесовские сети [36]
- Скрытые марковские модели (HMM) [36]
- Определитель минимальной ковариации [39] [40]
- Глубокое обучение [14]
- Сверточные нейронные сети (CNN): CNN продемонстрировали исключительную производительность в области неконтролируемого обучения для обнаружения аномалий, особенно при анализе изображений и видеоданных. [14] Их способность автоматически и иерархически изучать пространственную иерархию объектов от шаблонов низкого до высокого уровня делает их особенно подходящими для обнаружения визуальных аномалий. Например, CNN можно обучить на наборах данных изображений выявлять нетипичные закономерности, указывающие на дефекты или ненормальные условия в сценариях промышленного контроля качества. [41]
- Простые рекуррентные единицы (SRU). В данных временных рядов SRU, тип рекуррентной нейронной сети, эффективно используются для обнаружения аномалий путем фиксации временных зависимостей и аномалий последовательности. [14] В отличие от традиционных RNN, SRU спроектированы так, чтобы быть более быстрыми и более распараллеливаемыми, предлагая лучшее соответствие для обнаружения аномалий в реальном времени в сложных системах, таких как динамичные финансовые рынки или прогнозируемое техническое обслуживание оборудования, где быстрое выявление временных нарушений имеет решающее значение. [42]
На основе кластеров [ править ]
- Кластеризация: кластерного анализа. обнаружение выбросов на основе [43] [44]
- Отклонения от правил ассоциации и частые наборы элементов
- Обнаружение выбросов на основе нечеткой логики
Наборы [ править ]
- Ансамблевые техники с использованием объединения функций . [45] [46] нормализация баллов [47] [48] и разные источники разнообразия [49] [50]
Другие [ править ]
![]() | Этот раздел пуст. Вы можете помочь, добавив к нему . ( январь 2024 г. ) |
Обнаружение аномалий в динамических сетях [ править ]
Динамические сети, например, представляющие финансовые системы, взаимодействие в социальных сетях и транспортную инфраструктуру, подвержены постоянным изменениям, что делает обнаружение аномалий в них сложной задачей. В отличие от статических графов, динамические сети отражают развивающиеся отношения и состояния, требующие адаптивных методов обнаружения аномалий.
Виды аномалий в динамических сетях [ править ]
- Аномалии сообщества
- Аномалии сжатия
- Аномалии разложения
- Аномалии расстояний
- Аномалии вероятностной модели
Объяснимое обнаружение аномалий [ править ]
Многие из рассмотренных выше методов дают только прогнозирование оценки аномалии, что часто можно объяснить пользователям как точку, находящуюся в области низкой плотности данных (или относительно низкой плотности по сравнению с плотностью соседей). В объяснимом искусственном интеллекте пользователи требуют методов с более высокой объяснимостью. Некоторые методы позволяют дать более подробные пояснения:
- Степень выброса подпространства (SOD) [31] идентифицирует атрибуты, в которых выборка является нормальной, и атрибуты, по которым выборка отклоняется от ожидаемой.
- Вероятности корреляционных выбросов (COP) [32] вычислить вектор ошибок того, как точка выборки отклоняется от ожидаемого местоположения, что можно интерпретировать как контрфактическое объяснение: образец был бы нормальным, если бы его переместили в это место.
Программное обеспечение [ править ]
- ELKI — это набор инструментов для интеллектуального анализа данных Java с открытым исходным кодом, который содержит несколько алгоритмов обнаружения аномалий, а также ускорение индексов для них.
- PyOD — это библиотека Python с открытым исходным кодом, разработанная специально для обнаружения аномалий. [51]
- scikit-learn — это библиотека Python с открытым исходным кодом, которая содержит некоторые алгоритмы для неконтролируемого обнаружения аномалий.
- Wolfram Mathematica предоставляет функциональные возможности для неконтролируемого обнаружения аномалий в нескольких типах данных. [52]
Наборы данных [ править ]
- Репозиторий эталонных данных по обнаружению аномалий с тщательно отобранными наборами данных Мюнхенского университета Людвига-Максимилиана ; Зеркало. Архивировано 31 марта 2022 г. в Wayback Machine в Университете Сан-Паулу .
- ODDS – ODDS: большая коллекция общедоступных наборов данных для обнаружения выбросов с достоверной информацией в различных областях.
- Тест неконтролируемого обнаружения аномалий в Harvard Dataverse: наборы данных для неконтролируемого обнаружения аномалий с достоверной информацией.
- Репозиторий данных KMASH в Research Data Australia, содержащий более 12 000 наборов данных по обнаружению аномалий с достоверной информацией.
См. также [ править ]
- Обнаружение изменений
- Статистический контроль процессов
- Обнаружение новинок
- Иерархическая временная память
Ссылки [ править ]
- ↑ Перейти обратно: Перейти обратно: а б с д Чандола, В.; Банерджи, А.; Кумар, В. (2009). «Обнаружение аномалий: опрос». Обзоры вычислительной техники ACM . 41 (3): 1–58. дои : 10.1145/1541880.1541882 . S2CID 207172599 .
- ↑ Перейти обратно: Перейти обратно: а б Хокинс, Дуглас М. (1980). Идентификация выбросов . Спрингер. ISBN 978-0-412-21900-9 . OCLC 6912274 .
- ↑ Перейти обратно: Перейти обратно: а б Барнетт, Вик; Льюис, Льюис (1978). Выбросы в статистических данных . Уайли. ISBN 978-0-471-99599-9 . OCLC 1150938591 .
- ↑ Перейти обратно: Перейти обратно: а б с д Тудуму, Шрикант; Бранч, Филип; Джин, Цзюн; Сингх, Джагдатт (Джек) (2 июля 2020 г.). «Комплексный обзор методов обнаружения аномалий в больших объемах данных» . Журнал больших данных . 7 (1): 42. дои : 10.1186/s40537-020-00320-x . hdl : 10536/DRO/DU:30158643 . ISSN 2196-1115 .
- ↑ Перейти обратно: Перейти обратно: а б с д Кеммерер, РА; Винья, Г. (апрель 2002 г.). «Обнаружение вторжений: краткая история и обзор» . Компьютер . 35 (4): супл27–супл30. дои : 10.1109/mc.2002.1012428 . ISSN 0018-9162 .
- ^ Аггарвал, Чару (2017). Анализ выбросов . Издательская компания Springer, Incorporated. ISBN 978-3319475776 .
- ^ Деннинг, Делавэр (1987). «Модель обнаружения вторжений» (PDF) . Транзакции IEEE по разработке программного обеспечения . SE-13 (2): 222–232. CiteSeerX 10.1.1.102.5127 . дои : 10.1109/TSE.1987.232894 . S2CID 10028835 . Архивировано (PDF) из оригинала 22 июня 2015 г.
- ^ Тенг, HS; Чен, К.; Лу, Южная Каролина (1990). «Адаптивное обнаружение аномалий в реальном времени с использованием индуктивно генерируемых последовательных шаблонов». Слушания. Симпозиум компьютерного общества IEEE 1990 г. по исследованиям в области безопасности и конфиденциальности (PDF) . стр. 278–284. дои : 10.1109/RISP.1990.63857 . ISBN 978-0-8186-2060-7 . S2CID 35632142 .
- ^ Джонс, Анита К.; Силкен, Роберт С. (2000). «Обнаружение вторжений в компьютерные системы: исследование» . Технический отчет по информатике . Департамент компьютерных наук Университета Вирджинии: 1–25}.
- ^ Стоянович, Бранка; Божич, Йосип; Хофер-Шмитц, Катарина; Нарганг, Кай; Вебер, Андреас; Бадии, Атта; Сундарам, Махешкумар; Джордан, Эллиот; Руневич, Джоэл (январь 2021 г.). «Следуйте по следу: машинное обучение для обнаружения мошенничества в финтех-приложениях» . Датчики . 21 (5): 1594. Бибкод : 2021Senso..21.1594S . дои : 10.3390/s21051594 . ISSN 1424-8220 . ПМЦ 7956727 . PMID 33668773 .
- ^ Ахмед, Мохиуддин; Махмуд, Абдун Насер; Ислам, доктор Рафикуль (февраль 2016 г.). «Обзор методов обнаружения аномалий в финансовой сфере» . Компьютерные системы будущего поколения . 55 : 278–288. дои : 10.1016/j.future.2015.01.001 . ISSN 0167-739X . S2CID 204982937 .
- ^ Томек, Иван (1976). «Эксперимент с отредактированным правилом ближайшего соседа». Транзакции IEEE по системам, человеку и кибернетике . 6 (6): 448–452. дои : 10.1109/TSMC.1976.4309523 .
- ^ Смит, MR; Мартинес, Т. (2011). «Повышение точности классификации за счет выявления и удаления экземпляров, которые следует ошибочно классифицировать» (PDF) . Международная совместная конференция по нейронным сетям 2011 года . п. 2690. CiteSeerX 10.1.1.221.1371 . дои : 10.1109/IJCNN.2011.6033571 . ISBN 978-1-4244-9635-8 . S2CID 5809822 .
- ↑ Перейти обратно: Перейти обратно: а б с д и ж Касим, Марьям; Верду, Елена (01.06.2023). «Система обнаружения видеоаномалий с использованием глубоких сверточных и рекуррентных моделей» . Результаты по инженерному делу . 18 : 101026. doi : 10.1016/j.rineng.2023.101026 . ISSN 2590-1230 . S2CID 257728239 .
- ^ Чжан, Тан; Чоудери, Ааканша; Бахл, Парамвир (Виктор); Джеймисон, Кайл; Банерджи, Суман (07 сентября 2015 г.). «Проектирование и внедрение беспроводной системы видеонаблюдения» . Материалы 21-й ежегодной международной конференции по мобильным вычислениям и сетям . МобиКом '15. Нью-Йорк, штат Нью-Йорк, США: Ассоциация вычислительной техники. стр. 426–438. дои : 10.1145/2789168.2790123 . ISBN 978-1-4503-3619-2 . S2CID 12310150 .
- ↑ Перейти обратно: Перейти обратно: а б с Гоу, Ричард; Рабхи, Фетхи А.; Венугопал, Шрикумар (2018). «Обнаружение аномалий в сложных прикладных системах реального мира» . Транзакции IEEE по управлению сетями и услугами . 15 : 83–96. дои : 10.1109/TNSM.2017.2771403 . hdl : 1959.4/unsworks_73660 . S2CID 3883483 . Проверено 8 ноября 2023 г.
- ↑ Перейти обратно: Перейти обратно: а б Чаттерджи, Аян; Ахмед, Бестун С. (август 2022 г.). «Методы и приложения обнаружения аномалий Интернета вещей: обзор» . Интернет вещей . 19 : 100568. arXiv : 2207.09092 . дои : 10.1016/j.iot.2022.100568 . ISSN 2542-6605 . S2CID 250644468 .
- ↑ Перейти обратно: Перейти обратно: а б Гарг, Сахил; Каур, Кулджит; Батра, Шалини; Каддум, Жорж; Кумар, Нирадж; Букерш, Аззедин (01 марта 2020 г.). «Многоэтапная схема обнаружения аномалий для повышения безопасности в приложениях с поддержкой Интернета вещей» . Компьютерные системы будущего поколения . 104 : 105–118. дои : 10.1016/j.future.2019.09.038 . ISSN 0167-739X . S2CID 204077191 .
- ↑ Перейти обратно: Перейти обратно: а б с Марти, Луис; Санчес-Пи, Наят; Молина, Хосе Мануэль; Гарсия, Ана Кристина Бичарра (февраль 2015 г.). «Обнаружение аномалий на основе данных датчиков в приложениях нефтяной промышленности» . Датчики . 15 (2): 2774–2797. Бибкод : 2015Senso..15.2774M . дои : 10.3390/s150202774 . ISSN 1424-8220 . ПМЦ 4367333 . ПМИД 25633599 .
- ↑ Перейти обратно: Перейти обратно: а б Алджамиль, Сумайх С.; Аломари, Дорие М.; Алисмаил, Шата; Хавахер, Фатима; Альхудхайр, Альджавара А.; Альджубран, Фатима; Алзаннан, Разан М. (август 2022 г.). «Модель обнаружения аномалий для нефтегазопроводов с использованием машинного обучения» . Вычисление . 10 (8): 138. doi : 10.3390/computation10080138 . ISSN 2079-3197 .
- ^ Зимек, Артур ; Фильцмозер, Питер (2018). «Туда и обратно: обнаружение выбросов между статистическими рассуждениями и алгоритмами интеллектуального анализа данных» (PDF) . Междисциплинарные обзоры Wiley: интеллектуальный анализ данных и обнаружение знаний . 8 (6): e1280. дои : 10.1002/widm.1280 . ISSN 1942-4787 . S2CID 53305944 . Архивировано из оригинала (PDF) 14 ноября 2021 г. Проверено 9 декабря 2019 г.
- ^ Кампос, Гильерме О.; Зимек, Артур ; Сандер, Йорг; Кампелло, Рикардо Дж.Г.Б.; Миценкова, Барбора; Шуберт, Эрих; Согласен, Ира; Хоул, Майкл Э. (2016). «Об оценке неконтролируемого обнаружения выбросов: меры, наборы данных и эмпирическое исследование». Интеллектуальный анализ данных и обнаружение знаний . 30 (4): 891. doi : 10.1007/s10618-015-0444-8 . ISSN 1384-5810 . S2CID 1952214 .
- ^ Репозиторий эталонных данных по обнаружению аномалий Мюнхенского университета Людвига-Максимилиана ; Зеркало. Архивировано 31 марта 2022 г. в Wayback Machine в Университете Сан-Паулу .
- ^ Кнорр, Э.М.; Нг, РТ; Туцаков, В. (2000). «Выбросы на основе расстояния: алгоритмы и приложения». Журнал VLDB — международный журнал по очень большим базам данных . 8 (3–4): 237–253. CiteSeerX 10.1.1.43.1842 . дои : 10.1007/s007780050006 . S2CID 11707259 .
- ^ Рамасвами, С.; Растоги, Р.; Шим, К. (2000). Эффективные алгоритмы обнаружения выбросов из больших наборов данных . Материалы международной конференции ACM SIGMOD 2000 г. по управлению данными - SIGMOD '00. п. 427. дои : 10.1145/342009.335437 . ISBN 1-58113-217-4 .
- ^ Анджиулли, Ф.; Пиццути, К. (2002). Быстрое обнаружение выбросов в пространствах большой размерности . Принципы интеллектуального анализа данных и обнаружения знаний. Конспекты лекций по информатике. Том. 2431. с. 15. дои : 10.1007/3-540-45681-3_2 . ISBN 978-3-540-44037-6 .
- ^ Брюниг, ММ; Кригель, Х.-П. ; Нг, РТ; Сандер, Дж. (2000). LOF: Идентификация локальных выбросов на основе плотности (PDF) . Материалы Международной конференции ACM SIGMOD 2000 года по управлению данными . СИГМОД . стр. 93–104. дои : 10.1145/335191.335388 . ISBN 1-58113-217-4 .
- ^ Лю, Фэй Тони; Тинг, Кай Мин; Чжоу, Чжи-Хуа (декабрь 2008 г.). «Лес изоляции». 2008 г. Восьмая международная конференция IEEE по интеллектуальному анализу данных . стр. 413–422. дои : 10.1109/ICDM.2008.17 . ISBN 9780769535029 . S2CID 6505449 .
- ^ Лю, Фэй Тони; Тинг, Кай Мин; Чжоу, Чжи-Хуа (март 2012 г.). «Обнаружение аномалий на основе изоляции» . Транзакции ACM по извлечению знаний из данных . 6 (1): 1–39. дои : 10.1145/2133360.2133363 . S2CID 207193045 .
- ^ Шуберт, Э.; Зимек, А. ; Кригель, Х.-П. (2012). «Переосмысление обнаружения локальных выбросов: обобщенный взгляд на местность с приложениями для обнаружения пространственных, видео и сетевых выбросов». Интеллектуальный анализ данных и обнаружение знаний . 28 : 190–237. дои : 10.1007/s10618-012-0300-z . S2CID 19036098 .
- ↑ Перейти обратно: Перейти обратно: а б Кригель, HP ; Крегер, П.; Шуберт, Э.; Зимек, А. (2009). Обнаружение выбросов в осепараллельных подпространствах многомерных данных . Достижения в области обнаружения знаний и интеллектуального анализа данных. Конспекты лекций по информатике. Том. 5476. с. 831. дои : 10.1007/978-3-642-01307-2_86 . ISBN 978-3-642-01306-5 .
- ↑ Перейти обратно: Перейти обратно: а б Кригель, HP ; Крогер, П.; Шуберт, Э.; Зимек, А. (2012). Обнаружение выбросов в произвольно ориентированных подпространствах . 2012 IEEE 12-я Международная конференция по интеллектуальному анализу данных. п. 379. дои : 10.1109/ICDM.2012.21 . ISBN 978-1-4673-4649-8 .
- ^ Фанаи-Т, Х.; Гама, Дж. (2016). «Тензорное обнаружение аномалий: междисциплинарное исследование» . Системы, основанные на знаниях . 98 : 130–147. дои : 10.1016/j.knosys.2016.01.027 . S2CID 16368060 .
- ^ Зимек, А. ; Шуберт, Э.; Кригель, Х.-П. (2012). «Опрос по неконтролируемому обнаружению выбросов в многомерных числовых данных». Статистический анализ и интеллектуальный анализ данных . 5 (5): 363–387. дои : 10.1002/sam.11161 . S2CID 6724536 .
- ^ Шёлкопф, Б .; Платт, Дж. К.; Шоу-Тейлор, Дж.; Смола, Эй Джей; Уильямсон, Р.К. (2001). «Оценка поддержки многомерного распределения». Нейронные вычисления . 13 (7): 1443–71. CiteSeerX 10.1.1.4.4106 . дои : 10.1162/089976601750264965 . ПМИД 11440593 . S2CID 2110475 .
- ↑ Перейти обратно: Перейти обратно: а б с Хокинс, Саймон; Он, Хунсин; Уильямс, Грэм; Бакстер, Рохан (2002). «Обнаружение выбросов с использованием нейронных сетей-репликаторов». Хранилище данных и обнаружение знаний . Конспекты лекций по информатике. Том. 2454. стр. 170–180. CiteSeerX 10.1.1.12.3366 . дои : 10.1007/3-540-46145-0_17 . ISBN 978-3-540-44123-6 . S2CID 6436930 .
- ^ Ан, Дж.; Чо, С. (2015). «Обнаружение аномалий на основе вариационного автоэнкодера с использованием вероятности реконструкции» (PDF) . Специальная лекция по IE . 2 (1): 1–18. СНУДМ-ТР-2015-03.
- ^ Малхотра, Панкадж; Виг, Лавкеш; Шрофф, Гаутман; Агарвал, Пунит (22–24 апреля 2015 г.). Сети долговременной краткосрочной памяти для обнаружения аномалий во временных рядах . ESANN 2015: 23-й Европейский симпозиум по искусственным нейронным сетям, вычислительному интеллекту и машинному обучению. стр. 89–94. ISBN 978-2-87587-015-5 .
- ^ Хьюберт, Миа ; Дебрюйн, Мишель; Руссиу, Питер Дж. (2018). «Определитель минимальной ковариации и расширения» . ПРОВОДА Вычислительная статистика . 10 (3). arXiv : 1709.07045 . дои : 10.1002/wics.1421 . ISSN 1939-5108 . S2CID 67227041 .
- ^ Хьюберт, Миа ; Дебрюйн, Мишель (2010). «Определитель минимальной ковариации» . ПРОВОДА Вычислительная статистика . 2 (1): 36–43. дои : 10.1002/wics.61 . ISSN 1939-0068 . S2CID 123086172 .
- ^ Альзубайди, Лейт; Чжан, Цзинлань; Хумаиди, Амджад Дж.; Аль-Дуджайли, Аяд; Дуань, Е; Аль-Шамма, Омран; Сантамария, Дж.; Фадель, Мохаммед А.; Аль-Амиди, Мутана; Фархан, Лэйт (31 марта 2021 г.). «Обзор глубокого обучения: концепции, архитектуры CNN, проблемы, приложения, будущие направления» . Журнал больших данных . 8 (1): 53. дои : 10.1186/s40537-021-00444-8 . ISSN 2196-1115 . ПМК 8010506 . ПМИД 33816053 .
- ^ Белай, Мохаммед Аялев; Блэксет, Синдре Стенен; Рашид, Адиль; Сальво Росси, Пьерлуиджи (январь 2023 г.). «Неконтролируемое обнаружение аномалий для многомерных временных рядов на основе Интернета вещей: существующие решения, анализ производительности и будущие направления» . Датчики . 23 (5): 2844. Бибкод : 2023Senso..23.2844B . дои : 10.3390/s23052844 . ISSN 1424-8220 . ПМЦ 10007300 . ПМИД 36905048 .
- ^ Он, З.; Сюй, Х.; Дэн, С. (2003). «Обнаружение локальных выбросов на основе кластеров». Буквы для распознавания образов . 24 (9–10): 1641–1650. Бибкод : 2003PaReL..24.1641H . CiteSeerX 10.1.1.20.4242 . дои : 10.1016/S0167-8655(03)00003-5 .
- ^ Кампелло, RJGB; Мулави, Д.; Зимек, А. ; Сандер, Дж. (2015). «Оценки иерархической плотности для кластеризации данных, визуализации и обнаружения выбросов». Транзакции ACM по извлечению знаний из данных . 10 (1): 5:1–51. дои : 10.1145/2733381 . S2CID 2887636 .
- ^ Лазаревич А.; Кумар, В. (2005). «Объединение функций для обнаружения выбросов». Материалы одиннадцатой международной конференции ACM SIGKDD по обнаружению знаний в области интеллектуального анализа данных . стр. 157–166. CiteSeerX 10.1.1.399.425 . дои : 10.1145/1081870.1081891 . ISBN 978-1-59593-135-1 . S2CID 2054204 .
- ^ Нгуен, Х.В.; Анг, ХХ; Гопалкришнан, В. (2010). Анализ выбросов с помощью ансамбля гетерогенных детекторов на случайных подпространствах . Системы баз данных для продвинутых приложений. Конспекты лекций по информатике. Том. 5981. с. 368. дои : 10.1007/978-3-642-12026-8_29 . ISBN 978-3-642-12025-1 .
- ^ Кригель, HP ; Крегер, П.; Шуберт, Э.; Зимек, А. (2011). Интерпретация и унификация выбросов . Материалы Международной конференции SIAM 2011 по интеллектуальному анализу данных. стр. 13–24. CiteSeerX 10.1.1.232.2719 . дои : 10.1137/1.9781611972818.2 . ISBN 978-0-89871-992-5 .
- ^ Шуберт, Э.; Войдановский Р.; Зимек, А. ; Кригель, HP (2012). Об оценке рейтингов выбросов и оценок выбросов . Материалы Международной конференции SIAM 2012 по интеллектуальному анализу данных. стр. 1047–1058. дои : 10.1137/1.9781611972825.90 . ISBN 978-1-61197-232-0 .
- ^ Зимек, А. ; Кампелло, RJGB; Сандер, младший (2014). «Ансамбли для неконтролируемого обнаружения выбросов». Информационный бюллетень об исследованиях ACM SIGKDD . 15 :11–22. дои : 10.1145/2594473.2594476 . S2CID 8065347 .
- ^ Зимек, А. ; Кампелло, RJGB; Сандер, младший (2014). Возмущение данных для ансамблей обнаружения выбросов . Материалы 26-й Международной конференции по управлению научными и статистическими базами данных – SSDBM '14. п. 1. дои : 10.1145/2618243.2618257 . ISBN 978-1-4503-2722-0 .
- ^ Чжао, Юэ; Насрулла, Зейн; Ли, Чжэн (2019). «Pyod: набор инструментов Python для масштабируемого обнаружения выбросов» (PDF) . Журнал исследований машинного обучения . 20 . arXiv : 1901.01588 .
- ^ «Найти аномалии» . Документация по математике .