Частое обнаружение закономерностей
Частое обнаружение шаблонов (или обнаружение FP , анализ FP или частый анализ набора элементов ) является частью обнаружения знаний в базах данных , массового онлайн-анализа и интеллектуального анализа данных ; он описывает задачу поиска наиболее частых и релевантных закономерностей в больших наборах данных. [1] [2] Эта концепция была впервые представлена для баз данных транзакций интеллектуального анализа данных. [3] Часто встречающиеся шаблоны определяются как подмножества (наборы элементов, подпоследовательности или подструктуры), которые появляются в наборе данных с частотой не ниже заданного пользователем или автоматически определенного порога. [2] [4]
Техники
[ редактировать ]Методы добычи FP включают в себя:
- анализ рыночной корзины [3]
- перекрестный маркетинг
- дизайн каталога
- кластеризация
- классификация
- рекомендательные системы [1]
По большей части обнаружение FP может быть выполнено с использованием обучения правилам ассоциации с конкретными алгоритмами Eclat , FP-growth и алгоритмом Apriori .
Другие стратегии включают в себя:
и соответствующие конкретные методы.
Существуют реализации для различных машинного обучения систем или модулей , таких как MLlib для Apache Spark . [5]
Ссылки
[ редактировать ]- ^ Jump up to: а б Цзявэй Хан; Хун Ченг; Донг Синь; Сифэн Ян (2007). «Анализ частых шаблонов: текущее состояние и будущие направления» (PDF) . Интеллектуальный анализ данных и обнаружение знаний . 15 : 55–86. дои : 10.1007/s10618-006-0059-1 . S2CID 8085527 . Проверено 31 января 2019 г.
- ^ Jump up to: а б «Майнинг по частым закономерностям» . СИГКДД . 01.01.1980 . Проверено 31 января 2019 г.
- ^ Jump up to: а б Агравал, Ракеш; Имелинский, Томаш; Свами, Арун (1 июня 1993 г.). «Правила ассоциации майнинга между наборами элементов в больших базах данных». Запись ACM SIGMOD . 22 (2): 207–216. CiteSeerX 10.1.1.217.4132 . дои : 10.1145/170036.170072 . ISSN 0163-5808 .
- ^ «Интеллектуальный анализ частых шаблонов, закрытый частый набор элементов, максимально частый набор элементов при интеллектуальном анализе данных» . T4Учебники . 09.12.2018 . Проверено 31 января 2019 г.
- ^ «Майнинг по частым закономерностям» . Документация Spark 2.4.0 . Проверено 31 января 2019 г.