Примеры интеллектуального анализа данных
Интеллектуальный анализ данных — процесс обнаружения закономерностей в больших наборах данных — использовался во многих приложениях.
Бизнес [ править ]
В бизнесе интеллектуальный анализ данных — это анализ исторической деловой активности, хранящейся в виде статических данных в базах данных хранилищ данных. Цель состоит в том, чтобы выявить скрытые закономерности и тенденции. Программное обеспечение для интеллектуального анализа данных использует усовершенствованные алгоритмы распознавания образов для просеивания больших объемов данных и поиска ранее неизвестной стратегической бизнес-информации. Примеры того, для чего предприятия используют интеллектуальный анализ данных, включают в себя проведение анализа рынка для выявления новых групп продуктов, выявления основной причины производственных проблем, предотвращения оттока клиентов и привлечения новых клиентов, перекрестных продаж существующим клиентам и более точного профилирования клиентов. . [1]
- В современном мире компании собирают необработанные данные с огромной скоростью. Например, Walmart ежедневно обрабатывает более 20 миллионов транзакций в точках продаж. Эта информация хранится в централизованной базе данных, но была бы бесполезна без какого-либо программного обеспечения для интеллектуального анализа данных для ее анализа. Если бы Walmart проанализировал данные своих торговых точек с помощью методов интеллектуального анализа данных, они смогли бы определять тенденции продаж, разрабатывать маркетинговые кампании и более точно прогнозировать лояльность клиентов. [2] [3]
- Категоризация товаров, доступных на сайте электронной коммерции, является фундаментальной проблемой. Правильная система категоризации элементов важна для удобства пользователя, поскольку она помогает определить элементы, релевантные ему для поиска и просмотра. Категоризацию элементов можно сформулировать как задачу контролируемой классификации при интеллектуальном анализе данных, где категориями являются целевые классы, а признаками являются слова, составляющие некоторое текстовое описание элементов. Один из подходов состоит в том, чтобы найти изначально схожие группы и объединить их в скрытую группу. Теперь, когда у вас есть новый элемент, сначала классифицируйте его в скрытую группу, которая называется классификацией грубого уровня. Затем выполните второй раунд классификации, чтобы найти категорию, к которой принадлежит элемент. [4]
- Каждый раз, когда используется кредитная карта, карта лояльности магазина или заполняется гарантийный талон, происходит сбор данных о поведении пользователя. Многие люди находят объем информации, хранящейся о нас от таких компаний, как Google, Facebook и Amazon, тревожным и обеспокоены вопросами конфиденциальности. Хотя существует вероятность того, что наши персональные данные могут быть использованы во вредных или нежелательных целях, они также используются для улучшения нашей жизни. Например, Ford и Audi надеются однажды собрать информацию о манере вождения клиентов, чтобы они могли рекомендовать более безопасные маршруты и предупреждать водителей об опасных дорожных условиях. [5]
- Интеллектуальный анализ данных в приложениях управления взаимоотношениями с клиентами может существенно способствовать увеличению прибыли. [ нужна ссылка ] Вместо того чтобы случайно связываться с потенциальным или клиентом через колл-центр или отправлять почту, компания может сосредоточить свои усилия на потенциальных клиентах, которые, по прогнозам, будут иметь высокую вероятность откликнуться на предложение. Более сложные методы могут использоваться для оптимизации ресурсов в разных кампаниях, чтобы можно было предсказать, на какой канал и на какое предложение человек с наибольшей вероятностью отреагирует (по всем потенциальным предложениям). Кроме того, для автоматизации рассылки можно использовать сложные приложения. Как только результаты анализа данных (потенциальный потенциальный клиент/клиент и канал/предложение) определены, это «сложное приложение» может автоматически отправлять электронное или обычное письмо. Наконец, в тех случаях, когда многие люди предпримут действие без предложения, можно использовать « моделирование подъема », чтобы определить, у каких людей реакция на предложение будет наибольшим. Таким образом, моделирование Uplift позволяет маркетологам сосредоточить рассылки и предложения на убеждаемых людях, а не рассылать предложения людям, которые купят продукт без предложения. Кластеризацию данных также можно использовать для автоматического обнаружения сегментов или групп в наборе данных о клиентах.
- Компании, использующие интеллектуальный анализ данных, могут получить отдачу от инвестиций, но они также осознают, что количество прогнозных моделей может быстро стать очень большим. Например, вместо того, чтобы использовать одну модель для прогнозирования количества клиентов, которые уйдут , компания может решить построить отдельную модель для каждого региона и типа клиентов. В ситуациях, когда необходимо поддерживать большое количество моделей, некоторые компании обращаются к более автоматизированным методологиям интеллектуального анализа данных.
- Интеллектуальный анализ данных может быть полезен отделам кадров (HR) в выявлении характеристик наиболее успешных сотрудников. Полученная информация (например, об университетах, которые посещают весьма успешные сотрудники) может помочь HR соответствующим образом сосредоточить усилия по подбору персонала. Кроме того, приложения стратегического управления предприятием помогают компании преобразовать цели корпоративного уровня, такие как целевые показатели прибыли и доли прибыли, в операционные решения, такие как производственные планы и уровни рабочей силы. [6]
- Интеллектуальный анализ данных может быть полезен организациям. Организационный анализ данных (ODM) определяется как использование инструментов и технологий интеллектуального анализа данных (DM) для улучшения процесса принятия организационных решений путем преобразования данных в ценные и практические знания с целью получения стратегического и бизнес-конкурентного преимущества. Полученные данные, такие как уровень текучести кадров, могут помочь организациям соответствующим образом сосредоточить свои усилия по удержанию сотрудников. Кроме того, приложения для анализа и анализа данных для управления производительностью организации помогают компаниям преобразовывать цели уровня компании, такие как цели по прибыли и продажам, в оперативные решения, такие как ключевые показатели эффективности для сотрудников и требуемые измеряемые уровни усилий. [7]
- Анализ потребительской корзины использовался для определения моделей покупок Альфа-потребителя . Анализ данных, собранных об этом типе пользователей, позволил компаниям прогнозировать будущие тенденции покупок и прогнозировать спрос на поставки. [ нужна ссылка ]
- Интеллектуальный анализ данных — высокоэффективный инструмент в индустрии каталожного маркетинга. [ нужна ссылка ] Каталогизаторы имеют богатую базу данных истории транзакций своих клиентов для миллионов клиентов, насчитывающую несколько лет. Инструменты интеллектуального анализа данных могут выявить закономерности среди клиентов и помочь определить клиентов, которые с наибольшей вероятностью ответят на предстоящие почтовые кампании.
- Интеллектуальный анализ данных для бизнес-приложений можно интегрировать в сложный процесс моделирования и принятия решений. [8] LIONsolver использует реактивный бизнес-аналитик (RBI) для продвижения «целостного» подхода, который объединяет интеллектуальный анализ данных, моделирование и интерактивную визуализацию в сквозной процесс открытий и непрерывных инноваций, основанный на человеческом и автоматизированном обучении. [9]
- В области принятия решений подход RBI использовался для сбора знаний, которые постепенно приобретаются от лица, принимающего решения, а затем для соответствующей самостоятельной настройки метода принятия решений. [10] Связь между качеством системы интеллектуального анализа данных и объемом инвестиций, которые лицо, принимающее решения, готово сделать, было формализовано путем предоставления экономической точки зрения на ценность «извлеченных знаний» с точки зрения их выгоды для организации. [8] Эта теория классификации решений [8] было применено к реальной линии по производству полупроводниковых пластин, где были разработаны правила принятия решений для эффективного мониторинга и управления линией по производству полупроводниковых пластин. [11]
- Пример интеллектуального анализа данных, связанного с производственной линией интегральных схем (ИС), описан в статье «Извлечение тестовых данных ИС для оптимизации тестирования СБИС». [12] В этой статье описывается применение интеллектуального анализа данных и анализа решений к проблеме функционального тестирования на уровне кристалла. Упомянутые эксперименты демонстрируют возможность применения системы анализа исторических данных испытаний штампов для создания вероятностной модели закономерностей отказов штампов. Эти шаблоны затем используются для принятия решения в режиме реального времени, какой кристалл тестировать следующим и когда прекратить тестирование. На основе экспериментов с историческими данными испытаний было показано, что эта система потенциально может повысить прибыль от зрелых интегральных схем. Другие примеры [13] [14] Применение методологий интеллектуального анализа данных в условиях производства полупроводников предполагает, что методологии интеллектуального анализа данных могут быть особенно полезны, когда данных недостаточно, а различные физические и химические параметры, влияющие на процесс, демонстрируют очень сложные взаимодействия. Еще одним следствием является то, что онлайн-мониторинг процесса производства полупроводников с использованием интеллектуального анализа данных может быть очень эффективным.
Наука и техника [ править ]
В последние годы интеллектуальный анализ данных широко используется в таких областях науки и техники, как биоинформатика , генетика , медицина , образование и электроэнергетика .
- При изучении генетики человека анализ последовательностей помогает решить важную задачу — понять взаимосвязь картирования между индивидуальными вариациями в последовательности ДНК человека и изменчивостью восприимчивости к болезням. Проще говоря, его цель – выяснить, как изменения в последовательности ДНК человека влияют на риск развития распространенных заболеваний, таких как рак , что имеет большое значение для совершенствования методов диагностики, предотвращения и лечения этих заболеваний. Один из методов интеллектуального анализа данных, который используется для выполнения этой задачи, известен как многофакторное снижение размерности . [15]
- В области электроэнергетики методы интеллектуального анализа данных широко используются для мониторинга состояния высоковольтного электрооборудования. Целью мониторинга состояния является получение ценной информации, например, о состоянии изоляции ( или других важных параметрах, связанных с безопасностью). Методы кластеризации данных , такие как самоорганизующаяся карта (SOM), применяются для мониторинга и анализа вибраций устройств РПН трансформаторов (OLTCS). С помощью вибромониторинга можно наблюдать, что при каждой операции переключения отводов генерируется сигнал, содержащий информацию о состоянии контактов переключателя ответвлений и механизмов привода. Очевидно, что разные положения кранов будут генерировать разные сигналы. Однако наблюдалась значительная вариабельность сигналов в нормальных условиях для одного и того же положения крана. SOM применялся для обнаружения аномальных состояний и выдвижения гипотез о природе аномалий. [16]
- Методы интеллектуального анализа данных были применены для анализа растворенных газов (DGA) в силовых трансформаторах . DGA, как средство диагностики силовых трансформаторов, доступен уже много лет. Такие методы, как SOM, применялись для анализа полученных данных и определения тенденций, которые не очевидны для стандартных методов соотношения DGA (таких как треугольник Дюваля). [16]
- В исследованиях в области образования, где интеллектуальный анализ данных использовался для изучения факторов, побуждающих учащихся выбирать поведение, которое ухудшает их обучение, [17] и понять факторы, влияющие на удержание студентов в университетах. [18] Аналогичным примером социального применения интеллектуального анализа данных является его использование в системах поиска экспертов , при которых дескрипторы человеческого опыта извлекаются, нормализуются и классифицируются, чтобы облегчить поиск экспертов, особенно в научных и технических областях. Таким образом, интеллектуальный анализ данных может облегчить институциональную память .
- Методы интеллектуального анализа биомедицинских данных, поддерживаемые онтологиями предметной области , [19] анализ данных клинических испытаний, [20] и анализ трафика с использованием SOM. [21]
- В рамках надзора за побочными реакциями на лекарства Центр мониторинга Упсалы с 1998 года использует методы интеллектуального анализа данных для регулярного выявления моделей отчетности, указывающих на возникающие проблемы с безопасностью лекарств, в глобальной базе данных ВОЗ, содержащей 4,6 миллиона случаев предполагаемых побочных реакций на лекарства . [22] Недавно аналогичная методология была разработана для анализа больших коллекций электронных медицинских записей на предмет временных закономерностей, связывающих назначения лекарств с медицинскими диагнозами. [23]
- Интеллектуальный анализ данных применялся к программным артефактам в области разработки программного обеспечения : репозиториям программного обеспечения для майнинга .
- В области микробиологии методы интеллектуального анализа данных использовались для прогнозирования поведения популяций бактерий в пищевых продуктах. [24]
Права человека [ править ]
Анализ данных правительственных документов – особенно документов системы правосудия (т.е. судов, тюрем) – позволяет выявлять систематические нарушения прав человека в связи с созданием и публикацией недействительных или фальсифицированных юридических документов различными государственными учреждениями. [25] [26]
медицинских Интеллектуальный анализ данных
Некоторые алгоритмы машинного обучения могут применяться в медицинской сфере в качестве инструментов диагностики второго мнения и в качестве инструментов для этапа извлечения знаний в процессе обнаружения знаний в базах данных .Один из этих классификаторов (так называемый прототипный классификатор обучения ( PEL-C ) [27] способен обнаруживать синдромы , а также атипичные клинические случаи.
Современной областью медицины, в которой используется процесс интеллектуального анализа данных, является метаболомика , которая занимается исследованием биологических молекул и тем, как характеризуется их взаимодействие с жидкостями организма, клетками, тканями и т. д. [28] Метаболомика — это наука, требующая очень большого объема данных, и она часто включает в себя анализ огромных объемов нерелевантных данных, прежде чем прийти к каким-либо выводам. Интеллектуальный анализ данных позволил этой относительно новой области медицинских исследований значительно вырасти за последнее десятилетие и, вероятно, станет методом, с помощью которого будут обнаружены новые исследования в этой области. [28]
В 2011 году по делу Соррелл против IMS Health, Inc. , решение которого было принято Верховным судом США , постановлено, что аптеки могут делиться информацией с сторонними компаниями. Такая практика была разрешена Первой поправкой к Конституции , защищающей «свободу слова». [29] Однако принятие Закона о медицинских информационных технологиях для экономического и клинического здравоохранения (Закон HITECH) помогло инициировать внедрение электронных медицинских карт (EHR) и вспомогательных технологий в Соединенных Штатах. [30] Закон HITECH был подписан 17 февраля 2009 года как часть Закона о восстановлении и реинвестировании Америки (ARRA) и помог открыть двери для интеллектуального анализа медицинских данных. [31] По оценкам, до подписания этого закона только 20% врачей в США использовали электронные карты пациентов. [30] Сёрен Брунак отмечает, что «карты пациентов становятся максимально информативными» и тем самым «максимизируют возможности интеллектуального анализа данных». [30] Таким образом, электронные карты пациентов еще больше расширяют возможности интеллектуального анализа медицинских данных, тем самым открывая двери для обширного источника анализа медицинских данных.
данных Пространственный анализ
Пространственный анализ данных — это применение методов интеллектуального анализа данных к пространственным данным. Конечная цель интеллектуального анализа пространственных данных — найти закономерности в данных с точки зрения географии. До сих пор интеллектуальный анализ данных и географические информационные системы (ГИС) существовали как две отдельные технологии, каждая из которых имела свои методы, традиции и подходы к визуализации и анализу данных. В частности, большинство современных ГИС имеют только самые базовые функции пространственного анализа. Огромный взрыв географически привязанных данных, вызванный развитием информационных технологий, цифрового картографирования, дистанционного зондирования и глобальным распространением ГИС, подчеркивает важность разработки основанных на данных индуктивных подходов к географическому анализу и моделированию.
Интеллектуальный анализ данных предлагает большие потенциальные преимущества для принятия прикладных решений на основе ГИС. В последнее время задача интеграции этих двух технологий приобрела решающее значение, особенно в связи с тем, что различные организации государственного и частного сектора, обладающие огромными базами данных с тематическими и географически привязанными данными, начинают осознавать огромный потенциал содержащейся в них информации. Среди этих организаций:
- Офисы, которым требуется анализ или распространение статистических данных с географической привязкой
- Службы общественного здравоохранения ищут объяснения кластеризации заболеваний
- Экологические агентства оценивают влияние изменения моделей землепользования на изменение климата
- Компании, занимающиеся геомаркетингом, сегментируют клиентов на основе пространственного местоположения.
Проблемы пространственной добычи полезных ископаемых:Хранилища геопространственных данных, как правило, очень большие. Более того, существующие наборы данных ГИС часто разбиваются на компоненты объектов и атрибутов, которые обычно архивируются в гибридных системах управления данными. Алгоритмические требования существенно различаются для управления реляционными (атрибутами) данными и для управления топологическими (функциональными) данными. [32] С этим связан диапазон и разнообразие форматов географических данных, которые создают уникальные проблемы. Революция цифровых географических данных приводит к созданию новых типов форматов данных, выходящих за рамки традиционных «векторных» и «растровых» форматов. Репозитории географических данных все чаще содержат плохо структурированные данные, такие как изображения и мультимедиа с географической привязкой. [33]
Существует несколько важных исследовательских задач в области открытия географических знаний и интеллектуального анализа данных. Миллер и Хан [34] предложить следующий список новых тем исследований в этой области:
- Разработка и поддержка хранилищ географических данных (GDW) : Пространственные свойства часто сводятся к простым пространственным атрибутам в основных хранилищах данных. Создание интегрированного GDW требует решения проблем совместимости пространственных и временных данных, включая различия в семантике, системах привязки, геометрии, точности и положении.
- Улучшение пространственно-временного представления при открытии географических знаний . Современные методы открытия географических знаний (GKD) обычно используют очень простые представления географических объектов и пространственных отношений. Методы интеллектуального анализа географических данных должны распознавать более сложные географические объекты (т. е. линии и многоугольники) и взаимосвязи (т. е. неевклидовы расстояния, направление, связность и взаимодействие через приписываемое географическое пространство, такое как местность). Более того, измерение времени должно быть более полно интегрировано в эти географические представления и отношения.
- Открытие географических знаний с использованием различных типов данных : необходимо разработать методы GKD, которые смогут обрабатывать различные типы данных, выходящие за рамки традиционных растровых и векторных моделей, включая изображения и мультимедиа с географической привязкой, а также динамические типы данных (видеопотоки, анимация).
Временной анализ данных [ править ]
Данные могут содержать атрибуты, созданные и записанные в разное время. В этом случае для поиска значимых связей в данных может потребоваться рассмотрение временного порядка атрибутов. Временная связь может указывать на причинно-следственную связь или просто на ассоциацию. [ нужна ссылка ]
Сбор данных с датчиков [ править ]
Беспроводные сенсорные сети могут использоваться для облегчения сбора данных для интеллектуального анализа пространственных данных для различных приложений, таких как мониторинг загрязнения воздуха. [35] Характерной особенностью таких сетей является то, что близлежащие сенсорные узлы, контролирующие параметры окружающей среды, обычно регистрируют схожие значения. Такая избыточность данных из-за пространственной корреляции между наблюдениями датчиков вдохновляет методы внутрисетевого агрегирования и анализа данных. Измеряя пространственную корреляцию между данными, полученными различными датчиками, можно разработать широкий класс специализированных алгоритмов для разработки более эффективных алгоритмов интеллектуального анализа пространственных данных. [36]
данных Визуальный анализ
В процессе перехода от аналогового к цифровому формату были созданы, собраны и сохранены большие наборы данных, обнаруживающие статистические закономерности, тенденции и информацию, скрытую в данных, для построения прогнозных закономерностей. Исследования показывают, что визуальный анализ данных происходит быстрее и гораздо более интуитивно понятен, чем традиционный анализ данных. [37] [38] [39] См. также Компьютерное зрение .
Интеллектуальный анализ музыкальных данных [ править ]
Методы интеллектуального анализа данных и, в частности, анализ совпадений , использовались для обнаружения соответствующих сходств среди музыкальных корпусов (списков радио, баз данных компакт-дисков) для целей, включая классификацию музыки по жанрам . более объективную [40]
Мониторинг [ править ]
Интеллектуальный анализ данных использовался правительством США. Программы включают программу Total Information Awareness (TIA), Secure Flight (ранее известную как Компьютерная система предварительного досмотра пассажиров ( CAPPS II )), Анализ, распространение, визуализацию, понимание, семантическое улучшение ( ADVISE ), [41] и Межгосударственный обмен антитеррористической информацией ( MATRIX ). [42] Эти программы были прекращены из-за разногласий по поводу того, нарушают ли они 4-ю поправку к Конституции США, хотя многие программы, созданные в соответствии с ними, продолжают финансироваться разными организациями или под разными названиями. [43]
В контексте борьбы с терроризмом двумя особенно вероятными методами интеллектуального анализа данных являются «интеллектуальный анализ данных» и «предметный интеллектуальный анализ данных».
Анализ шаблонов [ править ]
«Интеллектуальный анализ шаблонов» — это метод интеллектуального анализа данных, который включает в себя поиск существующих шаблонов в данных. В этом контексте шаблоны часто означают правила ассоциации . Первоначальная мотивация поиска ассоциативных правил исходила из желания проанализировать данные о транзакциях супермаркетов, то есть изучить поведение покупателей с точки зрения приобретаемых продуктов. Например, правило ассоциации «пиво ⇒ картофельные чипсы (80%)» гласит, что четверо из пяти покупателей, купивших пиво, также купили картофельные чипсы.
В контексте анализа закономерностей как инструмента выявления террористической деятельности Национальный исследовательский совет дает следующее определение: «Интеллектуальный анализ данных ищет закономерности (включая аномальные закономерности данных), которые могут быть связаны с террористической деятельностью. Эти закономерности могут быть рассматриваться как маленькие сигналы в огромном океане шума». [44] [45] [46] Анализ шаблонов включает в себя новые области, такие как поиск музыкальной информации (MIR), где шаблоны, наблюдаемые как во временной, так и во вневременной областях, импортируются в классические методы поиска знаний.
Интеллектуальный анализ данных по предметам [ править ]
«Предметный анализ данных» — это метод интеллектуального анализа данных, включающий поиск ассоциаций между людьми в данных. В контексте борьбы с терроризмом Национальный исследовательский совет дает следующее определение: «Субъектный анализ данных использует инициирующее лицо или другие данные, которые, на основе другой информации, считаются представляющими большой интерес, и цель состоит в том, чтобы определить какие другие лица, финансовые операции или движения и т. д. связаны с этим исходным данным». [45]
Сетка знаний [ править ]
Обнаружение знаний «В сети» обычно относится к обнаружению знаний в открытой среде с использованием концепций сетевых вычислений , позволяющих пользователям интегрировать данные из различных онлайн-источников данных, а также использовать удаленные ресурсы для выполнения своих задач по интеллектуальному анализу данных. Самым ранним примером была Discovery Net . [47] [48] разработанный в Имперском колледже Лондона , получивший награду «Самое инновационное приложение для обработки данных» на конференции и выставке ACM SC02 (Supercomputing 2002), основанный на демонстрации полностью интерактивного распределенного приложения для обнаружения знаний для приложения биоинформатики. Другие примеры включают работу, проведенную исследователями из Университета Калабрии , которые разработали архитектуру Knowledge Grid для обнаружения распределенных знаний на основе Grid-вычислений . [49] [50]
Ссылки [ править ]
- ^ О'Брайен, Дж. А., и Маракас, генеральный менеджер (2011). Информационные системы управления. Нью-Йорк, штат Нью-Йорк: МакГроу-Хилл/Ирвин.
- ^ Александр, Дуг. «Интеллектуальный анализ данных» . Техасский университет в Остине: Колледж свободных искусств.
- ^ «Даниэле Медри: Большие данные и бизнес: продолжающаяся революция» . Статистика просмотров . 21 октября 2013 г. Архивировано из оригинала 17 июня 2015 г. Проверено 21 сентября 2015 г.
- ^ «Крупномасштабная классификация предметов» (PDF) . Архивировано из оригинала (PDF) 5 октября 2015 г.
- ^ Госс, С. (10 апреля 2013 г.). Сбор данных и наша личная конфиденциальность. Получено из Телеграфа: «Интеллектуальный анализ данных и наша личная конфиденциальность | The Sun News | Macon.com» . Архивировано из оригинала 5 июля 2014 г. Проверено 21 сентября 2015 г.
- ^ Монк, Эллен; Вагнер, Брет (2006). Концепции планирования ресурсов предприятия, второе издание . Бостон, Массачусетс: Технология курса Томсона. ISBN 978-0-619-21663-4 . OCLC 224465825 .
- ^ Чалуц-Бен Гал, Х. (2023). Рокач, Л.; Маймон, О.; Шмуэли, Э. (ред.). «Интеллектуальный анализ организационных данных на основе человеческих ресурсов (HRODM): темы, тенденции, фокус, будущее» (PDF) . Спрингер. стр. 833–866.
- ↑ Перейти обратно: Перейти обратно: а б с Эловичи, Юваль; Браха, Дэн (2003). «Подход к интеллектуальному анализу данных на основе теории принятия решений» (PDF) . Транзакции IEEE о системах, человеке и кибернетике. Часть A: Системы и люди . 33 (1): 42–51. дои : 10.1109/TSMCA.2003.812596 . hdl : 10150/105859 .
- ^ Баттити, Роберто; и Брунато, Мауро; Реактивная бизнес-аналитика. От данных к моделям и знаниям , Reactive Search Srl, Италия, февраль 2011 г. ISBN 978-88-905795-0-9 .
- ^ Баттити, Роберто; Пассерини, Андреа (2010). «Эволюционная многоцелевая оптимизация мозга и компьютера (BC-EMO): генетический алгоритм, адаптирующийся к лицу, принимающему решения» (PDF) . Транзакции IEEE в эволюционных вычислениях . 14 (15): 671–687. дои : 10.1109/TEVC.2010.2058118 . S2CID 2182650 .
- ^ Браха, Дэн; Эловичи, Юваль; Последний, Марк (2007). «Теория практического анализа данных с применением к контролю производства полупроводников» (PDF) . Международный журнал производственных исследований . 45 (13): 3059–3084. CiteSeerX 10.1.1.127.1472 . дои : 10.1080/00207540600654475 . S2CID 2299178 .
- ^ Фонтан, Тони; Дитерих, Томас; и Судика, Билл (2000); Анализ данных испытаний микросхем для оптимизации тестирования СБИС , в материалах шестой международной конференции ACM SIGKDD по обнаружению знаний и интеллектуальному анализу данных, ACM Press, стр. 18–25.
- ^ Браха, Дэн; Шмиловичи, Армин (2002). «Интеллектуальный анализ данных для улучшения процесса очистки в полупроводниковой промышленности» (PDF) . Транзакции IEEE по производству полупроводников . 15 (1): 91–101. CiteSeerX 10.1.1.10.7921 . дои : 10.1109/66.983448 .
- ^ Браха, Дэн; Шмилович, Армин (2003). «Об использовании индукции дерева решений для обнаружения взаимодействий в фотолитографическом процессе» (PDF) . Транзакции IEEE по производству полупроводников . 16 (4): 644–652. дои : 10.1109/TSM.2003.818959 .
- ^ Чжу, Синцюань; Дэвидсон, Ян (2007). Обнаружение знаний и интеллектуальный анализ данных: проблемы и реалии . Нью-Йорк, штат Нью-Йорк: Херши. п. 18. ISBN 978-1-59904-252-7 .
- ↑ Перейти обратно: Перейти обратно: а б МакГрэйл, Энтони Дж.; Гульски, Эдвард; Аллан, Дэвид; Бертвистл, Дэвид; Блэкберн, Тревор Р.; Грут, Эдвин Р.С. «Методы интеллектуального анализа данных для оценки состояния высоковольтной электростанции». CIGRÉ WG 15.11 Исследовательского комитета 15 .
- ^ Бейкер, Райан С.Дж. ум. «Является ли игра системным состоянием или чертой? Интеллектуальный анализ образовательных данных посредством многоконтекстного применения проверенной поведенческой модели». Семинар по интеллектуальному анализу данных для пользовательского моделирования, 2007 г.
- ^ Суперби Агирре, Хуан Франциско; Вандам, Жан-Филипп; Мескенс, Надин. «Определение факторов, влияющих на успеваемость студентов первого курса вуза, с использованием методов интеллектуального анализа данных». Семинар по интеллектуальному анализу данных в образовании, 2006 г.
- ^ Чжу, Синцюань; Дэвидсон, Ян (2007). Обнаружение знаний и интеллектуальный анализ данных: проблемы и реалии . Нью-Йорк, штат Нью-Йорк: Херши. стр. 163–189. ISBN 978-1-59904-252-7 .
- ^ Чжу, Синцюань; Дэвидсон, Ян (2007). Обнаружение знаний и интеллектуальный анализ данных: проблемы и реалии . Нью-Йорк, штат Нью-Йорк: Херши. стр. 31–48. ISBN 978-1-59904-252-7 .
- ^ Чен, Юдонг; Чжан, И; Ху, Цзяньмин; Ли, Сян (2006). «Анализ данных о трафике с использованием ядра PCA и самоорганизующейся карты». Симпозиум IEEE по интеллектуальным транспортным средствам , 2006 г. стр. 472–477. дои : 10.1109/IVS.2006.1689673 . ISBN 978-4-901122-86-3 . S2CID 16645060 .
- ^ Бейт, Эндрю; Линдквист, Мари; Эдвардс, И. Ральф; Олссон, Стен; Орре, Роланд; Ланснер, Андерс; де Фрейтас, Рохелио Мельядо (июнь 1998 г.). «Метод байесовской нейронной сети для генерации сигналов о побочных реакциях на лекарства» (PDF) . Европейский журнал клинической фармакологии . 54 (4): 315–21. дои : 10.1007/s002280050466 . ПМИД 9696956 . S2CID 25966839 . [ постоянная мертвая ссылка ]
- ^ Норен, Г. Никлас; Бейт, Эндрю; Хопстадиус, Йохан; Звезда Кристина; и Эдвардс, И. Ральф (2008); Обнаружение временных закономерностей тенденций и временных эффектов: его применение к записям пациентов. Материалы Четырнадцатой Международной конференции по обнаружению знаний и интеллектуальному анализу данных (SIGKDD 2008), Лас-Вегас, Невада , стр. 963–971.
- ^ Хиура, Сатоко; Косеки, Сиге; Кояма, Кенто (19 мая 2021 г.). «Прогнозирование поведения популяции Listeria monocytogenes в пищевых продуктах с использованием машинного обучения и базы данных о росте и выживании микробов» . Научные отчеты . 11 (1): 10613. Бибкод : 2021NatSR..1110613H . дои : 10.1038/s41598-021-90164-z . ISSN 2045-2322 . ПМЦ 8134468 . ПМИД 34012066 .
- ^ Зерник, Джозеф; Интеллектуальный анализ данных как гражданский долг - Государственные онлайн-системы регистрации заключенных , Международный журнал социальных сетей: мониторинг, измерение, майнинг , 1: 84–96 (2010)
- ^ Зерник, Джозеф; Анализ данных онлайн-записей судебных заседаний объединенных в сеть федеральных судов США , Международный журнал социальных сетей: мониторинг, измерение, майнинг , 1:69–83 (2010)
- ^ Гальярди, Ф (2011). «Классификаторы на основе экземпляров, применяемые к медицинским базам данных: диагностика и извлечение знаний». Искусственный интеллект в медицине . 52 (3): 123–139. doi : 10.1016/j.artmed.2011.04.002 . ПМИД 21621400 .
- ↑ Перейти обратно: Перейти обратно: а б Мартинес-Арранс, Ибон; Мэй, Ребекка; Перес-Корменсана, Мириам; Минхоле, Ициар; Салазар, Лорена Алонсо, Кристина; Мато, Хосе М. (2015). «Расширение исследований в области метаболомики посредством интеллектуального анализа данных». Журнал протеомики . 127 (Часть Б): 275–288. дои : 10.1016/j.jprot.2015.01.019 . PMID 25668325 .
- ^ Дэвид Г. Сэвидж (24 июня 2011 г.). «Фармацевтическая промышленность: Верховный суд встал на сторону фармацевтической промышленности в двух решениях» . Лос-Анджелес Таймс . Проверено 7 ноября 2012 г.
- ↑ Перейти обратно: Перейти обратно: а б с Гот, Грегори (2012). «Анализ медицинских данных». Коммуникации АКМ . 55 (6): 13. дои : 10.1145/2184319.2184324 .
- ^ «Что такое Закон HITECH (Медицинские информационные технологии для экономического и клинического здравоохранения) 2009 года? | Определение от TechTarget» .
- ^ Хили, Ричард Г. (1991); Системы управления базами данных , Магуайр, Дэвид Дж.; Гудчайлд, Майкл Ф.; и Ринд, Дэвид В. (ред.), Географические информационные системы: принципы и приложения , Лондон, Великобритания: Лонгман.
- ^ Камара, Антонио С.; и Рэпер, Джонатан (ред.) (1999); Пространственные мультимедиа и виртуальная реальность , Лондон, Великобритания: Тейлор и Фрэнсис
- ^ Миллер, Харви Дж.; и Хан, Цзявэй (ред.) (2001); Географический анализ данных и обнаружение знаний , Лондон, Великобритания: Тейлор и Фрэнсис
- ^ Может.; Ричардс, М.; Ганем, М.; Го, Ю.; Хассард, Дж. (2008). «Мониторинг загрязнения воздуха и добыча полезных ископаемых на основе сенсорной сетки в Лондоне» . Датчики . 8 (6): 3601–3623. Бибкод : 2008Senso...8.3601M . дои : 10.3390/s8063601 . ПМЦ 3714656 . ПМИД 27879895 .
- ^ Может.; Го, Ю.; Тиан, X.; Ганем, М. (2011). «Алгоритм агрегирования на основе распределенной кластеризации для пространственных коррелированных сенсорных сетей». Журнал датчиков IEEE . 11 (3): 641. Бибкод : 2011ISenJ..11..641M . CiteSeerX 10.1.1.724.1158 . дои : 10.1109/JSEN.2010.2056916 . S2CID 1639100 .
- ^ Чжао, Кайди; и Лю, Бин; Тирпарк, Томас М.; и Вэйминь, Сяо; Платформа визуального анализа данных для удобного выявления полезных знаний
- ^ Кейм, Дэниел А.; Визуализация информации и визуальный анализ данных
- ^ Берч, Майкл; Диль, Стефан; Вайсгербер, Питер; Визуальный анализ данных в архивах программного обеспечения
- ^ Паше, Франсуа; Вестерманн, Герт; и Лэгр, Дэмиен; Анализ музыкальных данных для распространения электронной музыки. Архивировано 27 марта 2014 г. в Wayback Machine , Труды 1-й конференции WedelMusic, Флоренция, Италия, 2001 г., стр. 101–106.
- ^ Счетная палата правительства, Интеллектуальный анализ данных: раннее внимание к конфиденциальности при разработке ключевой программы DHS может снизить риски , GAO-07-293 (февраль 2007 г.), Вашингтон, округ Колумбия
- ^ Отчет о программе безопасных полетов , NBC News
- ^ «Полная осведомленность о терроризме (TIA): действительно ли она мертва?» . Electronic Frontier Foundation (официальный сайт) . 2003. Архивировано из оригинала 25 марта 2009 г. Проверено 15 марта 2009 г.
- ^ Агравал, Ракеш; Маннила, Хейкки; Шрикант, Рамакришнан; Тойвонен, Ханну; и Веркамо, А. Инкери; Быстрое открытие правил ассоциации , в «Достижениях в области обнаружения знаний и интеллектуального анализа данных» , MIT Press, 1996, стр. 307–328.
- ↑ Перейти обратно: Перейти обратно: а б Национальный исследовательский совет, Защита частной жизни в борьбе с террористами: основа оценки программы , Вашингтон, округ Колумбия: National Academies Press, 2008 г.
- ^ Хааг, Стивен; Каммингс, Мейв; Филлипс, Эми (2006). Информационные системы управления для информационной эпохи . Торонто: МакГроу-Хилл Райерсон. п. 28 . ISBN 978-0-07-095569-1 . OCLC 63194770 .
- ^ Ганем, Мустафа; Го, Йике; Роу, Энтони; Вендел, Патрик (2002). «Сервисы обнаружения знаний на основе Grid для высокопроизводительной информатики». Материалы 11-го Международного симпозиума IEEE по высокопроизводительным распределенным вычислениям . п. 416. дои : 10.1109/HPDC.2002.1029946 . ISBN 978-0-7695-1686-8 . S2CID 28782519 .
- ^ Ганем, Мустафа; Курчин, Васа; Вендел, Патрик; Го, Йике (2009). «Создание и использование аналитических рабочих процессов в Discovery Net». Методы интеллектуального анализа данных в средах грид-вычислений . п. 119. дои : 10.1002/9780470699904.ch8 . ISBN 9780470699904 .
- ^ Каннатаро, Марио; Талия, Доменико (январь 2003 г.). «Сетка знаний: архитектура для распределенного обнаружения знаний» (PDF) . Коммуникации АКМ . 46 (1): 89–93. дои : 10.1145/602421.602425 . S2CID 8709194 . Архивировано из оригинала (PDF) 10 ноября 2011 г. Проверено 17 октября 2011 г.
- ^ Талия, Доменико; Трунфио, Паоло (июль 2010 г.). «Как задачи распределенного интеллектуального анализа данных могут развиваться как службы знаний» (PDF) . Коммуникации АКМ . 53 (7): 132–137. CiteSeerX 10.1.1.378.2206 . дои : 10.1145/1785414.1785451 . S2CID 14713292 . Архивировано из оригинала (PDF) 27 октября 2011 г. Проверено 17 октября 2011 г.