Jump to content

УПОМЯНУЛ

SEMMA — это аббревиатура, обозначающая Sample , Explore , Modify , Model и Assess . Это список последовательных шагов, разработанный институтом SAS , одним из крупнейших производителей программного обеспечения для статистики и бизнес-аналитики . Он руководит внедрением приложений интеллектуального анализа данных . [1] Хотя SEMMA часто считается общей методологией интеллектуального анализа данных, SAS утверждает, что это «скорее логическая организация набора функциональных инструментов» одного из их продуктов, SAS Enterprise Miner, «для выполнения основных задач интеллектуального анализа данных». . [2]

Предыстория [ править ]

В расширяющейся области интеллектуального анализа данных раздается призыв к созданию стандартной методологии или простого списка лучших практик для диверсифицированного и итеративного процесса интеллектуального анализа данных, который пользователи могут применять в своих проектах интеллектуального анализа данных независимо от отрасли. В то время как межотраслевой стандартный процесс интеллектуального анализа данных или CRISP-DM, основанный инициативой Европейской стратегической программы исследований в области информационных технологий , был направлен на создание нейтральной методологии, SAS также предложила образец, которому следует следовать в своих инструментах интеллектуального анализа данных.

Фазы SEMMA [ править ]

Этапы SEMMA и связанных с ней задач следующие: [2]

  • Образец . Процесс начинается с выборки данных , например, выбора набора данных для моделирования. Набор данных должен быть достаточно большим, чтобы содержать достаточно информации для извлечения, и в то же время достаточно маленьким, чтобы его можно было эффективно использовать. На этом этапе также происходит разделение данных.
  • Исследовать . Этот этап охватывает понимание данных путем обнаружения ожидаемых и непредвиденных взаимосвязей между переменными, а также аномалий с помощью визуализации данных .
  • Изменить . Фаза изменения содержит методы для выбора, создания и преобразования переменных при подготовке к моделированию данных.
  • Модель . На этапе моделирования основное внимание уделяется применению различных методов моделирования (извлечения данных) к подготовленным переменным для создания моделей, которые, возможно, обеспечат желаемый результат.
  • Оценивать . Последний этап – оценка. Оценка результатов моделирования показывает надежность и полезность созданных моделей.

Критика [ править ]

SEMMA в основном фокусируется на задачах моделирования проектов интеллектуального анализа данных, оставляя в стороне бизнес-аспекты (в отличие, например, от CRISP-DM и его фазы понимания бизнеса). Кроме того, SEMMA призвана помочь пользователям программного обеспечения SAS Enterprise Miner. Поэтому применение его за пределами Enterprise Miner может быть неоднозначным. [3] Однако для завершения этапа «Выборки» SEMMA необходимо глубокое понимание бизнес-аспектов для проведения эффективной выборки. Таким образом, по сути, для эффективного завершения выборки потребуется понимание бизнеса. [4]

См. также [ править ]

Ссылки [ править ]

  1. ^ Азеведо, А. и Сантос, М.Ф. KDD, SEMMA и CRISP-DM: параллельный обзор . В материалах Европейской конференции IADIS по интеллектуальному анализу данных, 2008 г., стр. 182–185. Архивировано 9 января 2013 года в Wayback Machine.
  2. ^ Jump up to: Перейти обратно: а б Веб-сайт SAS Enterprise Miner. Архивировано 8 марта 2012 г. на Wayback Machine.
  3. ^ Роханизаде, С.С. и Могадам, М.Б. Предлагаемая методология интеллектуального анализа данных и ее применение к промышленным процедурам. Журнал промышленной инженерии 4 (2009), стр. 37-50.
  4. ^ [1] KDD, SEMMA И CRISP-DM: ПАРАЛЛЕЛЬНЫЙ ОБЗОР, Ана Азеведо и М.Ф. Сантос
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: da97b9d00e29f8d08fbe1341427e7365__1688910480
URL1:https://arc.ask3.ru/arc/aa/da/65/da97b9d00e29f8d08fbe1341427e7365.html
Заголовок, (Title) документа по адресу, URL1:
SEMMA - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)