Сбор информации
Тема этой статьи Википедии может не соответствовать общему правилу по известности . ( октябрь 2011 г. ) |
Сбор информации (IH) был одним из первых продуктов интеллектуального анализа данных , появившихся в 1990-х годах. Он был изобретен Ральфом Виггинсом и произведен компанией Ryan Corp, позже Information Harvesting Inc., из Кембриджа, штат Массачусетс. [1] Уиггинс имел опыт работы в области генетических алгоритмов и нечеткой логики . [2] IH стремился вывести правила из наборов данных. Сначала он сделал это, классифицировав различные входные переменные в одну из нескольких ячеек, тем самым придав некоторую структуру непрерывным переменным на входе. Затем IH приступает к созданию правил, сочетая обобщение с запоминанием, которые позволяют определить значение прогнозируемой переменной, возможно, создавая в процессе много уровней правил. Он включал в себя стратегии проверки наличия переобучения и, если да, его корректировки. Из-за своих стратегий коррекции переобучения путем рассмотрения большего количества данных и уточнения правил на основе этих данных IH также можно рассматривать как форму машинного обучения .
Преимущество IH по сравнению с другими продуктами интеллектуального анализа данных того времени и даже более поздних периодов заключалось в том, что он предоставлял механизм для поиска множества правил, которые классифицировали бы данные и определяли, в соответствии с установленными критериями, лучшие правила для использования.