Панель инструментов выбора функций
Разработчик(и) | UTIA , Чешская академия наук |
---|---|
Стабильная версия | 3.1.1 / 9 сентября 2012 г |
Написано в | С++ |
Операционная система | Кроссплатформенность (v3) |
Тип | Машинное обучение , распознавание образов |
Лицензия | Бесплатно для некоммерческого использования |
Веб-сайт | первый день |
Feature Selection Toolbox (FST) — это программное обеспечение, предназначенное в первую очередь для выбора функций в области машинного обучения . [1] написан на C++ , разработан в Институте теории информации и автоматизации (UTIA) Чешской академии наук .
Версия 1
[ редактировать ]Первое поколение Feature Selection Toolbox (FST1) представляло собой приложение Windows с пользовательским интерфейсом, позволяющее пользователям применять несколько неоптимальных, оптимальных и смешанных методов выбора функций к данным, хранящимся в тривиальном собственном текстовом формате плоского файла. [2]
Версия 3
[ редактировать ]Третье поколение Feature Selection Toolbox (FST3) представляло собой библиотеку без пользовательского интерфейса, написанную как более эффективную и универсальную, чем исходная FST1. [3]
FST3 поддерживает несколько стандартных задач интеллектуального анализа данных , точнее, данных предварительную обработку и классификацию , но основное внимание в нем уделяется выбору функций . В контексте выбора функций он реализует несколько распространенных, а также менее обычных методов, с особым упором на поточную реализацию различных методов последовательного поиска (разновидность восхождения на холм ). Реализованные методы включают индивидуальное ранжирование признаков, плавающий поиск, осциллирующий поиск (подходящий для задач очень большой размерности) в рандомизированной или детерминированной форме, оптимальные методы типа ветвей и границ , вероятностные критерии расстояния класса, различные оценки точности классификатора, оптимизацию размера подмножества признаков, выбор признаков с заранее заданными весами признаков, ансамблями критериев, гибридными методами, обнаружением всех эквивалентных решений или оптимизацией по двум критериям. FST3 более узкоспециализирован, чем популярное программное обеспечение, такое как среда Waikato для анализа знаний Weka , RapidMiner или PRTools. [4]
По умолчанию методы, реализованные в наборе инструментов, основаны на предположении, что данные доступны в виде одного плоского файла в простом собственном формате или в формате Weka ARFF, где каждая точка данных описывается фиксированным числом числовых атрибутов. FST3 предоставляется без пользовательского интерфейса и предназначен для пользователей, знакомых как с машинным обучением , так и с программированием на C++ . Старое программное обеспечение FST1 больше подходит для простых экспериментов или образовательных целей, поскольку его можно использовать без необходимости писать код на C++.
История
[ редактировать ]- В 1999 году в UTIA началась разработка первой версии Feature Selection Toolbox в рамках докторской диссертации. Первоначально он был разработан в среде RAD C++ Optima++ (позже переименованной в Power++).
- В 2002 году разработка первого поколения FST была приостановлена, в основном из-за прекращения поддержки Sybase используемой тогда среды разработки.
- В 2002–2008 годах ядро FST было перекодировано и использовалось только для исследовательских экспериментов внутри UTIA.
- В 2009 году началась переписка третьего ядра FST с нуля.
- В 2010 году FST3 стал общедоступным в виде библиотеки C++ без графического интерфейса. На сопроводительной веб-странице собраны ссылки, связанные с выбором функций, справочные материалы, документация и исходный FST1, доступный для загрузки.
- В 2011 году обновление FST3 до версии 3.1 включало новые методы (в частности, новое ранжирование функций с учетом зависимостей, подходящее для задач распознавания очень больших размеров) и улучшения основного кода.
См. также
[ редактировать ]- Выбор функции
- Распознавание образов
- Машинное обучение
- Интеллектуальный анализ данных
- OpenNN , Открытая библиотека нейронных сетей для прогнозной аналитики.
- Weka , комплексное и популярное программное обеспечение Java с открытым исходным кодом от Университета Вайкато.
- RapidMiner , ранее называвшаяся Yet Another Learning Environment (YALE), коммерческая платформа машинного обучения.
- PRTools Делфтского технологического университета
- Infosel++ специализируется на теории информации. выборе функций на основе
- Tooldiag — набор инструментов для распознавания образов C++
- Список программного обеспечения для численного анализа
Ссылки
[ редактировать ]- ^ Петр Сомол; Яна Нововичова; Павел Пудил (2010). «Эффективный выбор подмножества функций и оптимизация размера подмножества» (PDF) . Последние достижения в распознавании образов, INTECH . стр. 75–97. ISBN 978-953-7619-90-9 .
- ^ Петр Сомол; Павел Пудил (2002). «Панель инструментов выбора функций» (PDF) . Распознавание образов, том 35, № 12, Elsevier . стр. 2749–2759.
- ^ Петр Сомол; Павел Вача; Станислав Микеш; Ян Гора; Павел Пудил; Павел Еврей (2010). «Введение в Feature Selection Toolbox 3 — библиотека C++ для поиска подмножеств, моделирования и классификации данных» (PDF) . УТИА Тех. Отчет №. 2287 . стр. 1–12 . Проверено 2 ноября 2010 г.
- ^ PRИнструменты