Века (программное обеспечение)
Разработчик(и) | Университет Вайкато |
---|---|
Стабильная версия | 3.8.6 (стабильная) / 28 января 2022 г |
Предварительный выпуск | 3.9.6 / 28 января 2022 г |
Репозиторий | |
Написано в | Ява |
Операционная система | Windows , MacOS , Linux |
Платформа | IA-32 , x86-64 , ARM_архитектура ; Ява SE |
Тип | Машинное обучение |
Лицензия | Стандартная общественная лицензия GNU |
Веб-сайт | мл |
Waikato Environment for Knowledge Analysis ( Weka ) — это набор бесплатного программного обеспечения для машинного обучения и анализа данных , распространяемого по лицензии GNU General Public License . Он был разработан в Университете Вайкато , Новая Зеландия , и является сопутствующим программным обеспечением к книге «Интеллектуальный анализ данных: практические инструменты и методы машинного обучения». [1]
Описание
[ редактировать ]Weka содержит коллекцию инструментов визуализации и алгоритмов для анализа данных и прогнозного моделирования , а также графические пользовательские интерфейсы для быстрого доступа к этим функциям. [1] Первоначальная не-Java-версия Weka представляла собой интерфейс Tcl / Tk для (в основном сторонних) алгоритмов моделирования, реализованных на других языках программирования, плюс утилиты предварительной обработки данных на C и систему на основе make-файлов для проведения экспериментов по машинному обучению. Эта оригинальная версия была в первую очередь разработана как инструмент для анализа данных из сельскохозяйственной сферы, [2] [3] но более поздняя версия, полностью основанная на Java (Weka 3), разработка которой началась в 1997 году, сейчас используется во многих различных областях приложений, в частности, в образовательных целях и исследованиях. К преимуществам Weka относятся:
- Доступен бесплатно по лицензии GNU General Public License .
- Портативность, поскольку она полностью реализована на языке программирования Java и, таким образом, работает практически на любой современной вычислительной платформе.
- Комплексная коллекция методов предварительной обработки данных и моделирования.
- Простота использования благодаря графическому пользовательскому интерфейсу.
Weka поддерживает несколько стандартных задач интеллектуального анализа данных , а именно предварительную обработку данных, кластеризацию , классификацию , регрессию , визуализацию и выбор признаков . Ожидается, что входные данные в Weka будут отформатированы в соответствии с форматом атрибутно-реляционных файлов, а имя файла будет иметь расширение .arff. Все методы Weka основаны на предположении, что данные доступны в виде одного плоского файла или отношения, где каждая точка данных описывается фиксированным количеством атрибутов (обычно числовые или номинальные атрибуты, но также поддерживаются некоторые другие типы атрибутов). . Weka обеспечивает доступ к SQL базам данных с помощью подключения к базе данных Java и может обрабатывать результат, возвращаемый запросом к базе данных. Weka предоставляет доступ к глубокому обучению с помощью Deeplearning4j . [4] Он не способен к многореляционному интеллектуальному анализу данных, но существует отдельное программное обеспечение для преобразования набора связанных таблиц базы данных в единую таблицу, подходящую для обработки с помощью Weka. [5] Еще одна важная область, которая в настоящее время не охвачена алгоритмами, включенными в дистрибутив Weka, — это моделирование последовательностей.
Пакеты расширений
[ редактировать ]В версии 3.7.2 был добавлен менеджер пакетов, упрощающий установку пакетов расширений. [6] Некоторые функции, которые раньше были включены в Weka до этой версии, с тех пор были перенесены в такие пакеты расширений, но это изменение также облегчает другим вносить расширения в Weka и поддерживать программное обеспечение, поскольку эта модульная архитектура позволяет независимые обновления ядро Weka и отдельные расширения.
История
[ редактировать ]- В 1993 году Университет Вайкато в Новой Зеландии начал разработку оригинальной версии Weka, которая представляла собой смесь Tcl/Tk, C и make-файлов.
- В 1997 году было принято решение переработать Weka с нуля на Java, включая реализацию алгоритмов моделирования. [7]
- В 2005 году Weka получила награду SIGKDD за услуги по интеллектуальному анализу и раскрытию знаний. [8] [9]
- В 2006 году корпорация Pentaho приобрела эксклюзивную лицензию на использование Weka для бизнес-аналитики . [10] Он образует компонент интеллектуального анализа данных и прогнозной аналитики пакета бизнес-аналитики Pentaho. С тех пор Pentaho была приобретена Hitachi Vantara, а Weka теперь поддерживает компонент с открытым исходным кодом PMI (Plugin for Machine Intelligence). [11]
Сопутствующие инструменты
[ редактировать ]- Auto-WEKA — это автоматизированная система машинного обучения для Weka. [12]
- Среда для разработки KDD-приложений, поддерживаемых индексными структурами ( ELKI ) — аналогичный Weka проект с упором на кластерный анализ , т. е. неконтролируемые методы.
- H2O.ai — это платформа для анализа данных и машинного обучения с открытым исходным кодом.
- KNIME — это программное обеспечение для машинного обучения и интеллектуального анализа данных, реализованное на Java .
- Massive Online Analysis (MOA) — это проект с открытым исходным кодом для крупномасштабного анализа потоков данных, также разработанный в Университете Вайкато в Новой Зеландии .
- Neural Designer — это программное обеспечение для интеллектуального анализа данных, основанное на методах глубокого обучения, написанное на C++ .
- Orange — аналогичный проект с открытым исходным кодом для интеллектуального анализа данных, машинного обучения и визуализации на основе scikit-learn .
- RapidMiner — это коммерческая платформа машинного обучения , реализованная на Java и интегрирующая Weka.
- scikit-learn — популярная библиотека машинного обучения на Python.
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Перейти обратно: а б Виттен, Ян Х .; Фрэнк, Эйбе; Холл, Марк А.; Пал, Кристофер Дж. (2011). Интеллектуальный анализ данных: практические инструменты и методы машинного обучения (3-е изд.). Сан-Франциско (Калифорния): Морган Кауфманн . ISBN 9780080890364 . Проверено 19 января 2011 г.
- ^ Холмс, Джеффри; Донкин, Эндрю; Виттен, Ян Х. (1994). Weka: Инструментарий машинного обучения (PDF) . Материалы Второй конференции Австралии и Новой Зеландии по интеллектуальным информационным системам, Брисбен, Австралия . Проверено 25 июня 2007 г.
- ^ Гарнер, Стивен Р.; Каннингем, Салли Джо; Холмс, Джеффри; Невилл-Мэннинг, Крейг Г .; Виттен, Ян Х. (1995). Применение инструментов машинного обучения: Опыт работы с сельскохозяйственными базами данных (PDF) . Материалы практического семинара по машинному обучению, Конференция по машинному обучению , Тахо-Сити (Калифорния), США. стр. 14–21 . Проверено 25 июня 2007 г.
- ^ «Метаданные пакета Weka» . 2017 . Получено 11 ноября 2017 г. - через SourceForge .
- ^ Ройтеманн, Питер; Пфарингер, Бернхард; Франк, Эйбе (2004). «Proper: набор инструментов для обучения на реляционных данных с помощью пропозициональных и многоэкземплярных обучающихся». 17-я Австралийская совместная конференция по искусственному интеллекту (AI2004) . Спрингер-Верлаг. CiteSeerX 10.1.1.459.8443 .
- ^ «weka-wiki — Пакеты» . Проверено 27 января 2020 г. - через GitHub .
- ^ Виттен, Ян Х.; Фрэнк, Эйбе; Тригг, Лен; Холл, Марк А.; Холмс, Джеффри; Каннингем, Салли Джо (1999). Weka: Практические инструменты и методы машинного обучения с реализациями на Java (PDF) . Материалы семинара ICONIP/ANZIIS/ANNES'99 по новым технологиям знаний и информационным системам на основе коннекционизма. стр. 192–196 . Проверено 26 июня 2007 г.
- ^ Пятецкий-Шапиро, Григорий И. (28 июня 2005 г.). «Победитель премии SIGKDD за услуги по интеллектуальному анализу данных и раскрытию знаний» . КДнаггетс . Проверено 25 июня 2007 г.
- ^ «Обзор лауреатов премии SIGKDD Service Award» . АКМ. 2005 . Проверено 25 июня 2007 г.
- ^ «Pentaho приобретает проект Weka» . Пентахо . Проверено 06 февраля 2018 г.
- ^ «Плагин для машинного интеллекта» . Хитачи Вантара .
- ^ Торнтон, Крис; Хаттер, Фрэнк; Хоос, Хольгер Х .; Лейтон-Браун, Кевин (11 августа 2013 г.). Auto-WEKA: комбинированный выбор и гиперпараметрическая оптимизация алгоритмов классификации . Материалы 19-й международной конференции ACM SIGKDD по обнаружению знаний и интеллектуальному анализу данных . АКМ. стр. 847–855. дои : 10.1145/2487575.2487629 . ISBN 978-1-4503-2174-7 .
Внешние ссылки
[ редактировать ]- Официальный сайт Университета Вайкато в Новой Зеландии
- Программное обеспечение для интеллектуального анализа данных и машинного обучения
- Бесплатные приложения искусственного интеллекта
- Бесплатное программное обеспечение для анализа данных
- Бесплатное научное программное обеспечение
- Бесплатное программное обеспечение, написанное на Java (языке программирования).
- Программное обеспечение, использующее лицензию GPL