млпи
Разработчик(и) | Ведущий разработчик: Давиде Альбанезе; Авторы: Джузеппе Юрман, Стефано Мерлер, Роберто Визинтайнер, Марко Кьеричи |
---|---|
Стабильная версия | 3.5.0 / 12 марта 2012 г |
Написано в | Питон , Си и С++ |
Операционная система | Linux , macOS , FreeBSD , Microsoft Windows |
Тип | Машинное обучение |
Лицензия | лицензия GPL |
Веб-сайт | млпи |
mlpy — это Python с открытым исходным кодом , библиотека машинного обучения построенная на основе NumPy / SciPy , научной библиотеки GNU , и в ней широко используется язык Cython . mlpy предоставляет широкий спектр современных методов машинного обучения для контролируемых и неконтролируемых задач и направлен на поиск разумного компромисса между модульностью, ремонтопригодностью, воспроизводимостью, удобством использования и эффективностью. mlpy является мультиплатформенным, работает с Python 2 и 3 и распространяется под лицензией GPL3.
Подходит для задач машинного обучения общего назначения, [1] [ не удалось пройти проверку ] [2] [ не удалось пройти проверку ] [3] [4] [ не удалось пройти проверку ] Мотивирующей областью применения mlpy является биоинформатика, то есть анализ высокопроизводительных омических данных. [5]
Функции
[ редактировать ]- Регрессия: наименьшие квадраты , гребневая регрессия , регрессия наименьших углов, эластичная сеть , гребневая регрессия ядра, машины опорных векторов (SVM), частичные наименьшие квадраты (PLS)
- Классификация: линейный дискриминантный анализ (LDA), базовый перцептрон , эластичная сеть, логистическая регрессия , (ядро) машины опорных векторов (SVM), диагональный линейный дискриминантный анализ (DLDA), классификатор Голуба, на основе Парзена, (ядро) дискриминантный классификатор Фишера, k-ближайший сосед, Итеративный РЕЛЬЕФ, Дерево классификации, Классификатор максимального правдоподобия
- Кластеризация: иерархическая кластеризация , иерархическая кластеризация с сохранением памяти, k-средние.
- Уменьшение размерности : (ядро) дискриминантный анализ Фишера (FDA), дискриминантный анализ спектральной регрессии (SRDA), (ядро) анализ главных компонентов (PCA)
Функции ядра управляются через общий уровень ядра. В частности, пользователь может выбирать между предоставлением данных или предварительно вычисленным ядром во входном пространстве. Линейные, полиномиальные, гауссовы, экспоненциальные и сигмовидные ядра доступны по умолчанию, а также можно определить собственные ядра. Многие алгоритмы классификации и регрессии оснащены внутренней процедурой ранжирования признаков: в качестве альтернативы mlpy реализует алгоритм I-Relief. рекурсивное исключение признаков Для выбора признаков доступны (RFE) для линейных классификаторов и алгоритм KFDA-RFE. Методы анализа списка функций (например, индикатор стабильности Канберры). [6] ), предоставляются повторная выборка данных и оценка ошибок, а также различные методы анализа кластеризации (иерархический, иерархический с сохранением памяти, k-средние). Наконец, посвященныйвключены субмодули для продольного анализа данных посредством вейвлет-преобразования (непрерывного, дискретного и непрореженного) и алгоритмов динамического программирования (динамическое искажение времени и варианты).
См. также
[ редактировать ]- scikit-learn — библиотека машинного обучения с открытым исходным кодом для языка программирования Python.
- Infer.NET — библиотека машинного обучения с открытым исходным кодом для .NET Framework.
Ссылки
[ редактировать ]- ^ Солеймани и др. (2011). Непрерывное обнаружение эмоций в ответ на музыкальные клипы . Международная конференция IEEE по автоматическому распознаванию лиц и жестов и семинары, 2011 г.
- ^ Мегис, Т. и др. (2011). ObsPy – Что он может сделать для центров обработки данных и обсерваторий? Анналы геофизики, 2011.
- ^ Нгуен, MH (2010). Нгуен и др. Оптимальный выбор функций для машин опорных векторов . Распознавание образов, 2010.
- ^ Сантана Р. (2011) Р. Сантана. Оценка алгоритмов распространения: от доступных реализаций к потенциальным разработкам . Материалы 13-й ежегодной конференции по генетическим и эволюционным вычислениям, 2011 г.
- ^ Вухти С. (2010). Генные пути и подсети различают основные подтипы глиомы и выявляют потенциал, лежащий в основе биологии . Журнал биомедицинской информатики, 2010 г.
- ^ Юрман, Джузеппе; Мерлер, Стефано; Барла, Анналиса; Паоли, Сильвано; Галеа, Антонио; Фурланелло, Чезаре (2008). «Алгебраические показатели устойчивости ранжированных списков в молекулярном профилировании» . Биоинформатика . 24 (2): 258–264. doi : 10.1093/биоинформатика/btm550 . ПМИД 18024475 .