Jump to content

CatBoost

CatBoost
Оригинальный автор(ы) Андрей Гулин: [1] / Yandex
Разработчик(и) Участники Яндекса и CatBoost [2]
Первоначальный выпуск 18 июля 2017 г .; 7 лет назад ( 18.07.2017 ) [3] [4]
Стабильная версия
1.2.3 [5] / 23 февраля 2024 г .; 5 месяцев назад ( 23.02.2024 )
Написано в Питон , Р , С++ , Java
Операционная система Linux , MacOS , Windows
Тип Машинное обучение
Лицензия Лицензия Апач 2.0
Веб-сайт кошачий импульс .есть

CatBoost [6] — это с открытым исходным кодом, библиотека программного обеспечения разработанная Яндексом . Он обеспечивает структуру повышения градиента , которая, среди других функций, пытается решить категориальные функции, используя альтернативу, основанную на перестановках, по сравнению с классическим алгоритмом. [7] Он работает на Linux , Windows , macOS и доступен в Питон , [8] Р , [9] а модели, построенные с использованием catboost, можно использовать для прогнозов на C++ , Java , [10] C# , Rust , Core ML , ONNX и PMML . Исходный код лицензируется по лицензии Apache и доступен на GitHub. [6]

Журнал InfoWorld наградил библиотеку «Лучшими инструментами машинного обучения» в 2017 году. [11] вместе с TensorFlow , Pytorch , XGBoost и 8 другими библиотеками.

Kaggle назвал CatBoost одной из наиболее часто используемых платформ машинного обучения (ML) в мире. В опросе 2020 года он вошел в топ-8 наиболее часто используемых сред машинного обучения. [12] и в топ-7 наиболее часто используемых сред ML в опросе 2021 года. [13]

По состоянию на апрель 2022 года CatBoost устанавливается примерно 100 000 раз в день из PyPI. репозитория [14]

CatBoost приобрел популярность по сравнению с другими алгоритмами повышения градиента в первую очередь благодаря следующим особенностям: [15]

  • Встроенная обработка категориальных функций [16]
  • Быстрое обучение графического процессора [17]
  • Визуализации и инструменты для анализа моделей и функций
  • Использование забывчивых деревьев или симметричных деревьев для более быстрого выполнения.
  • Приказанное усиление для преодоления переобучения [7]

В 2009 году Андрей Гулин разработал MatrixNet — собственную библиотеку повышения градиента, которая использовалась в Яндексе для ранжирования результатов поиска.С 2009 года MatrixNet используется в различных проектах Яндекса, в том числе в рекомендательных системах и прогнозировании погоды.

В 2014–2015 годах Андрей Гулин с командой исследователей запустил новый проект Tensornet, направленный на решение проблемы «как работать с категориальными данными ». В результате появилось несколько собственных библиотек Gradient Boosting с разными подходами к обработке категориальных данных.

В 2016 году команда Machine Learning Infrastructure под руководством Анны Дорогуш начала работу над Gradient Boosting в Яндексе, включая Matrixnet и Tensornet. Они реализовали и открыли исходный код следующей версии библиотеки Gradient Boosting под названием CatBoost, которая поддерживает категориальные и текстовые данные, обучение графического процессора, анализ моделей и инструменты визуализации.

CatBoost был открыт в июле 2017 года и находится в стадии активной разработки в Яндексе и сообществе разработчиков ПО с открытым исходным кодом.

Приложение

[ редактировать ]
  • JetBrains использует CatBoost для завершения кода [18]
  • Cloudflare использует CatBoost для обнаружения ботов [19]
  • Careem использует CatBoost для прогнозирования будущих пунктов назначения поездок [20]

См. также

[ редактировать ]
  1. ^ «Андрей Гулин - Люди - Исследования в Яндексе» . исследование.yandex.com .
  2. ^ "кошачий буст/кошачий буст" . Гитхаб .
  3. ^ «Яндекс CatBoost с открытым исходным кодом, библиотека машинного обучения, повышающая градиент» . ТехКранч . 18 июля 2017 года . Проверено 30 августа 2020 г.
  4. ^ Егулалп, Сердар (18 июля 2017 г.). «Библиотека машинного обучения CatBoost с открытым исходным кодом Яндекса» . Инфомир . Проверено 30 августа 2020 г.
  5. ^ «Релизы · catboost/catboost» . Гитхаб . Проверено 14 марта 2024 г.
  6. ^ Jump up to: а б "кошачий буст/кошачий буст" . 30 августа 2020 г. – через GitHub.
  7. ^ Jump up to: а б Prokhorenkova, Liudmila; Gusev, Gleb; Vorobev, Aleksandr; Dorogush, Anna Veronika; Gulin, Andrey (2019-01-20). "CatBoost: unbiased boosting with categorical features". arXiv : 1706.09516 [ cs.LG ].
  8. ^ «Индекс пакетов Python PYPI: catboost» . Проверено 20 августа 2020 г.
  9. ^ «Пакет Conda Force Catboost-R» . Проверено 30 августа 2020 г.
  10. ^ «Репозиторий Maven: ai.catboost »catboost-prediction» . mvnrepository.com . Проверено 30 августа 2020 г.
  11. ^ персонал, InfoWorld (27 сентября 2017 г.). «Bossie Awards 2017: Лучшие инструменты машинного обучения» . Инфомир .
  12. ^ «Состояние науки о данных и машинного обучения в 2020 году» .
  13. ^ «Состояние науки о данных и машинного обучения в 2021 году» .
  14. ^ «Catboost статистики PyPI» . Статистика PyPI .
  15. ^ Джозеф, Ману (29 февраля 2020 г.). «Усилители градиента V: CatBoost» . Глубокий и мелкий . Проверено 30 августа 2020 г.
  16. ^ Дорогуш, Анна Вероника; Ершов Василий; Гулин, Андрей (24 октября 2018 г.). «CatBoost: повышение градиента с поддержкой категориальных функций». arXiv : 1810.11363 [ cs.LG ].
  17. ^ «CatBoost обеспечивает быстрое повышение градиента в деревьях решений с использованием графических процессоров» . Блог разработчиков NVIDIA . 13 декабря 2018 г. Проверено 30 августа 2020 г.
  18. ^ «Завершение кода, Эпизод 4: Обучение модели» . Блог разработчиков JetBrains . 20 августа 2021 г.
  19. ^ «Остановите ботов: практические уроки машинного обучения» . Блог Cloudflare . 20 февраля 2019 г.
  20. ^ «Как служба прогнозирования пунктов назначения Careem ускоряет вашу поездку» . Карим . 2019-02-19.
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 5865612837f0e7590dfcd9a9ce82e426__1719158760
URL1:https://arc.ask3.ru/arc/aa/58/26/5865612837f0e7590dfcd9a9ce82e426.html
Заголовок, (Title) документа по адресу, URL1:
CatBoost - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)