Jump to content

ЛайтГБМ

ЛайтГБМ
Оригинальный автор(ы) Гуолинь Кэ [1] / Исследования Майкрософт
Разработчик(и) Участники Microsoft и LightGBM [2]
Первоначальный выпуск 2016 ; 8 лет назад ( 2016 )
Стабильная версия
v4.3.0 [3] / 15 января 2024 г .; 5 месяцев назад ( 15.01.2024 )
Репозиторий github /Microsoft /ЛайтГБМ
Написано в С++ , Питон , Р , С
Операционная система Windows , macOS , Linux
Тип Машинное обучение , повышения градиента платформа
Лицензия МОЯ лицензия
Веб-сайт легкий ГБМ .readthedocs .что

LightGBM , сокращение от Light Gradient-Boosting Machine , — это бесплатная распределенная среда повышения градиента с открытым исходным кодом для машинного обучения , первоначально разработанная Microsoft . [4] [5] Он основан на алгоритмах дерева решений и используется для ранжирования , классификации и других задач машинного обучения. Основное внимание при разработке уделяется производительности и масштабируемости.

Обзор [ править ]

Платформа LightGBM поддерживает различные алгоритмы, включая GBT, GBDT , GBRT , GBM , MART. [6] [7] и РФ . [8] LightGBM обладает многими преимуществами XGBoost , включая разреженную оптимизацию, параллельное обучение, несколько функций потерь, регуляризацию, группировку и раннюю остановку. Основное различие между ними заключается в конструкции деревьев. LightGBM не выращивает дерево по уровням — строка за строкой — как это делает большинство других реализаций. [9] Вместо этого он выращивает деревья по листьям. Он выбирает лист, который, по его мнению, приведет к наибольшему уменьшению потерь. [ нужна ссылка ] Кроме того, LightGBM не использует широко используемый алгоритм обучения на основе сортированного дерева решений, который ищет лучшую точку разделения по отсортированным значениям признаков. [10] как это делают XGBoost или другие реализации. Вместо этого LightGBM реализует высокооптимизированный алгоритм обучения дерева решений на основе гистограмм, который дает большие преимущества как в эффективности, так и в потреблении памяти. [11] Алгоритм LightGBM использует два новых метода: одностороннюю выборку на основе градиента (GOSS) и объединение эксклюзивных функций (EFB), которые позволяют алгоритму работать быстрее, сохраняя при этом высокий уровень точности. [12]

LightGBM работает в Linux , Windows и macOS и поддерживает C++ , Python , [13] R и С# . [14] Исходный код доступен под лицензией MIT License и доступен на GitHub . [15]

Односторонняя выборка градиента основе на

Односторонняя выборка на основе градиента (GOSS) — это метод, который использует тот факт, что в GBDT нет собственного веса для экземпляра данных. Поскольку экземпляры данных с разными градиентами играют разную роль в вычислении прироста информации, экземпляры с большими градиентами будут вносить больший вклад в прирост информации. Поэтому, чтобы сохранить точность информации, GOSS сохраняет экземпляры с большими градиентами и случайным образом отбрасывает экземпляры с небольшими градиентами. [12]

Эксклюзивный набор функций [ править ]

Эксклюзивное объединение функций (EFB) — это практически без потерь метод сокращения количества эффективных функций. В разреженном пространстве признаков многие признаки почти исключаются, что означает, что они редко принимают ненулевые значения одновременно. Функции с горячим кодированием — прекрасный пример эксклюзивных функций. EFB объединяет эти функции, уменьшая размерность для повышения эффективности при сохранении высокого уровня точности. Объединение эксклюзивных функций в одну функцию называется пакетом эксклюзивных функций. [12]

См. также [ править ]

Ссылки [ править ]

  1. ^ «Голинь Кэ» . Гитхаб .
  2. ^ «Майкрософт/ЛайтГБМ» . Гитхаб . 7 июля 2022 г.
  3. ^ «Релизы · microsoft/LightGBM» . Гитхаб .
  4. ^ Браунли, Джейсон (31 марта 2020 г.). «Повышение градиента с помощью Scikit-Learn, XGBoost, LightGBM и CatBoost» .
  5. ^ Копитар, Леон; Кочбек, Примоз; Силар, Леона; Шейх, Азиз; Стиглик, Грегор (20 июля 2020 г.). «Раннее выявление сахарного диабета 2 типа с использованием моделей прогнозирования на основе машинного обучения» . Научные отчеты . 10 (1): 11981. Бибкод : 2020НатСР..1011981К . дои : 10.1038/s41598-020-68771-z . ПМЦ   7371679 . PMID   32686721 – через www.nature.com.
  6. ^ «Понимание параметров LightGBM (и способы их настройки)» . neptune.ai . 6 мая 2020 г.
  7. ^ «Обзор LightGBM» . аванвик . 16 мая 2018 г.
  8. ^ «Параметры — документация LightGBM 3.0.0.99» . Lightgbm.readthedocs.io .
  9. ^ Усилители градиента IV: LightGBM - Deep & Shallow
  10. ^ Маниш, Мехта; Ракеш, Агравал; Йорма, Риссанен (24 ноября 2020 г.). «SLIQ: быстрый масштабируемый классификатор для интеллектуального анализа данных». Международная конференция по расширению технологий баз данных : 18–32. CiteSeerX   10.1.1.89.7734 .
  11. ^ «Функции — документация LightGBM 3.1.0.99» . Lightgbm.readthedocs.io .
  12. ^ Jump up to: Перейти обратно: а б с Кэ, Гуолинь; Мэн, Ци; Финли, Томас; Ван, Тайфэн; Чен, Вэй; Ма, Вэйдун; Да, Цивэй; Лю, Те-Янь (2017). «LightGBM: высокоэффективное дерево решений по повышению градиента» . Достижения в области нейронных систем обработки информации . 30 .
  13. ^ «lightgbm: Пакет Python LightGBM» . 7 июля 2022 г. – через PyPI.
  14. ^ «Пространство имен Microsoft.ML.Trainers.LightGbm» . docs.microsoft.com .
  15. ^ «Майкрософт/ЛайтГБМ» . 6 октября 2020 г. – через GitHub.

Дальнейшее чтение [ править ]

Внешние ссылки [ править ]

Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 6116d4f004e02b9e2ec1a011f9845b9c__1718065500
URL1:https://arc.ask3.ru/arc/aa/61/9c/6116d4f004e02b9e2ec1a011f9845b9c.html
Заголовок, (Title) документа по адресу, URL1:
LightGBM - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)