IBM Гранит

Из Википедии, бесплатной энциклопедии
Гранит
Разработчики) IBM Исследования [1]
Начальная версия 7 ноября 2023 г .; 6 месяцев назад ( 07.11.2023 )
Платформа IBM Watsonx (изначально)
GitHub
Обнимающее лицо
РЭЛ ИИ
Тип
Лицензия Собственный
Модели кода: с открытым исходным кодом ( Apache 2.0 ). [2]

IBM Granite — это серия базовых моделей , предназначенных только для декодеров , созданных IBM . Об этом было объявлено 7 сентября 2023 года. [3] [4] а первоначальная статья была опубликована 4 дня спустя. [5] IBM Первоначально предназначенный для использования в облачной для обработки данных и генеративного искусственного интеллекта платформе Watsonx вместе с другими моделями. [6] IBM открыла исходный код некоторых моделей кода. [7] Модели гранита обучаются на наборах данных, взятых из Интернета , научных публикаций , наборов кодовых данных, юридических и финансовых документов. [8] [9] [1]

Модели фундамента [ править ]

Базовая модель — это модель ИИ, обученная на обширных данных в таком масштабе, что ее можно адаптировать к широкому кругу последующих задач. [10]

Первыми моделями фундаментов Granite были Granite.13b.instruct и Granite.13b.chat. «13b» в их названии происходит от 13 миллиардов, количество параметров, которые они имеют в качестве моделей, меньше, чем у большинства более крупных моделей того времени. Более поздние модели варьируются от 3 до 34 миллиардов параметров. [3] [11]

6 мая 2024 года IBM выпустила исходный код четырех вариантов моделей Granite Code под Apache 2 , разрешительной лицензией с открытым исходным кодом , которая позволяет совершенно бесплатно использовать, модифицировать и распространять программное обеспечение, и разместила их на Hugging Face для публичного использования. [12] [13] Согласно собственному отчету IBM, Granite 8b превосходит Llama 3 в ряде задач, связанных с кодированием, в аналогичном диапазоне параметров. [14] [15]

См. также [ править ]

Ссылки [ править ]

  1. ^ Перейти обратно: а б Макдауэлл, Стив. «Новые модели IBM Granite Foundation обеспечивают безопасный ИИ на предприятии» . Форбс .
  2. ^ IBM-granite/granite-code-models , IBM Granite, 08 мая 2024 г. , получено 8 мая 2024 г.
  3. ^ Перейти обратно: а б Нирмал, Динеш (7 сентября 2023 г.). «Создание искусственного интеллекта для бизнеса: фундаментальные модели IBM Granite» . ИБМ .
  4. ^ «IBM представляет серию аппаратно-эффективных языковых моделей Granite» . 7 сентября 2023 г.
  5. ^ «Модели гранитного фундамента» (PDF) . ИБМ. 2023-11-30.
  6. ^ Фриттс, Гарольд (22 апреля 2024 г.). «IBM добавляет Meta Llama 3 в watsonx и расширяет возможности ИИ» . StorageReview.com . Проверено 8 мая 2024 г.
  7. ^ Джиндал, Сиддхарт (7 мая 2024 г.). «IBM выпускает модели гранитного кода с открытым исходным кодом, превосходящие Llama 3» . Журнал Analytics India . Проверено 8 мая 2024 г.
  8. ^ Ажар, Али (08 апреля 2024 г.). «IBM патентует более быстрый метод обучения LLM для предприятий» . Датанами . Проверено 8 мая 2024 г.
  9. ^ Виггерс, Кайл (07 сентября 2023 г.). «IBM представляет новые функции и модели генеративного искусственного интеллекта» . ТехКранч . Проверено 8 мая 2024 г.
  10. ^ «Представляем Центр исследований моделей фундамента (CRFM)» . Стэнфорд ХАЙ . 18 августа 2021 г.
  11. ^ Павар, Сахил (11 сентября 2023 г.). «IBM представляет модели LLM серии Granite для платформы Watsonx» . Аналитический дрейф . Проверено 9 мая 2024 г.
  12. ^ Девять, Адрианна (7 мая 2024 г.). «IBM делает гранитные модели искусственного интеллекта открытыми на новой платформе InstructLab» . ЭкстримТех .
  13. ^ «IBM открывает исходный код своих моделей искусственного интеллекта Granite — и они имеют серьезный бизнес» . ЗДНЕТ . Проверено 21 мая 2024 г.
  14. ^ Джиндал, Сиддхарт (7 мая 2024 г.). «IBM выпускает модели гранитного кода с открытым исходным кодом, превосходящие Llama 3» . Журнал Analytics India . Проверено 9 мая 2024 г.
  15. ^ Синхронизировано (13 мая 2024 г.). «Гранитный код IBM: обеспечение разработки корпоративного программного обеспечения с помощью точности искусственного интеллекта | Синхронизация» . syncedreview.com . Проверено 21 мая 2024 г.

Внешние ссылки [ править ]