IBM Гранит
Разработчики) | IBM Исследования [1] |
---|---|
Начальная версия | 7 ноября 2023 г |
Платформа | IBM Watsonx (изначально) GitHub Обнимающее лицо РЭЛ ИИ |
Тип | |
Лицензия | Собственный Модели кода: с открытым исходным кодом ( Apache 2.0 ). [2] |
Часть серии о |
Машинное обучение и интеллектуальный анализ данных |
---|
IBM Granite — это серия базовых моделей , предназначенных только для декодеров , созданных IBM . Об этом было объявлено 7 сентября 2023 года. [3] [4] а первоначальная статья была опубликована 4 дня спустя. [5] IBM Первоначально предназначенный для использования в облачной для обработки данных и генеративного искусственного интеллекта платформе Watsonx вместе с другими моделями. [6] IBM открыла исходный код некоторых моделей кода. [7] Модели гранита обучаются на наборах данных, взятых из Интернета , научных публикаций , наборов кодовых данных, юридических и финансовых документов. [8] [9] [1]
Модели фундамента [ править ]
Базовая модель — это модель ИИ, обученная на обширных данных в таком масштабе, что ее можно адаптировать к широкому кругу последующих задач. [10]
Первыми моделями фундаментов Granite были Granite.13b.instruct и Granite.13b.chat. «13b» в их названии происходит от 13 миллиардов, количество параметров, которые они имеют в качестве моделей, меньше, чем у большинства более крупных моделей того времени. Более поздние модели варьируются от 3 до 34 миллиардов параметров. [3] [11]
6 мая 2024 года IBM выпустила исходный код четырех вариантов моделей Granite Code под Apache 2 , разрешительной лицензией с открытым исходным кодом , которая позволяет совершенно бесплатно использовать, модифицировать и распространять программное обеспечение, и разместила их на Hugging Face для публичного использования. [12] [13] Согласно собственному отчету IBM, Granite 8b превосходит Llama 3 в ряде задач, связанных с кодированием, в аналогичном диапазоне параметров. [14] [15]
См. также [ править ]
Ссылки [ править ]
- ^ Перейти обратно: а б Макдауэлл, Стив. «Новые модели IBM Granite Foundation обеспечивают безопасный ИИ на предприятии» . Форбс .
- ^ IBM-granite/granite-code-models , IBM Granite, 08 мая 2024 г. , получено 8 мая 2024 г.
- ^ Перейти обратно: а б Нирмал, Динеш (7 сентября 2023 г.). «Создание искусственного интеллекта для бизнеса: фундаментальные модели IBM Granite» . ИБМ .
- ^ «IBM представляет серию аппаратно-эффективных языковых моделей Granite» . 7 сентября 2023 г.
- ^ «Модели гранитного фундамента» (PDF) . ИБМ. 2023-11-30.
- ^ Фриттс, Гарольд (22 апреля 2024 г.). «IBM добавляет Meta Llama 3 в watsonx и расширяет возможности ИИ» . StorageReview.com . Проверено 8 мая 2024 г.
- ^ Джиндал, Сиддхарт (7 мая 2024 г.). «IBM выпускает модели гранитного кода с открытым исходным кодом, превосходящие Llama 3» . Журнал Analytics India . Проверено 8 мая 2024 г.
- ^ Ажар, Али (08 апреля 2024 г.). «IBM патентует более быстрый метод обучения LLM для предприятий» . Датанами . Проверено 8 мая 2024 г.
- ^ Виггерс, Кайл (07 сентября 2023 г.). «IBM представляет новые функции и модели генеративного искусственного интеллекта» . ТехКранч . Проверено 8 мая 2024 г.
- ^ «Представляем Центр исследований моделей фундамента (CRFM)» . Стэнфорд ХАЙ . 18 августа 2021 г.
- ^ Павар, Сахил (11 сентября 2023 г.). «IBM представляет модели LLM серии Granite для платформы Watsonx» . Аналитический дрейф . Проверено 9 мая 2024 г.
- ^ Девять, Адрианна (7 мая 2024 г.). «IBM делает гранитные модели искусственного интеллекта открытыми на новой платформе InstructLab» . ЭкстримТех .
- ^ «IBM открывает исходный код своих моделей искусственного интеллекта Granite — и они имеют серьезный бизнес» . ЗДНЕТ . Проверено 21 мая 2024 г.
- ^ Джиндал, Сиддхарт (7 мая 2024 г.). «IBM выпускает модели гранитного кода с открытым исходным кодом, превосходящие Llama 3» . Журнал Analytics India . Проверено 9 мая 2024 г.
- ^ Синхронизировано (13 мая 2024 г.). «Гранитный код IBM: обеспечение разработки корпоративного программного обеспечения с помощью точности искусственного интеллекта | Синхронизация» . syncedreview.com . Проверено 21 мая 2024 г.