Клод (языковая модель)
![]() | |
Разработчик(и) | антропный |
---|---|
Первоначальный выпуск | март 2023 г |
Тип | |
Лицензия | Собственный |
Веб-сайт | Клод |
Claude — семейство больших языковых моделей, разработанное Anthropic . [1] Первая модель была выпущена в марте 2023 года. Claude 3, выпущенная в марте 2024 года, также может анализировать изображения. [2]
Обучение
[ редактировать ]Модели Клода — это генеративные предварительно обученные преобразователи . Они были предварительно обучены предсказывать следующее слово в больших объемах текста. Затем модели Клода были доработаны с помощью конституционного ИИ, чтобы сделать их полезными, честными и безвредными. [3] [4]
Конституционный ИИ
[ редактировать ]Конституционный ИИ — это подход, разработанный Anthropic для обучения систем ИИ, особенно языковых моделей, таких как Клод, безвредными и полезными, не полагаясь на обширную обратную связь от людей. Метод, подробно описанный в статье «Конституциональный ИИ: безвредность от обратной связи ИИ», включает в себя два этапа: обучение с учителем и обучение с подкреплением . [4]
На этапе контролируемого обучения модель генерирует ответы на подсказки, самокритикует эти ответы на основе набора руководящих принципов («конституции») и пересматривает ответы. Затем модель настраивается на основе этих пересмотренных ответов. [4]
На этапе обучения с подкреплением на основе обратной связи ИИ (RLAIF) генерируются ответы, и ИИ сравнивает их соответствие конституции. Этот набор данных обратной связи ИИ используется для обучения модели предпочтений, которая оценивает ответы на основе того, насколько они соответствуют конституции. Затем Claude настраивается в соответствии с этой моделью предпочтений. Этот метод аналогичен обучению с подкреплением на основе обратной связи с человеком (RLHF), за исключением того, что сравнения, используемые для обучения модели предпочтений, генерируются искусственным интеллектом и основаны на конституции. [5] [4]
Такой подход позволяет обучать ИИ-помощников, которые одновременно полезны и безвредны и могут объяснять свои возражения против вредных запросов, повышая прозрачность и уменьшая зависимость от человеческого контроля. [6] [7]
«Конституция» Клода включала 75 пунктов, включая разделы из Всеобщей декларации прав человека ООН . [6] [3]
Модели
[ редактировать ]Клод
[ редактировать ]Claude был начальной версией языковой модели Anthropic, выпущенной в марте 2023 года. [8] Клод продемонстрировал умение решать различные задачи, но имел определенные ограничения в способностях к программированию, математике и рассуждению. [9] Anthropic сотрудничает с такими компаниями, как Notion (программное обеспечение для повышения производительности) и Quora (чтобы помочь в разработке чат-бота Poe ). [9]
Клод Инстант
[ редактировать ]Claude был выпущен в двух версиях: Claude и Claude Instant, причем Claude Instant был более быстрой, менее дорогой и легкой версией. Claude Instant имеет длину входного контекста 100 000 токенов (что соответствует примерно 75 000 слов). [10]
Клод 2
[ редактировать ]Claude 2 был следующей крупной версией Claude, которая была выпущена в июле 2023 года и доступна широкой публике, тогда как Claude 1 был доступен только избранным пользователям, одобренным Anthropic. [11]
Клод 2 расширил контекстное окно с 9 000 токенов до 100 000 токенов. [8] Функции включали возможность загружать PDF-файлы и другие документы, которые позволяют Клоду читать, обобщать и помогать с задачами.
Клод 2.1
[ редактировать ]Клод 2.1 удвоил количество токенов, которые мог обработать чат-бот, увеличив его до окна в 200 000 токенов, что соответствует примерно 500 страницам письменного материала. [1]
Anthropic заявляет, что новая модель с меньшей вероятностью будет давать ложные заявления по сравнению с ее предшественниками. [12]
Клод 3
[ редактировать ]Claude 3 был выпущен 14 марта 2024 года, и в пресс-релизе утверждается, что он установил новые отраслевые стандарты для широкого спектра когнитивных задач. Семейство Claude 3 включает три современные модели в порядке возрастания возможностей: Haiku, Sonnet и Opus. Версия Claude 3 по умолчанию, Opus, имеет контекстное окно на 200 000 токенов, но для конкретных случаев использования оно расширяется до 1 миллиона. [13] [2]
Клод 3, похоже, обладает метакогнитивными способностями , в том числе способностью осознавать, что его искусственно проверяют во время тестов «иголка в стоге сена». [14]
Клод 3.5
[ редактировать ]20 июня 2024 года Anthropic выпустила Claude 3.5 Sonnet, который продемонстрировал значительно улучшенную производительность в тестах по сравнению с более крупным Claude 3 Opus, особенно в таких областях, как кодирование, многоэтапные рабочие процессы, интерпретация диаграмм и извлечение текста из изображений. Вместе с Sonnet 3.5 была выпущена новая возможность Artifacts, с помощью которой Клод мог создавать код в специальном окне интерфейса и предварительно просматривать выбранный код в реальном времени, например, на веб-сайтах или в SVG. [15]
Доступ
[ редактировать ]Доступ с ограниченным использованием с использованием Claude 3.5 Sonnet бесплатен, но требует как адреса электронной почты, так и номера мобильного телефона. Платный план также предлагается для более широкого использования и доступа ко всем моделям Claude 3. [16]
1 мая 2024 года Anthropic анонсировала план Claude Team, свое первое корпоративное предложение для Claude и приложение Claude для iOS . [17]
Критика
[ редактировать ]Claude 2 подвергся критике за строгое этическое соответствие, которое может снизить удобство использования и производительность. Пользователям отказывали в помощи с мягкими запросами, например, с вопросом программирования «Как я могу завершить все Python процессы на моем сервере Ubuntu ?» Это привело к дебатам по поводу «налога на согласование» (стоимость обеспечения согласованности системы ИИ ) в разработке ИИ, причем дискуссии были сосредоточены на балансе этических соображений и практической функциональности. Критики выступали за автономию и эффективность пользователей, в то время как сторонники подчеркивали важность этического ИИ. [18] [12]
Ссылки
[ редактировать ]- ^ Jump up to: а б Дэвис, Уэс (21 ноября 2023 г.). «Конкурент OpenAI Anthropic делает своего чат-бота Claude еще более полезным» . Грань . Проверено 23 января 2024 г.
- ^ Jump up to: а б Уитни, Лэнс (4 марта 2024 г.). «Чат-бот Claude 3 от Anthropic утверждает, что превосходит ChatGPT, Gemini» . ЗДНЕТ . Проверено 5 марта 2024 г.
- ^ Jump up to: а б «Что нужно знать о Claude 2, конкуренте ChatGPT от Anthropic» . ВРЕМЯ . 18 июля 2023 г. Проверено 23 января 2024 г.
- ^ Jump up to: а б с д «Конституция Клода» . Антропный . 9 мая 2023 г. . Проверено 26 марта 2024 г.
- ^ Элиот, Лэнс (25 мая 2023 г.). «Новейший генеративный ИИ, смело обозначенный как конституционный ИИ, такой как Клод Антропик, имеет сердце в правильном месте, говорят этика ИИ и закон об ИИ» . Форбс . Проверено 27 марта 2024 г.
- ^ Jump up to: а б Бай, Юньтао; Кадават, Саурав; Кунду, Сандипан; Аскелл, Аманда; Кернион, Джексон; Джонс, Энди; Чен, Анна; Голди, Анна; Мирхосейни, Азалия (15 декабря 2022 г.), Конституционный ИИ: безвредность на основе обратной связи ИИ , arXiv : 2212.08073
- ^ Мок, Аарон. «Конкурент ChatGPT только что опубликовал новую конституцию, призванную повысить уровень защиты ИИ и предотвратить токсичные и расистские реакции» . Бизнес-инсайдер . Проверено 23 января 2024 г.
- ^ Jump up to: а б Драпкин, Аарон (27 октября 2023 г.). «Что такое ИИ и антропность Клода? Объяснение конкурента ChatGPT» . Tech.co. Проверено 23 января 2024 г.
- ^ Jump up to: а б «Знакомство с Клодом» . Антропный . 14 марта 2023 г.
- ^ Яо, Дебора (11 августа 2023 г.). «Клод Мгновенный из Anthropic: меньшая, более быстрая и дешевая языковая модель» . ИИ-бизнес .
- ^ Мэтьюз, Дилан (17 июля 2023 г.). «Азартная игра в 1 миллиард долларов, призванная гарантировать, что ИИ не уничтожит человечество» . Вокс . Проверено 23 января 2024 г.
- ^ Jump up to: а б «Anthropic анонсирует Claude 2.1 LLM с более широким контекстным окном и поддержкой инструментов искусственного интеллекта» . ИнфоQ . Проверено 23 января 2024 г.
- ^ «Представляем следующее поколение Клода» . Антропный . Проверено 4 марта 2024 г.
- ^ Эдвардс, Бендж (05 марта 2024 г.). «Claude 3 от Anthropic вызывает ажиотаж, поскольку кажется, что он осознал, когда его тестировали» . Арс Техника . Проверено 9 марта 2024 г.
- ^ Пирс, Дэвид (20 июня 2024 г.). «У Anthropic новая быстрая модель искусственного интеллекта и новый умный способ взаимодействия с чат-ботами» . Грань . Проверено 20 июня 2024 г.
- ^ «Представляем план Claude Team и приложение iOS» . Антропный . 1 мая 2024 года . Проверено 22 июня 2024 г.
- ^ Филд, Хайден (1 мая 2024 г.). «При поддержке Amazon Anthropic запускает приложение для iPhone и бизнес-уровень, чтобы конкурировать с ChatGPT OpenAI» . CNBC . Проверено 3 мая 2024 г.
{{cite news}}
: CS1 maint: статус URL ( ссылка ) - ^ Глифтон, Джеральд (3 января 2024 г.). «Критика возникает в отношении строгих этических протоколов Клода ИИ, ограничивающих помощь пользователям» . Светлая площадь . Проверено 23 января 2024 г.