Jump to content

Клод (языковая модель)

(Перенаправлено из Клода 2 )

Клод
Разработчик(и) антропный
Первоначальный выпуск март 2023 г .; 1 год назад ( 2023-03 )
Тип
Лицензия Собственный
Веб-сайт Клод .есть

Claude — семейство больших языковых моделей, разработанное Anthropic . [1] Первая модель была выпущена в марте 2023 года. Claude 3, выпущенная в марте 2024 года, также может анализировать изображения. [2]

Обучение

[ редактировать ]

Модели Клода — это генеративные предварительно обученные преобразователи . Они были предварительно обучены предсказывать следующее слово в больших объемах текста. Затем модели Клода были доработаны с помощью конституционного ИИ, чтобы сделать их полезными, честными и безвредными. [3] [4]

Конституционный ИИ

[ редактировать ]

Конституционный ИИ — это подход, разработанный Anthropic для обучения систем ИИ, особенно языковых моделей, таких как Клод, безвредными и полезными, не полагаясь на обширную обратную связь от людей. Метод, подробно описанный в статье «Конституциональный ИИ: безвредность от обратной связи ИИ», включает в себя два этапа: обучение с учителем и обучение с подкреплением . [4]

На этапе контролируемого обучения модель генерирует ответы на подсказки, самокритикует эти ответы на основе набора руководящих принципов («конституции») и пересматривает ответы. Затем модель настраивается на основе этих пересмотренных ответов. [4]

На этапе обучения с подкреплением на основе обратной связи ИИ (RLAIF) генерируются ответы, и ИИ сравнивает их соответствие конституции. Этот набор данных обратной связи ИИ используется для обучения модели предпочтений, которая оценивает ответы на основе того, насколько они соответствуют конституции. Затем Claude настраивается в соответствии с этой моделью предпочтений. Этот метод аналогичен обучению с подкреплением на основе обратной связи с человеком (RLHF), за исключением того, что сравнения, используемые для обучения модели предпочтений, генерируются искусственным интеллектом и основаны на конституции. [5] [4]

Такой подход позволяет обучать ИИ-помощников, которые одновременно полезны и безвредны и могут объяснять свои возражения против вредных запросов, повышая прозрачность и уменьшая зависимость от человеческого контроля. [6] [7]

«Конституция» Клода включала 75 пунктов, включая разделы из Всеобщей декларации прав человека ООН . [6] [3]

Claude был начальной версией языковой модели Anthropic, выпущенной в марте 2023 года. [8] Клод продемонстрировал умение решать различные задачи, но имел определенные ограничения в способностях к программированию, математике и рассуждению. [9] Anthropic сотрудничает с такими компаниями, как Notion (программное обеспечение для повышения производительности) и Quora (чтобы помочь в разработке чат-бота Poe ). [9]

Клод Инстант

[ редактировать ]

Claude был выпущен в двух версиях: Claude и Claude Instant, причем Claude Instant был более быстрой, менее дорогой и легкой версией. Claude Instant имеет длину входного контекста 100 000 токенов (что соответствует примерно 75 000 слов). [10]

Claude 2 был следующей крупной версией Claude, которая была выпущена в июле 2023 года и доступна широкой публике, тогда как Claude 1 был доступен только избранным пользователям, одобренным Anthropic. [11]

Клод 2 расширил контекстное окно с 9 000 токенов до 100 000 токенов. [8] Функции включали возможность загружать PDF-файлы и другие документы, которые позволяют Клоду читать, обобщать и помогать с задачами.

Клод 2.1 удвоил количество токенов, которые мог обработать чат-бот, увеличив его до окна в 200 000 токенов, что соответствует примерно 500 страницам письменного материала. [1]

Anthropic заявляет, что новая модель с меньшей вероятностью будет давать ложные заявления по сравнению с ее предшественниками. [12]

Claude 3 был выпущен 14 марта 2024 года, и в пресс-релизе утверждается, что он установил новые отраслевые стандарты для широкого спектра когнитивных задач. Семейство Claude 3 включает три современные модели в порядке возрастания возможностей: Haiku, Sonnet и Opus. Версия Claude 3 по умолчанию, Opus, имеет контекстное окно на 200 000 токенов, но для конкретных случаев использования оно расширяется до 1 миллиона. [13] [2]

Клод 3, похоже, обладает метакогнитивными способностями , в том числе способностью осознавать, что его искусственно проверяют во время тестов «иголка в стоге сена». [14]

20 июня 2024 года Anthropic выпустила Claude 3.5 Sonnet, который продемонстрировал значительно улучшенную производительность в тестах по сравнению с более крупным Claude 3 Opus, особенно в таких областях, как кодирование, многоэтапные рабочие процессы, интерпретация диаграмм и извлечение текста из изображений. Вместе с Sonnet 3.5 была выпущена новая возможность Artifacts, с помощью которой Клод мог создавать код в специальном окне интерфейса и предварительно просматривать выбранный код в реальном времени, например, на веб-сайтах или в SVG. [15]

Доступ с ограниченным использованием с использованием Claude 3.5 Sonnet бесплатен, но требует как адреса электронной почты, так и номера мобильного телефона. Платный план также предлагается для более широкого использования и доступа ко всем моделям Claude 3. [16]

1 мая 2024 года Anthropic анонсировала план Claude Team, свое первое корпоративное предложение для Claude и приложение Claude для iOS . [17]

Claude 2 подвергся критике за строгое этическое соответствие, которое может снизить удобство использования и производительность. Пользователям отказывали в помощи с мягкими запросами, например, с вопросом программирования «Как я могу завершить все Python процессы на моем сервере Ubuntu ?» Это привело к дебатам по поводу «налога на согласование» (стоимость обеспечения согласованности системы ИИ ) в разработке ИИ, причем дискуссии были сосредоточены на балансе этических соображений и практической функциональности. Критики выступали за автономию и эффективность пользователей, в то время как сторонники подчеркивали важность этического ИИ. [18] [12]

  1. ^ Jump up to: а б Дэвис, Уэс (21 ноября 2023 г.). «Конкурент OpenAI Anthropic делает своего чат-бота Claude еще более полезным» . Грань . Проверено 23 января 2024 г.
  2. ^ Jump up to: а б Уитни, Лэнс (4 марта 2024 г.). «Чат-бот Claude 3 от Anthropic утверждает, что превосходит ChatGPT, Gemini» . ЗДНЕТ . Проверено 5 марта 2024 г.
  3. ^ Jump up to: а б «Что нужно знать о Claude 2, конкуренте ChatGPT от Anthropic» . ВРЕМЯ . 18 июля 2023 г. Проверено 23 января 2024 г.
  4. ^ Jump up to: а б с д «Конституция Клода» . Антропный . 9 мая 2023 г. . Проверено 26 марта 2024 г.
  5. ^ Элиот, Лэнс (25 мая 2023 г.). «Новейший генеративный ИИ, смело обозначенный как конституционный ИИ, такой как Клод Антропик, имеет сердце в правильном месте, говорят этика ИИ и закон об ИИ» . Форбс . Проверено 27 марта 2024 г.
  6. ^ Jump up to: а б Бай, Юньтао; Кадават, Саурав; Кунду, Сандипан; Аскелл, Аманда; Кернион, Джексон; Джонс, Энди; Чен, Анна; Голди, Анна; Мирхосейни, Азалия (15 декабря 2022 г.), Конституционный ИИ: безвредность на основе обратной связи ИИ , arXiv : 2212.08073
  7. ^ Мок, Аарон. «Конкурент ChatGPT только что опубликовал новую конституцию, призванную повысить уровень защиты ИИ и предотвратить токсичные и расистские реакции» . Бизнес-инсайдер . Проверено 23 января 2024 г.
  8. ^ Jump up to: а б Драпкин, Аарон (27 октября 2023 г.). «Что такое ИИ и антропность Клода? Объяснение конкурента ChatGPT» . Tech.co. ​Проверено 23 января 2024 г.
  9. ^ Jump up to: а б «Знакомство с Клодом» . Антропный . 14 марта 2023 г.
  10. ^ Яо, Дебора (11 августа 2023 г.). «Клод Мгновенный из Anthropic: меньшая, более быстрая и дешевая языковая модель» . ИИ-бизнес .
  11. ^ Мэтьюз, Дилан (17 июля 2023 г.). «Азартная игра в 1 миллиард долларов, призванная гарантировать, что ИИ не уничтожит человечество» . Вокс . Проверено 23 января 2024 г.
  12. ^ Jump up to: а б «Anthropic анонсирует Claude 2.1 LLM с более широким контекстным окном и поддержкой инструментов искусственного интеллекта» . ИнфоQ . Проверено 23 января 2024 г.
  13. ^ «Представляем следующее поколение Клода» . Антропный . Проверено 4 марта 2024 г.
  14. ^ Эдвардс, Бендж (05 марта 2024 г.). «Claude 3 от Anthropic вызывает ажиотаж, поскольку кажется, что он осознал, когда его тестировали» . Арс Техника . Проверено 9 марта 2024 г.
  15. ^ Пирс, Дэвид (20 июня 2024 г.). «У Anthropic новая быстрая модель искусственного интеллекта и новый умный способ взаимодействия с чат-ботами» . Грань . Проверено 20 июня 2024 г.
  16. ^ «Представляем план Claude Team и приложение iOS» . Антропный . 1 мая 2024 года . Проверено 22 июня 2024 г.
  17. ^ Филд, Хайден (1 мая 2024 г.). «При поддержке Amazon Anthropic запускает приложение для iPhone и бизнес-уровень, чтобы конкурировать с ChatGPT OpenAI» . CNBC . Проверено 3 мая 2024 г. {{cite news}}: CS1 maint: статус URL ( ссылка )
  18. ^ Глифтон, Джеральд (3 января 2024 г.). «Критика возникает в отношении строгих этических протоколов Клода ИИ, ограничивающих помощь пользователям» . Светлая площадь . Проверено 23 января 2024 г.
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 11fff5e46dbc88cbcab7f55f6d1c34fa__1722617820
URL1:https://arc.ask3.ru/arc/aa/11/fa/11fff5e46dbc88cbcab7f55f6d1c34fa.html
Заголовок, (Title) документа по адресу, URL1:
Claude (language model) - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)