Jump to content

Воробей (чат-бот)

(Перенаправлено с Воробья (бот) )
Воробей отвечает на вопрос и дополнительный вопрос, используя доказательства.

Sparrow чат-бот, разработанный искусственного интеллекта исследовательской лабораторией DeepMind , дочерней компанией Alphabet Inc. Он предназначен для того, чтобы правильно отвечать на вопросы пользователей, одновременно снижая риск небезопасных и неуместных ответов. [1] Одной из причин, по которой стоит Sparrow, является решение проблемы языковых моделей, дающих неверные, предвзятые или потенциально вредные результаты. [1] [2] Sparrow обучается с использованием человеческих суждений, чтобы быть более «полезным, правильным и безвредным» по сравнению с базовыми предварительно обученными языковыми моделями. [1] При разработке Sparrow участникам платного исследования предлагалось взаимодействовать с Sparrow и собирать их предпочтения, чтобы тренировать модель того, насколько полезен ответ. [2]

Чтобы повысить точность и избежать проблемы галлюцинаций неправильных ответов, Sparrow имеет возможность поиска в Интернете с помощью Google Search. [1] [2] [3] для того, чтобы найти и привести доказательства любых фактических утверждений, которые он делает.

Чтобы сделать модель более безопасной, ее поведение ограничено набором правил, например «не делайте угрожающих заявлений» и «не делайте ненавистных или оскорбительных комментариев», а также правилами о возможно вредных советах и ​​запрете претензий. быть человеком. [1] В ходе исследования участников попросили поговорить с системой и попытаться обманом заставить ее нарушить эти правила. [2] На суждениях этих участников была обучена «модель правил», которая использовалась для дальнейшего обучения.

Воробей был представлен в сентябре 2022 года в статье под названием «Улучшение согласованности агентов диалога посредством целенаправленных человеческих суждений»; [4] однако бот не был опубликован публично. [1] [3] Генеральный директор DeepMind Демис Хассабис заявил, что DeepMind рассматривает возможность выпуска Sparrow для «частной бета-версии» где-то в 2023 году. [4] [5] [6]

Обучение

[ редактировать ]

Sparrow — это глубокая нейронная сеть, основанная на архитектуре модели машинного обучения трансформатора . DeepMind Chinchilla AI . Он точно настроен на основе предварительно обученной модели большого языка (LLM) [1] который имеет 70 миллиардов параметров. [7]

Воробей обучается с использованием обучения с подкреплением на основе обратной связи от человека (RLHF). [1] [3] хотя также используются некоторые методы контролируемой точной настройки. В обучении RLHF используются две модели вознаграждения для фиксации человеческих суждений: «модель предпочтений», которая предсказывает, что предпочтет участник исследования, и «модель правил», которая предсказывает, нарушила ли модель одно из правил. [3]

Ограничения

[ редактировать ]

Корпус обучающих данных Sparrow в основном написан на английском языке, а это означает, что на других языках он работает хуже. [ нужна ссылка ]

При состязательном расследовании участниками исследования правила нарушаются в 8% случаев; [2] однако это все равно в три раза ниже, чем базовая предварительно обученная модель (Шиншилла).

См. также

[ редактировать ]
  1. ^ Перейти обратно: а б с д и ж г час Куах, Катянна (23 января 2023 г.). «Секрет Sparrow, последнего чат-бота вопросов и ответов DeepMind: обратная связь от людей» . Регистр . Проверено 6 февраля 2023 г.
  2. ^ Перейти обратно: а б с д и Гупта, Кхушбу (28 сентября 2022 г.). «Deepmind представляет Sparrow, чат-бот на базе искусственного интеллекта, разработанный для создания более безопасных систем машинного обучения» . МаркТехПост . Проверено 6 февраля 2023 г.
  3. ^ Перейти обратно: а б с д Голдман, Шэрон (23 января 2023 г.). «Почему DeepMind не развертывает своего нового чат-бота с искусственным интеллектом — и что это значит для ответственного ИИ» . Венчурный бит . Проверено 6 февраля 2023 г.
  4. ^ Перейти обратно: а б Катбертсон, Энтони (16 января 2023 г.). «Чат-бот DeepMind с искусственным интеллектом может делать то, чего не может ChatGPT, — утверждает генеральный директор» . Независимый . Проверено 6 февраля 2023 г.
  5. ^ Перриго, Билли (12 января 2023 г.). «Генеральный директор DeepMind помог сделать ИИ массовым явлением. Теперь он призывает к осторожности» . ВРЕМЯ . Проверено 6 февраля 2023 г.
  6. ^ Уилсон, Марк (16 января 2023 г.). «Google DeepMind заявляет, что скоро выпустит более взрослого конкурента ChatGPT» . Технический радар . Проверено 6 февраля 2023 г.
  7. ^ Хоффманн, Иордания (12 апреля 2022 г.). «Эмпирический анализ оптимального для вычислений обучения модели большого языка» . ДипМайнд . Проверено 6 февраля 2023 г.
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: f2825b6028485c32bf3a7cc202eebe8f__1709661060
URL1:https://arc.ask3.ru/arc/aa/f2/8f/f2825b6028485c32bf3a7cc202eebe8f.html
Заголовок, (Title) документа по адресу, URL1:
Sparrow (chatbot) - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)