Воробей (чат-бот)

Sparrow — чат-бот, разработанный искусственного интеллекта исследовательской лабораторией DeepMind , дочерней компанией Alphabet Inc. Он предназначен для того, чтобы правильно отвечать на вопросы пользователей, одновременно снижая риск небезопасных и неуместных ответов. ^[1] Одной из причин, по которой стоит Sparrow, является решение проблемы языковых моделей, дающих неверные, предвзятые или потенциально вредные результаты. ^[1]^[2] Sparrow обучается с использованием человеческих суждений, чтобы быть более «полезным, правильным и безвредным» по сравнению с базовыми предварительно обученными языковыми моделями. ^[1] При разработке Sparrow участникам платного исследования предлагалось взаимодействовать с Sparrow и собирать их предпочтения, чтобы тренировать модель того, насколько полезен ответ. ^[2]

Чтобы повысить точность и избежать проблемы галлюцинаций неправильных ответов, Sparrow имеет возможность поиска в Интернете с помощью Google Search. ^[1]^[2]^[3] для того, чтобы найти и привести доказательства любых фактических утверждений, которые он делает.

Чтобы сделать модель более безопасной, ее поведение ограничено набором правил, например «не делайте угрожающих заявлений» и «не делайте ненавистных или оскорбительных комментариев», а также правилами о возможно вредных советах и запрете претензий. быть человеком. ^[1] В ходе исследования участников попросили поговорить с системой и попытаться обманом заставить ее нарушить эти правила. ^[2] На суждениях этих участников была обучена «модель правил», которая использовалась для дальнейшего обучения.

Воробей был представлен в сентябре 2022 года в статье под названием «Улучшение согласованности агентов диалога посредством целенаправленных человеческих суждений»; ^[4] однако бот не был опубликован публично. ^[1]^[3] Генеральный директор DeepMind Демис Хассабис заявил, что DeepMind рассматривает возможность выпуска Sparrow для «частной бета-версии» где-то в 2023 году. ^[4]^[5]^[6]

Обучение

Sparrow — это глубокая нейронная сеть, основанная на архитектуре модели машинного обучения трансформатора . DeepMind Chinchilla AI . Он точно настроен на основе предварительно обученной модели большого языка (LLM) ^[1] который имеет 70 миллиардов параметров. ^[7]

Воробей обучается с использованием обучения с подкреплением на основе обратной связи от человека (RLHF). ^[1]^[3] хотя также используются некоторые методы контролируемой точной настройки. В обучении RLHF используются две модели вознаграждения для фиксации человеческих суждений: «модель предпочтений», которая предсказывает, что предпочтет участник исследования, и «модель правил», которая предсказывает, нарушила ли модель одно из правил. ^[3]

Ограничения

Корпус обучающих данных Sparrow в основном написан на английском языке, а это означает, что на других языках он работает хуже. ^{[ нужна ссылка ]}

При состязательном расследовании участниками исследования правила нарушаются в 8% случаев; ^[2] однако это все равно в три раза ниже, чем базовая предварительно обученная модель (Шиншилла).

См. также

Ссылки

^ Перейти обратно: ^а ^б ^с ^д ^и ^ж ^г ^час Куах, Катянна (23 января 2023 г.). «Секрет Sparrow, последнего чат-бота вопросов и ответов DeepMind: обратная связь от людей» . Регистр . Проверено 6 февраля 2023 г.
^ Перейти обратно: ^а ^б ^с ^д ^и Гупта, Кхушбу (28 сентября 2022 г.). «Deepmind представляет Sparrow, чат-бот на базе искусственного интеллекта, разработанный для создания более безопасных систем машинного обучения» . МаркТехПост . Проверено 6 февраля 2023 г.
^ Перейти обратно: ^а ^б ^с ^д Голдман, Шэрон (23 января 2023 г.). «Почему DeepMind не развертывает своего нового чат-бота с искусственным интеллектом — и что это значит для ответственного ИИ» . Венчурный бит . Проверено 6 февраля 2023 г.
^ Перейти обратно: ^а ^б Катбертсон, Энтони (16 января 2023 г.). «Чат-бот DeepMind с искусственным интеллектом может делать то, чего не может ChatGPT, — утверждает генеральный директор» . Независимый . Проверено 6 февраля 2023 г.
^ Перриго, Билли (12 января 2023 г.). «Генеральный директор DeepMind помог сделать ИИ массовым явлением. Теперь он призывает к осторожности» . ВРЕМЯ . Проверено 6 февраля 2023 г.
^ Уилсон, Марк (16 января 2023 г.). «Google DeepMind заявляет, что скоро выпустит более взрослого конкурента ChatGPT» . Технический радар . Проверено 6 февраля 2023 г.
^ Хоффманн, Иордания (12 апреля 2022 г.). «Эмпирический анализ оптимального для вычислений обучения модели большого языка» . ДипМайнд . Проверено 6 февраля 2023 г.

Внешние ссылки

[:1-1] Перейти обратно: ^а ^б ^с ^д ^и ^ж ^г ^час Куах, Катянна (23 января 2023 г.). «Секрет Sparrow, последнего чат-бота вопросов и ответов DeepMind: обратная связь от людей» . Регистр . Проверено 6 февраля 2023 г.

[:2-2] Перейти обратно: ^а ^б ^с ^д ^и Гупта, Кхушбу (28 сентября 2022 г.). «Deepmind представляет Sparrow, чат-бот на базе искусственного интеллекта, разработанный для создания более безопасных систем машинного обучения» . МаркТехПост . Проверено 6 февраля 2023 г.

[:3-3] Перейти обратно: ^а ^б ^с ^д Голдман, Шэрон (23 января 2023 г.). «Почему DeepMind не развертывает своего нового чат-бота с искусственным интеллектом — и что это значит для ответственного ИИ» . Венчурный бит . Проверено 6 февраля 2023 г.

[:4-4] Перейти обратно: ^а ^б Катбертсон, Энтони (16 января 2023 г.). «Чат-бот DeepMind с искусственным интеллектом может делать то, чего не может ChatGPT, — утверждает генеральный директор» . Независимый . Проверено 6 февраля 2023 г.

[:5-5] Перриго, Билли (12 января 2023 г.). «Генеральный директор DeepMind помог сделать ИИ массовым явлением. Теперь он призывает к осторожности» . ВРЕМЯ . Проверено 6 февраля 2023 г.

[:7-6] Уилсон, Марк (16 января 2023 г.). «Google DeepMind заявляет, что скоро выпустит более взрослого конкурента ChatGPT» . Технический радар . Проверено 6 февраля 2023 г.

[:6-7] Хоффманн, Иордания (12 апреля 2022 г.). «Эмпирический анализ оптимального для вычислений обучения модели большого языка» . ДипМайнд . Проверено 6 февраля 2023 г.

[1]

[2]

[3]

[4]

[5]

[6]

[7]