Воробей (чат-бот)
Sparrow — чат-бот, разработанный искусственного интеллекта исследовательской лабораторией DeepMind , дочерней компанией Alphabet Inc. Он предназначен для того, чтобы правильно отвечать на вопросы пользователей, одновременно снижая риск небезопасных и неуместных ответов. [1] Одной из причин, по которой стоит Sparrow, является решение проблемы языковых моделей, дающих неверные, предвзятые или потенциально вредные результаты. [1] [2] Sparrow обучается с использованием человеческих суждений, чтобы быть более «полезным, правильным и безвредным» по сравнению с базовыми предварительно обученными языковыми моделями. [1] При разработке Sparrow участникам платного исследования предлагалось взаимодействовать с Sparrow и собирать их предпочтения, чтобы тренировать модель того, насколько полезен ответ. [2]
Чтобы повысить точность и избежать проблемы галлюцинаций неправильных ответов, Sparrow имеет возможность поиска в Интернете с помощью Google Search. [1] [2] [3] для того, чтобы найти и привести доказательства любых фактических утверждений, которые он делает.
Чтобы сделать модель более безопасной, ее поведение ограничено набором правил, например «не делайте угрожающих заявлений» и «не делайте ненавистных или оскорбительных комментариев», а также правилами о возможно вредных советах и запрете претензий. быть человеком. [1] В ходе исследования участников попросили поговорить с системой и попытаться обманом заставить ее нарушить эти правила. [2] На суждениях этих участников была обучена «модель правил», которая использовалась для дальнейшего обучения.
Воробей был представлен в сентябре 2022 года в статье под названием «Улучшение согласованности агентов диалога посредством целенаправленных человеческих суждений»; [4] однако бот не был опубликован публично. [1] [3] Генеральный директор DeepMind Демис Хассабис заявил, что DeepMind рассматривает возможность выпуска Sparrow для «частной бета-версии» где-то в 2023 году. [4] [5] [6]
Обучение
[ редактировать ]Sparrow — это глубокая нейронная сеть, основанная на архитектуре модели машинного обучения трансформатора . DeepMind Chinchilla AI . Он точно настроен на основе предварительно обученной модели большого языка (LLM) [1] который имеет 70 миллиардов параметров. [7]
Воробей обучается с использованием обучения с подкреплением на основе обратной связи от человека (RLHF). [1] [3] хотя также используются некоторые методы контролируемой точной настройки. В обучении RLHF используются две модели вознаграждения для фиксации человеческих суждений: «модель предпочтений», которая предсказывает, что предпочтет участник исследования, и «модель правил», которая предсказывает, нарушила ли модель одно из правил. [3]
Ограничения
[ редактировать ]Корпус обучающих данных Sparrow в основном написан на английском языке, а это означает, что на других языках он работает хуже. [ нужна ссылка ]
При состязательном расследовании участниками исследования правила нарушаются в 8% случаев; [2] однако это все равно в три раза ниже, чем базовая предварительно обученная модель (Шиншилла).
См. также
[ редактировать ]- Безопасность ИИ
- Рассуждения здравого смысла
- Этика искусственного интеллекта
- Обработка естественного языка
- Оперативное проектирование
Ссылки
[ редактировать ]- ^ Перейти обратно: а б с д и ж г час Куах, Катянна (23 января 2023 г.). «Секрет Sparrow, последнего чат-бота вопросов и ответов DeepMind: обратная связь от людей» . Регистр . Проверено 6 февраля 2023 г.
- ^ Перейти обратно: а б с д и Гупта, Кхушбу (28 сентября 2022 г.). «Deepmind представляет Sparrow, чат-бот на базе искусственного интеллекта, разработанный для создания более безопасных систем машинного обучения» . МаркТехПост . Проверено 6 февраля 2023 г.
- ^ Перейти обратно: а б с д Голдман, Шэрон (23 января 2023 г.). «Почему DeepMind не развертывает своего нового чат-бота с искусственным интеллектом — и что это значит для ответственного ИИ» . Венчурный бит . Проверено 6 февраля 2023 г.
- ^ Перейти обратно: а б Катбертсон, Энтони (16 января 2023 г.). «Чат-бот DeepMind с искусственным интеллектом может делать то, чего не может ChatGPT, — утверждает генеральный директор» . Независимый . Проверено 6 февраля 2023 г.
- ^ Перриго, Билли (12 января 2023 г.). «Генеральный директор DeepMind помог сделать ИИ массовым явлением. Теперь он призывает к осторожности» . ВРЕМЯ . Проверено 6 февраля 2023 г.
- ^ Уилсон, Марк (16 января 2023 г.). «Google DeepMind заявляет, что скоро выпустит более взрослого конкурента ChatGPT» . Технический радар . Проверено 6 февраля 2023 г.
- ^ Хоффманн, Иордания (12 апреля 2022 г.). «Эмпирический анализ оптимального для вычислений обучения модели большого языка» . ДипМайнд . Проверено 6 февраля 2023 г.