ГПТ-4о
Разработчик(и) | ОпенАИ |
---|---|
Первоначальный выпуск | 13 мая 2024 г |
Предшественник | ГПТ-4 Турбо |
Тип | |
Лицензия | Собственный |
Веб-сайт | опенай |
GPT-4o ( GPT-4 Omni ) — многоязычный, мультимодальный генеративный предварительно обученный преобразователь, разработанный OpenAI . Об этом объявил технический директор OpenAI Мира Мурати во время демонстрации в прямом эфире 13 мая 2024 года и выпустил в тот же день. [1] GPT-4o бесплатен, но с лимитом использования, который для подписчиков ChatGPT Plus в 5 раз выше . [2] Он может обрабатывать и генерировать текст, изображения и аудио. [3] Его API в два раза быстрее и вдвое дешевле, чем у его предшественника GPT-4 Turbo . [1]
Фон
[ редактировать ]Первоначально несколько версий GPT-4o были тайно запущены под разными названиями на арене чат-ботов организации крупных модельных систем ( LMSYS ) как три разные модели. Эти три модели назывались gpt2-chatbot, im-a-good-gpt2-chatbot и im-also-a-good-gpt2-chatbot. [4] 7 мая 2024 года Сэм Альтман написал в Твиттере «im-a-good-gpt2-chatbot», что обычно интерпретировалось как подтверждение того, что это новые модели OpenAI, проходящие A/B-тестирование . [5] [6]
Возможности
[ редактировать ]GPT-4o достиг самых современных результатов в тестах голоса, многоязычия и зрения, установив новые рекорды в распознавании и переводе аудио речи. [7] [8] GPT-4o набрал 88,7 баллов в тесте Massive Multitask Language Analysis ( MMLU ) по сравнению с 86,5 баллом GPT-4. [9] В отличие от GPT-3.5 и GPT-4, которые используют другие модели для обработки звука, GPT-4o изначально поддерживает голосовую связь. [9] Сэм Альтман отметил 15 мая 2024 года, что возможности голосовой связи GPT-4o еще не интегрированы в ChatGPT и что старая версия все еще используется. [10]
Модель поддерживает более 50 языков, [1] которые, по утверждению OpenAI, охватывают более 97% говорящих. [11] Мира Мурати продемонстрировала многоязычные возможности модели, поговорив с ней по-итальянски и заставив ее переводить с английского на итальянский во время прямой трансляции демонстрационного мероприятия OpenAI 13 мая 2024 года. Кроме того, новый токенизатор использует меньше токенов для определенных языков, особенно языков, которые не основаны на латинском алфавите , что делает его более дешевым для этих языков. [9]
GPT-4o имеет знания до октября 2023 года. [12] [13] и имеет длину контекста 128 тыс. токенов [12] с лимитом выходных токенов, ограниченным до 2048. [13]
По состоянию на май 2024 года это ведущая модель в тестах Elo Arena Benchmarks организации больших модельных систем (LMSYS) Калифорнийского университета в Беркли . [14]
ГПТ-4о мини
[ редактировать ]18 июля 2024 года OpenAI выпустила меньшую и дешевую версию GPT-4o mini . [15]
По данным OpenAI, его низкая стоимость, как ожидается, будет особенно полезна для компаний, стартапов и разработчиков, которые стремятся интегрировать его в свои сервисы, которые часто совершают большое количество вызовов API . Его API стоит 0,15 доллара США за миллион входных токенов и 0,6 доллара США за миллион выходных токенов по сравнению с 5 и 15 долларами США соответственно для GPT-4o. Он также значительно более функционален и на 60% дешевле, чем GPT-3.5 Turbo, который он заменил в интерфейсе ChatGPT. [15] Цена после тонкой настройки увеличивается вдвое: 0,3 доллара за миллион входных токенов и 1,2 доллара за миллион выходных токенов. [16]
GPT-4o mini станет доступен осенью 2024 года на мобильных устройствах Apple и настольных компьютерах Mac благодаря функции Apple Intelligence . [15]
Скандал со Скарлетт Йоханссон
[ редактировать ]На момент выпуска GPT-4o предлагал пять голосов: Breeze, Cove, Ember, Juniper и Sky. Быстро было замечено сходство голоса американской актрисы Скарлетт Йоханссон и Скай. 14 мая Entertainment Weekly задались вопросом, было ли это сходство намеренным. [17] 18 мая муж Йоханссон, Колин Йост , пошутил по поводу сходства в сюжете Saturday Night Live . [18] 20 мая 2024 года OpenAI отключила голос Sky, опубликовав заявление, в котором говорилось: «Мы слышали вопросы о том, как мы выбирали голоса в ChatGPT, особенно в Sky. Мы работаем над тем, чтобы приостановить использование Sky, пока мы их решаем». [19]
Скарлетт Йоханссон снялась в научно-фантастическом фильме Спайка Джонза «Она» в 2013 году, сыграв роль Саманты, виртуальной помощницы с искусственным интеллектом, олицетворяемой женским голосом. В рамках промоушена, приведшего к выпуску GPT-4o, Сэм Альтман 13 мая написал в Твиттере одно слово: «она». [20] [21]
OpenAI утверждала, что каждый голос основан на озвучке нанятого актера. В частности, OpenAI заявила, что «голос Скай не является имитацией Скарлетт Йоханссон, а принадлежит другой профессиональной актрисе, использующей свой собственный естественный голос». [19] Уже в сентябре 2023 года OpenAI заявила, что их новая говорящая версия своего помощника ChatGPT, которая звучит так, будто Скарлетт Йоханссон «не должна была напоминать» актрису. [22] Технический директор Мира Мурати заявила: «Я не знаю насчет голоса. Мне действительно пришлось пойти и послушать голос Скарлетт Йоханссон». OpenAI также заявила, что озвучка была нанята еще до обращения к Йоханссон. [21]
21 мая Йоханссон опубликовала заявление, в котором объяснила, что OpenAI неоднократно предлагала ей заключить сделку, чтобы получить разрешение на использование ее голоса еще за девять месяцев до релиза, но она отклонила эту сделку. Она сказала, что была «шокирована, разгневана и не верила, что г-н Альтман будет преследовать голос, который настолько похож на мой, что мои ближайшие друзья и новостные агентства не могли заметить разницы». В своем заявлении Йоханссон также использовала этот инцидент, чтобы привлечь внимание к отсутствию правовых гарантий использования творческой работы для создания ведущих инструментов искусственного интеллекта, поскольку ее юрисконсульт потребовал от OpenAI подробно описать особенности создания Sky voice. [21] [23]
Наблюдатели отметили сходство с тем, как Йоханссон ранее подала в суд и урегулировала дело с The Walt Disney Company за нарушение контракта в отношении прямой трансляции ее фильма Marvel «Черная вдова» . [24] Многие полагают, что это соглашение принесло ей около 40 миллионов долларов. [25]
Также 21 мая Шира Овиде из Washington Post поделилась своим списком «самых упрямых собственников» технологических компаний, приняв решение продолжать использовать голос, похожий на голос Йоханссон, несмотря на ее возражение, а затем отрицая сходство, заняв 6-е место. . [22] 24 мая Дерек Робертсон из Politico написал о «массовой негативной реакции», заключив, что «присвоение голоса одной из самых известных кинозвезд мира - в отношении [...] фильма, который служит предостережением о более чем - зависимость от искусственного интеллекта – вряд ли поможет вернуть общественность в угол [Сэма Альтмана] в ближайшее время». [26]
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Jump up to: а б с Виггерс, Кайл (13 мая 2024 г.). «OpenAI представляет модель GPT-4o «omni», которая теперь используется в ChatGPT» . ТехКранч . Проверено 13 мая 2024 г.
- ^ Филд, Хайден (13 мая 2024 г.). «OpenAI запускает новую модель искусственного интеллекта GPT-4o и настольную версию ChatGPT» . CNBC . Проверено 14 мая 2024 г.
- ^ Колберн, Томас. «OpenAI представляет GPT-4o, новую флагманскую модель мультимодального ИИ» . Регистр . Проверено 18 мая 2024 г.
- ^ Эдвардс, Бендж (13 мая 2024 г.). «Перед запуском GPT-4o побил рекорды в таблице лидеров чат-ботов под секретным именем» . Арс Техника . Проверено 17 мая 2024 г.
- ^ Сэм, Альтман (7 мая 2024 г.). " https://twitter.com/sama/status/1787222050589028528 " Twitter, X. Проверено 14 мая 2024 г.
- ^ Зефф, Максвелл (07 мая 2024 г.). «Новый мощный чат-бот таинственным образом возвращается посреди ночи» . Гизмодо . Проверено 17 мая 2024 г.
- ^ ван Рейменам, Марк (13 мая 2024 г.). «OpenAI запустила GPT-4o: будущее взаимодействия ИИ уже здесь» . Цифровой динамик . Проверено 17 мая 2024 г.
- ^ Доус, Райан (14 мая 2024 г.). «GPT-4o обеспечивает человеческое взаимодействие с искусственным интеллектом с интеграцией текста, звука и изображения» . Новости ИИ . Проверено 18 мая 2024 г.
- ^ Jump up to: а б с «Привет, GPT-4o» . ОпенАИ .
- ^ «OpenAI GPT-4o: Как получить доступ к голосовому режиму GPT-4o; идеи Сэма Альтмана» . Таймс оф Индия . 16 мая 2024 г. ISSN 0971-8257 . Проверено 18 мая 2024 г.
- ^ Эдвардс, Бендж (13 мая 2024 г.). «Большое обновление ChatGPT-4o позволяет вести аудио-видео переговоры с «эмоциональным» чат-ботом с искусственным интеллектом» . Арс Техника . Проверено 17 мая 2024 г.
- ^ Jump up to: а б «Модели — OpenAI API» . ОпенАИ . Проверено 17 мая 2024 г.
- ^ Jump up to: а б Конвей, Адам (13 мая 2024 г.). «Что такое GPT-4o? Все, что вам нужно знать о новой модели OpenAI, которую каждый может использовать бесплатно» . Разработчики XDA . Проверено 17 мая 2024 г.
- ^ Франзен, Карл (13 мая 2024 г.). «OpenAI анонсирует новую бесплатную модель GPT-4o и ChatGPT для настольных компьютеров» . ВенчурБит . Проверено 18 мая 2024 г.
- ^ Jump up to: а б с Франзен, Карл (18 июля 2024 г.). «OpenAI представляет GPT-4o mini — меньшую по размеру и гораздо более дешевую мультимодальную модель искусственного интеллекта» . ВенчурБит . Проверено 18 июля 2024 г.
- ^ «Цены OpenAI» .
{{cite web}}
: CS1 maint: статус URL ( ссылка ) - ^ Стензель, Уэсли (14 мая 2024 г.). «ChatGPT намеренно запускает говорящий ИИ, который звучит точно так же, как Скарлетт Йоханссон в фильме «Она»?» . Развлекательный еженедельник . Проверено 21 мая 2024 г.
- ^ Карузо, Ник (20 мая 2024 г.). «Скарлетт Йоханссон говорит, что она была «шокирована, разгневана и не поверила», услышав голос ChatGPT, который похож на нее — прочитайте заявление» . ТВЛайн . Проверено 21 мая 2024 г.
- ^ Jump up to: а б «Как выбирались голоса для ChatGPT» . ОпенАИ . 19 мая 2024 г.
- ^ "ее" . X (ранее Twitter) . 13 мая 2024 г. . Проверено 21 мая 2024 г.
- ^ Jump up to: а б с Аллин, Бобби (20 мая 2024 г.). «Скарлетт Йоханссон говорит, что она «шокирована и возмущена» новым голосом ChatGPT» . ЭНЕРГЕТИЧЕСКИЙ ЯДЕРНЫЙ РЕАКТОР .
- ^ Jump up to: а б Овиде, Шира (30 мая 2024 г.). «Перспектива | Насколько глупо было то, что OpenAI сделал со Скарлетт Йоханссон?» . Вашингтон Пост .
- ^ Микл, Трипп (20 мая 2024 г.). «Скарлетт Йоханссон сказала «нет», но виртуальный помощник OpenAI звучит так же, как она» . Нью-Йорк Таймс . ISSN 0362-4331 . Проверено 21 мая 2024 г.
- ^ «Скарлетт Йоханссон бросила вызов Disney. Теперь она сражается с OpenAI за голос ChatGPT, который звучит как ее» . Яху Финанс . 21 мая 2024 г. Проверено 21 мая 2024 г.
- ^ Пулвер, Эндрю (01 октября 2021 г.). «Скарлетт Йоханссон урегулировала иск Черной вдовы с Диснеем» . Хранитель . ISSN 0261-3077 . Проверено 21 мая 2024 г.
- ^ Робертсон, Дерек (22 мая 2024 г.). «Ошибка Скарлетт Йоханссон Сэма Альтмана только что сделала искусственный интеллект более трудным для продажи в Вашингтоне» . Политик .