ДАЛЛ-И
Разработчик(и) | ОпенАИ |
---|---|
Первоначальный выпуск | 5 января 2021 г |
Стабильная версия | ОТ И 3 / 10 августа 2023 г |
Тип | Модель преобразования текста в изображение |
Веб-сайт | лаборатории |
Часть серии о |
Искусственный интеллект |
---|
DALL·E , DALL·E 2 и DALL·E 3 — это модели преобразования текста в изображение, разработанные OpenAI с использованием методологий глубокого обучения для создания цифровых изображений из на естественном языке, описаний известных как « подсказки ».
Первая версия DALL-E была анонсирована в январе 2021 года. В следующем году был выпущен ее преемник DALL-E 2. DALL·E 3 был выпущен в составе ChatGPT для клиентов ChatGPT Plus и ChatGPT Enterprise в октябре 2023 г. [1] с доступностью через API OpenAI [2] и платформа «Лаборатории» предоставлены в начале ноября. [3] Microsoft реализовала эту модель в инструменте Bing Image Creator и планирует внедрить ее в свое приложение Designer. [4]
История и предыстория
[ редактировать ]DALL·E был раскрыт OpenAI в сообщении в блоге 5 января 2021 года и использует версию GPT-3. [5] модифицирован для создания изображений.
6 апреля 2022 года OpenAI анонсировала DALL·E 2, преемника, предназначенного для создания более реалистичных изображений с более высоким разрешением, которые «могут сочетать концепции, атрибуты и стили». [6] 20 июля 2022 года DALL·E 2 вступил в стадию бета-тестирования: приглашения были разосланы 1 миллиону человек из списка ожидания; [7] пользователи могут каждый месяц бесплатно создавать определенное количество изображений и приобретать больше. [8] Ранее доступ был ограничен предварительно выбранными пользователями для предварительного просмотра исследования из-за опасений по поводу этики и безопасности. [9] [10] 28 сентября 2022 года DALL·E 2 был открыт для всех, и требование о списке ожидания было снято. [11] В сентябре 2023 года OpenAI анонсировала свою последнюю модель изображения DALL·E 3, способную понимать «значительно больше нюансов и деталей», чем предыдущие версии. [12] В начале ноября 2022 года OpenAI выпустила DALL·E 2 в качестве API , позволяющего разработчикам интегрировать модель в свои собственные приложения. Microsoft представила реализацию DALL·E 2 в своем приложении Designer и инструменте Image Creator, включенном в Bing и Microsoft Edge . [13] API работает на основе цены за изображение, причем цены варьируются в зависимости от разрешения изображения. Скидки за оптовые продажи доступны компаниям, работающим с корпоративной командой OpenAI. [14]
Название программного обеспечения представляет собой смесь имен анимированного робота Pixar, персонажа ВАЛЛ-И, и каталонского художника-сюрреалиста Сальвадора Дали . [15] [5]
В феврале 2024 года OpenAI начала добавлять водяные знаки к изображениям, созданным DALL-E, содержащим метаданные в стандарте C2PA (Coalition for Content Provenance and Authenticity), продвигаемом Content Authenticity Initiative . [16]
Технология
[ редактировать ]Первая модель генеративного предварительно обученного трансформатора (GPT) была первоначально разработана OpenAI в 2018 году. [17] с использованием архитектуры Transformer . Первая итерация, GPT-1, [18] масштабирован для производства ГПТ-2 ; в 2019 году [19] в 2020 году его снова увеличили до производства GPT-3 со 175 миллиардами параметров. [20] [5] [21]
Модель DALL·E представляет собой мультимодальную реализацию GPT-3. [22] с 12 миллиардами параметров [5] который «заменяет текст на пиксели», обученный на парах текст-изображение из Интернета. [23] Более подробно, входные данные для модели Transformer — это последовательность токенизированных подписей к изображениям, за которыми следуют фрагменты токенизированных изображений. Подпись к изображению написана на английском языке, маркирована парой байтов (размер словаря 16384) и может иметь длину до 256 токенов. Каждое изображение представляет собой изображение RGB размером 256×256, разделенное на участки 32×32 по 4×4 каждый. Затем каждый патч преобразуется дискретным вариационным автокодировщиком в токен (размер словаря 8192).
DALL·E был разработан и анонсирован публике совместно с CLIP (предварительная тренировка по контрастному языку и изображению). [23] CLIP — это отдельная модель, основанная на нулевом обучении , которая была обучена на 400 миллионах пар изображений с текстовыми подписями, взятых из Интернета. [5] [23] [24] Его роль состоит в том, чтобы «понять и ранжировать» выходные данные DALL·E, предсказывая, какая подпись из списка из 32 768 подписей, случайно выбранных из набора данных (одна из которых была правильным ответом), наиболее подходит для изображения. Эта модель используется для фильтрации большего исходного списка изображений, созданных DALL·E, для выбора наиболее подходящих результатов. [15] [23]
DALL·E 2 использует 3,5 миллиарда параметров — меньше, чем его предшественник. [25] DALL·E 2 использует диффузионную модель, основанную на внедренных изображениях CLIP, которые во время вывода генерируются из внедренных текстов CLIP с помощью предыдущей модели. [25]
Предварительная тренировка контрастного языка и изображения (CLIP)
[ редактировать ]Предварительная тренировка контрастного языка и изображения [26] — это методика обучения пары моделей. Одна модель принимает фрагмент текста и выводит один вектор. Другой принимает изображение и выводит один вектор.
Чтобы обучить такую пару моделей, нужно начать с подготовки большого набора данных пар изображений и подписей, а затем выбрать пакеты размером . Пусть выходные данные моделей текста и изображения будут соответственно . Убыток, понесенный по этой партии, составит: Проще говоря, это общая сумма потерь перекрестной энтропии в каждом столбце и каждой строке матрицы. .
Выпущенные модели были обучены на наборе данных «WebImageText», содержащем 400 миллионов пар подписей к изображениям. Общее количество слов аналогично WebText, который содержит около 40 ГБ текста.
Возможности
[ редактировать ]DALL·E может создавать изображения в различных стилях, включая фотореалистичные изображения, картины и смайлы . [5] Он может «манипулировать и переставлять» объекты на своих изображениях. [5] и может правильно размещать элементы дизайна в новых композициях без явных инструкций. Том Данн, пишущий для BoingBoing, заметил: «Например, когда его просят нарисовать редис дайкон, сморкающийся, потягивающий латте или катающийся на одноколесном велосипеде, DALL·E часто рисует носовой платок, руки и ноги в подходящих местах». [27] DALL·E продемонстрировал способность «заполнять пробелы», чтобы получить необходимые детали без конкретных подсказок, например, добавляя рождественские образы к подсказкам, обычно связанным с празднованием. [28] и правильно разместил тени на изображениях, где они не упоминались. [29] Кроме того, DALL·E демонстрирует широкое понимание тенденций в области визуального дизайна и дизайна. [ нужна ссылка ]
DALL·E может создавать изображения для самых разных произвольных описаний с разных точек зрения. [30] лишь с редкими неудачами. [15] Марк Ридл, доцент Технологической школы интерактивных вычислений Джорджии , обнаружил, что DALL-E может смешивать концепции (описываемые как ключевой элемент человеческого творчества ). [31] [32]
Его способности к визуальному мышлению достаточны для решения матриц Ворона (визуальные тесты, которые часто проводятся людям для измерения интеллекта). [33] [34]
DALL·E 3 следует сложным подсказкам с большей точностью и детальностью, чем его предшественники, и способен генерировать более связный и точный текст. [35] [12] DALL·E 3 интегрирован в ChatGPT Plus. [12]
Модификация изображения
[ редактировать ]Учитывая существующее изображение, DALL·E 2 может создавать «вариации» изображения как отдельные выходные данные на основе оригинала, а также редактировать изображение, чтобы изменить или расширить его. При «закрашивании» и «закрашивании» в DALL·E 2 используется контекст изображения для заполнения недостающих областей с использованием носителя , соответствующего оригиналу, согласно заданной подсказке.
Например, это можно использовать для вставки нового объекта в изображение или расширения изображения за пределы исходных границ. [36] Согласно OpenAI, «Outpainting учитывает существующие визуальные элементы изображения, включая тени, отражения и текстуры, для сохранения контекста исходного изображения». [37]
Технические ограничения
[ редактировать ]Понимание языка DALL·E 2 имеет пределы. Иногда невозможно отличить «Жёлтую книгу и красную вазу» от «Красной книги и жёлтой вазы» или «Панду, делающую латте-арт» от «Латте-арт панды». [38] Он генерирует изображения «космонавта верхом на лошади», когда ему предоставляется подсказка «лошадь верхом на космонавте». [39] Он также не может генерировать правильные изображения в различных обстоятельствах. Запрос более трех объектов, отрицаний, чисел и связных предложений может привести к ошибкам, а признаки объекта могут появиться не на том объекте. [30] Дополнительные ограничения включают в себя обработку текста, которая, даже если буквы написаны разборчиво, почти всегда приводит к бреду, похожему на сон, и ограниченную способность обрабатывать научную информацию, такую как астрономия или медицинские изображения. [40]
Этические проблемы
[ редактировать ]Зависимость DALL·E 2 от общедоступных наборов данных влияет на результаты и в некоторых случаях приводит к алгоритмической предвзятости , например, к генерированию большего числа мужчин, чем женщин, для запросов, в которых не упоминается пол. [40] Данные обучения DALL·E 2 были отфильтрованы для удаления изображений насилия и сексуального характера, но было обнаружено, что в некоторых случаях это увеличивает предвзятость, например, снижает частоту появления женщин. [41] OpenAI предполагает, что это может быть связано с тем, что женщины с большей вероятностью подвергались сексуализации в обучающих данных, из-за чего фильтр влиял на результаты. [41] В сентябре 2022 года OpenAI подтвердила The Verge , что DALL·E незаметно вставляет фразы в запросы пользователя, чтобы устранить предвзятость результатов; например, «черный мужчина» и «азиатская женщина» вставляются в подсказки, в которых не указан пол или раса. [42]
Проблема DALL·E 2 и подобных моделей генерации изображений заключается в том, что они могут использоваться для распространения дипфейков и других форм дезинформации. [43] [44] В попытке смягчить это программное обеспечение отклоняет запросы с участием общественных деятелей и загрузки, содержащие человеческие лица. [45] Подсказки, содержащие потенциально нежелательный контент, блокируются, а загруженные изображения анализируются на предмет обнаружения оскорбительных материалов. [46] Недостатком фильтрации на основе подсказок является то, что ее легко обойти, используя альтернативные фразы, которые приводят к аналогичному результату. Например, слово «кровь» фильтруется, а «кетчуп» и «красная жидкость» — нет. [47] [46]
Еще одна проблема, связанная с DALL·E 2 и подобными моделями, заключается в том, что из-за своей точности и популярности они могут вызвать технологическую безработицу среди художников, фотографов и графических дизайнеров. [48] [49] DALL·E 3 предназначен для того, чтобы запретить пользователям создавать произведения искусства в стиле ныне живущих художников. [12]
В 2023 году Microsoft предложила Министерству обороны США использовать модели DALL·E для обучения системе управления полем боя . [50] В январе 2024 года OpenAI сняла полный запрет на использование в военных целях из своей политики использования. [51]
Прием
[ редактировать ]Большая часть репортажей о DALL·E сосредоточена на небольшом подмножестве «сюрреалистических» произведений. [23] или «причудливый» [31] выходы. Результат DALL-E для «иллюстрации молодого редиса дайкона в пачке, выгуливающего собаку» был упомянут в фрагментах из Input , [52] НБК , [53] Природа , [54] и другие публикации. [5] [55] [56] Широко освещалась и его продукция «кресла в форме авокадо». [23] [32]
ExtremeTech заявила, что «вы можете попросить у DALL·E изображение телефона или пылесоса за определенный период времени, и он поймет, как эти объекты изменились». [28] Engadget также отметил свою необычную способность «понимать, как телефоны и другие объекты меняются со временем». [29]
Согласно MIT Technology Review , одной из целей OpenAI было «дать языковым моделям лучшее понимание повседневных концепций, которые люди используют для понимания вещей». [23]
Инвесторы с Уолл-стрит положительно восприняли проект DALL·E 2, причем некоторые фирмы считают, что он может стать поворотным моментом для будущей многотриллионной отрасли. К середине 2019 года OpenAI уже получила финансирование на сумму более 1 миллиарда долларов от Microsoft и Khosla Ventures. [57] [58] [59] а в январе 2023 года, после запуска DALL·E 2 и ChatGPT, получила дополнительное финансирование в размере 10 миллиардов долларов от Microsoft. [60]
Японское аниме- сообщество негативно отреагировало на DALL·E 2 и подобные модели. [61] [62] [63] Художники обычно выдвигают два аргумента против программного обеспечения. Во-первых, искусство ИИ не является искусством, поскольку оно не создается человеком с намерением. «Сопоставление изображений, созданных с помощью ИИ, с их собственными работами унижает достоинство и подрывает время и навыки, которые затрачиваются на их искусство. Инструменты создания изображений с использованием ИИ подвергаются резкой критике со стороны художников, поскольку они обучены искусству, созданному человеком, взятому из сеть». [7] Во-вторых, проблемы с законом об авторском праве и моделями преобразования текста в изображение. OpenAI не опубликовала информацию о том, какие наборы данных использовались для обучения DALL·E 2, что вызвало обеспокоенность некоторых, что работы художников использовались для обучения без разрешения. Законы об авторском праве, касающиеся этих тем, на данный момент не дают окончательных результатов. [8]
После интеграции DALL·E 3 в Bing Chat и ChatGPT Microsoft и OpenAI столкнулись с критикой за чрезмерную фильтрацию контента, при этом критики заявили, что DALL·E подвергся «лоботомии». [64] В качестве доказательства была приведена пометка изображений, созданных с помощью таких подсказок, как «человек ломает серверную стойку кувалдой». Сообщается, что в первые дни после запуска фильтрация была усилена до такой степени, что изображения, созданные с помощью некоторых предложенных Bing подсказок, блокировались. [64] [65] TechRadar утверждает, что чрезмерная осторожность может ограничить ценность DALL·E как творческого инструмента. [65]
Реализации с открытым исходным кодом
[ редактировать ]Поскольку OpenAI не опубликовала исходный код ни для одной из трех моделей, было предпринято несколько попыток создать модели с открытым исходным кодом, предлагающие аналогичные возможности. [66] [67] Craiyon, выпущенный в 2022 году на платформе Hugging Face 's Spaces (ранее DALL·E Mini, пока OpenAI не запросил изменение названия в июне 2022 года), представляет собой модель искусственного интеллекта, основанную на оригинальной DALL·E, которая была обучена на нефильтрованных данных из Интернета. . Он привлек значительное внимание средств массовой информации в середине 2022 года после своего выпуска из-за своей способности создавать юмористические образы. [68] [69] [70]
См. также
[ редактировать ]- Искусство искусственного интеллекта
- ДипДрим
- Изображение (Google Brain)
- Середина пути
- Стабильная диффузия
- Оперативное проектирование
Ссылки
[ редактировать ]- ^ Дэвид, Эмилия (20 сентября 2023 г.). «OpenAI выпускает третью версию DALL·E» . Грань . Архивировано из оригинала 20 сентября 2023 года . Проверено 21 сентября 2023 г.
- ^ «Платформа OpenAI» . платформа.openai.com . Архивировано из оригинала 20 марта 2023 года . Проверено 10 ноября 2023 г.
- ^ Найлз, Рэймонд (10 ноября 2023 г.) [Обновлено на этой неделе]. «ДАЛЛ-Э 3 API» . Справочный центр OpenAI . Архивировано из оригинала 10 ноября 2023 года . Проверено 10 ноября 2023 г.
- ^ Мехди, Юсуф (21 сентября 2023 г.). «Анонсируем Microsoft Copilot, вашего повседневного помощника в области искусственного интеллекта» . Официальный блог Microsoft . Архивировано из оригинала 21 сентября 2023 года . Проверено 21 сентября 2023 г.
- ^ Jump up to: а б с д и ж г час Джонсон, Хари (5 января 2021 г.). «OpenAI представляет DALL-E для генерации изображений из текста» . ВенчурБит. Архивировано из оригинала 5 января 2021 года . Проверено 5 января 2021 г.
- ^ «ДАЛЛ·Э 2» . ОпенАИ . Архивировано из оригинала 6 апреля 2022 года . Проверено 6 июля 2022 г.
- ^ Jump up to: а б «DALL·E теперь доступен в бета-версии» . ОпенАИ . 20 июля 2022 года. Архивировано из оригинала 20 июля 2022 года . Проверено 20 июля 2022 г.
- ^ Jump up to: а б Аллин, Бобби (20 июля 2022 г.). «Сюрреалистично или слишком реально? Потрясающий инструмент искусственного интеллекта DALL·E выводит изображения на более широкую сцену» . ЭНЕРГЕТИЧЕСКИЙ ЯДЕРНЫЙ РЕАКТОР . Архивировано из оригинала 20 июля 2022 года . Проверено 20 июля 2022 г.
- ^ «Список ожидания DALL·E» . labs.openai.com . Архивировано из оригинала 4 июля 2022 года . Проверено 6 июля 2022 г.
- ^ «От младенцев Trump Nevermind до глубоких фейков: DALL·E и этика искусственного интеллекта» . Хранитель . 18 июня 2022 года. Архивировано из оригинала 6 июля 2022 года . Проверено 6 июля 2022 г.
- ^ «DALL·E теперь доступен без списка ожидания» . ОпенАИ . 28 сентября 2022 года. Архивировано из оригинала 4 октября 2022 года . Проверено 5 октября 2022 г.
- ^ Jump up to: а б с д «ДАЛЛ·Э 3» . ОпенАИ . Архивировано из оригинала 20 сентября 2023 года . Проверено 21 сентября 2023 г.
- ^ «DALL·E API теперь доступен в публичной бета-версии» . ОпенАИ . 3 ноября 2022 года. Архивировано из оригинала 19 ноября 2022 года . Проверено 19 ноября 2022 г.
- ^ Виггерс, Кайл (3 ноября 2022 г.). «Теперь каждый может создавать приложения, использующие DALL·E 2 для создания изображений» . ТехКранч . Архивировано из оригинала 19 ноября 2022 года . Проверено 19 ноября 2022 г.
- ^ Jump up to: а б с Колдьюи, Девин (5 января 2021 г.). «DALL-E OpenAI создает правдоподобные изображения буквально всего, что вы попросите» . Архивировано из оригинала 6 января 2021 года . Проверено 5 января 2021 г.
- ^ Гроукут, Мэтт (8 февраля 2024 г.). «Изображения AI, созданные на DALL-E, теперь содержат тег подлинности контента» . ПетаПиксель . Проверено 4 апреля 2024 г.
- ^ Рэдфорд, Алек; Нарасимхан, Картик; Салиманс, Тим; Суцкевер, Илья (11 июня 2018 г.). «Улучшение понимания языка посредством генеративной предварительной подготовки» (PDF) . ОпенАИ . п. 12. Архивировано (PDF) из оригинала 26 января 2021 года . Проверено 23 января 2021 г.
- ^ «От GPT-1 до GPT-4: объяснение и сравнение каждой из моделей GPT OpenAI» . 11 апреля 2023 года. Архивировано из оригинала 15 апреля 2023 года . Проверено 29 апреля 2023 г.
- ^ Рэдфорд, Алек; Ву, Джеффри; Дитя, Ревон; Луан, Дэвид; Амодей, Дарио; Суцкевер, Илуа (14 февраля 2019 г.). «Языковые модели предназначены для многозадачного обучения без присмотра» (PDF) . cdn.openai.com . 1 (8). Архивировано (PDF) из оригинала 6 февраля 2021 года . Проверено 19 декабря 2020 г.
- ^ Браун, Том Б.; Манн, Бенджамин; Райдер, Ник; Суббия, Мелани; Каплан, Джаред; Дхаривал, Прафулла; Нилакантан, Арвинд; Шьям, Пранав; Састри, Гириш; Аскелл, Аманда; Агарвал, Сандхини; Герберт-Восс, Ариэль; Крюгер, Гретхен; Хениган, Том; Дитя, Ревон; Рамеш, Адитья; Зиглер, Дэниел М.; Ву, Джеффри; Зима, Клеменс; Гессен, Кристофер; Чен, Марк; Сиглер, Эрик; Литвин, Матеуш; Грей, Скотт; Шахматы, Бенджамин; Кларк, Джек; Бернер, Кристофер; МакКэндлиш, Сэм; Рэдфорд, Алек; Суцкевер, Илья; Амодей, Дарио (22 июля 2020 г.). «Языковые модели изучаются немногими». arXiv : 2005.14165 [ cs.CL ].
- ^ Рамеш, Адитья; Павлов Михаил; Гох, Габриэль; Грей, Скотт; Восс, Челси; Рэдфорд, Алек; Чен, Марк; Суцкевер, Илья (24 февраля 2021 г.). «Генерация текста в изображение с нулевым выстрелом». arXiv : 2102.12092 [ cs.LG ].
- ^ Тамкин, Алекс; Брандейдж, Майлз; Кларк, Джек; Гангули, Дип (2021). «Понимание возможностей, ограничений и социального воздействия моделей большого языка». arXiv : 2102.02503 [ cs.CL ].
- ^ Jump up to: а б с д и ж г Небеса, Уилл Дуглас (5 января 2021 г.). «Это кресло из авокадо может стать будущим искусственного интеллекта» . Обзор технологий MIT. Архивировано из оригинала 5 января 2021 года . Проверено 5 января 2021 г.
- ^ « ИИ «DALL·E» генерирует изображение из всего, что вы описываете» . Engadget . 6 января 2021 года. Архивировано из оригинала 27 января 2021 года . Проверено 18 июля 2022 г.
- ^ Jump up to: а б Рамеш, Адитья; Дхаривал, Прафулла; Никол, Алекс; Чу, Кейси; Чен, Марк (12 апреля 2022 г.). «Иерархическая генерация условных текстовых изображений с помощью CLIP Latents». arXiv : 2204.06125 [ cs.CV ].
- ^ Рэдфорд, Алек; Ким, Чон Ук; Халласи, Крис; Рамеш, Адитья; Гох, Габриэль; Агарвал, Сандхини; Састри, Гириш; Аскелл, Аманда; Мишкин, Памела; Кларк, Джек; Крюгер, Гретхен; Суцкевер, Илья (2021). «Изучение переносимых визуальных моделей под контролем естественного языка». arXiv : 2103.00020 [ cs.CV ].
- ^ Данн, Том (10 февраля 2021 г.). «Эта нейронная сеть искусственного интеллекта превращает текстовые подписи в произведения искусства, как медуза Пикачу» . БоингБоинг . Архивировано из оригинала 22 февраля 2021 года . Проверено 2 марта 2021 г.
- ^ Jump up to: а б Уитвам, Райан (6 января 2021 г.). «DALL-E» OpenAI генерирует изображения из текстовых описаний» . ЭкстримТех . Архивировано из оригинала 28 января 2021 года . Проверено 2 марта 2021 г.
- ^ Jump up to: а б Дент, Стив (6 января 2021 г.). «Приложение DALL-E от OpenAI генерирует изображения просто по описанию» . Engadget . Архивировано из оригинала 27 января 2021 года . Проверено 2 марта 2021 г.
- ^ Jump up to: а б Маркус, Гэри; Дэвис, Эрнест; Ааронсон, Скотт (2 мая 2022 г.). «Очень предварительный анализ DALL-E 2». arXiv : 2204.13807 [ cs.CV ].
- ^ Jump up to: а б Шид, Сэм (8 января 2021 г.). «Почему все говорят о генераторе изображений, выпущенном лабораторией искусственного интеллекта, поддерживаемой Илоном Маском» . CNBC . Архивировано из оригинала 16 июля 2022 года . Проверено 2 марта 2021 г.
- ^ Jump up to: а б Уэйкфилд, Джейн (6 января 2021 г.). «ИИ рисует редиску в пачке, выгуливающую собаку» . Британская радиовещательная корпорация . Архивировано из оригинала 2 марта 2021 года . Проверено 3 марта 2021 г.
- ^ Марковиц, Дейл (10 января 2021 г.). «Вот как работает волшебный генератор изображений DALL-E от OpenAI» . TheNextWeb . Архивировано из оригинала 23 февраля 2021 года . Проверено 2 марта 2021 г.
- ^ «DALL·E: Создание изображений из текста» . ОпенАИ . 5 января 2021 года. Архивировано из оригинала 27 марта 2021 года . Проверено 13 августа 2022 г. .
- ^ Эдвардс, Бендж (20 сентября 2023 г.). «Новый генератор изображений AI от OpenAI расширяет границы детализации и обеспечивает быструю точность» . Арс Техника . Архивировано из оригинала 21 сентября 2023 года . Проверено 21 сентября 2023 г.
- ^ Колдьюи, Девин (6 апреля 2022 г.). «Новый инструмент OpenAI рисует что угодно, больше и лучше, чем когда-либо» . ТехКранч . Архивировано из оригинала 6 мая 2023 года . Проверено 26 ноября 2022 г.
- ^ «DALL·E: Знакомство с перекраской» . ОпенАИ . 31 августа 2022 года. Архивировано из оригинала 26 ноября 2022 года . Проверено 26 ноября 2022 г.
- ^ Сахария, Читван; Чан, Уильям; Саксена, Саураб; Ли, Лала; Ванг, Джей; Дентон, Эмили; Гасемипур, Сейед Камьяр Сейед; Аян, Бурджу Карагол; Махдави, С. Сара; Лопес, Рафа Гонтихо; Салиманс, Тим (23 мая 2022 г.). «Фотореалистичные модели распространения текста в изображение с глубоким пониманием языка». arXiv : 2205.11487 [ cs.CV ].
- ^ Маркус, Гэри (28 мая 2022 г.). «Лошадь едет космонавта» . Дорога к искусственному интеллекту, которому мы можем доверять . Архивировано из оригинала 19 июня 2022 года . Проверено 18 июня 2022 г.
- ^ Jump up to: а б Стрикленд, Элиза (14 июля 2022 г.). «Неудачи DALL·E 2 — самое интересное в нем» . IEEE-спектр . Архивировано из оригинала 15 июля 2022 года . Проверено 16 августа 2022 г.
- ^ Jump up to: а б «DALL·E 2 Меры по снижению риска перед тренировкой» . ОпенАИ . 28 июня 2022 года. Архивировано из оригинала 19 июля 2022 года . Проверено 18 июля 2022 г.
- ^ Джеймс Винсент (29 сентября 2022 г.). «Генератор изображений OpenAI DALL·E доступен для использования всем сразу же» . Грань . Архивировано из оригинала 29 сентября 2022 года . Проверено 29 сентября 2022 г.
- ^ Тейлор, Джош (18 июня 2022 г.). «От младенцев Trump Nevermind до глубоких фейков: DALL-E и этика искусства искусственного интеллекта» . Хранитель . Архивировано из оригинала 6 июля 2022 года . Проверено 2 августа 2022 г.
- ^ Найт, Уилл (13 июля 2022 г.). «Когда ИИ создает искусство, люди дают творческую искру» . Проводной . Архивировано из оригинала 2 августа 2022 года . Проверено 2 августа 2022 г.
- ^ Роуз, Янус (24 июня 2022 г.). «DALL-E теперь генерирует реалистичные лица фальшивых людей» . Порок . Архивировано из оригинала 30 июля 2022 года . Проверено 2 августа 2022 г.
- ^ Jump up to: а б OpenAI (19 июня 2022 г.). «Предварительная версия DALL·E 2 — риски и ограничения» . Гитхаб . Архивировано из оригинала 2 августа 2022 года . Проверено 2 августа 2022 г.
- ^ Лейн, Лаура (1 июля 2022 г.). «ДАЛЛ-И, сделай мне еще одного Пикассо, пожалуйста» . Житель Нью-Йорка . Архивировано из оригинала 2 августа 2022 года . Проверено 2 августа 2022 г.
- ^ Голдман, Шэрон (26 июля 2022 г.). «OpenAI: Убьет ли DALL·E 2 творческую карьеру?» . Архивировано из оригинала 15 августа 2022 года . Проверено 16 августа 2022 г.
- ^ Блейн, Лоз (29 июля 2022 г.). «DALL-E 2: инструмент мечты и экзистенциальная угроза для художников» . Архивировано из оригинала 17 августа 2022 года . Проверено 16 августа 2022 г.
- ^ Биддл, Сэм (10 апреля 2024 г.). «Microsoft представила DALL-E OpenAI как инструмент боя для вооруженных сил США» . Перехват .
- ^ Биддл, Сэм (12 января 2024 г.). «OpenAI незаметно снимает запрет на использование ChatGPT для «Военного дела» » . Перехват .
- ^ Касана, Мехрин (7 января 2021 г.). «Этот ИИ превращает текст в сюрреалистическое искусство, основанное на предложениях» . Вход. Архивировано из оригинала 29 января 2021 года . Проверено 2 марта 2021 г.
- ^ Эренкранц, Мелани (27 января 2021 г.). «Вот DALL-E: алгоритм научился рисовать все, что вы ему скажете» . Новости Эн-Би-Си . Архивировано из оригинала 20 февраля 2021 года . Проверено 2 марта 2021 г.
- ^ Стоув, Эмма (5 февраля 2021 г.). «Цирк тихоходок и древо жизни — лучшие научные снимки января» . Природа . Архивировано из оригинала 8 марта 2021 года . Проверено 2 марта 2021 г.
- ^ Найт, Уилл (26 января 2021 г.). «Этот ИИ может перейти от «искусства» к управлению беспилотным автомобилем» . Проводной . Архивировано из оригинала 21 февраля 2021 года . Проверено 2 марта 2021 г.
- ^ Мец, Рэйчел (2 февраля 2021 г.). «Редиска в пачке гуляет с собакой? Этот ИИ умеет ее очень хорошо рисовать» . Си-Эн-Эн. Архивировано из оригинала 16 июля 2022 года . Проверено 2 марта 2021 г.
- ^ Лесвинг, Киф (8 октября 2022 г.). «Почему Кремниевая долина так взволнована неуклюжими рисунками, сделанными искусственным интеллектом» . CNBC . Архивировано из оригинала 29 июля 2023 года . Проверено 1 декабря 2022 г.
- ^ Этерингтон, Даррелл (22 июля 2019 г.). «Microsoft инвестирует $1 млрд в OpenAI в рамках нового многолетнего партнерства» . ТехКранч . Архивировано из оригинала 22 июля 2019 года . Проверено 21 сентября 2023 г.
- ^ «Первый венчурный спонсор OpenAI высказывает мнение о генеративном искусственном интеллекте» Fortune . Архивировано из оригинала 23 октября 2023 года . Проверено 21 сентября 2023 г.
- ^ Мец, Кейд; Вайзе, Карен (23 января 2023 г.). «Microsoft инвестирует 10 миллиардов долларов в OpenAI, создателя ChatGPT» . Нью-Йорк Таймс . ISSN 0362-4331 . Архивировано из оригинала 21 сентября 2023 года . Проверено 21 сентября 2023 г.
- ^ «Искусство, созданное искусственным интеллектом, вызывает яростную реакцию японского аниме-сообщества» . Остальной мир . 27 октября 2022 года. Архивировано из оригинала 31 декабря 2022 года . Проверено 3 января 2023 г.
- ^ Руз, Кевин (2 сентября 2022 г.). «Картина, созданная искусственным интеллектом, получила художественную премию. Художники недовольны» . Нью-Йорк Таймс . ISSN 0362-4331 . Архивировано из оригинала 31 мая 2023 года . Проверено 3 января 2023 г.
- ^ Доус, Райан (15 декабря 2022 г.). «Реакция ArtStation усиливается после реакции на протесты в области искусства ИИ» . Новости ИИ . Архивировано из оригинала 3 января 2023 года . Проверено 3 января 2023 г.
- ^ Jump up to: а б Корден, Джез (8 октября 2023 г.). «В течение нескольких дней создание образа Bing Dall-E 3 было отличным, но теперь Microsoft предсказуемо провела его лоботомию» . Центр Windows . Архивировано из оригинала 10 октября 2023 года . Проверено 11 октября 2023 г.
- ^ Jump up to: а б Аллан, Даррен (9 октября 2023 г.). «Microsoft использует Bing AI Image Creator – и результаты не имеют особого смысла» . ТехРадар . Архивировано из оригинала 10 октября 2023 года . Проверено 11 октября 2023 г.
- ^ Сахар Мор, Stripe (16 апреля 2022 г.). «Как DALL-E 2 может решить серьезные проблемы компьютерного зрения» . ВенчурБит . Архивировано из оригинала 24 мая 2022 года . Проверено 15 июня 2022 г.
- ^ jina-ai/dalle-flow , Джина AI, 17 июня 2022 г., заархивировано из оригинала 17 июня 2022 г. , получено 17 июня 2022 г.
- ^ Карсон, Эрин (14 июня 2022 г.). «Все, что нужно знать о Dall-E Mini, потрясающем творце искусственного интеллекта» . CNET . Архивировано из оригинала 15 июня 2022 года . Проверено 15 июня 2022 г.
- ^ Шредер, Одра (9 июня 2022 г.). «Программа искусственного интеллекта DALL-E mini подсказывает поистине проклятые образы» . Ежедневная точка . Архивировано из оригинала 10 июня 2022 года . Проверено 15 июня 2022 г.
- ^ Диас, Ана (15 июня 2022 г.). «Люди используют DALL-E mini, чтобы создавать мемы-мерзости вроде мопса Пикачу» . Полигон . Архивировано из оригинала 15 июня 2022 года . Проверено 15 июня 2022 г.