Синтез образа человека
Синтез изображений человека — это технология, которую можно применять для создания правдоподобных и даже фотореалистичных изображений. [1] [2] человеческих подобий, движущихся или неподвижных. Фактически он существует с начала 2000-х годов. Во многих фильмах, в которых используются изображения, сгенерированные компьютером, используются синтетические изображения человекоподобных персонажей, наложенные в цифровом формате на реальный или другой смоделированный материал фильма. К концу 2010-х годов с глубоким обучением искусственный интеллект был применен для синтеза изображений и видео , похожих на людей, без необходимости человеческой помощи после завершения этапа обучения, тогда как старый школьный 7D-маршрут требовал огромного количества человеческой работы..
Хронология человека синтеза образа
- В 1971 году Анри Гуро впервые сделал геометрию и компьютерную изображение человеческого лица. Моделью была его жена Сильви Гуро. 3D-модель представляла собой простую каркасную модель , и он применил шейдер Гуро, которым он наиболее известен, чтобы создать первое известное представление человеческого подобия на компьютере (см. изображения) . [3]
- Короткометражный 1972 года фильм «Компьютерная анимация руки» и Эдвина Кэтмалла Фреда Парка стал первым случаем, когда компьютерные изображения использовались в фильме для имитации движущегося человеческого облика. В фильме использовались компьютерная симуляция руки и лица (см. фильм здесь) .
- 1976 года В фильме «Мир будущего» были повторно использованы части «Компьютерно-анимированной руки» . на большом экране
- Клип 1983 года на песню Musique Non-Stop немецкой группы Kraftwerk вышел в эфир в 1986 году. Созданный художницей Ребеккой Аллен , он представляет собой нереалистично выглядящие, но четко узнаваемые компьютерные симуляции участников группы.
- Фильм 1994 года « Ворона» был первым фильмом, в котором использовалась цифровая композиция компьютерного моделирования лица на сценах, снятых с использованием дублера . Необходимость была музой, поскольку актер Брэндон Ли, игравший главного героя, трагически случайно погиб на сцене.
- В 1999 году Пол Дебевец и др. из USC запечатлели поле отражения человеческого лица с помощью своей первой версии световой сцены . Они представили свой метод на SIGGRAPH 2000. [4]
- В 2003 году зрительский дебют фотореалистичных человеческих образов состоялся в фильмах 2003 года «Матрица: Перезагрузка» в эпизоде жестокой драки , где до 100 агентов Смитов сражаются с Нео , а также в «Матричных революциях» , где в начале финального поединка агенту Смиту . бьют по скуле Нео оставил цифрового двойника неестественно невредимым. Бонусный DVD «Матричные революции» документирует и довольно подробно описывает процесс и использованные методы, включая захват движений лица и лимбальных захват движений , а также проецирование на модели.
- В 2003 году выпустила «Аниматрикс: Последний полет Осириса» человеческое — современное подобие, не совсем обманывающее зрителя компания Square Pictures .
- В 2003 году цифровое изображение Тоби Магуайра было создано для фильмов «Человек-паук 2» и «Человек-паук 3» компанией Sony Pictures Imageworks . [5]
- В 2005 году Лицо будущего» . был основан проект « [6] Университетом Сент-Эндрюса и лабораторией восприятия, финансируемой EPSRC . [7] На веб-сайте есть «Трансформер лиц», который позволяет пользователям трансформировать свое лицо в лицо любой этнической принадлежности и возраста , а также превращать свое лицо в картину (в стиле Сандро Боттичелли или Амедео Модильяни ). [8] Этот процесс достигается за счет объединения фотографии пользователя со средним лицом. [7]
- В 2009 году Дебевец и др. представила новые цифровые изображения, сделанные Image Metrics , на этот раз актрисы Эмили О'Брайен, чье отражение было запечатлено с помощью световой сцены USC 5. [9] Движение выглядит довольно убедительно по сравнению с неуклюжим сюжетом в «Аниматрикс: Последний полет Осириса» , который был самым современным в 2003 году, если фотореализм был намерением аниматоров.
- В 2009 году был создан цифровой двойник молодого Арнольда Шварценеггера, для фильма «Терминатор: Спасение» хотя конечный результат раскритиковали как неубедительный. Геометрия лица была заимствована по слепку Шварценеггера 1984 года.
- В 2010 году Walt Disney Pictures выпустила научно-фантастическое продолжение под названием «Трон: Наследие» с обновленным цифровым двойником актера Джеффа Бриджеса, играющего антагониста CLU .
- На выставке SIGGGRAPH 2013 Activision и Университет Южной Калифорнии представили «Цифровую Иру» в реальном времени, цифровое лицо, похожее на Ари Шапиро, ученого-исследователя ИКТ Университета Южной Калифорнии. [10] с использованием световой ступени X USC, разработанной Ghosh et al. как для поля отражения, так и для захвата движения. [11] Конечный результат, как предварительно вычисленный, так и рендеринг в реальном времени с использованием новейшего игрового графического процессора, показан здесь и выглядит довольно реалистично.
- В 2014 году Университета Южной Калифорнии Институт творческих технологий совместно со Смитсоновским институтом был создан с использованием новейшей мобильной световой сцены Университета Южной Калифорнии, на которой президент Барак Обама запечатлел свою геометрию, текстуры и отражательную способность. [12]
- В 2014 году Ян Гудфеллоу и др. представил принципы генеративно-состязательной сети . В начале 2018 года GAN попали в заголовки газет из-за разногласий по поводу дипфейков .
- Для 2015 года фильма «Форсаж 7» создала цифровой двойник актера Пола Уокера , погибшего в результате несчастного случая во время съемок, компания Weta Digital чтобы завершить работу над фильмом. [13]
- В 2016 году методы, позволяющие в существующем 2D-видео практически в реальном времени . имитировать выражения лица были убедительно продемонстрированы [14]
- В 2016 году был создан цифровой двойник Питера Кушинга для фильма «Изгой-один» , где он выглядел того же возраста, что и актер во время съемок оригинального фильма «Звездные войны» 1977 года .
- На выставке SIGGRAPH 2017 представили цифровую копию верхней части туловища Барака Обамы, управляемую звуком исследователи из Вашингтонского университета . (Просмотр) Он управлялся только голосовой дорожкой в качестве исходных данных для анимации после фазы обучения для получения синхронизации губ и более широкой информации о лице из обучающего материала, состоящего из 2D-видео со звуком. завершения [15]
- Конец 2017 г. [16] а в начале 2018 года всплыл спор о дипфейках , когда порновидео были обработаны с помощью глубокого машинного обучения, так что лицо актрисы было заменено мнением программного обеспечения о том, как будет выглядеть лицо другого человека в той же позе и освещении.
- На в 2018 году конференции разработчиков игр Epic Games и Tencent Games продемонстрировали «Сирену», цифровой двойник актрисы Бинцзе Цзян . Это стало возможным благодаря следующим технологиям: CubicMotion системе компьютерного зрения , 3Lateral системе лицевой оснастки . и системе захвата движения Vicon Демонстрация проходила практически в реальном времени со скоростью 60 кадров в секунду на Unreal Engine 4 . [17]
- В 2018 году на Всемирной интернет-конференции в Учжене агентство новостей Синьхуа представило двух цифровых двойников, похожих на настоящих ведущих новостей Цю Хао (китайский язык). [18] и Чжан Чжао (английский язык). Цифровые двойники были созданы совместно с Sogou . [19] Ни использованный синтез речи , ни жесты цифровых двойников якорей не были достаточно хороши, чтобы обмануть зрителя и заставить его принять их за реальных людей, изображенных телекамерой.
- В сентябре 2018 года Google добавила «непроизвольные синтетические порнографические изображения» в свой список запретов, что позволило любому запрашивать результаты блокировки поисковой системы, которые ложно изображают их как «обнаженных или в откровенно сексуальной ситуации». [20]
- В феврале 2019 года Nvidia открыла исходный код StyleGAN , новой генеративно-состязательной сети . [21] Сразу после этого Филип Ванг создал веб-сайт ThisPersonDoesNotExist.com с помощью StyleGAN, чтобы продемонстрировать, что неограниченное количество часто фотореалистичных портретов лиц людей может быть создано автоматически с использованием GAN. [22] StyleGAN от Nvidia был представлен в еще не рецензируемой статье в конце 2018 года. [22]
- в июне 2019 года На выставке CVPR MIT , которая синтезирует вероятные CSAIL представил систему под названием «Speech2Face: изучение лица за голосом» лица на основе просто записи голоса. Его обучали на большом количестве видеозаписей говорящих людей.
- С 1 июля 2019 г. [23] Вирджиния ввела уголовную ответственность за продажу и распространение несанкционированной синтетической порнографии, но не за ее изготовление. [24] как § 18.2–386.2 под названием «Незаконное распространение или продажа изображений другого лица; штраф. стал частью Кодекса штата Вирджиния . тексте закона говорится: « Любое лицо, которое с намерением принудить преследовать , В или запугать , злонамеренно распространяет или продает любые видеографические или неподвижные изображения, созданные любыми средствами, на которых изображено другое лицо, полностью обнаженное или находящееся в раздетом состоянии. с целью обнажить гениталии , лобковую область, ягодицы или женскую грудь , если такое лицо знает или имеет основания знать, что оно не имеет лицензии или разрешения на распространение или продажу таких видеографических или неподвижных изображений, виновно в совершении правонарушения . 1 класса » . [24] Идентичными законопроектами были законопроект Палаты представителей № 2678, представленный делегатом Маркусом Саймоном Палате делегатов Вирджинии 14 января 2019 года, а три дня спустя идентичный законопроект Сената № 1736 был внесен в Сенат Вирджинии сенатором Адамом Эббином .
- С 1 сентября 2019 года законопроект сената Техаса SB 751 о поправках вступили в силу к избирательному кодексу, предоставляющий кандидатам на выборах 30-дневный период защиты на выборах, в течение которого создание и распространение цифровых двойников или синтетических подделок кандидатов является правонарушением. В тексте закона предмет закона определяется как « видео, созданное с целью обмана, которое как бы изображает реального человека, совершающего действие, не произошедшее в действительности ». [25]
- В сентябре 2019 года Yle , финская общественная телерадиовещательная компания , показала результат экспериментальной журналистики — дипфейк действующего президента Саули Ниинистё в своей главной новостной передаче с целью осветить развивающиеся технологии дезинформации и проблемы, которые возникают из-за этого.
- 1 января 2020 г. [26] В Калифорнии вступил в силу закон штата AB-602, запрещающий производство и распространение синтетической порнографии без согласия изображенных людей. AB-602 предоставляет жертвам синтетической порнографии судебный запрет и создает правовые угрозы предусмотренного законом и штрафного ущерба для преступников, создающих или распространяющих синтетическую порнографию без согласия. Законопроект AB-602 был подписан губернатором Калифорнии Гэвином Ньюсомом 3 октября 2019 года, а его автором является Ассамблеи штата Калифорния член Марк Берман . [27]
- 1 января 2020 года вступил в силу китайский закон, требующий, чтобы на искусственно сфальсифицированных материалах было четкое указание о их фальшивости. Невыполнение этого требования может считаться преступлением, заявила Администрация киберпространства Китая на своем веб-сайте. Китай объявил об этом новом законе в ноябре 2019 года. [28] Китайское правительство, похоже, оставляет за собой право преследовать как пользователей, так и онлайн-видеоплатформы, не соблюдающие правила. [29] 12 ноября [дипфейк]
прорыв в фотореализме: отражения захват Ключевой
В 1999 году Пол Дебевец и др. из USC впервые осуществил захват отражения человеческого лица с помощью своей чрезвычайно простой световой сцены . Они представили свой метод и результаты на SIGGRAPH 2000. [4]
Научный прорыв потребовал обнаружения подповерхностной световой составляющей (имитационные модели слегка светятся изнутри), которую можно найти, зная, что свет, отраженный от слоя нефть-воздух, сохраняет свою поляризацию , а подповерхностный свет теряет поляризацию. Таким образом, оснащенный только подвижным источником света, подвижной видеокамерой, двумя поляризаторами и компьютерной программой, выполняющей чрезвычайно простые математические операции, был получен последний фрагмент, необходимый для достижения фотореализма. [4]
Для получения правдоподобного результата как свет, отраженный от кожи ( BRDF ), так и свет внутри кожи (особый случай BTDF ), которые вместе составляют BSDF необходимо захватить и смоделировать .
Захват [ править ]
- 3D- геометрия и текстуры фиксируются в 3D- модели с помощью метода 3D-реконструкции , такого как выборка объекта с помощью 3D-сканирования с помощью сканера RGB XYZ , такого как Arius3d или Cyberware (текстуры из фотографий, а не чистый сканер RGB XYZ), стереофотограмметрически. из синхронизированных фотографий или даже из достаточно повторяющихся и неодновременных фотографий . Цифровую скульптуру можно использовать для создания моделей частей тела, данные о которых невозможно получить, например, частей тела, покрытых одеждой.
- Для получения правдоподобных результатов также необходимо захватить поле отражательной способности или выбрать аппроксимацию из библиотек для формирования 7D-модели отражения цели.
Синтез [ править ]
Весь процесс создания цифровых двойников, то есть персонажей, настолько реалистичных и реалистичных, что их можно выдать за изображения людей, представляет собой очень сложную задачу, поскольку требует фотореалистичного моделирования , анимации, перекрестного сопоставления и визуализации динамики мягкого тела персонажа. человеческий облик.
Синтез с актером и подходящими алгоритмами применяется с помощью мощных компьютеров. Роль актера в синтезе состоит в том, чтобы позаботиться о имитации человеческих выражений при синтезе неподвижных изображений, а также движений человека при синтезе кинофильмов. Алгоритмы необходимы для моделирования законов физики и физиологии и соответствующего отображения моделей, их внешнего вида, движений и взаимодействия.
Часто моделирование и рендеринг на основе физики / физиологии (т. е. скелетная анимация ), так и моделирование и рендеринг на основе изображений в части синтеза используются как . Гибридные модели, использующие оба подхода, показали лучшие результаты по реалистичности и простоте использования. Целевая анимация морфинга снижает рабочую нагрузку, предоставляя контроль более высокого уровня, при котором различные выражения лица определяются как деформации модели, а выражение лица позволяет интуитивно настраивать выражения. Целевая анимация Morph может затем трансформировать модель между различными определенными выражениями лица или позами тела без особой необходимости вмешательства человека.
Использование карт смещения играет важную роль в получении реалистичного результата с мелкими деталями кожи, такими как поры и морщины размером до 100 мкм .
машинного Подход обучения
В конце 2010-х годов машинное обучение , а точнее генеративно-состязательные сети использовала NVIDIA (GAN), для создания случайных, но фотореалистичных человекоподобных портретов. Система, названная StyleGAN , была обучена на базе данных из 70 000 изображений с сайта-хранилища изображений Flickr . Исходный код был опубликован на GitHub в 2019 году. [30] Результаты работы генераторной сети на основе случайных входных данных были опубликованы на ряде веб-сайтов. [31] [32]
Аналогичным образом, с 2018 года технология дипфейков позволила GAN менять лица между актерами; В сочетании со способностью имитировать голоса GAN могут создавать фальшивые видео, которые кажутся убедительными. [33]
Приложения [ править ]
Основные области применения относятся к стоковой фотографии , синтетическим наборам данных , виртуальной кинематографии , компьютерным и видеоиграм , а также скрытым дезинформационным атакам . [34] [32] Некоторые ИИ для распознавания лиц используют изображения, сгенерированные другими ИИ, в качестве синтетических данных для обучения. [35]
Более того, некоторые исследования показывают, что это может иметь терапевтический эффект , поскольку « психологи и консультанты также начали использовать аватары для оказания терапии клиентам, имеющим фобии в анамнезе , травмы , зависимости, синдром Аспергера или социальную тревогу ». [36] Сильный отпечаток памяти и эффекты активации мозга, вызванные наблюдением за вашим цифровым двойником, называются эффектом двойника . [36] Эффект двойника может излечиться, когда скрытая дезинформационная атака становится объектом атаки как таковая.
Связанные вопросы [ править ]
Синтез речи практически неотличим от записи реального человеческого голоса с момента появления в 2016 году программного обеспечения для редактирования и генерации голоса Adobe Voco , прототип которого должен стать частью Adobe Creative Suite , и DeepMind WaveNet , прототипа. из Google. [37] Способность воровать голоса других людей и манипулировать ими вызывает очевидные этические проблемы. [38]
На конференции по нейронным системам обработки информации (NeurIPS) 2018 года исследователи из Google представили работу «Перенос обучения от проверки говорящего к синтезу текста в речь с несколькими динамиками», которая переносит обучение от проверки говорящего для достижения синтеза речи, что можно заставить звучать почти так же, как кто-либо, используя образец речи продолжительностью всего 5 секунд (послушайте) . [39]
Поиск изображений для обучения ИИ поднимает вопрос конфиденциальности, поскольку люди, которых используют для обучения, не давали согласия. [40]
Технология создания цифровых звуковых аналогов попала в руки преступников: в 2019 году исследователям Symantec стало известно о трех случаях использования технологии в преступных целях. [41] [42]
Это в сочетании с тем фактом, что (по состоянию на 2016 год) были достоверно продемонстрированы методы, позволяющие в существующих 2D-видео практически в реальном времени, подделывать выражения лица увеличивает нагрузку на ситуацию с дезинформацией. [14]
См. также [ править ]
- Актерская игра с захватом движения
- Интернет-манипулирование
- Медиасинтез
- Методы пропаганды
- Сбор 3D-данных и реконструкция объектов
- 3D-реконструкция из нескольких изображений
- Оценка 3D-позы в целом и оценка шарнирной позы тела, особенно для определения человеческого сходства.
- 4D реконструкция
- Отслеживание пальцев
- Распознавание жестов
- СтильGAN
Ссылки [ править ]
- ^ Физическая модель мышц для управления формой рта в IEEE Explore (требуется членство)
- ^ Реалистичная 3D-анимация лица в телеконференциях в виртуальном пространстве на IEEE Explore (требуется членство)
- ^ «Компьютерные изображения: приз долголетия за штриховку Гуро» . 14 сентября 2008 г.
- ^ Jump up to: Перейти обратно: а б с Дебевец, Пол (2000). «Получение поля отражения человеческого лица» . Материалы 27-й ежегодной конференции по компьютерной графике и интерактивным технологиям - SIGGRAPH '00 . АКМ. стр. 145–156. дои : 10.1145/344779.344855 . ISBN 978-1581132083 . S2CID 2860203 . Проверено 24 мая 2017 г.
- ^ Пигин, Фредерик. «Конспекты курса цифрового клонирования лица Siggraph 2005» (PDF) . Проверено 24 мая 2017 г.
- ^ «Лицо-трансформер Сент-Эндрюс» . Бесполезный шкаф . 30 января 2005 г. Проверено 7 декабря 2020 г. .
- ^ Jump up to: Перейти обратно: а б Уэст, Марк (4 декабря 2007 г.). «Изменение облика науки» . Плюс журнал . Проверено 7 декабря 2020 г. .
- ^ Годдард, Джон (27 января 2010 г.). «Многоликость расовых исследований» . thestar.com . Проверено 7 декабря 2020 г. .
- ^ В этом видео выступления TED в 00:04:59 вы можете увидеть два клипа: один с настоящей Эмили, снятый настоящей камерой, и другой с цифровым двойником Эмили, снятым с помощью симуляции камеры . сложно сказать . Брюса Лоумена сканировали с помощью 6-го этапа освещения USC в неподвижном положении, а также записывали его бег на беговой дорожке . Многие, многие цифровые двойники Брюса бегают бегло и естественно, глядя на финальную часть видео выступления TED.
- ^ ReForm – Голливуд создает цифровые клоны (youtube). Проект «Создатели». 24 мая 2017 г.
- ^ Дебевец, Пол. «Цифровой Ира SIGGRAPH 2013 в реальном времени» . Архивировано из оригинала 21 февраля 2015 года . Проверено 24 мая 2017 г.
- ^ «Сканирование и печать 3D-портрета президента Барака Обамы» . Университет Южной Калифорнии. 2013 . Проверено 24 мая 2017 г.
- ^ Джардина, Кэролайн (25 марта 2015 г.). « Форсаж 7» и как Weta Питера Джексона создала цифрового Пола Уокера» . Голливудский репортер . Проверено 24 мая 2017 г.
- ^ Jump up to: Перейти обратно: а б Тис, Юстус (2016). «Face2Face: захват лиц в реальном времени и реконструкция RGB-видео» . Учеб. Компьютерное зрение и распознавание образов (CVPR), IEEE . Проверено 24 мая 2017 г.
- ^ Суваджанакорн, Супасорн; Зейтц, Стивен; Кемельмахер-Шлизерман, Ира (2017), Synthesizing Obama: Learning Lip Sync from Audio , Вашингтонский университет , получено 2 марта 2018 г.
- ^ Реттгерс, Янко (21 февраля 2018 г.). «Порнопродюсеры предлагают помочь Голливуду удалить дипфейковые видео» . Разнообразие . Проверено 28 февраля 2018 г.
- ^ Такахаши, декан (21 марта 2018 г.). «Epic Games демонстрирует потрясающего цифрового человека в реальном времени с помощью демо-версии Siren» . ВенчурБит . Проверено 10 сентября 2018 г.
- ^ Куо, Лили (9 ноября 2018 г.). «Первый в мире ведущий новостей об искусственном интеллекте представлен в Китае» . TheGuardian.com . Проверено 9 ноября 2018 г.
- ^ Гамильтон, Изобель Ашер (9 ноября 2018 г.). «Китай создал, как он утверждает, первую ведущую новостей об искусственном интеллекте — смотрите это в действии здесь» . Бизнес-инсайдер . Проверено 9 ноября 2018 г.
- ^ Харвелл, Дрю (30 декабря 2018 г.). «Фейковые порновидео используются в качестве оружия для преследования и унижения женщин: «Каждый является потенциальной мишенью» » . Вашингтон Пост . Проверено 14 марта 2019 г.
В сентябре [2018 года] Google добавила в свой запретный список «принудительные синтетические порнографические изображения».
- ^ «Генератор гиперреалистичных лиц NVIDIA с открытым исходным кодом StyleGAN» . Medium.com . 9 февраля 2019 года . Проверено 3 октября 2019 г.
- ^ Jump up to: Перейти обратно: а б Паес, Дэнни (13 февраля 2019 г.). «Этот человек не существует — лучший одноразовый веб-сайт 2019 года» . Инверсия . Проверено 5 марта 2018 г.
- ^ «Новые законы штата вступают в силу 1 июля» . 24 июня 2019 г.
- ^ Jump up to: Перейти обратно: а б «§ 18.2–386.2. Незаконное распространение или продажа изображений другого лица; штраф» . Вирджиния . Проверено 1 января 2020 г.
- ^ «О создании уголовной ответственности за изготовление вводящего в заблуждение видео с целью повлиять на исход выборов» . Техас . 14 июня 2019 года . Проверено 2 января 2020 г.
В этом разделе «дипфейковое видео» означает видео, созданное с целью обмана и изображающее реального человека, совершающего действие, не произошедшее в действительности.
- ^ Джонсон, Р.Дж. (30 декабря 2019 г.). «Вот новые законы Калифорнии, вступающие в силу в 2020 году» . КФИ . iHeartMedia . Проверено 1 января 2020 г.
- ^ Михальчик, Кэрри (4 октября 2019 г.). «Законы Калифорнии направлены на борьбу с дипфейками в политике и порнографии» . cnet.com . CNET . Проверено 14 октября 2019 г.
- ^ «Китай стремится искоренить фейковые новости и дипфейки с помощью новых правил онлайн-контента» . Reuters.com . Рейтер . 29 ноября 2019 года . Проверено 8 декабря 2019 г.
- ^ Статт, Ник (29 ноября 2019 г.). «Китай считает уголовным преступлением публикацию дипфейков или фейковых новостей без раскрытия информации» . Грань . Проверено 8 декабря 2019 г.
- ^ Синхронизировано (9 февраля 2019 г.). «Генератор гиперреалистичных лиц NVIDIA с открытым исходным кодом StyleGAN» . Синхронизировано . Проверено 4 августа 2020 г.
- ^ Веб-сайт публичной демонстрации StyleGAN
- ^ Jump up to: Перейти обратно: а б Портер, Джон (20 сентября 2019 г.). «100 000 бесплатных фотографий, созданных искусственным интеллектом, привлекли внимание компаний, занимающихся стоковыми фотографиями» . Грань . Проверено 7 августа 2020 г.
- ^ «Что такое дипфейк?» . PCMAG.com . Март 2020 года . Проверено 8 июня 2020 г.
- ^ Харвелл, Дрю. «Приложениям для знакомств нужны женщины. Рекламодателям нужно разнообразие. Компании, занимающиеся искусственным интеллектом, предлагают решение: фальшивые люди» . Вашингтон Пост . Проверено 4 августа 2020 г.
- ^ «Нейронным сетям для обучения нужны данные. Даже если они поддельные» . Журнал Кванта . 11 декабря 2023 г. Проверено 18 июня 2023 г.
- ^ Jump up to: Перейти обратно: а б Мерфи, Саманта (2023). «Scientific American: ваш аватар, ваш гид» (.pdf) . Scientific American/Университет Стэнфорда . Проверено 11 декабря 2023 г.
- ^ «WaveNet: генеративная модель для необработанного аудио» . Deepmind.com . 8 сентября 2016 года. Архивировано из оригинала 27 мая 2017 года . Проверено 24 мая 2017 г.
- ^ «Adobe Voco «Photoshop для голоса» вызывает беспокойство» . BBC.com . Би-би-си . 7 ноября 2016 г. Проверено 5 июля 2016 г.
- ^ Цзя, Йе; Чжан, Ю; Вайс, Рон Дж. (12 июня 2018 г.), «Перенос обучения от проверки говорящего к синтезу речи с несколькими говорящими», Достижения в области нейронных систем обработки информации , 31 : 4485–4495, arXiv : 1806.04558 , Bibcode : 2018arXiv180604558J
- ^ Рэйчел Мец (19 апреля 2019 г.). «Если ваше изображение размещено в Интернете, возможно, оно тренирует ИИ для распознавания лиц» . CNN . Проверено 4 августа 2020 г.
- ^ «Фальшивые голоса помогают киберпреступникам украсть деньги » . bbc.com . Би-би-си . 8 июля 2019 года . Проверено 16 апреля 2020 г.
- ^ Дрю, Харвелл (16 апреля 2020 г.). «Сначала искусственный интеллект: программное обеспечение, имитирующее голос, как сообщается, использовалось при крупной краже» . Вашингтон Пост . Проверено 8 сентября 2019 г.