15.ai

15.ai
Тип сайта	Искусственный интеллект , синтез речи , машинное обучение , глубокое обучение
Доступно в	Английский
Основатель(и)	15
URL-адрес	15 .есть
Коммерческий	Нет
Регистрация	Никто
Запущен	Первый выпуск : 12 марта 2020 г .; 4 года назад ; Стабильный выпуск : v24.2.1 / сентябрь 2021 г .; 2 года назад
Текущий статус	На техническом обслуживании

15.ai — это некоммерческое бесплатное искусственного интеллекта веб-приложение , которое генерирует естественные эмоциональные изображения высокой точности. ^[а] голосовое преобразование текста в речь множества вымышленных персонажей из различных медиа-источников. ^[4]^[5]^[6]^[7] Проект, разработанный исследователем Массачусетского технологического института под псевдонимом 15 , использует комбинацию алгоритмов синтеза звука , синтеза речи глубоких нейронных сетей и моделей анализа настроений для генерации и обслуживания эмоциональных голосов персонажей быстрее, чем в реальном времени, особенно голосов с очень небольшим количество обучаемых данных.

Запущенный в начале 2020 года, 15.ai начинался как доказательство концепции демократизации . озвучки и дубляжа с использованием технологий ^[8] Его бесплатный и некоммерческий характер (с единственным условием: при использовании проекта должна быть указана соответствующая информация), простота использования, отсутствие требований к регистрации учетной записи пользователя и существенные улучшения текущих реализаций преобразования текста в речь были высоко оценены пользователями; ^[5]^[4]^[6] однако некоторые критики и актеры озвучивания ставят под сомнение законность и этичность оставления такой технологии общедоступной и легкодоступной. ^[8]^[9]^[10]

15.ai , ставший толчком к популяризации клонирования голоса искусственного интеллекта (также известного как аудиодипфейки ) при создании контента и первым общедоступным проектом синтеза голоса искусственного интеллекта, включающим использование существующих популярных вымышленных персонажей, оказал значительное влияние на несколько интернет- фандомов , в первую очередь фандомы My Little Pony: Friendship Is Magic , Team Fortress 2 и SpongeBob SquarePants . Кроме того, 15.ai вдохновил на использование проекта 4chan Pony Preservation Project в других генеративного искусственного интеллекта . проектах ^[11]^[12]

С ростом популярности 15.ai появилось несколько коммерческих альтернатив, что привело к случаям неправильной атрибуции и кражи. В январе 2022 года было обнаружено, что Voiceverse NFT , компания, о актер озвучивания Трой Бейкер сотрудничестве с которой объявил , занималась плагиатом работы 15.ai как части своей платформы. ^[13]^[14]^[15]

В сентябре 2022 года, через год после последнего стабильного выпуска, 15.ai был временно закрыт в рамках подготовки к будущему обновлению. По состоянию на август 2024 года веб-сайт все еще недоступен, а последнее сообщение 15 датировано февралем 2023 года. ^[16]

Функции

HAL 9000 , известный своим зловещим роботизированным голосом, — один из доступных персонажей на 15.ai. ^[4]

В число доступных персонажей входят GLaDOS и Уитли из Portal , персонажи из Team Fortress 2 , Сумеречная Искорка и ряд главных, второстепенных и второстепенных персонажей из My Little Pony: Friendship Is Magic , Губка Боб из SpongeBob SquarePants , Дарья Моргендорфер и Джейн Лейн из Daria , Десятый Доктор из «Доктора Кто» , HAL 9000 из «Космической одиссеи 2001», Рассказчик из «The Stanley Parable» , для Wii U/3DS / Switch Диктор Super Smash Bros. (ранее), Карл Брутананадилевски из Aqua Teen Hunger Force , Стивен Вселенная из Стивен Вселенная , Дэн из Dan Vs. и Санс из Undertale . ^[12]^[11]^[17]^[18]

Модель глубокого обучения , используемая приложением, является недетерминированной : каждый раз, когда речь генерируется из одной и той же текстовой строки, интонация речи будет немного отличаться. Приложение также поддерживает ручное изменение эмоций сгенерированной строки с помощью эмоциональных контекстуализаторов (термин, придуманный в рамках этого проекта), предложения или фразы, передающей эмоции дубля, которые служат руководством для модели во время вывода. ^[11]^[12]Эмоциональные контекстуализаторы — это представления эмоционального содержания предложения, выведенные с помощью полученных с помощью передачи, смайлов, встраивания глубокой нейронной сети, с использованием DeepMoji, алгоритма анализа настроений разработанного MIT Media Lab в 2017 году. ^[19]^[20] DeepMoji был обучен на 1,2 миллиардах случаев появления смайлов в данных Твиттера с 2013 по 2017 год, и было обнаружено, что он превосходит людей в правильном определении сарказма в твитах и других онлайн-способах общения. ^[21]^[22]^[23]

15.ai использует модель с несколькими динамиками — сотни голосов обучаются одновременно, а не последовательно, что сокращает необходимое время обучения и позволяет модели изучать и обобщать общий эмоциональный контекст, даже для голосов, не подвергающихся воздействию такого эмоционального контекста. ^[24] Следовательно, весь состав персонажей в приложении основан на одной обученной модели, а не на нескольких моделях с одним говорящим, обученных на разных наборах данных. ^[25] Лексикон , используемый 15.ai, был взят из различных интернет-источников, включая Оксфордские словари , Викисловарь , Словарь произношения CMU , 4chan , Reddit и Twitter . Произношение незнакомых слов автоматически определяется с использованием фонологических правил, изученных моделью глубокого обучения. ^[11]

Приложение поддерживает упрощенную версию набора английских фонетических транскрипций, известную как ARPABET, для исправления неправильного произношения или учета гетеронимов — слов, которые пишутся одинаково, но произносятся по-разному (например, слово read , которое может произноситься как / ˈ r ɛ d / или / ˈ r iː d / в зависимости от времени ). Хотя оригинальные коды ARPABET, разработанные в 1970-х годах Агентством перспективных исследовательских проектов, поддерживают 50 уникальных символов для обозначения и различения английских фонем. ^[26] ( Соглашение ARPABET словаря произношений CMU набор кодов транскрипции, за которыми следует 15.ai ^[11]) сокращает набор символов до 39 фонем за счет объединения аллофонических фонетических реализаций в единый стандарт (например, AXR/ER; UX/UW) и использование нескольких общих символов вместе для замены слоговых согласных (например, EN/AH0 N). ^[27]^[28] Строки ARPABET можно вызвать в приложении, заключив строку фонем в фигурные скобки внутри поля ввода (например, {AA1 R P AH0 B EH2 T} для обозначения / ˈ ɑːr p ə ˌ b ɛ t / , произношения слова ARPABET ). ^[11]

Ниже приводится таблица фонем, используемых 15.ai и Словарем произношения CMU: ^[29]

гласные
АРПАБЕТ	руп.	НАСИЛИЕ	Пример
`AA`	ах	ɑ	странный
`AE`	а	ой	в
`AH0`	а	а	о
`AH`	в, эээ	ʌ	хижина
`AO`	хорошо	ɔ	должен
`AW`	ой	а'	корова
`AY`	глаз	аа	скрывать
`EH`	э, э	е	Э д

гласные
АРПАБЕТ	руп.	НАСИЛИЕ	Пример
`ER`	ударь , муж	ɝ , ɚ	повредить
`EY`	является	еɪ	ел
`IH`	я , я	ɪ	это
`IY`	да	я	есть
`OW`	ой	о''	оа т
`OY`	ООО	ɔɪ	Той ой
`UH`	он	ʊ	капюшон
`UW`	и	в	два

Стресс
АБ	Описание
0	Никакого стресса
1	Первичный стресс
2	Вторичный стресс

Согласные
АРПАБЕТ	руп.	НАСИЛИЕ	Пример
`B`	б	б	быть
`CH`	ч , чч	тʃ	сыр
`D`	д	д	д э
`DH`	д	д	ты
`F`	ж	ж	платеж
`G`	г	ɡ	зеленый
`HH`	час	час	он
`JH`	дж	дʒ	ну и дела ee

Согласные
АРПАБЕТ	руп.	НАСИЛИЕ	Пример
`K`	к	к	ключ
`L`	л	л	я да
`M`	м	м	мне
`N`	н	н	колено
`NG`	из	ŋ	пи нг
`P`	п	п	пи пи
`R`	р	р	читать
`S`	с , сс	с	море

Согласные
АРПАБЕТ	руп.	НАСИЛИЕ	Пример
`SH`	ш	ʃ	она
`T`	т	т	чай
`TH`	й	я	эта эта
`V`	v	v	ви
`W`	ш , что	В	мы
`Y`	и	дж	урожай
`Z`	С	С	з ее
`ZH`	zh	ʒ	захват

Фон

Синтез речи

В 2016 году с предложением DeepMind компании WaveNet модели синтеза речи на основе глубокого обучения начали набирать популярность как метод моделирования сигналов и генерации человеческой речи. ^[30]^[31]^[3]^[8] Tacotron2, архитектура нейронной сети для синтеза речи, разработанная Google AI , была опубликована в 2018 году и требовала десятков часов аудиоданных для создания разборчивой речи; при обучении в течение 2 часов речи модель была способна воспроизводить разборчивую речь посредственного качества, а при обучении в течение 36 минут речи модель не могла воспроизводить разборчивую речь. ^[32]^[33]

В течение многих лет сокращение объема данных, необходимых для обучения реалистичной высококачественной модели преобразования текста в речь, было основной целью научных исследователей в области синтеза речи с глубоким обучением. ^[34]^[35] Разработчик 15.ai утверждает, что всего 15 секунд данных достаточно, чтобы клонировать голос до человеческих стандартов, а это значительное сокращение объема требуемых данных. ^[36]

Материалы, защищенные авторским правом, в глубоком обучении

Знаменательное дело между Google и Гильдией авторов в 2013 году постановило, что Google Книги — сервис, который осуществляет поиск по полному тексту печатных книг, защищенных авторским правом, — является преобразовательным , тем самым отвечая всем требованиям добросовестного использования. ^[37] Это дело создало важный юридический прецедент в области глубокого обучения и искусственного интеллекта: использование материалов, защищенных авторским правом, для обучения дискриминационной модели или некоммерческой генеративной модели было признано законным. Законность коммерческих генеративных моделей, обученных с использованием материалов, защищенных авторским правом, все еще обсуждается; из-за того, что модели машинного обучения представляют собой «черный ящик», любые обвинения в нарушении авторских прав посредством прямой конкуренции будет трудно доказать. ^{[ нужна ссылка ]}

Разработка

15.ai был разработан и создан анонимным учёным-исследователем из Массачусетского технологического института, известным под псевдонимом 15 . ^[38]

Согласно сообщениям разработчика на Hacker News , эксплуатация 15.ai обходится в несколько тысяч долларов в месяц; они способны поддержать проект благодаря успешному выходу стартапа . ^[39] Разработчик заявил, что во время учебы в Массачусетском технологическом институте ему платили минимальную почасовую ставку за работу над соответствующим проектом (приблизительно 14 долларов в час в Массачусетсе). ^[40]), который в конечном итоге превратился в 15.ai. Они также заявили, что демократизация технологии клонирования голоса — не единственная функция сайта; в ответ на вопрос пользователя, можно ли провести исследование без общедоступного веб-сайта, разработчик написал:

[...] Веб-сайт имеет несколько целей. Это служит доказательством концепции платформы, которая позволяет любому создавать контент , даже если он не может нанять кого-то для озвучивания своих проектов.
Он также демонстрирует прогресс моих исследований в гораздо более увлекательной форме — имея возможность использовать реальную модель, вы можете обнаружить в ней такие вещи, о которых даже я не подозревал (например, заставить персонажей издавать задыхающиеся звуки или стоны, используя расстановка запятых между определенными фонемами).
Это также не позволяет мне выбирать лучшие результаты и демонстрировать только те, которые работают (что, я считаю, является большой проблемой, характерной для современного машинного обучения — это неискренне и вводит в заблуждение). Возможность взаимодействовать с моделью без фильтра позволяет пользователю точно оценить, насколько хороша текущая работа по номинальной стоимости.
— 15ai, Хакерские новости ^[39]

Алгоритм, используемый проектом для облегчения клонирования голосов с минимальным количеством жизнеспособных данных, получил название DeepThroat. ^[41] ( двусмысленный смысл в отношении синтеза речи с использованием глубоких нейронных сетей и полового акта глубокого минета ). Проект и алгоритм, первоначально задуманные как часть программы студенческих исследовательских возможностей Массачусетского технологического института , находились в разработке в течение многих лет до первого выпуска приложения. ^[11]

Разработчик также тесно сотрудничал с проектом Pony Preservation Project из /mlp/, My Little Pony доски на 4chan . Проект Pony Preservation Project , начавшийся в 2019 году, представляет собой «совместную работу /mlp/ по созданию и хранению наборов данных о пони» с целью создания приложений в области искусственного интеллекта. ^[42]^[43]^[44] Голоса « Дружба – это чудо» на 15.ai были обучены на большом наборе данных, собранном краудсорсинговым проектом Pony Preservation Project: аудио и диалоги из сериала и сопутствующих медиа, включая все девять сезонов «Дружба – это чудо» , фильм 2017 года , спин-оффы , утечки и различный другой контент, озвученный теми же актерами озвучивания, был проанализирован , расшифрован вручную и обработан для удаления фонового шума. По словам разработчика, коллективные усилия и конструктивная критика со стороны Pony Preservation Project были неотъемлемой частью разработки 15.ai. ^[42]

Кроме того, разработчик заявил, что логотип 15.ai, на котором изображен робот Сумеречная Искорка , является данью уважения тому факту, что ее голос (в первоначальном исполнении Тары Стронг ) был незаменим для реализации эмоциональных контекстуализаторов. ^[39]

Прием

15.ai был встречен в основном положительно. Лиана Рупперт из Game Informer охарактеризовала 15.ai как «упрощенно блестящий». ^[5] Лорен Мортон из Rock, Paper, Shotgun и Натали Клейтон из PCGamer назвали это «захватывающим». ^[7]^[6] и Хосе Вильялобос из LaPS4 написал, что он «работает так же легко, как кажется». ^[17]^[б] Пользователи высоко оценили возможность легко создавать аудиозапись популярных персонажей, которая звучит правдоподобно для тех, кто не знает, что голоса были синтезированы искусственным интеллектом: Зак Звизен из Kotaku сообщил, что «[его] подруга была убеждена, что это новая голосовая линия из GLaDOS голоса ». актриса Эллен МакЛейн », ^[4] в то время как Риональди Чандрасета из Towards Data Science написал, что после просмотра видео на YouTube с голосами популярных персонажей, созданных 15.ai, «[его] первой мыслью было то, что создатель видео использовалcameo.com для оплаты новых диалогов от оригинальных актеров озвучивания». и заявил, что «качество голосов, озвученных 15.ai, намного превосходит [своих конкурентов]».

Прием также получил широкое признание за рубежом, особенно в Японии . Такаюки Фурусима из Den Fami Нико Геймер охарактеризовал 15.ai как «волшебный», а Юки Куросава из Automaton Media назвал его «революционным». ^[12]^[11]

Ученый-компьютерщик и предприниматель Эндрю Нг прокомментировал в своем информационном бюллетене The Batch , что технология, лежащая в основе 15.ai, может быть «чрезвычайно продуктивной» и может «совершить революцию в использовании виртуальных актеров »; однако он также отметил, что «синтезирование голоса человеческого актера без согласия, возможно, неэтично и, возможно, незаконно» и потенциально может привести к случаям выдачи себя за другое лицо и мошенничества . ^[8]^[9] В своем блоге Revolution Marginal экономист Тайлер Коуэн назвал 15 одним из «самых недооцененных талантов в области искусственного интеллекта и машинного обучения». ^[45]

Влияние

Создание фандомного контента

15.ai часто использовался для создания контента в различных фандомах , включая My Little Pony: Friendship Is Magic фандом , Team Fortress 2 фандом , фандом Portal и фандом SpongeBob SquarePants , с многочисленными видео и проектами, содержащими выступления 15 .ai стал вирусным . ^[4]^[5]

Фэндом My Little Pony: Friendship Is Magic стал свидетелем возрождения создания видео и музыкального контента, что стало прямым результатом вдохновения на новый жанр контента, созданного фанатами с помощью искусственного интеллекта. Некоторые фанфики были адаптированы в полностью озвученные «эпизоды»: «Налоговые льготы» — это 17-минутная анимационная видеоверсия написанной фанатами истории, опубликованной в 2014 году, в которой используются голоса, сгенерированные из 15.ai, со звуковыми эффектами и редактированием звука , имитируя эпизодический стиль первых сезонов « Дружбы – это чудо» . ^[46]^[47]

Вирусные видеоролики из фандома Team Fortress 2 , в которых используются голоса из 15.ai, включают Spy is a Furry (всего несколько видеороликов набрали более 3 миллионов просмотров на YouTube). ^{[yt 1]}^{[yt 2]}^{[yt 3]}) и The RED Bread Bank , оба из которых вдохновили Source Filmmaker на создание анимационных видеороликов. ^[11] Другие фандомы использовали голоса с 15.ai для создания вирусных видеороликов. По состоянию на июль 2022 г. ^[update]вирусное видео Among Us Struggles (в котором используются голоса из Friendship Is Magic ) имеет более 5,5 миллионов просмотров на YouTube; ^{[yt 4]} YouTubers , TikTokers и стримеры Twitch также использовали 15.ai для своих видео, таких как видео FitMC об истории 2b2t — одного из старейших работающих серверов Minecraft — и видео datpon3 TikTok с участием главных героев Friendship Is Magic , которые 1,4 миллиона и 510 тысяч просмотров соответственно. ^{[yt 5]}^{[тт 1]}

Некоторые пользователи создали виртуальных помощников с искусственным интеллектом, используя 15.ai и внешнее программное обеспечение для голосового управления. Один пользователь в Твиттере создал личного настольного помощника, вдохновленного GLaDOS, используя диалог, сгенерированный 15.ai, в тандеме с системой голосового управления VoiceAttack, при этом программа может загружать приложения, произносить соответствующие случайные диалоги и благодарить пользователя в ответ на действия. . ^[11]^[12]

Трой Бейкер / Скандал с плагиатом Voiceverse NFT

Трой Бейкер
@TroyBakerVA
Я сотрудничаю с @VoiceverseNFT, чтобы изучить способы, с помощью которых мы могли бы вместе предоставить новым авторам новые инструменты для создания новых вещей и дать каждому возможность владеть и инвестировать в создаваемые ими интеллектуальные права. Нам всем есть что рассказать. Вы можете ненавидеть.Или вы можете создать.Что это будет?
14 января 2022 г. ^{[твит 1]}

В декабре 2021 года разработчик 15.ai написал в Твиттере , что не заинтересован во включении невзаимозаменяемых токенов (NFT) в свою работу. ^[10]^[14]^{[твит 2]}

14 января 2022 года было обнаружено, что Voiceverse NFT, компания, о сотрудничестве с которой видеоигр и аниме дубляжа актер Трой Бейкер объявил о своем партнерстве, в рамках своей маркетинговой кампании занималась плагиатом голосовых реплик, созданных на 15.ai. ^[13]^[14]^[15] Файлы журналов показали, что Voiceverse сгенерировал аудиозапись Сумеречная Искорка и Радуги Дэш из шоу « Мой маленький пони: Дружба – это чудо» с помощью 15.ai, подстроил их так, чтобы они звучали неузнаваемо по сравнению с оригинальными голосами, и присвоил их без должного упоминания ложным продавать свою собственную платформу — нарушение условий обслуживания 15.ai. ^[36]^[10]^[15]

15
@fifteenai
Мне сообщили, что вышеупомянутый вокальный синтезатор NFT активно пытается присвоить мою работу в свою пользу.Покопавшись в файлах журналов , я обнаружил доказательства того, что некоторые голоса, за которые они приписывают себе заслугу, действительно были созданы с моего собственного сайта.
14 января 2022 г. ^{[твит 3]}

Происхождение голосовой вселенной
@VoiceverseNFT
Привет @fifteenai, нам очень жаль. Голос действительно был взят с вашей платформы, которую наша маркетинговая команда использовала без должного упоминания. Команда Chubbiverse ничего об этом не знает. Мы позаботимся о том, чтобы это никогда не повторилось.
14 января 2022 г. ^{[твит 4]}

15
@fifteenai
Иди на хуй.
14 января 2022 г. ^{[твит 5]}

За неделю до объявления о партнерстве с Бейкером Voiceverse опубликовал (ныне удаленный) пост в Твиттере, непосредственно отвечая на (ныне удаленный) видеоролик, опубликованный Chubbiverse — платформой NFT, с которой сотрудничала Voiceverse, — демонстрирующий созданный искусственным интеллектом видео. голос и заявил, что он был создан с использованием платформы Voiceverse, отметив : «Интересно, кто создал для этого голос? ;)» ^[13]^{[твит 6]} Через несколько часов после того, как стало известно о партнерстве, разработчик 15.ai был предупрежден другим пользователем Твиттера, который спросил его мнение о партнерстве, на что он предположил, что это «похоже на мошенничество». ^{[твит 7]}- опубликовали скриншоты файлов журналов, доказывающие, что пользователь веб-сайта (с отредактированным IP-адресом ) ввел точные слова, произнесенные голосом ИИ в видео, опубликованном Chubbiverse, ^{[твит 8]} и впоследствии напрямую ответил на претензию Voiceverse, написав в Твиттере: «Конечно, не ты :)». ^[36]^[14]^{[твит 9]}

После этого твита Voiceverse призналась в плагиате голосов с 15.ai в качестве своей собственной платформы, заявив, что их маркетинговая команда использовала проект, не указав должного значения, и что «команда Chubbiverse [не знала] об этом». В ответ на признание 15 написали в Твиттере: « Иди на хуй ». ^[13]^[14]^[15]^[36] Последний твит стал вирусным , набрав более 75 000 лайков и 13 000 ретвитов с множеством репостов. ^{[твит 10]}^{[твит 11]}^{[твит 12]}

Первоначальное партнерство между Бейкером и Voiceverse было встречено резкой негативной реакцией и повсеместно негативным приемом. ^[13] Критики подчеркнули воздействие на окружающую среду и возможность мошенничества, связанного с продажей NFT. ^[48] Комментаторы также указали на иронию первого твита Бейкера, объявляющего о партнерстве, которое закончилось словами: «Вы можете ненавидеть. Или вы можете создавать. Что это будет?», за несколько часов до публичного раскрытия того, что рассматриваемая компания вместо этого прибегла к краже. создания собственного продукта. Бейкер ответил, что он ценит людей, которые делятся своими мыслями, и их ответы «заставляют [ема] о многом задуматься». ^[49]^[50] Он также признал, что фраза «ненависть/создать» в его первоначальном твите могла быть «немного враждебной», и попросил фанатов в социальных сетях простить его. ^[14]^[51] Две недели спустя, 31 января, Бейкер объявил, что прекращает сотрудничество с Voiceverse. ^[52]^[53]^[54]

Реакция актеров озвучивания

Некоторые актеры озвучивания публично осудили использование технологии клонирования голоса. В число названных причин входят опасения по поводу выдачи себя за другое лицо и мошенничества , несанкционированного использования голоса актера в порнографии , а также возможности использования ИИ для того, чтобы сделать актеров озвучивания устаревшими . ^[8]^[9]^[10]

См. также

Примечания

^ Фраза «высокая точность» в исследованиях TTS часто используется для описания вокодеров , которые способны восстанавливать сигналы с очень небольшими искажениями, и не является просто синонимом «высокого качества». См. документы о HiFi-GAN, ^[1] ГАН-ТТС, ^[2] и параллельный WaveNet ^[3] за беспристрастные примеры такого использования терминологии.
^ Перевод оригинальной цитаты, написанной на испанском языке: «Адрес — 15.AI, и он работает так же просто, как кажется». ^[17]

Ссылки

Примечания

^ Конг, Джунгил (2020). «HiFi-GAN: генеративно-состязательные сети для эффективного и высококачественного синтеза речи». arXiv : 2010.05646v2 [ cs ].
^ Бинковский, Николай (2019). «Высококачественный синтез речи с состязательными сетями». arXiv : 1909.11646v2 [ cs ].
^ Jump up to: ^а ^б ^с ван ден Оорд, Аарон; Ли, Яже; Бабушкин Игорь (12 ноября 2017 г.). «Высококачественный синтез речи с помощью WaveNet» . ДипМайнд . Архивировано из оригинала 18 июня 2022 года . Проверено 5 июня 2022 г.
^ Jump up to: ^а ^б ^с ^д ^и Цвизен, Зак (18 января 2021 г.). «Веб-сайт позволяет заставить GLaDOS говорить все, что вы хотите» . Котаку . Архивировано из оригинала 17 января 2021 года . Проверено 18 января 2021 г.
^ Jump up to: ^а ^б ^с ^д Руперт, Лиана (18 января 2021 г.). «Заставьте GLaDOS из Portal и других любимых персонажей говорить самые странные вещи с помощью этого приложения» . Игровой информер . Игровой информер . Архивировано из оригинала 18 января 2021 года . Проверено 18 января 2021 г.
^ Jump up to: ^а ^б ^с Клейтон, Натали (19 января 2021 г.). «Заставьте актеров TF2 декламировать старые мемы с помощью этого инструмента преобразования текста в речь ИИ» . ПК-геймер . Архивировано из оригинала 19 января 2021 года . Проверено 19 января 2021 г.
^ Jump up to: ^а ^б Мортон, Лорен (18 января 2021 г.). «Вкладывайте слова в уста игровых персонажей с помощью этого увлекательного инструмента преобразования текста в речь» . Камень, Бумага, Дробовик . Архивировано из оригинала 18 января 2021 года . Проверено 18 января 2021 г.
^ Jump up to: ^а ^б ^с ^д ^и Нг, Эндрю (1 апреля 2020 г.). «Клонирование голоса для масс» . Пакет . Архивировано из оригинала 7 августа 2020 года . Проверено 5 апреля 2020 г.
^ Jump up to: ^а ^б ^с Нг, Эндрю (7 марта 2021 г.). «Еженедельный информационный бюллетень № 83» . Пакет . Архивировано из оригинала 26 февраля 2022 года . Проверено 7 марта 2021 г.
^ Jump up to: ^а ^б ^с ^д Лопес, Уле (16 января 2022 г.). «Фирма NFT, поддерживаемая Троем Бейкером, признает, что без разрешения использовала голосовые линии, взятые из другого сервиса» . Wccftech . Архивировано из оригинала 16 января 2022 года . Проверено 7 июня 2022 г.
^ Jump up to: ^а ^б ^с ^д ^и ^ж ^г ^час ^я ^дж Куросава, Юки (19 января 2021 г.). «Программное обеспечение для чтения голоса игровых персонажей «15.ai» уже доступно. Вы можете попросить персонажей из «Undertale» и «Portal» произнести ваши любимые реплики. АВТОМАТОН 19 . Архивировано из оригинала 19 января 2021 г. Проверено января 2021 г.
^ Jump up to: ^а ^б ^с ^д ^и Ёсиюки, Фурусима (18 января 2021 г.). «GLaDOS из «Portal» и Санс из «UNDERTALE» зачитывают текст. 15.ai», — сервис, целью которого является воспроизведение эмоций, содержащихся в тексте, стал горячей темой. " . Denfaminicogamer . Архивировано из оригинала 18 января 2021 года . Проверено 18 января 2021 года .
^ Jump up to: ^а ^б ^с ^д ^и Уильямс, Деми (18 января 2022 г.). «Voiceverse NFT признает, что принимает голосовые линии от некоммерческой службы» . НМЕ . Архивировано из оригинала 18 января 2022 года . Проверено 18 января 2022 г.
^ Jump up to: ^а ^б ^с ^д ^и ^ж Райт, Стив (17 января 2022 г.). «Компания NFT, поддерживаемая Троем Бейкером, признается в использовании контента без разрешения» . Стививор . Архивировано из оригинала 17 января 2022 года . Проверено 17 января 2022 г.
^ Jump up to: ^а ^б ^с ^д Генри, Джозеф (18 января 2022 г.). «Сообщается, что партнер Троя Бейкера, компания NFT Voiceverse, крадет голосовые строки с 15.ai» . Тех Таймс . Архивировано из оригинала 26 января 2022 года . Проверено 14 февраля 2022 г.
^ «x.com» . X (ранее Twitter) . 23 февраля 2023 года. Архивировано из оригинала 30 мая 2024 года . Проверено 30 мая 2024 г.
^ Jump up to: ^а ^б ^с Вильялобос, Хосе (18 января 2021 г.). «Откройте для себя 15.AI, веб-сайт, на котором вы можете заставить GlaDOS говорить все, что захотите» . ЛаПС4 . Архивировано из оригинала 18 января 2021 года . Проверено 18 января 2021 г.
^ Мото, Эухенио (20 января 2021 г.). «15.ai, сайт, который позволяет вам использовать голоса популярных персонажей, чтобы говорить все, что вы хотите» . Yahoo! Финансы . Архивировано из оригинала 8 марта 2022 года . Проверено 20 января 2021 г.
^ Фелбо, Бьярке (2017). «Использование миллионов экземпляров эмодзи для изучения представлений в любой области для выявления настроений, эмоций и сарказма». Материалы конференции 2017 года по эмпирическим методам обработки естественного языка . стр. 1615–1625. arXiv : 1708.00524 . дои : 10.18653/v1/D17-1169 . S2CID 2493033 .
^ Корфилд, Гарет (7 августа 2017 г.). «Бот-детектор сарказма? Звучит просто великолепно. Определенно» . Регистр . Архивировано из оригинала 2 июня 2022 года . Проверено 2 июня 2022 г.
^ «Алгоритм, обученный на Emoji, знает, когда вы саркастичны в Твиттере» . Обзор технологий Массачусетского технологического института . 3 августа 2017 г. Архивировано из оригинала 2 июня 2022 г. Проверено 2 июня 2022 г.
^ «Эмодзи помогают программному обеспечению распознавать эмоции и сарказм» . Би-би-си . 7 августа 2017 года. Архивировано из оригинала 2 июня 2022 года . Проверено 2 июня 2022 г.
^ Лоу, Джош (7 августа 2017 г.). «Наполненные эмодзи злые твиты помогли ученым создать бота, обнаруживающего сарказм, который мог бы выявлять разжигание ненависти» . Newsweek . Архивировано из оригинала 2 июня 2022 года . Проверено 2 июня 2022 г.
^ Валле, Рафаэль (2020). «Меллотрон: экспрессивный синтез голоса с несколькими динамиками путем регулирования ритма, высоты тона и токенов глобального стиля». arXiv : 1910.11997 [ eess ].
^ Купер, Эрика (2020). «Преобразование текста в речь с несколькими динамиками с нулевым выстрелом и современными встроенными нейронными динамиками». arXiv : 1910.10838 [ eess ].
^ Клаутау, Альдебаро (2001). «ARPABET и алфавит TIMIT» (PDF) . Архивировано из оригинала (PDF) 3 июня 2016 года . Проверено 8 сентября 2017 г.
^ «Фонетика» (PDF) . Колумбийский университет . 2017. Архивировано (PDF) из оригинала 19 июня 2022 года . Проверено 11 июня 2022 г.
^ Лутс, Линсен (март 2010 г.). Расширение словарей произношения на основе данных (MSc). Стелленбошский университет, факультет электротехники и электроники. CiteSeerX 10.1.1.832.2872 . Архивировано из оригинала 11 июня 2022 года . Проверено 11 июня 2022 г. Таблица 3.2
^ «Произносящий словарь КМУ» . Произносящий словарь КМУ . 16 июля 2015 года. Архивировано из оригинала 3 июня 2022 года . Проверено 4 июня 2022 г.
^ Сюй, Вэй-Нин (2018). «Иерархическое генеративное моделирование для синтеза управляемой речи». arXiv : 1810.07217 [ cs.CL ].
^ Хабиб, Раза (2019). «Полуконтролируемое генеративное моделирование для управляемого синтеза речи». arXiv : 1910.01709 [ cs.CL ].
^ «Аудио образцы из «Полу-контролируемого обучения для повышения эффективности данных при сквозном синтезе речи» » . 30 августа 2018 года. Архивировано из оригинала 11 ноября 2020 года . Проверено 5 июня 2022 г.
^ Шен, Джонатан; Панг, Руомин; Вайс, Рон Дж.; Шустер, Майк; Джейтли, Навдип; Ян, Цзунхэн; Чен, Чжифэн; Чжан, Ю; Ван, Юйсюань; Скерри-Райан, Р.Дж.; Саурус, Риф А.; Агиомиргианнакис, Яннис; Ву, Юнхуэй (2018). «Естественный синтез TTS путем обработки WaveNet на основе предсказаний Mel-спектрограммы». arXiv : 1712.05884 [ cs.CL ].
^ Чунг, Ю-Ань (2018). «Полу-контролируемое обучение для повышения эффективности обработки данных при сквозном синтезе речи». arXiv : 1808.10128 [ cs.CL ].
^ Рен, Йи (2019). «Почти неконтролируемое преобразование текста в речь и автоматическое распознавание речи». arXiv : 1905.06791 [ cs.CL ].
^ Jump up to: ^а ^б ^с ^д Филлипс, Том (17 января 2022 г.). «Фирма NFT, поддерживаемая Троем Бейкером, признает, что без разрешения использовала голосовые линии, взятые из другого сервиса» . Еврогеймер . Архивировано из оригинала 17 января 2022 года . Проверено 17 января 2022 г.
^ - F.2d – (2-й круг, 2015). (временно цитируется: Приложение LEXIS 17988, 2015 г. в США; Оговорка (16 Октября 2015))
^ «15» . Твиттер . 9 июня 2022 г. . Проверено 9 июня 2022 г.
^ Jump up to: ^а ^б ^с «15.ай» . Хакерские новости . 12 июня 2022 года. Архивировано из оригинала 13 июня 2022 года . Проверено 13 июня 2022 г.
^ «Заработок, кредит и волонтерство» . МИТ УРОП . Архивировано из оригинала 19 июня 2022 года . Проверено 13 июня 2022 г.
^ «15.ai – О» . 15.ай. 20 февраля 2022 года. Архивировано из оригинала 6 октября 2021 года . Проверено 20 февраля 2022 г.
^ Jump up to: ^а ^б ^с Бранвен, Гверн (6 марта 2020 г.). « 15.ai», 15, Проект по сохранению пони» . Гверн.нет . Гверн. Архивировано из оригинала 18 марта 2022 года . Проверено 17 июня 2022 г.
^ Скотелларо, Шон (14 марта 2020 г.). «Аккуратный «Проект по сохранению пони» с использованием нейронных сетей для создания голосов пони» . Эквестрия Дейли . Архивировано из оригинала 23 июня 2021 года . Проверено 11 июня 2022 г.
^ «Проект по сохранению пони (тема 108)» . 4чан . Дезуархив. 20 февраля 2022 г. . Проверено 20 февраля 2022 г.
^ Коуэн, Тайлер (12 мая 2022 г.). «Самый недооцененный талант в области искусственного интеллекта?» . Маргинальная революция (блог) . Архивировано из оригинала 19 июня 2022 года . Проверено 16 июня 2022 г.
^ Скотелларо, Шон (15 мая 2022 г.). «Полный простой анимационный эпизод – Налоговые льготы (Сумерки)» . Эквестрия Дейли . Архивировано из оригинала 21 мая 2022 года . Проверено 28 мая 2022 г.
^ Ужасно тяжелые невзгоды Сумеречной Искорки . 27 апреля 2014 года. Архивировано из оригинала 30 июня 2022 года . Проверено 28 апреля 2022 г. {{cite book}}: |website= игнорируется ( помогите )
^ Филлипс, Том (14 января 2022 г.). «Актер озвучивания видеоигр Трой Бейкер теперь продвигает NFT» . Еврогеймер . Архивировано из оригинала 14 января 2022 года . Проверено 14 января 2022 г.
^ Маквертор, Майкл (14 января 2022 г.). «Актер озвучки «Последних из нас» хочет продавать «голосовые NFT», что вызывает гнев» . Полигон . Архивировано из оригинала 14 января 2022 года . Проверено 14 января 2022 г.
^ «Последний из нас, актер озвучивания, всех бесит NFT Push» . Котаку . 14 января 2022 года. Архивировано из оригинала 14 января 2022 года . Проверено 14 января 2022 г.
^ Перслоу, Мэтт (14 января 2022 г.). «Трой Бейкер работает с NFT, но фанатов это не впечатляет» . ИГН . Архивировано из оригинала 14 января 2022 года . Проверено 14 января 2022 г.
^ Стрикленд, Дерек (31 января 2022 г.). «Актер «Последних из нас» Трой Бейкер прислушивается к фанатам и отказывается от планов NFT» . Твиктаун . Архивировано из оригинала 31 января 2022 года . Проверено 31 января 2022 г.
^ Петерсон, Дэнни (31 января 2022 г.). « Актер «Последних из нас» Трой Бейкер меняет курс в отношении NFT на фоне негативной реакции фанатов» . Мы позаботились об этом . Архивировано из оригинала 14 февраля 2022 года . Проверено 14 февраля 2022 г.
^ Питерс, Джей (31 января 2022 г.). «Голос Джоэла из The Last of Us уходит из проекта NFT после протестов» . Грань . Архивировано из оригинала 4 февраля 2022 года . Проверено 4 февраля 2022 г.

Твиты

^ @TroyBakerVA (14 января 2022 г.). «Я сотрудничаю с @VoiceverseNFT, чтобы изучить способы, с помощью которых мы могли бы вместе предоставить новым авторам новые инструменты для создания новых вещей и дать каждому возможность владеть и инвестировать в создаваемую ими интеллектуальную собственность. Нам всем есть что рассказать. Вам можешь ненавидеть. Или ты можешь создать, что это будет?» ( Твит ) – через Твиттер .
^ @fifteenai (12 декабря 2021 г.). «Я не заинтересован во включении NFT в какой-либо аспект своей работы. Пожалуйста, перестаньте спрашивать» ( Твит ) – через Твиттер .
^ @fifteenai (14 января 2022 г.). «Мне сообщили, что вышеупомянутый синтезатор вокала NFT активно пытается присвоить мою работу в своих целях. Покопавшись в файлах журналов, я обнаружил доказательства того, что некоторые из голосов, за которые они приписывают себе признание, действительно были созданы из моих собственный сайт» ( Tweet ) – через Twitter .
^ @VoiceverseNFT (14 января 2022 г.). «Привет, @fifteenai, нам очень жаль. Голос действительно был взят с вашей платформы, которую наша маркетинговая команда использовала, не указав должного упоминания. Команда Chubbiverse ничего об этом не знает. Мы позаботимся о том, чтобы это никогда не повторилось» ( Твит ) — через Твиттер .
^ @fifteenai (14 января 2022 г.). «Иди на хуй» ( Твит ) – через Твиттер .
^ @VoiceverseNFT (7 января 2022 г.). «Интересно, кто создал этот голос? ;)» ( Твит ). Архивировано из оригинала 7 января 2022 года — через Twitter .
^ @fifteenai (14 января 2022 г.). «Похоже на мошенничество» ( Твит ) – через Твиттер .
^ @fifteenai (14 января 2022 г.). «Отдайте должное или удалите этот пост» ( Твит ) – через Твиттер .
^ @fifteenai (14 января 2022 г.). «Конечно, не ты :)» ( Твит ) – через Твиттер .
^ @fifteenai (14 января 2022 г.). «Иди на хуй» ( Твит ) – через Твиттер .
^ @yongyea (14 января 2022 г.). «Схема NFT, которую продвигает Трой Бейкер, уже оказалась в беде после кражи и получения прибыли от чужой работы. Кто мог предвидеть это» ( Твит ) – через Твиттер .
^ @BronyStruggle (15 января 2022 г.). «актуальный» ( Твит ) – через Твиттер .

YouTube (только для количества просмотров и использования 15.ai)

^ «ШПАЙ — ПУШИСТЫЙ» . Ютуб . 17 января 2021 года. Архивировано из оригинала 13 июня 2022 года . Проверено 14 июня 2022 г.
^ «Шпион — пушистый анимационный фильм» . Ютуб . Архивировано из оригинала 14 июня 2022 года . Проверено 14 июня 2022 г.
^ «[SFM] – Признание шпиона – [TF2 15.ai]» . Ютуб . 15 января 2021 года. Архивировано из оригинала 30 июня 2022 года . Проверено 14 июня 2022 г.
^ «Среди нас борьба» . Ютуб . 21 сентября 2020 г. . Проверено 15 июля 2022 г.
^ «ОБНОВЛЕННАЯ Хронология 2b2t (2010–2020 гг.)» . Ютуб . 14 марта 2020 года. Архивировано из оригинала 1 июня 2022 года . Проверено 14 июня 2022 г.

Тик Ток

^ "Она сказала "👹" " . ТикТок . Проверено 15 июля 2022 г.

Внешние ссылки

[4] Фраза «высокая точность» в исследованиях TTS часто используется для описания вокодеров , которые способны восстанавливать сигналы с очень небольшими искажениями, и не является просто синонимом «высокого качества». См. документы о HiFi-GAN, ^[1] ГАН-ТТС, ^[2] и параллельный WaveNet ^[3] за беспристрастные примеры такого использования терминологии.

[46] Перевод оригинальной цитаты, написанной на испанском языке: «Адрес — 15.AI, и он работает так же просто, как кажется». ^[17]

[1] Конг, Джунгил (2020). «HiFi-GAN: генеративно-состязательные сети для эффективного и высококачественного синтеза речи». arXiv : 2010.05646v2 [ cs ].

[2] Бинковский, Николай (2019). «Высококачественный синтез речи с состязательными сетями». arXiv : 1909.11646v2 [ cs ].

[deepmind-3] Jump up to: ^а ^б ^с ван ден Оорд, Аарон; Ли, Яже; Бабушкин Игорь (12 ноября 2017 г.). «Высококачественный синтез речи с помощью WaveNet» . ДипМайнд . Архивировано из оригинала 18 июня 2022 года . Проверено 5 июня 2022 г.

[kotaku-5] Jump up to: ^а ^б ^с ^д ^и Цвизен, Зак (18 января 2021 г.). «Веб-сайт позволяет заставить GLaDOS говорить все, что вы хотите» . Котаку . Архивировано из оригинала 17 января 2021 года . Проверено 18 января 2021 г.

[gameinformer-6] Jump up to: ^а ^б ^с ^д Руперт, Лиана (18 января 2021 г.). «Заставьте GLaDOS из Portal и других любимых персонажей говорить самые странные вещи с помощью этого приложения» . Игровой информер . Игровой информер . Архивировано из оригинала 18 января 2021 года . Проверено 18 января 2021 г.

[pcgamer-7] Jump up to: ^а ^б ^с Клейтон, Натали (19 января 2021 г.). «Заставьте актеров TF2 декламировать старые мемы с помощью этого инструмента преобразования текста в речь ИИ» . ПК-геймер . Архивировано из оригинала 19 января 2021 года . Проверено 19 января 2021 г.

[rockpapershotgun-8] Jump up to: ^а ^б Мортон, Лорен (18 января 2021 г.). «Вкладывайте слова в уста игровых персонажей с помощью этого увлекательного инструмента преобразования текста в речь» . Камень, Бумага, Дробовик . Архивировано из оригинала 18 января 2021 года . Проверено 18 января 2021 г.

[thebatch-9] Jump up to: ^а ^б ^с ^д ^и Нг, Эндрю (1 апреля 2020 г.). «Клонирование голоса для масс» . Пакет . Архивировано из оригинала 7 августа 2020 года . Проверено 5 апреля 2020 г.

[batch-10] Jump up to: ^а ^б ^с Нг, Эндрю (7 марта 2021 г.). «Еженедельный информационный бюллетень № 83» . Пакет . Архивировано из оригинала 26 февраля 2022 года . Проверено 7 марта 2021 г.

[wccftech-11] Jump up to: ^а ^б ^с ^д Лопес, Уле (16 января 2022 г.). «Фирма NFT, поддерживаемая Троем Бейкером, признает, что без разрешения использовала голосовые линии, взятые из другого сервиса» . Wccftech . Архивировано из оригинала 16 января 2022 года . Проверено 7 июня 2022 г.

[automaton-12] Jump up to: ^а ^б ^с ^д ^и ^ж ^г ^час ^я ^дж Куросава, Юки (19 января 2021 г.). «Программное обеспечение для чтения голоса игровых персонажей «15.ai» уже доступно. Вы можете попросить персонажей из «Undertale» и «Portal» произнести ваши любимые реплики. АВТОМАТОН 19 . Архивировано из оригинала 19 января 2021 г. Проверено января 2021 г.

[Denfaminicogamer-13] Jump up to: ^а ^б ^с ^д ^и Ёсиюки, Фурусима (18 января 2021 г.). «GLaDOS из «Portal» и Санс из «UNDERTALE» зачитывают текст. 15.ai», — сервис, целью которого является воспроизведение эмоций, содержащихся в тексте, стал горячей темой. " . Denfaminicogamer . Архивировано из оригинала 18 января 2021 года . Проверено 18 января 2021 года .

[nme-14] Jump up to: ^а ^б ^с ^д ^и Уильямс, Деми (18 января 2022 г.). «Voiceverse NFT признает, что принимает голосовые линии от некоммерческой службы» . НМЕ . Архивировано из оригинала 18 января 2022 года . Проверено 18 января 2022 г.

[stevivor-15] Jump up to: ^а ^б ^с ^д ^и ^ж Райт, Стив (17 января 2022 г.). «Компания NFT, поддерживаемая Троем Бейкером, признается в использовании контента без разрешения» . Стививор . Архивировано из оригинала 17 января 2022 года . Проверено 17 января 2022 г.

[techtimes-16] Jump up to: ^а ^б ^с ^д Генри, Джозеф (18 января 2022 г.). «Сообщается, что партнер Троя Бейкера, компания NFT Voiceverse, крадет голосовые строки с 15.ai» . Тех Таймс . Архивировано из оригинала 26 января 2022 года . Проверено 14 февраля 2022 г.

[17] «x.com» . X (ранее Twitter) . 23 февраля 2023 года. Архивировано из оригинала 30 мая 2024 года . Проверено 30 мая 2024 г.

[LaPS4-18] Jump up to: ^а ^б ^с Вильялобос, Хосе (18 января 2021 г.). «Откройте для себя 15.AI, веб-сайт, на котором вы можете заставить GlaDOS говорить все, что захотите» . ЛаПС4 . Архивировано из оригинала 18 января 2021 года . Проверено 18 января 2021 г.

[yahoofin-19] Мото, Эухенио (20 января 2021 г.). «15.ai, сайт, который позволяет вам использовать голоса популярных персонажей, чтобы говорить все, что вы хотите» . Yahoo! Финансы . Архивировано из оригинала 8 марта 2022 года . Проверено 20 января 2021 г.

[20] Фелбо, Бьярке (2017). «Использование миллионов экземпляров эмодзи для изучения представлений в любой области для выявления настроений, эмоций и сарказма». Материалы конференции 2017 года по эмпирическим методам обработки естественного языка . стр. 1615–1625. arXiv : 1708.00524 . дои : 10.18653/v1/D17-1169 . S2CID 2493033 .

[21] Корфилд, Гарет (7 августа 2017 г.). «Бот-детектор сарказма? Звучит просто великолепно. Определенно» . Регистр . Архивировано из оригинала 2 июня 2022 года . Проверено 2 июня 2022 г.

[22] «Алгоритм, обученный на Emoji, знает, когда вы саркастичны в Твиттере» . Обзор технологий Массачусетского технологического института . 3 августа 2017 г. Архивировано из оригинала 2 июня 2022 г. Проверено 2 июня 2022 г.

[23] «Эмодзи помогают программному обеспечению распознавать эмоции и сарказм» . Би-би-си . 7 августа 2017 года. Архивировано из оригинала 2 июня 2022 года . Проверено 2 июня 2022 г.

[24] Лоу, Джош (7 августа 2017 г.). «Наполненные эмодзи злые твиты помогли ученым создать бота, обнаруживающего сарказм, который мог бы выявлять разжигание ненависти» . Newsweek . Архивировано из оригинала 2 июня 2022 года . Проверено 2 июня 2022 г.

[arxivmello-25] Валле, Рафаэль (2020). «Меллотрон: экспрессивный синтез голоса с несколькими динамиками путем регулирования ритма, высоты тона и токенов глобального стиля». arXiv : 1910.11997 [ eess ].

[arxivmulti-26] Купер, Эрика (2020). «Преобразование текста в речь с несколькими динамиками с нулевым выстрелом и современными встроенными нейронными динамиками». arXiv : 1910.10838 [ eess ].

[klautau-27] Клаутау, Альдебаро (2001). «ARPABET и алфавит TIMIT» (PDF) . Архивировано из оригинала (PDF) 3 июня 2016 года . Проверено 8 сентября 2017 г.

[columbia-28] «Фонетика» (PDF) . Колумбийский университет . 2017. Архивировано (PDF) из оригинала 19 июня 2022 года . Проверено 11 июня 2022 г.

[prondicts-29] Лутс, Линсен (март 2010 г.). Расширение словарей произношения на основе данных (MSc). Стелленбошский университет, факультет электротехники и электроники. CiteSeerX 10.1.1.832.2872 . Архивировано из оригинала 11 июня 2022 года . Проверено 11 июня 2022 г. Таблица 3.2

[cmudict-30] «Произносящий словарь КМУ» . Произносящий словарь КМУ . 16 июля 2015 года. Архивировано из оригинала 3 июня 2022 года . Проверено 4 июня 2022 г.

[arxiv1-31] Сюй, Вэй-Нин (2018). «Иерархическое генеративное моделирование для синтеза управляемой речи». arXiv : 1810.07217 [ cs.CL ].

[arxiv2-32] Хабиб, Раза (2019). «Полуконтролируемое генеративное моделирование для управляемого синтеза речи». arXiv : 1910.01709 [ cs.CL ].

[tacotron-33] «Аудио образцы из «Полу-контролируемого обучения для повышения эффективности данных при сквозном синтезе речи» » . 30 августа 2018 года. Архивировано из оригинала 11 ноября 2020 года . Проверено 5 июня 2022 г.

[arxiv3-34] Шен, Джонатан; Панг, Руомин; Вайс, Рон Дж.; Шустер, Майк; Джейтли, Навдип; Ян, Цзунхэн; Чен, Чжифэн; Чжан, Ю; Ван, Юйсюань; Скерри-Райан, Р.Дж.; Саурус, Риф А.; Агиомиргианнакис, Яннис; Ву, Юнхуэй (2018). «Естественный синтез TTS путем обработки WaveNet на основе предсказаний Mel-спектрограммы». arXiv : 1712.05884 [ cs.CL ].

[35] Чунг, Ю-Ань (2018). «Полу-контролируемое обучение для повышения эффективности обработки данных при сквозном синтезе речи». arXiv : 1808.10128 [ cs.CL ].

[36] Рен, Йи (2019). «Почти неконтролируемое преобразование текста в речь и автоматическое распознавание речи». arXiv : 1905.06791 [ cs.CL ].

[eurogamer-37] Jump up to: ^а ^б ^с ^д Филлипс, Том (17 января 2022 г.). «Фирма NFT, поддерживаемая Троем Бейкером, признает, что без разрешения использовала голосовые линии, взятые из другого сервиса» . Еврогеймер . Архивировано из оригинала 17 января 2022 года . Проверено 17 января 2022 г.

[38] - F.2d – (2-й круг, 2015). (временно цитируется: Приложение LEXIS 17988, 2015 г. в США; Оговорка (16 Октября 2015))

[twitter-39] «15» . Твиттер . 9 июня 2022 г. . Проверено 9 июня 2022 г.

[hn-40] Jump up to: ^а ^б ^с «15.ай» . Хакерские новости . 12 июня 2022 года. Архивировано из оригинала 13 июня 2022 года . Проверено 13 июня 2022 г.

[41] «Заработок, кредит и волонтерство» . МИТ УРОП . Архивировано из оригинала 19 июня 2022 года . Проверено 13 июня 2022 г.

[15aiabout-42] «15.ai – О» . 15.ай. 20 февраля 2022 года. Архивировано из оригинала 6 октября 2021 года . Проверено 20 февраля 2022 г.

[gwern-43] Jump up to: ^а ^б ^с Бранвен, Гверн (6 марта 2020 г.). « 15.ai», 15, Проект по сохранению пони» . Гверн.нет . Гверн. Архивировано из оригинала 18 марта 2022 года . Проверено 17 июня 2022 г.

[44] Скотелларо, Шон (14 марта 2020 г.). «Аккуратный «Проект по сохранению пони» с использованием нейронных сетей для создания голосов пони» . Эквестрия Дейли . Архивировано из оригинала 23 июня 2021 года . Проверено 11 июня 2022 г.

[ppp-45] «Проект по сохранению пони (тема 108)» . 4чан . Дезуархив. 20 февраля 2022 г. . Проверено 20 февраля 2022 г.

[47] Коуэн, Тайлер (12 мая 2022 г.). «Самый недооцененный талант в области искусственного интеллекта?» . Маргинальная революция (блог) . Архивировано из оригинала 19 июня 2022 года . Проверено 16 июня 2022 г.

[taxbreaks-48] Скотелларо, Шон (15 мая 2022 г.). «Полный простой анимационный эпизод – Налоговые льготы (Сумерки)» . Эквестрия Дейли . Архивировано из оригинала 21 мая 2022 года . Проверено 28 мая 2022 г.

[49] Ужасно тяжелые невзгоды Сумеречной Искорки . 27 апреля 2014 года. Архивировано из оригинала 30 июня 2022 года . Проверено 28 апреля 2022 г. {{cite book}}: |website= игнорируется ( помогите )

[eurogamer2-68] Филлипс, Том (14 января 2022 г.). «Актер озвучивания видеоигр Трой Бейкер теперь продвигает NFT» . Еврогеймер . Архивировано из оригинала 14 января 2022 года . Проверено 14 января 2022 г.

[69] Маквертор, Майкл (14 января 2022 г.). «Актер озвучки «Последних из нас» хочет продавать «голосовые NFT», что вызывает гнев» . Полигон . Архивировано из оригинала 14 января 2022 года . Проверено 14 января 2022 г.

[70] «Последний из нас, актер озвучивания, всех бесит NFT Push» . Котаку . 14 января 2022 года. Архивировано из оригинала 14 января 2022 года . Проверено 14 января 2022 г.

[71] Перслоу, Мэтт (14 января 2022 г.). «Трой Бейкер работает с NFT, но фанатов это не впечатляет» . ИГН . Архивировано из оригинала 14 января 2022 года . Проверено 14 января 2022 г.

[tweaktown-72] Стрикленд, Дерек (31 января 2022 г.). «Актер «Последних из нас» Трой Бейкер прислушивается к фанатам и отказывается от планов NFT» . Твиктаун . Архивировано из оригинала 31 января 2022 года . Проверено 31 января 2022 г.

[wgtc-73] Петерсон, Дэнни (31 января 2022 г.). « Актер «Последних из нас» Трой Бейкер меняет курс в отношении NFT на фоне негативной реакции фанатов» . Мы позаботились об этом . Архивировано из оригинала 14 февраля 2022 года . Проверено 14 февраля 2022 г.

[74] Питерс, Джей (31 января 2022 г.). «Голос Джоэла из The Last of Us уходит из проекта NFT после протестов» . Грань . Архивировано из оригинала 4 февраля 2022 года . Проверено 4 февраля 2022 г.

[56] @TroyBakerVA (14 января 2022 г.). «Я сотрудничаю с @VoiceverseNFT, чтобы изучить способы, с помощью которых мы могли бы вместе предоставить новым авторам новые инструменты для создания новых вещей и дать каждому возможность владеть и инвестировать в создаваемую ими интеллектуальную собственность. Нам всем есть что рассказать. Вам можешь ненавидеть. Или ты можешь создать, что это будет?» ( Твит ) – через Твиттер .

[57] @fifteenai (12 декабря 2021 г.). «Я не заинтересован во включении NFT в какой-либо аспект своей работы. Пожалуйста, перестаньте спрашивать» ( Твит ) – через Твиттер .

[58] @fifteenai (14 января 2022 г.). «Мне сообщили, что вышеупомянутый синтезатор вокала NFT активно пытается присвоить мою работу в своих целях. Покопавшись в файлах журналов, я обнаружил доказательства того, что некоторые из голосов, за которые они приписывают себе признание, действительно были созданы из моих собственный сайт» ( Tweet ) – через Twitter .

[59] @VoiceverseNFT (14 января 2022 г.). «Привет, @fifteenai, нам очень жаль. Голос действительно был взят с вашей платформы, которую наша маркетинговая команда использовала, не указав должного упоминания. Команда Chubbiverse ничего об этом не знает. Мы позаботимся о том, чтобы это никогда не повторилось» ( Твит ) — через Твиттер .

[60] @fifteenai (14 января 2022 г.). «Иди на хуй» ( Твит ) – через Твиттер .

[61] @VoiceverseNFT (7 января 2022 г.). «Интересно, кто создал этот голос? ;)» ( Твит ). Архивировано из оригинала 7 января 2022 года — через Twitter .

[62] @fifteenai (14 января 2022 г.). «Похоже на мошенничество» ( Твит ) – через Твиттер .

[63] @fifteenai (14 января 2022 г.). «Отдайте должное или удалите этот пост» ( Твит ) – через Твиттер .

[64] @fifteenai (14 января 2022 г.). «Конечно, не ты :)» ( Твит ) – через Твиттер .

[65] @fifteenai (14 января 2022 г.). «Иди на хуй» ( Твит ) – через Твиттер .

[66] @yongyea (14 января 2022 г.). «Схема NFT, которую продвигает Трой Бейкер, уже оказалась в беде после кражи и получения прибыли от чужой работы. Кто мог предвидеть это» ( Твит ) – через Твиттер .

[67] @BronyStruggle (15 января 2022 г.). «актуальный» ( Твит ) – через Твиттер .

[50] «ШПАЙ — ПУШИСТЫЙ» . Ютуб . 17 января 2021 года. Архивировано из оригинала 13 июня 2022 года . Проверено 14 июня 2022 г.

[51] «Шпион — пушистый анимационный фильм» . Ютуб . Архивировано из оригинала 14 июня 2022 года . Проверено 14 июня 2022 г.

[52] «[SFM] – Признание шпиона – [TF2 15.ai]» . Ютуб . 15 января 2021 года. Архивировано из оригинала 30 июня 2022 года . Проверено 14 июня 2022 г.

[53] «Среди нас борьба» . Ютуб . 21 сентября 2020 г. . Проверено 15 июля 2022 г.

[54] «ОБНОВЛЕННАЯ Хронология 2b2t (2010–2020 гг.)» . Ютуб . 14 марта 2020 года. Архивировано из оригинала 1 июня 2022 года . Проверено 14 июня 2022 г.

[55] "Она сказала "👹" " . ТикТок . Проверено 15 июля 2022 г.

[а]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[22]

[23]

[24]

[25]

[26]

[27]

[28]

[29]

[3]

[30]

[31]

[32]

[33]

[34]

[35]

[36]

[37]

[38]

[39]

[40]

[41]

[42]

[43]

[44]

[б]

[45]

[46]

[47]

[yt 1]

[yt 2]

[yt 3]

[yt 4]

[yt 5]

[тт 1]

[твит 1]

[твит 2]

[твит 3]

[твит 4]

[твит 5]

[твит 6]

[твит 7]

[твит 8]

[твит 9]

[твит 10]

[твит 11]

[твит 12]

[48]

[49]

[50]

[51]

[52]

[53]

[54]

[1]

[2]