Китайская компания Tencent Cloud объявила о запуске цифровой платформы для создания людей – Deepfakes-as-a-Service (DFaaS). По сообщениям китайских СМИ , сервису требуется всего 3 минуты живого видео и 100 произнесенных предложений. И за $145 сервис создаст цифрового человека высокой четкости. Для создания дипфейка требуется всего 24 часа.
Некоторые аспекты (задний фон и тон кожи) могут настраиваться. Стоит отметить, что сгенерированные дипфейки обладают плоской интонацией и единым речевым ритмом, характерных для традиционных акустических моделей. Это достигается за счет использования собственной технологии настройки тембра с малыми выборками, основанной на акустических моделях глубокого обучения и вокодерах (устройство синтеза речи на основе произвольного сигнала) нейронных сетей.
Сгенерированный дипфейк (слева) и реальный человек (справа)
В Tencent Cloud заявили, что компания надеется построить автоматизированную фабрику людей “AI + Intelligent Factory” и полагаться на универсальную платформу для производства, продаж и обслуживания. Фабрика по созданию цифрового человека опирается на платформу Tencent Cloud TI – платформу машинного обучения, которая предлагает более 10 алгоритмов ИИ.
Tencent предлагает 5 стилей для своих цифровых людей: 3D-реалистичный, 3D-полуреалистичный, 3D-мультфильм, 2D-реальный человек и 2D-мультфильм. Также для цифрового человека могут быть созданы индивидуальные вопросы и ответы, которые превратят его в своего рода дипфейк чат-бота.
Компания Tencent, похоже, больше всего заинтересована в использовании такой технологии для размещения рекламных роликов в прямом эфире – популярной формы электронной коммерции в Китае. Местные СМИ также сообщили, что Tencent может создать цифровых врачей, юристов и других специалистов.