Цей стартап хоче глибоко клонувати ваш голос і продавати його тому, хто більше заплатить

catalogue of articles 19 января, 202319 февраля, 2024 Комментариев нет

Цей стартап хоче глибоко клонувати ваш голос і продавати його тому, хто більше заплатить

Є відео, яке періодично з’являється на моїй стрічці на YouTube. Це розмова між реперами Snoop Dogg і 50 Cent, які нарікають на те, що в порівнянні з їх поколінням всі сучасні хіп-хоп виконавці звучать начебто однаково. “Коли людина вирішує бути собою, вона пропонує те, чим ніхто інший не може бути, – каже 50 Cent. “Так, тому що коли ти будеш собою – хто може бути тобою, окрім тебе?” відповідає Снуп.

“Ми можемо багато чого переосмислити”
Як відреагує громадськість?
Подумайте про майбутнє

Снуп Догг пародіює сьогоднішніх реперів, схожих за звучанням

Коли відео було завантажено в жовтні 2014 року, це, можливо, в цілому було правдою. Але лише через кілька років це вже точно не так. У світі аудіопідробок можна навчити штучний інтелект звучати моторошно схоже на іншу людину, надаючи йому аудіоконтент, що складається з багатогодинних розмовних даних цієї людини. Результати виявляються нервово точними.

Такі публічні особи, як репер Jay-Z і психолог Джордан Пітерсон, вже скаржилися на те, що люди привласнюють їхні голоси, створюючи аудіопідробки, а потім змушують їх говорити дурниці в інтернеті. “Прокиньтеся, – написав Петерсон. “Святість вашого голосу і вашого іміджу знаходиться під серйозною загрозою”. І це лише найлегші випадки. В інших випадках результати можуть перерости в неприховану злочинність. В одному з інцидентів 2019 року злочинці використовували аудіопідробку, щоб видати себе за голос генерального директора енергетичної компанії і переконати підлеглого по телефону терміново перевести 243 000 доларів на банківський рахунок.

Veritone, компанія зі сфери штучного інтелекту, яка створює інтелектуальні інструменти для маркування медіа для індустрії розваг, повертає владу над аудіопідробками в руки (або, е-е, в горло) тих, кому вона по праву належить. Цього місяця компанія анонсувала Marvel.ai, що президент компанії Райан Стілберг описав Digital Trends як “повне рішення для надання голосу як послуги”. За певну плату Veritone створить модель штучного інтелекту, яка буде звучати так само, як ви (або, що більш ймовірно, відома людина з відразу впізнаваним голосом), яку потім можна буде ліцензувати на умовах позики, як високотехнологічну версію голосу Аріель з “Русалоньки”, що надається під заставу .

Синтетичний голос від MARVEL.ai

“Ваш голос так само цінний, як і будь-який інший контент або атрибут бренду, який у вас є”, – сказав Стілберг. “Він знаходиться на одному рівні з вашим ім’ям і образом, вашим обличчям, вашим підписом, або піснею, яку ви написали, або частиною контенту, яку ви створили”.

“Ми можемо багато чого переосмислити”

Певні особи, звичайно, вже давно продають свої голоси у формі запису рекламних роликів або закадрового голосу, виконання пісень та незліченних інших форм монетизації. Але вони закінчуються

Що, якби, наприклад, Кевін Харт міг надати ліцензію на свій голос розкішному бренду, який потім міг би використовувати його для створення персоналізованої реклами із зазначенням імені глядача, місцезнаходження його найближчого магазину та конкретного товару, який він, найімовірніше, придбає? Замість того, щоб проводити буквально дні в студії звукозапису, ШІ міг би дозволити це зробити, не вимагаючи від Харта (принаймні, принаймні, з боку Харта) нічого більшого, ніж підписати пунктирну лінію про згоду на використання його голосу згаданою третьою стороною. Поки він не знімався в кіно, не гастролював з комедійним туром, не був у відпустці або навіть не спав, його цифровий голос міг би приносити йому гроші.

“Ми можемо багато чого перепрофілювати”, – пояснив Стілберг щодо процесу навчання. “Люди, які вже говорять тоннами, якщо вони створюють подкасти або виступають у ЗМІ, мають дуже багато даних. У нас, напевно, вже є тонна цієї інформації, якщо вони є нашими клієнтами”.

“Те, що нас так захоплює в цій новій категорії ШІ, – це розширюваність і варіативність”.

Стілберг розповів, що ідея “голос як послуга” виникла у Veritone кілька років тому. Однак тоді він не був переконаний, що моделі машинного навчання здатні створювати гіперреалістичні синтетичні голоси, які він шукав. Це особливо важливо, коли мова йде про голоси, які ми добре знаємо, навіть якщо ми ніколи не зустрічалися з диктором, про якого йде мова. Результатом може бути свого роду звукова долина, де кожен неправильний звук попереджає слухачів про те, що вони слухають фальшивку. Але тут, у 2021 році, він переконаний, що все просунулося настільки, що тепер це стало можливим. Звідси і Marvel.ai.

Стілберг схвильовано розповідає про величезний потенціал технології, просторікуючи про її можливу безліч “способів виконання”. Veritone може створювати моделі для перетворення тексту в мову. Вона також може створювати моделі для перетворення мови в мову, за допомогою яких голосовий актор може “керувати” вокальним виконанням, читаючи слова з відповідною інтонацією, а потім накладаючи готовий голос в кінці, як фільтр в Snapchat. Компанія також може знімати відбитки пальців з кожного голосу, щоб визначити, чи був фрагмент реального аудіо, який десь з’являється, створений за допомогою її технології.

“Чим більше ви думаєте про це … ви буквально знайдете ще 50 [можливих варіантів використання]”, – сказав він. “Що нас так захоплює в цій новій категорії ШІ, так це розширюваність і варіативність”.

Розглянемо деякі інші. Відомий спортсмен може бути богом на баскетбольному майданчику, але дияволом, коли справа доходить до читання реплік в сценарії так, щоб вони звучали природно. Використовуючи технологію Veritone, їх роль у сценах відеоігор або читання аудіокниги мемуарів (які вони, можливо, і не писали) може виконувати голос актора, який потім піддається цифровій обробці для того, щоб звучати як спортсмен. Як інша можливість, фільм може бути перекладений для інших країн з голосом того ж актора, який зараз читає репліки

Як відреагує громадськість?

Що ж тоді відбувається, коли з’являється реклама, в якій не тільки знаменитість читає репліки, але й у випадках, коли ми знаємо, що цей виконавець ніколи насправді не говорив цих реплік, а скоріше його голос був програмно використаний для того, щоб показати нам цільову рекламу? Стілберг сказав, що це мало чим відрізняється від того, якби знаменитість передала контроль над своїми соціальними мережами сторонньому менеджеру по роботі з клієнтами. Якщо ми бачимо твіт Тейлор Свіфт, ми знаємо, що це, цілком можливо, не сама Тейлор вистукує повідомлення, особливо якщо це схвалення або частина рекламного контенту.

Але голос – це зовсім інша річ, саме тому, що він більш особистий. Особливо, якщо він супроводжується певним ступенем персоналізації, що є одним із випадків використання, який має найбільший сенс. Правда полягає в тому, що, за словами сценариста Вільяма Голдмана, ніхто не знає, якою буде реакція громадськості – саме тому, що ніхто не робив подібного раніше.

“Це ж буде по всьому спектру, чи не так?” сказав Стілберг. “Деякі люди скажуть: “Я буду використовувати цей інструмент для того, щоб трохи покращити свій день і заощадити час”. Інші скажуть: “Я хочу, щоб мій голос був усюди, щоб розширити свій бренд, і я збираюся отримати ліцензію на нього”.

На його думку, рішення буде прийматися в кожному конкретному випадку окремо. “Ви повинні бути в гармонії з реакцією вашої аудиторії, і якщо ви бачите, що щось працює або не працює, – сказав він. “Їм може сподобатися. Вони можуть сказати: “Знаєте що? Мені подобається той факт, що ви даєте мені в 10 разів більше контенту або більше особистого контенту, хоча я знаю, що ви використовували синтетичний контент, щоб збільшити його. Дякую вам. Дякую”.

Подумайте про майбутнє

І не варто очікувати, що вона залишиться суто про аудіо. “Ми завжди були зачаровані потенціалом використання синтетичного контенту для розширення, доповнення або потенційно повної заміни деяких із застарілих форм виробництва контенту, – продовжив він. “Чи то в аудіо-, чи, зрештою, в майбутньому, у відеоформаті”.

Саме так: Захопивши ринок у світі аудіопідробок, Veritone планує зробити ще один крок і увійти в світ повністю реалізованих віртуальних аватарів, які і звучать, і виглядають так, що їх неможливо відрізнити від їх джерела.

Раптом та персоналізована реклама з “Окремої думки” звучатиме набагато менше як наукова фантастика.

Рекомендації редакції

Чому штучний інтелект ніколи не буде правити світом

Оптичні ілюзії можуть допомогти нам створити наступне покоління штучного інтелекту
Останній штрих: як вчені наділяють роботів тактильними відчуттями, подібними до людських
Формула сміху: Чому машинний гумор – це святий грааль АІ
Майбутнє автоматизації: Роботи йдуть, але вони не заберуть вашу роботу
HBO Max

Спеціальні можливості
Що буде далі: Як технології допомагають суспільству відкритися після коронавірусу
Veritone MARVEL.ai

Source: digitaltrends.com

Каталог статей

Цей стартап хоче глибоко клонувати ваш голос і продавати його тому, хто більше заплатить

Цей стартап хоче глибоко клонувати ваш голос і продавати його тому, хто більше заплатить

“Ми можемо багато чого переосмислити”

Як відреагує громадськість?

Подумайте про майбутнє

Чому штучний інтелект ніколи не буде правити світом

Добавить комментарий

Цей стартап хоче глибоко клонувати ваш голос і продавати його тому, хто більше заплатить

“Ми можемо багато чого переосмислити”

Як відреагує громадськість?

Подумайте про майбутнє

Чому штучний інтелект ніколи не буде правити світом

Похожие записи:

Добавить комментарий