fbpx

Каталог статей

Каталог статей для размещения статей информационного характера

Технології

Штучний інтелект тепер може повторити голос будь-якої людини всього за хвилину тренувань

АІ тепер може повторити голос будь-якої людини всього за одну хвилину тренувань

Пам’ятаєте круту технологію з фільму “Місія нездійсненна”, яка дозволяє герою Тома Круза Ітану Ханту імітувати голоси інших персонажів за допомогою хитромудрої технології синтезу мовлення?

Так от, монреальський стартап під назвою Lyrebird (названий на честь птаха, що імітує звуки) щойно винайшов це по-справжньому.

“Ми розробляємо нові технології синтезу мови, які, серед іншого, дозволяють нам копіювати голос людини, маючи дуже мало даних”, – каже Александр де Бребіссон, один з аспірантів, який розробив технологію глибокого навчання, що лежить в основі проекту. “Наші експерименти показують, що одна хвилина аудіо вже містить багато ДНК людського голосу. Ми можемо вивчити новий голос, маючи так само мало даних, тому що наша модель здатна вловити схожість між новим голосом і всіма голосами, які вона вже знає. Наші моделі розуміють основні змінні, які роблять [один] голос відмінним від іншого”.

  • DirectStorage від Microsoft тепер може збільшити час завантаження ігор на 200
  • ШІ Dall-E, що генерує зображення, тепер доступний для всіх бажаючих
  • Хакери тепер можуть впроваджувати шкідливе програмне забезпечення в GIF-файли, якими ви ділитеся

За словами де Бребіссона, після того, як технологія була представлена на цьому тижні, його команда отримала десятки різних варіантів використання по електронній пошті, деякі з яких містили додатки, про які вони вже думали, а інші – ні.

Деякі компанії, наприклад, зацікавлені в тому, щоб їхні користувачі могли обирати аудіокниги, начитані голосами відомих людей або членів сім’ї. Те ж саме стосується медичних компаній, які могли б дозволити людям з вадами голосу тренувати свої синтетичні голоси, щоб вони звучали як вони самі, якщо існують записані зразки їхніх розмовних голосів. Ще одна цікава ідея – компанії, що розробляють відеоігри, можуть запропонувати можливість для ігрових персонажів говорити голосом людини-гравця.

Існує багато інших цікавих можливостей, які призвели до того, що 10 000 людей вже підписалися на розсилку інформації про майбутню бета-версію. “Згодом ми додамо нові функції, наприклад, дозволимо компаніям створювати унікальні голоси, пристосовані до їхніх потреб, і контролювати емоції [голосового] покоління”, – продовжив де Бребіссон.

Хоча це ще не звучить ідеально, не важко уявити, як це може звучати через кілька років. У поєднанні з такими технологіями, як програмне забезпечення для переконливого редагування рухомих губ людини, яка говорить, “фейкові новини” приблизно 2025 року, безумовно, повинні бути дуже веселими.

Рекомендації редакції

  • Оновіть Windows зараз – Microsoft щойно виправила кілька небезпечних експлойтів
  • Microsoft Edge тепер попереджає, коли ваші помилки можуть призвести до фішингу
  • Тепер ви можете знижувати голоси до коментарів до відео TikTok
  • Хакери тепер використовують нові

Source: digitaltrends.com

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *