fbpx

Каталог статей

Каталог статей для размещения статей информационного характера

Технології

Імітація людського голосу. Нові технології перевернуть суспільство

Вимовте 160 французьких чи англійських фраз в додаток на смартфоні, яке розробляє компанія CandyVoice – програма проаналізує ваш голос і буде озвучувати їм будь-який текст.
Звучання, правда, виходить дещо штучне, але шеф компанії Жан-Люк Кребуа обіцяє, що вже скоро його неможливо буде відрізнити від вашого природного голосу. Аналогічну програму під назвою FestVox розробляє Інститут лінгвістичних досліджень Університету Карнегі-Меллон для англійської та чотирьох найпоширеніших мов в Індії. А китайський інтернет-гігант Baidu заявляє, що вже створив програму, якої достатньо послухати всього п’ятдесят пропозицій, щоб точно відтворювати будь-голос.
Клонування (або «банкінг») людського голосу досі було дуже недешевою справою, яку робили в студіях під замовлення, переважно для людей, які ризикували втратити голос з-за раку або операції. Для цього потрібно було вимовляти безліч фраз, причому щоразу з різним емоційним наголосом та інтонацією (стверджувальне пропозицію, питання, команда тощо), щоб охопити всі варіанти вимови. Вартість такої послуги у компанії AcapelaGroup в Бельгії становить щонайменше 3000 євро і вимагає, як мінімум, восьми годин студійного запису. Інші компанії беруть навіть дорожче і примушують своїх клієнтів днями просиджувати в студії.
Тепер цього всього не потрібно. Додаток на смартфоні розкладає сказані вами фрази на микрофрагменты тривалістю п’ять мілісекунд (кожен з точною заввишки), які використовують як своєрідний голосової алфавіт, з якого комбінує слова. За допомогою цього додатка жінка, наприклад, може надати свій голос програмі, яка озвучує текст на моніторі для її сліпого чоловіка. Шеф може записати свій командний тон на автовідповідач для підлеглих на роботі. Користувач Facebook може прослухати пост голосом його автора, а батьки, які багато часу проводять на роботі, можуть записати свої голоси на інтерактивні іграшки, якими грають їх діти. Принаймні так бачить майбутнє цієї технології Ґершон Сильберт, шеф компанії VivoText з Тель-Авіва, яка займається клонуванням голосу.
VivoText вже в наступному році планує випустити додаток, яке дозволить користувачам регулювати не тільки швидкість і інтонацію озвученого тексту, а навіть рівень радості чи смутку в ньому. Ліцензію на використання цієї програми VivoText планує надати американському виробникові дитячих іграшок Hasbro. Компанія хоче домогтися повністю ідентичного імітації голосу, однак у ній погоджуються, що успіхи одночасно лякають і вимагають запобіжних заходів. Адже, наприклад, пранкери можуть записати прокляття голосом мами і довести дитину до відчаю.
Ще більше лякає, що голос будь-якої людини можна взяти з YouTube або будь-якого іншого ресурсу. Дослідникам з Алабамського університету на чолі з Нитешем Саксеною достатньо п’яти хвилин онлайнових записів, щоб зімітувати голос з допомогою програми FestVox. Коли ці записи використовували проти біометричних голосових програм, які використовують банки для автентифікації клієнта, вони змогли обдурити їх у 80% випадків. А коли їх дали послухати добровольцям протягом 90 секунд, ті не змогли відрізнити підробки в половині випадків. За словами експерта голосових систем Джорджа Пепкуна, поява таких технологій «відкриває безмежний потенціал для дезінформації», особливо якщо їх використовують як доказ у суді. Ін. Пепкун, який раніше працював як експерт по синтезу людського голосу в Лос-Аламоської національної лабораторії (військова лабораторія в Нью-Мексико), вважає, що імітація голосу буде мати і військове застосування: наприклад, можна буде дезінформувати ворожі війська голосом їхнього командира.
Проти подібних дій сьогодні вже розробляють контрзаходи. Компанія Nuance Communications створює алгоритм, який буде розпізнавати крихітні коливання частоти в місцях, де микрофрагменты голоси зшиті разом. А розробник фотошопу Adobe закодирует в створений своїм додатком VoCo штучний голос спеціальні знаки, за яким комп’ютер зможе його впізнати. Втім, навіть незважаючи на все це, легко уявити, який хаос запанує в світі, якщо лиходії зможуть копіювати чий голос.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *