fbpx

Каталог статей

Каталог статей для размещения статей информационного характера

Технології

Штучний персоналізований голос: тембр на благодійність

У світі налічується близько 2,5 млн людей, які з різних причин втратили можливість розмовляти голосом, і за них це робить комп’ютер. Електронний голос звучить постійно однаково, і таких пацієнтів не відрізнити на слух. Однак незабаром це може змінитися, адже у світі з’явився банк голосу, куди можна пожертвувати свій.
Один з найпопулярніших фізиків – Стівен Хокінг, відомий також своєю системою комунікації. Букви вимовляє комп’ютер, і цей голос став іконою, а сам вчений вже вважає його своїм. Він користується однією системою комунікації вже понад 20 років, але його хвороба продовжує прогресувати, і поточне рішення вже не справляється. І коли в Intel почали роботу над нової, поліпшеної версії системи, у Хокінга була лише одна вимога – залишити його голос без змін.
«Цей голос став таким відомим, що він вважає його персональних голосом, – розповідає Хорст Хоссекер. Він працює керівником проекту оновлення комунікаційної системи і займає посаду директора лабораторії Intel Computational Imaging Lab. – Він заснований на застарілій технології, але це робить його унікальним і його неможливо скопіювати, навіть якщо захотіти».
Ідея створення банку голоси
Незважаючи на те, що люди втрачають здатність розмовляти, вони все одно хочуть демонструвати свою природну індивідуальність навіть при спілкуванні через комп’ютер. Дослідниця Рупал Пател в 2002 році з’ясувала, що для цього вони змінюють тембр і висоту комп’ютерного голосу так, щоб він був максимально схожий на їх власний. Однак це не допомагало, і розрізнити особистість користувача на слух було неможливо.
«Я склала два плюс два, – згадує вона, – Я подумала, що якщо у них є ця частина голоси, тоді можна побудувати для них персональне звучання». Ця ідея залишилася, і в наступні роки Пател розвивала свої технології. У 2007 році вона заснувала свою компанію VocaliD, мета якої – створювати персональний голос для комп’ютерних систем мовлення, які використовують німі люди. Для цього вона змішує звуки, що видають пацієнти, із записами слів від здорових донорів. Ця послуга платна, а ціна фінального «голоси» залежить від початкових вимог.
Створювати індивідуальний голос фахівцям VocaliD вдається завдяки тому, що звучання людини складається з двох компонентів. Голосові зв’язки генерують звук, а індивідуальності йому додає фільтр – шлях, по якому проходить повітря всередині тіла. Різні травми впливають саме на останній, а ось голосові зв’язки залишаються робочими.
Завдання експертів VocaliD – знайти такого донора, який має схожий фільтр, і з допомогою сучасних технологій накласти його на звуки, які видає пацієнт. Стати донором такого банку голосу може кожен – для цього потрібен комп’ютер, мікрофон і кілька годин для запису сотень підготовлених пропозицій. Поки компанія працює тільки з англійською мовою, тому записи виконуються нею.
Після надходження записів фахівці VocaliD нарізають їх на окремі слова або словосполучення, які можна склеювати разом в будь-якому порядку.
За оцінками Пател, голосовими донорами стало вже 500-600 осіб, а ще близько 24 тисяч записалися в добровольці і готуються зробити це в майбутньому. «У минулому ми шукали підходящий голос за базовими параметрами донора – віком і статтю, – розповідає фахівець. – Зараз ми розробляємо нові методи більш тонкого пошуку, щоб брати до уваги різні нюанси: якість голосу, хрипоту, акцент, ріст і вага тощо».
В майбутньому VocaliD планує піти ще далі по шляху персоналізації і зробити так, щоб штучний голос дорослішав разом з пацієнтом. «Якщо у вас є записи людини з певними проміжками часу, ви побачите, що голос змінюється, – каже Пател. – Можливо, для цього не обов’язково шукати нового донора, а можна зробити це комп’ютерною обробкою».
«Дуже важко переоцінити важливість голосу в тому, як ми уявляємо себе світу, – говорить учений Університету Каліфорнії Джоді Крейман. – Так само, як при погляді на кого можна робити висновки, так само, і якщо почути їх голос. Рівень освіти, здоров’я, зовнішній вигляд, соціальні здібності – все це можна почути голоси. Якщо його втратити, тоді втрачається соціальне «я».
Створювати штучні персоналізовані голоси трудомістка і тривалий завдання. Поки VoiceiD виконало для трьох дівчат-підлітків. Вони звучать все ще роботизированно, але в їх голосі відстежується індивідуальність:
«Справжній питання в тому, як швидко ми можемо повертати людям їх голос, – говорить Пател. – Список очікування налічує більше тисячі пацієнтів. На створення кожного голосу, крім запису донора, потрібно 10-15 годин».
У VocaliD також хочуть заробляти гроші не тільки на інвалідах, але і продавати свої послуги звичайним людям. «Можна озвучувати вхідні електронні листи своїм голосом, – каже Пател. – Або зробити відеоігри більш персональними, надавши своїм віртуальним героям власний голос».

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *