fbpx

Каталог статей

Каталог статей для размещения статей информационного характера

Технології

Alexa і Siri не розуміють тон вашого голосу, але Oto може

Alexa і Siri не розуміють тон вашого голосу, але Oto може

Технологія розпізнавання мовлення сьогодні використовується повсюдно, особливо в розумних помічниках зі штучним інтелектом, таких як Alexa від Amazon, Siri від Apple і Google Assistant. Але, як знає кожен, хто коли-небудь спілкувався в реальному житті, мовлення – це не лише слова, які людина вимовляє, але й тон, яким вона їх вимовляє. Це одна з причин, чому текстові розмови в Інтернеті можуть бути таким кошмаром, оскільки самі по собі основні слова не дають достатньої кількості нюансів для того, щоб завжди передати значення людини.

Одним з цікавих стартапів, який прагне внести більше розуміння в розпізнавання мови, є Oto, відгалуження від престижної SRI International, яка допомогла створити Siri більше десяти років тому. Oto працює над технологією голосових інтонацій, яка, принаймні на початковому етапі, дозволить колл-центрам краще розуміти голосові емоції як абонентів, так і торгових агентів.

“Наша місія в Oto полягає в тому, щоб розблокувати емпатію в машинах, і з цією метою ми розробили DeepTone, унікальну технологію, засновану на глибоких нейронних мережах, навчених на сотнях тисяч реальних розмов, щоб оцінити крихітні варіації емоцій, присутніх в мові”, – сказав Ніколя Пероні, співзасновник і головний технічний директор Oto, в інтерв’ю Digital Trends.

  • DirectStorage від Microsoft тепер може збільшити час завантаження ігор на 200
  • Нове шкідливе програмне забезпечення може вкрасти дані вашої кредитної картки – і воно швидко поширюється
  • Міні-комп’ютер Nvidia Jetson Orin Nano вартістю 200 доларів у 80 разів швидший за попередню версію

Ці крихітні варіації, описані як “латентні стани мовця”, дозволяють реєструвати емоційний тон слів мовця в режимі реального часу, багато разів на секунду. Система була навчена на базі даних 100 000 висловлювань від 3000 осіб, взятих з 2 мільйонів розмов про продаж.

“Застосування інтонації майже безмежне”, – сказав Тео Боршберг, співзасновник і генеральний директор компанії. “Ми вступаємо у світ, де переважає голос. Незабаром ви будете розмовляти з усім: Вашим автомобілем, годинником, холодильником, колонками [і не тільки]. Розуміння нюансів мовлення стане ключем до створення змістовних розмов. Зараз ми працюємо над людською якістю розмов у контакт-центрах. Поки що не можна судити про якість розмови лише за текстом, вона занадто неоднозначна”.

За допомогою технології Oto можна в режимі реального часу спонукати торгових агентів вкладати “правильну енергію” під час дзвінків, демонструючи при цьому достатню емпатію до клієнтів. “Цінність полягає в тому, що вперше колл-центри можуть вимірювати якість обслуговування і діяти на основі цієї інформації в масштабі, щоб врятувати розгніваних клієнтів від відтоку”, – сказав Боршберг.

Нещодавно Oto оголосила про раунд початкового фінансування в розмірі $5,3 млн. Ці кошти будуть використані для розвитку інженерної та торгової команд компанії. Це також допоможе їй ще більше розширити свої технологічні пропозиції для розуміння нових емоцій і поведінки за допомогою голосу.

Рекомендації редакції

  • Ця нова функція AMD може прискорити ваші ігри одним клацанням миші
  • Цей моторошний додаток для Mac може записувати кожну мить вашого життя в Інтернеті
  • Чому штучний інтелект ніколи не буде правити світом
  • Ви, ймовірно, не зможете досягти максимальної тактової частоти на Ryzen 9 7950X від AMD
  • Ця гра дозволяє хакерам атакувати ваш ПК, і вам навіть не потрібно в неї грати

Source: digitaltrends.com

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *