5 способів, за допомогою яких майбутні асистенти штучного інтелекту виведуть голосові технології на новий рівень

catalogue of articles 22 января, 202321 февраля, 2024 Комментариев нет

5 способів, як майбутні АІ-помічники виведуть голосові технології на новий рівень

З моменту дебюту Siri на iPhone 4s у 2011 році голосові помічники пройшли шлях від неробочого трюку до основи технології розумних колонок, які є в кожному шостому американському домі.

Більше знань, менше проблем
Більше (і краще) персоналізації
Стаємо проактивнішими
Вся справа у зворотному зв’язку
Нові методи взаємодії

“До появи Siri, коли я говорив про те, чим я займаюся, на мене дивилися порожніми поглядами”, – розповів Digital Trends Том Хебнер (Tom Hebner), керівник відділу інновацій компанії Nuance Communications, яка займається розробкою передових голосових технологій зі штучним інтелектом. “Люди говорили: “Ви створюєте ці жахливі телефонні системи? Я вас ненавиджу”. Це була єдина взаємодія однієї групи людей з голосовими технологіями”.

Сьогодні це вже не так. За прогнозами eMarketer, до 2020 року майже 100 мільйонів користувачів смартфонів будуть користуватися голосовими помічниками. Але, хоча асистенти зі штучним інтелектом вже не є новинкою, ми все ще перебуваємо на початку їх еволюції. Попереду ще довгий шлях, перш ніж вони повністю виправдають обіцянки, які покладаються на голосових помічників як на товарну категорію.

Ось п’ять способів, за допомогою яких ця технологія може бути вдосконалена, щоб зробити її розумнішою і ефективнішою – і в результаті допомогти нам вести більш продуктивне життя. Називайте їх “прогнозами” або “списком бажань”, але це проблеми, які необхідно вирішити.

Більше знань, менше проблем

Alexa може сказати вам, яка погода в Куала-Лумпурі, Малайзія; скільки доларів США ви отримаєте за 720 південноафриканських рандів, і як пишеться “дестабілізаціонізм”. А ось споживчі ШІ-помічники – це, по суті, цифровий еквівалент людини з повним набором найсучасніших енциклопедій. Ви отримуєте (сподіваємося) правильну інформацію, але там немає професійного рівня експертизи.

“Проблема, з якою стикаються системи у вашому домі, полягає в тому, що вони намагаються робити дуже широкий спектр речей”, – сказав Хебнер в інтерв’ю Digital Trends.

Це складне завдання, але це може змінити правила гри. Nuance розробляє багато спеціалізованих систем, націлених на один конкретний випадок використання, наприклад, допомагаючи клієнтам авіакомпаній відповідати на запити або лікарям робити нотатки. Це не тільки означає, що ці системи можуть заглиблюватися, щоб отримати більш детальну інформацію, але й означає, що в них може бути вбудовано більше інтелектуальних даних. “Люди були дуже схвильовані комп’ютерами, які могли розуміти слова, але це не обов’язково має значення, якщо ви не знаєте, що робити з цими словами”, – сказав Хебнер.

Він навів приклад системи Nuance, яка не лише розуміє, коли лікарі зачитують список потенційних ліків для пацієнтів, але й може попередити про потенційні конфлікти. Це далеко за межами можливостей більшості асистентів зі штучним інтелектом користувацького рівня.

Однак наявність більш детальних знань у різних сферах – на що натякає Alexa Skills – може стати трансформаційним фактором. Прохання до розумної колонки про юридичну або медичну консультацію звучить, на перший погляд, божевільно. Але в таких областях, як юридичні боти, були досягнуті надзвичайні успіхи, в той час як нещодавно опублікований звіт свідчить про те, що Apple хоче, щоб Siri могла вести бесіди з користувачами на тему здоров’я до 2021 року.

Графи спеціальних знань для помічників зі штучним інтелектом зараз є предметом фантастичних мрій, хоча нещодавній звіт Voicebot.ai показує, наскільки швидко розширюється набір навичок віртуальних помічників. Однак, коли навички перейдуть на територію спеціальностей, нас чекає справжнє задоволення!

Більше (і краще) персоналізації

Персоналізація сучасних розумних колонок все ще знаходиться в зародковому стані. Ви можете змінювати акцент і стать голосового помічника, додавати або видаляти навички, а також повідомляти йому інформацію про своє ім’я та місце роботи. У деяких випадках ви можете налаштувати кілька голосових профілів, щоб Google Home розпізнавав окремих членів вашого домогосподарства.

Але попереду ще довгий шлях – хоча сік повинен бути вартий того, щоб його вичавити. Компанія Mattersight Corporation розробила технологію колл-центру зі штучним інтелектом під назвою Predictive Behavioral Routing, яка аналізує мовленнєві шаблони абонентів і підбирає їм людей-операторів із сумісними типами особистості. За даними компанії, підбір людини з сумісним типом особистості призведе до успішної розмови, яка триватиме вдвічі менше часу, ніж розмова з людиною з конфліктним типом особистості.

Використання подібного підходу може призвести до того, що асистенти зі штучним інтелектом відповідатимуть вам так, як ви хочете, щоб до вас зверталися. Це може бути щось таке просте, як відповідність акценту і гучності голосу людини, з якою вони розмовляють. Або він може змінити спосіб викладу думок, можливо, використовуючи більш емоційні слова для одних користувачів, порівняно з більш щільною детальною інформацією, яку він міг би використовувати для інших. Можливо, деякі люди хочуть, щоб голосовий асистент довго спілкувався з ними, в той час як інші просто хочуть, щоб він передав необхідну інформацію в максимально стислій формі. Асистенти зі штучним інтелектом повинні вміти і те, і інше.

Такі технології, як Google Duplex, показують, наскільки переконливо точними стають синтезовані голоси і розмови, згенеровані ШІ. В міру того, як ШІ просуваються в сфери, більш складні, ніж замовлення пісень і таймери приготування їжі, очікується, що ця технологія відіграватиме важливу роль.

Цьому можуть сприяти прориви в здатності ідентифікувати користувачів за голосом. Гебнер зазначає, що технологія Nuance може ідентифікувати користувачів лише за однією секундою аудіозапису. “Раніше потрібно було 10 секунд, щоб зрозуміти, хто ви, щоб отримати точний сигнал”, – сказав він. “Це значний прогрес”. Можливість ідентифікувати користувачів за невеликим фрагментом голосу вирішує проблему паролів і відкриває можливість використовувати голосових помічників для більш делікатної конфіденційної інформації.

Стаємо проактивнішими

Хороший помічник

Існують великі питання щодо того, чи хочуть люди передавати певну роботу машинам чи ні.

Як би ви поставилися до того, щоб помічник зі штучним інтелектом приймав рішення від вашого імені? Це може бути що завгодно – від включення термостата, коли хтось каже, що йому холодно, або перенесення обідньої зустрічі, тому що ви запізнюєтеся, до підказок робити більше фізичних вправ або краще заощаджувати свою зарплату. У міру того, як все більше і більше розумних пристроїв проникає в будинок, кількість речей, якими може керувати голосовий помічник, значно збільшиться.

Частково це соціальне питання про те, наскільки комфортно людям, коли машини приймають рішення за них. Існують великі питання щодо того, чи хочуть люди передавати певну роботу машинам чи ні. Подумайте про це, як про передачу кредитної картки і ключів від будинку своєму помічникові з плоті і крові – тільки з набагато більшим посипанням Скайнету. Недоліком є відмова від певної частки контролю. Потенційним плюсом є збільшення вашого вільного часу. Звичайно, існує великий технічний виклик…

Вся справа у зворотному зв’язку

Том Хебнер вказав на великий виклик, пов’язаний з питанням проактивності: як наші машини знають, коли вони все зробили правильно? Повертаючись до ідеї про хорошого та чудового помічника, чудовий помічник може підготувати всі ваші файли перед великою зустріччю, і вам не потрібно буде про це просити. Але що, якщо це неправильні файли? Великою проблемою в тому, щоб зробити домашніх помічників зі штучним інтелектом більш проактивними, є те, що в даний час існує мало способів виявити, чи є інформація, яку ми отримуємо, правильною чи неправильною.

“Якщо я прошу поставити одну і ту ж пісню кожен день, коли заходжу в свій будинок, а потім одного разу я заходжу, і вона просто починає грати, як вони дізнаються, що вони отримали її правильно?” сказав Хебнер. “Якщо я не зупиняю її, чи означає це, що вона правильна? Якщо я скажу “стоп”, чи означає це, що вона зробила щось не так і не повинна більше цього робити? Механізм зворотного зв’язку є однією з причин, чому ви не отримуєте більш проактивних систем”.

Це складне питання для інженерів. Будь-хто, хто коли-небудь мав стажиста, який просив у нього інструкцій та зворотного зв’язку щодо кожного завдання, знає, що іноді легше виконати роботу самому, ніж делегувати її. Асистент штучного інтелекту створений для того, щоб зробити ваше життя більш безпроблемним, а не для того, щоб щодня проводити десятки міні-опитувань, щоб підтвердити, чи правильно він зробив свою роботу. Це потрібно вирішити таким чином, щоб не порушити зручність користування цими пристроями і не вимагати тривалого навчання перед тим, як системи вивчать ваші уподобання.

Яка ж відповідь? Я не впевнений. Але, як одного разу сказав Стів Джобс, це не робота клієнта з’ясовувати це.

Нові методи взаємодії

У фільмі “2001: Космічна одіссея” є сцена, в якій кровожерливий HAL 9000, на диво досі найвідоміший вигаданий штучний інтелект в історії, показує, що він використовує мікрофони не тільки для того, щоб визначити, що йому говорять. Коли двоє членів екіпажу намагаються вибрати місце для розмови, де вони знають, що Хол не почує, Хол обертається

Ідея про те, що голосові помічники повинні обмежуватися лише голосом, зменшує можливу кількість способів їхньої корисної взаємодії з нами. З розвитком технологій розпізнавання облич і відстеження емоцій, постійним зростанням кількості біометричних даних, які постійно збираються про користувачів, і навіть можливістю технології читання думок на горизонті, з’являється безліч різних сигналів, які можуть бути використані штучними інтелектами для того, щоб робити свої висновки.

Думка про те, що через 10 років ми будемо використовувати тільки голос для управління цими помічниками ШІ, все одно, що дивитися на комп’ютери на початку 80-х і думати, що ми ніколи не матимемо в своєму розпорядженні більше, ніж клавіатуру.

Рекомендації редакції

Наступне велике відкриття в науці вже у вас в кишені

Як далеко ми знаходимося від масового домашнього інтернету 5G?
Штучний інтелект, що відчуває емоції, вже тут, і він може бути на вашій наступній співбесіді
Асистенти вчителя зі штучним інтелектом можуть допомогти заповнити прогалини, створені віртуальними класами
Тимчасові татуювання, що зчитують мозкові хвилі, можуть вивести технології, що носяться, на новий рівень
Amazon Echo Show

Source: digitaltrends.com

Каталог статей

5 способів, за допомогою яких майбутні асистенти штучного інтелекту виведуть голосові технології на новий рівень

5 способів, як майбутні АІ-помічники виведуть голосові технології на новий рівень

Більше знань, менше проблем

Більше (і краще) персоналізації

Стаємо проактивнішими

Вся справа у зворотному зв’язку

Нові методи взаємодії

Наступне велике відкриття в науці вже у вас в кишені

Добавить комментарий

5 способів, як майбутні АІ-помічники виведуть голосові технології на новий рівень

Більше знань, менше проблем

Більше (і краще) персоналізації

Стаємо проактивнішими

Вся справа у зворотному зв’язку

Нові методи взаємодії

Наступне велике відкриття в науці вже у вас в кишені

Похожие записи:

Добавить комментарий