fbpx

Каталог статей

Каталог статей для размещения статей информационного характера

Технології

Розпізнавання мови смартфоном дозволяє набирати текст в 3 рази швидше, ніж ви можете набрати його на клавіатурі

Розпізнавання мови смартфоном дозволяє набирати текст в 3 рази швидше, ніж ви можете набрати його на клавіатурі

Комп’ютерне диктування набагато краще, ніж це було десять років тому, але наскільки краще? Це було завданням комп’ютерних вчених зі Стенфордського університету, Вашингтонського університету і китайського технологічного гіганта Baidu, які нещодавно провели експеримент, в якому люди змагалися з найсучаснішим програмним забезпеченням для розпізнавання мовлення як за швидкістю, так і за точністю.

Професор комп’ютерних наук зі Стенфорда Джеймс Лендей сказав, що дослідження розпочалося з “розмови в кав’ярні” між ним і професором Стенфорда Ендрю Нгом, який зараз є головним науковим співробітником Baidu. “Ендрю сказав, що інструменти розпізнавання мови Baidu стають дійсно чудовими, але вони не знають правильного експерименту, щоб кількісно оцінити це”, – розповів Лендей в інтерв’ю Digital Trends.

Хмарне програмне забезпечення для розпізнавання мови Deep Speech 2 від Baidu засноване на нейронній мережі глибокого навчання: вражаючий інструмент машинного навчання, який здатний навчатися, аналізуючи величезні масиви даних реальної мови.

  • Intel Core i5 vs. i7: який процесор підійде саме вам?
  • Чому я перетворив свій ноутбук з Windows на Chromebook, і чому ви теж повинні це зробити
  • Pixel Feature Drops раніше були вражаючими – тепер вони жахливо посередні

“Раніше у нас не було даних і обчислювальних можливостей для побудови цих моделей, щоб комп’ютер міг розуміти різні акценти і особливості мови”, – продовжує Лендей.

Зрештою, звичайна розмова між Ландеєм і Нгом перетворилася на повномасштабний експеримент, в якому взяли участь 32 учасники, які розмовляли або китайською, або англійською мовами. Всі учасники вже давно користувалися текстовими повідомленнями, і обидва використовували стандартні клавіатури, які поставляються разом з iPhone.

Для англомовних це означало звичайну QWERTY клавіатуру iOS, в той час як учасники, які розмовляли китайською мовою, використовували клавіатуру Apple з піньїньською розкладкою. В обох випадках розпізнавання мови відбувалося приблизно втричі швидше, ніж користувачі могли набирати текст – при цьому рівень помилок був на 20,4 відсотка нижчим для розпізнавання англійської мови і на 63,4 відсотка нижчим для мандаринського еквіваленту.

“Я очікував, що розпізнавання мови буде швидшим за розпізнавання тексту”, – сказав Ландей. “Ми знаємо це, тому що ви можете говорити швидше, ніж ви можете друкувати. Проблема в минулому полягала в тому, що ви отримували багато помилок при розпізнаванні мови, і це сповільнювало вас. Я думав, що мова виявиться швидшою. Але я не очікував, що вона виявиться втричі швидшою. Я думав, може, відсотків на 50 швидше. Натомість це виявилося набагато більше”.

Звичайно, тест не є вичерпним на 100 відсотків. Наразі найшвидшою у світі мобільною клавіатурою (принаймні англійською мовою) є клавіатура стороннього виробника Fleksy. У 2014 році в Книзі рекордів Гіннеса за найшвидший набір тексту користувач зміг набрати 126 літер за 1 секунду.

Щодо значення дослідження, Лендей вважає, що воно є важливим еталоном для розпізнавання мови. “Є ще багато можливостей для вдосконалення, але ми вважаємо, що певна точка перегину вже пройдена”, – сказав він. “Подальші вдосконалення будуть стосуватися розпізнавання імен, кращої роботи в шумному середовищі тощо”.

Це, за його словами, відкриває більше можливостей для розробників більш серйозно подумати про включення розпізнавання мови в свої системи без хвилювань. “Те, що буде мати все більший сенс, – це покладатися на мову, – сказав він. “Наприклад, мультимодальні інтерфейси, що поєднують мову з іншими елементами, щоб допомогти людям орієнтуватися. Проте найбільшим викликом буде розуміння значення слів і речень. Над цим ще треба працювати”.

Рекомендації редакторів

  • Фотографічні стилі – це найбільш недооцінена функція камери iPhone 14, яку ви не використовуєте
  • Маєте M1 Mac? Apple тепер дозволить вам відремонтувати його самостійно
  • Що таке ЦАП і навіщо він потрібен?
  • 3 круті речі, які варто спробувати з додатком Freeform від Apple для Mac
  • Ваші коментарі в Instagram не відображаються? Ви не самотні

Source: digitaltrends.com

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *