fbpx

Каталог статей

Каталог статей для размещения статей информационного характера

Технології

Нова розумна система розпізнавання мови від Массачусетського технологічного інституту вивчає мову, як новонароджена дитина

Нова розумна система розпізнавання мови від Массачусетського технологічного інституту вивчає мову, як новонароджена дитина

Системи розпізнавання мови, можливо, ще не досконалі, але, як показують приклади Amazon Echo, вони постійно вдосконалюються і стають все більш поширеними.

Нове дослідження дослідників з Лабораторії комп’ютерних наук і штучного інтелекту Массачусетського технологічного інституту (CSAIL) пропонує нову методику навчання цих систем – шляхом навчання за допомогою зображень.

“Це спроба зробити так, щоб машини потребували менше навчання під наглядом для вивчення розмовної мови”, – сказав Джим Гласс, старший науковий співробітник CSAIL, в інтерв’ю виданню Digital Trends. “Традиційний спосіб навчання систем розпізнавання мови – це використання записів розмов людей і, для кожного висловлювання, транскрипція того, які саме слова були сказані. В ідеалі, у вас є сотні або тисячі годин мовлення, щоб система працювала належним чином. Деякі з найбільших компаній, що займаються цим – такі як Baidu і Google – використовують десятки тисяч годин для навчання. Чим більше у них анотованих даних, тим краще працюють ці системи”.

Так що ж у цьому поганого? Адже, як зазначалося, технології розпізнавання мови постійно вдосконалюються. Що б не робили комп’ютерні вчені, очевидно, працює.

Можливо, це і так, але цей новий підхід цікавий з кількох причин. По-перше, відкриття здатності машини навчати себе розуміти, дивлячись на комбіновані зображення і аудіо (зрештою, можна уявити, що вона навчається, переглядаючи YouTube), набагато ближче до того, як ми навчаємось як люди.

По-друге – і це, мабуть, важливіше – це той факт, що це може допомогти принести розпізнавання мови в ті частини світу, які могли б отримати велику користь від такого роду технологій.

“Виробництво анотованих даних є дорогим”, – продовжив пан Гласс. “Розпізнавання мовлення триває вже десятки років, і здебільшого це стосується мов тих країн, які можуть дозволити собі інвестувати в такого роду ресурси. Коли справа доходить до мов, це, як правило, ті мови, які, на думку компаній, допоможуть їм отримати прибуток. Найбільше уваги приділяється англійській мові, за нею йдуть західноєвропейські мови, а також інші мови, такі як японська та китайська. Проблема полягає в тому, що у світі існує близько 7000 мов, якими розмовляють, і близько 300, якими розмовляють понад 1 мільйон людей. Багатьом з них просто не приділяється достатньої уваги – якщо взагалі приділяється”.

У тих частинах світу, де рівень грамотності низький, легко зрозуміти, як розпізнавання мови може змінити ситуацію з точки зору надання людям доступу до інформації. Сподіваємось, що ця технологія допоможе досягти цієї мети.

Є надія, що з часом такі підходи до розпізнавання мовлення підвищать свою ефективність до такої міри, що трудомістке маркування даних мовного навчання перестане вважатися необхідністю.

Якщо все піде за планом, то від цього виграють усі – чи то англомовні громадяни США, чи то носії мови хоса в Південній Африці.

Рекомендації редакції

10 найкращих АІ-генераторів зображень для створення мистецтва з тексту

  • Чому АІ ніколи не буде правити світом
  • Як ми дізнаємося, коли АІ насправді стане розумним?
  • Ноутбук для машинного навчання Lambda – це замаскований Razer
  • Нові підказки Google Docs спробують виправити ваш поганий почерк
  • андроїд повідомлення поліпшення телефони повідомлення один одному

Source: digitaltrends.com

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *