fbpx

Каталог статей

Каталог статей для размещения статей информационного характера

Технології

Новітній штучний інтелект Массачусетського технологічного інституту напрочуд добре розпізнає, що відбувається на відео

Новітній ШІ Массачусетського технологічного інституту напрочуд добре визначає, що відбувається на відео

Всього кілька кадрів інформації, що розповідають історію, – це все, що нам потрібно, щоб зрозуміти, що відбувається. Це, зрештою, основа коміксів – які надають достатньо важливих сюжетних моментів, щоб ми могли зрозуміти, що сталося. На жаль, роботам, оснащеним технологією комп’ютерного зору, важко це зробити. Принаймні, до цього часу.

Нещодавно Массачусетський технологічний інститут (MIT) продемонстрував новий тип системи штучного інтелекту, яка використовує нейронну мережу для заповнення прогалин у відеокадрах, щоб з’ясувати, яка діяльність відбувається. Результати показали, що вона напрочуд добре визначає, що відбувається на відео.

“Нещодавно розроблені модулі часових відносин дозволяють системі ШІ аналізувати кілька ключових кадрів і оцінювати часові відносини між ними, щоб зрозуміти, що відбувається на відео – наприклад, штабель об’єктів, який падає”, – розповів Digital Trends Болей Чжоу (Bolei Zhou), колишній аспірант Лабораторії комп’ютерних наук і штучного інтелекту Массачусетського технологічного інституту (CSAIL), який зараз є доцентом кафедри комп’ютерних наук в Китайському університеті в Гонконзі. “Оскільки модель працює з ключовими кадрами, рідко вибраними з вхідного відео, ефективність обробки значно підвищується, що дозволяє розпізнавати активність в реальному часі”.

Ще однією цікавою властивістю моделі ШІ є те, що вона може передбачати і прогнозувати те, що станеться на ранніх стадіях, переглядаючи кадри відео. Наприклад, якщо він бачить людину, яка тримає пляшку, алгоритм передбачає, що вона може взяти напій або, можливо, стиснути її. Такі здібності передбачення будуть важливими для штучного інтелекту, що використовується в таких сферах, як автономне водіння, де він може проактивно запобігати аваріям, вгадуючи, що станеться в той чи інший момент.

“Він також може бути використаний для моніторингу людської поведінки, як, наприклад, домашній робот-помічник, який може передбачати ваші наміри, доставляючи речі заздалегідь”, – продовжив Чжоу. “Він [додатково може бути використаний] для аналізу величезної кількості відео в Інтернеті, для кращого розуміння відео і пошуку відео”.

Наступним кроком проекту буде розширення можливостей ШІ з розпізнавання ширшого кола об’єктів і дій. Команда також працює з дослідниками робототехніки над впровадженням цього розпізнавання в робототехнічні системи. В результаті вони можуть отримати покращене сприйняття і навички візуального мислення.

Рекомендації редакторів

  • Мета створила DALL-E для відео, і це одночасно моторошно і

Source: digitaltrends.com

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *