fbpx

Каталог статей

Каталог статей для размещения статей информационного характера

Технології

Система машинного навчання оживляє нерухомі зображення, вгадуючи, що буде далі

Система машинного навчання оживляє нерухомі зображення, вгадуючи, що буде далі

Чи то вгадування того, яку пісню ви хочете послухати, чи то які рекламні оголошення вам слід показати, сучасний ШІ все більше зосереджується на прогнозуванні майбутнього. Але між подібними програмами і тим, щоб просто подивитися на сцену і вгадати, що станеться далі, лежить величезна прірва.

Саме це зробили дослідники з Массачусетського технологічного інституту в новій статті, яка розкриває не лише їхню здатність дивитися на нерухомі зображення і вгадувати, що станеться далі – те, що ми висвітлювали в минулому – але й фактично генерувати відео з цим.

“Ми зацікавлені в тому, щоб навчити машини тому, що може статися в конкретній обстановці”, – розповів Digital Trends Карл Вондрік, аспірант в галузі комп’ютерних наук. – “Наприклад, ми хотіли, щоб машина могла створювати відео. “Наприклад, ми хотіли, щоб машина розпізнавала, що відбувається на пляжі. Ми хочемо, щоб вона знала, що хвилі будуть розбиватися, люди будуть грати у воді – це все речі, яким дуже важко навчити машину. Причина в тому, що людині потрібно дуже багато часу, щоб сісти і написати правила, щоб пояснити все, що може статися в тому чи іншому сценарії. Натомість ми хотіли навчити їх, переглядаючи величезну кількість відеоматеріалів”.

  • Оптичні ілюзії можуть допомогти нам створити наступне покоління ШІ
  • Наступні графічні процесори Nvidia будуть частково спроектовані ШІ
  • У Windows 11 були великі чотири місяці. Ось що буде далі

Для цього Вондрік і його колеги-дослідники використовували глибоке навчання, щоб “навчити” комп’ютер розуміти повсякденні сцени, переглядаючи еквівалент дворічної давності відеоматеріалів в Інтернеті. Після цього вони показали машині нерухомі зображення і попросили її згенерувати відео, щоб оживити цю сцену.

Як і багато інших прикладів комп’ютерної творчості, таких як технологія DeepDream від Google, згенеровані зображення можуть бути дещо тривіальними – хоча не можна заперечувати, що вони багато в чому правильно відображають світ. Наприклад, система Массачусетського технологічного інституту бере нерухоме зображення пляжу і анімує його, щоб показати розбиття хвиль, саме так, як сподівався Вондрік.

Обмеження означають, що відеоролики тривають лише одну секунду і анімовані як телевізійні фільми 1990-х років, але це вражаючий початок.

“Одне з застосувань, яке мене дуже зацікавило, – це передбачення майбутнього”, – сказав Вондрік. “Наша робота полягає у створенні відео, яке дозволяє нам передбачити, що станеться далі. Це важливо для робототехніки. Ви можете собі уявити, що робот може передбачити, коли, наприклад, літня людина впаде, а потім запобігти цьому. Це також має застосування у комп’ютерній графіці. Наразі система не є фотореалістичною, але, продовжуючи її вдосконалювати, я думаю, що ми зможемо генерувати повноцінні відео. Тому це може бути дуже корисним інструментом для чогось на кшталт голлівудського кіновиробництва”.

Потенційно це ще більш значуще. “У найбільшому сенсі ця робота стосується того, як комп’ютер навчається моделювати світ”, – сказав він. “Навчити машину розуміти, як працює світ, буде дуже важливо, оскільки комп’ютери починають робити все більше і більше дій в нашому світі – і для цього їм потрібно розуміти, що відбувається”.

Рекомендації редакції

  • Сьогодні виповнилося п’ять років з дня випуску iMac Pro. Що буде далі?
  • Відеодзвінки в Microsoft Teams незабаром будуть працювати на основі штучного інтелекту та машинного навчання
  • Ноутбук Lambda з машинним навчанням – це замаскований Razer
  • Радар Aptiv на основі машинного навчання бачить навіть те, що ви не бачите
  • Що таке Nvidia Image Scaling? Як користуватися функцією масштабування

Source: digitaltrends.com

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *