Чому навчання роботів грі в хованки може стати ключем до ШІ нового покоління

catalogue of articles 21 января, 202321 февраля, 2024 Комментариев нет

Чому навчання роботів грі в хованки може стати ключем до ШІ наступного покоління

Штучний загальний інтелект, ідея розумного агента ШІ, здатного розуміти і навчатися будь-яким інтелектуальним завданням, які може виконувати людина, вже давно стала частиною наукової фантастики. Оскільки ШІ стає дедалі розумнішим і розумнішим – особливо завдяки проривам в інструментах машинного навчання, які здатні переписувати свій код, щоб вчитися на новому досвіді, – він дедалі частіше стає частиною реальних розмов про штучний інтелект.

Будуємо світи
Правила гри
Складне – легко, легке – важко

Але як ми вимірюємо AGI, коли він з’являється? Протягом багатьох років дослідники пропонували різні способи. Найвідомішим залишається тест Тюрінга, в якому людина-суддя взаємодіє, невидима, як з людиною, так і з машиною, і повинна спробувати вгадати, хто з них хто. Два інших – Тест студента коледжу роботів Бена Гертцеля і Тест працевлаштування Нільса Нільссона – спрямовані на практичну перевірку здібностей штучного інтелекту, з’ясовуючи, чи зможе він здобути вищу освіту або виконувати роботу на робочому місці. Інший, який я особисто не сприймаю, стверджує, що інтелект може бути виміряний успішною здатністю без проблем зібрати меблі в стилі “Ікеа”, що складаються з плоских пакунків.

Один з найцікавіших показників AGI був запропонований співзасновником Apple Стівом Возняком. Воз, як його називають друзі та шанувальники, пропонує “Кавовий тест”. Загальний інтелект, за його словами, означав би робота, який здатний зайти в будь-який будинок у світі, знайти кухню, зварити свіжу чашку кави, а потім налити її в кухоль.

Оптичні ілюзії можуть допомогти нам створити наступне покоління ШІ
Останній штрих: як вчені наділяють роботів тактильними відчуттями, подібними до людських
Смішна формула: Чому машинний гумор – це святий грааль ШІ

Як і з кожним тестом на інтелект ШІ, можна сперечатися про те, наскільки широкими або вузькими є параметри. Однак ідея про те, що інтелект повинен бути пов’язаний зі здатністю орієнтуватися в реальному світі, є інтригуючою. Це також намагається перевірити новий дослідницький проект.

Будуємо світи

“За останні кілька років спільнота ШІ досягла величезних успіхів у навчанні агентів ШІ виконувати складні завдання”, – розповів Digital Trends Лука Вайс, науковий співробітник Інституту Аллена по ШІ, лабораторії штучного інтелекту, заснованої покійним співзасновником Microsoft Полом Алленом.

В якості прикладу Вайс навів розробку DeepMind агентів штучного інтелекту, які здатні навчитися грати в класичні ігри Atari і перемагати людей в го. Однак Вайс зазначив, що ці завдання “часто відірвані” від нашого світу. Покажіть картинку реального світу ШІ, навченому грати в ігри Atari, і він буде

Інститут Аллена створив щось на кшталт імперії нерухомості. Але це не фізична нерухомість, а віртуальна. Інститут розробив сотні віртуальних кімнат і квартир – в тому числі кухні, спальні, ванні кімнати і вітальні – в яких агенти ШІ можуть взаємодіяти з тисячами об’єктів. Ці простори можуть похвалитися реалістичною фізикою, підтримкою декількох агентів і навіть такими станами, як спека і холод. Ідея полягає в тому, щоб дозволити агентам ШІ грати в цих середовищах, щоб вони могли побудувати більш реалістичне сприйняття світу.

“У [нашій новій] роботі ми хотіли зрозуміти, як агенти ШІ можуть дізнатися про реалістичне середовище, граючи в інтерактивну гру в ньому”, – сказав Вайс. “Щоб відповісти на це питання, ми навчили двох агентів грати в Cache, варіант гри в хованки, використовуючи навчання з підкріпленням у високоточного середовища AI2-THOR. Завдяки цьому ігровому процесу ми виявили, що наші агенти навчилися представляти окремі зображення, наближаючись до продуктивності методів, що вимагають мільйонів зображень, позначених вручну – і навіть почали розвивати деякі когнітивні примітиви, які часто вивчаються психологами [розвитку]”.

Правила гри

На відміну від звичайних хованок, в Cache боти по черзі ховають такі об’єкти, як туалетні вантузи, буханці хліба, помідори та інші, кожен з яких може похвалитися своєю індивідуальною геометрією. Потім два агенти – один ховає, інший шукає – змагаються, щоб побачити, чи зможе один з них успішно заховати об’єкт від іншого. Це передбачає низку викликів, включаючи розвідку та картографування, розуміння перспективи, ховання, маніпуляції з об’єктами та пошук. Все точно симулюється, навіть до вимоги, що той, хто ховає, повинен вміти маніпулювати об’єктом в руці і не впустити його.

Використовуючи глибоке навчання з підкріпленням – парадигму машинного навчання, засновану на навчанні діям в середовищі для отримання максимальної винагороди – боти все краще і краще ховають об’єкти, а також шукають їх.

“Що робить це настільки складним для ШІ, так це те, що вони не бачать світ так, як бачимо його ми”, – сказав Вайс. “Мільярди років еволюції призвели до того, що, навіть будучи немовлятами, наш мозок ефективно перетворює фотони в поняття. З іншого боку, штучний інтелект починає з нуля і бачить свій світ як величезну сітку чисел, які він повинен навчитися розшифровувати у значення. Більше того, на відміну від шахів, де світ акуратно вміщується в 64 клітинках, кожне зображення, яке бачить агент, фіксує лише невеликий шматочок навколишнього середовища, і тому він повинен інтегрувати свої спостереження в часі, щоб сформувати цілісне розуміння світу”.

Зрозуміло, що ця остання робота не стосується створення надінтелектуального штучного інтелекту. У таких фільмах, як “Термінатор 2: Судний день”, суперкомп’ютер “Скайнет” досягає самосвідомості рівно о 2.14 ночі за східним часом 29 серпня 1997 року. Незважаючи на дату, за якою вже майже чверть століття в нашому колективному дзеркалі заднього виду, здається малоймовірним, що настане такий точний переломний момент, коли звичайний ШІ перетвориться на AGI. Замість цього ми будемо зривати все більше і більше обчислювальних плодів – низько висячих і високо висячих – до тих пір, поки, нарешті, не отримаємо щось, що наближається до узагальненого інтелекту в різних областях.

Складне – легко, легке – важко

Дослідники традиційно тяжіють до складних завдань для ШІ, виходячи з того, що якщо складні проблеми можна вирішити, то легкі не повинні від них відставати. Якщо можна змоделювати процес прийняття рішень дорослою людиною, то чи дійсно такі ідеї, як постійність об’єктів (ідея про те, що об’єкти все ще існують, коли ми їх не бачимо), які дитина засвоює протягом перших кількох місяців свого життя, можуть виявитися настільки складними? Відповідь – так, і цей парадокс, що коли справа доходить до ШІ, складне часто виявляється легким, а легке – складним, і є тим, на що спрямована робота, подібна до цієї.

“Найпоширеніша парадигма навчання агентів ШІ [передбачає] величезні, розмічені вручну набори даних, вузько сфокусовані на одному завданні – наприклад, розпізнаванні об’єктів”, – сказав Вайс. “Хоча цей підхід мав великий успіх, я думаю, що оптимістично вірити в те, що ми зможемо вручну створити достатню кількість наборів даних для створення ШІ-агента, який зможе розумно діяти в реальному світі, спілкуватися з людьми і вирішувати всілякі проблеми, з якими він не стикався раніше. Для цього, я вважаю, нам потрібно дати агентам можливість вивчити фундаментальні когнітивні примітиви, які ми сприймаємо як належне, дозволивши їм вільно взаємодіяти з навколишнім світом. Наша робота показує, що використання ігрового процесу для мотивації агентів ШІ взаємодіяти і досліджувати свій світ призводить до того, що вони починають вивчати ці примітиви – і тим самим показує, що ігровий процес є перспективним напрямком від набору даних вручну до експериментального навчання”.

Документ, що описує цю роботу, буде представлений на майбутній Міжнародній конференції з навчальних репрезентацій 2021 року.

Каталог статей

Чому навчання роботів грі в хованки може стати ключем до ШІ нового покоління

Чому навчання роботів грі в хованки може стати ключем до ШІ наступного покоління

Будуємо світи

Правила гри

Складне – легко, легке – важко

Рекомендації редакторів

Добавить комментарий

Чому навчання роботів грі в хованки може стати ключем до ШІ наступного покоління

Будуємо світи

Правила гри

Складне – легко, легке – важко

Рекомендації редакторів

Похожие записи:

Добавить комментарий