fbpx

Каталог статей

Каталог статей для размещения статей информационного характера

Технології

ШІ Google AlphaGo Zero швидко опанував старовинну настільну гру без допомоги людини

ШІ Google AlphaGo Zero швидко опанував старовинну настільну гру без допомоги людини

Компанія Google шокувала світ у 2016 році, коли AlphaGo, програма штучного інтелекту, створена спеціально для гри в стародавню настільну гру Го, перемогла одного з головних конкурентів гри в матчі з п’яти партій. Такого досягнення не прогнозували щонайменше ще десять років, і це змусило техніків і нефахівців замислитись над тим, наскільки розумним став ШІ.

Трохи більше року потому AlphaGo знову змагався у гучному матчі, цього разу проти найкращого гравця в Го у світі, 19-річного вундеркінда на ім’я Ке Цзе. Машина обіграла людину з рахунком 3:0. З цими перемогами за плечима Google оголосив у травні, що відправить AlphaGo на пенсію.

Але група Google по розробці штучного інтелекту DeepMind щойно представила нову, блискучу, розумнішу версію AlphaGo під назвою AlphaGo Zero, яка перевершила можливості свого попередника, освоївши стародавню настільну гру без будь-якої допомоги з боку людини. Оснащена лише правилами гри, AlphaGo Zero зуміла вивчити Го з нуля, створити власні знання на цьому шляху, і в кінцевому підсумку перемогти свого попередника 100 партій до нуля.

Як старий, так і новий AlphaGo навчалися за допомогою процесу, званого навчанням з підкріпленням, який заохочує хороші ходи, які з більшою ймовірністю будуть винагороджені перемогою. Однак спосіб, яким DeepMind навчав системи, відрізнявся, і саме тут AlphaGo Zero дійсно блищала.

Щоб навчити оригінальну AlphaGo, дослідники DeepMind завантажили в систему тисячі ігор, в які грали аматори і професійні гравці в людське Го. Ці ігри допомогли системі розробити виграшні стратегії і визначити хороші і погані ходи. AlphaGo Zero, з іншого боку, грала тільки сама по собі (хоча і мільйони разів), роблячи ходи навмання, поки не розпізнавала стратегії. Нова система не отримувала жодної допомоги від людини, окрім початкового запуску.

Що дійсно вражає в самонавчанні AlphaGo Zero, так це те, що вона пройшла шлях від новачка до чемпіона всього за кілька днів. Система стартувала як абсолютно некомпетентний гравець. На третій день, граючи тільки проти самої себе, система була здатна перемогти свого попередника. На 40-й день DeepMind припускає, що система стала найсильнішим гравцем в Го за всю історію.

Якщо оригінальна AlphaGo була трохи більше, ніж надзвичайно талановитим гравцем в настільні ігри, то досягнення AlphaGo Zero – зокрема, її здатність навчати себе з нуля – робить систему придатною для широкого спектру реальних застосувань. Ті ж принципи, які допомагають AlphaGo Zero навчатися лише на основі правил, можуть бути застосовані і до інших завдань, що базуються на правилах.

“Для нас AlphaGo – це не просто перемога в грі в го”, – сказав Деміс Хассабіс, генеральний директор DeepMind, в інтерв’ю The Guardian. “Це було також

Source: digitaltrends.com

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *