Каталог статей

Нейромережа може створювати зображення високої роздільної здатності на основі текстового опису

Нейромережа може створювати зображення високої роздільної здатності на основі текстового опису

Що стосується штучного інтелекту, то 2016 рік був роком глибокого навчання. Нейронні мережі, натхненні мозком, отримали величезну кількість інвестицій в часі, ресурсах і фінансуванні – і, о Боже, це коли-небудь окупалося!

У новому дослідженні, проведеному дослідниками з Ратгерського університету, Університету Північної Кароліни в Шарлотті, Університету Лехі і Китайського університету Гонконгу, нейронні мережі були використані для створення високоякісних зображень на основі не більш детальних, ніж базові текстові описи.

“Генерація реалістичних зображень з текстових описів має багато застосувань”, – сказав дослідник Хан Чжан в інтерв’ю Digital Trends. “Попередні підходи мають труднощі в створенні зображень з високою роздільною здатністю, а їх синтезовані зображення в багатьох випадках не мають деталей і яскравих частин об’єкта. Наш StackGAN вперше генерує зображення 256 x 256 з фотореалістичними деталями”.

Відеороликом про цю роботу поділився в мережі YouTuber Карой Жолнаї-Фехер (Károly Zsolnai-Fehér) в рамках своєї чудової серії освітніх відеороликів Two Minute Papers.

“Протягом багатьох років ми навчали нейронні мережі виконувати такі завдання, як розпізнавання облич, дорожніх знаків або рукописного тексту, – розповів нам Жолнаї-Фехер. “Зазвичай, за допомогою мільйонів навчальних прикладів ми показуємо нейромережі, як щось робити, і очікуємо, що вона засвоїть ці концепції, а потім буде добре працювати самостійно. Ця робота зовсім інша: тут нейромережі після навчання здатні створювати щось абсолютно нове – наприклад, синтезувати нові, фотореалістичні зображення з написаного нами тексту. Це відкриває світ можливостей, і я дуже хочу побачити, куди дослідники заведуть цю концепцію в майбутньому”.

Хоча приклади комп’ютерної творчості, безумовно, були і раніше – від “Машини кошмарів” Массачусетського технологічного інституту до проектів, які можуть генерувати передбачуване відео, просто дивлячись на нерухоме зображення, – це, тим не менш, інтригуюча робота. Вона захоплює ще й тому, що двоетапний метод малювання зображень виглядає для нашого способу мислення дуже схожим на те, як художники роблять ескіз твору, а потім роблять другий прохід, щоб додати деталей.

Можливо, ми ще далекі від того, щоб замінити людей-ілюстраторів роботами, але це, тим не менш, захоплюючий стрибок вперед.

Рекомендації редакції

Source: digitaltrends.com

Exit mobile version