Нейромережа може створювати зображення високої роздільної здатності на основі текстового опису
Що стосується штучного інтелекту, то 2016 рік був роком глибокого навчання. Нейронні мережі, натхненні мозком, отримали величезну кількість інвестицій в часі, ресурсах і фінансуванні – і, о Боже, це коли-небудь окупалося!
У новому дослідженні, проведеному дослідниками з Ратгерського університету, Університету Північної Кароліни в Шарлотті, Університету Лехі і Китайського університету Гонконгу, нейронні мережі були використані для створення високоякісних зображень на основі не більш детальних, ніж базові текстові описи.
“Генерація реалістичних зображень з текстових описів має багато застосувань”, – сказав дослідник Хан Чжан в інтерв’ю Digital Trends. “Попередні підходи мають труднощі в створенні зображень з високою роздільною здатністю, а їх синтезовані зображення в багатьох випадках не мають деталей і яскравих частин об’єкта. Наш StackGAN вперше генерує зображення 256 x 256 з фотореалістичними деталями”.
- Мета зробила DALL-E для відео, і це одночасно моторошно і дивовижно
- Оптичні ілюзії можуть допомогти нам створити наступне покоління ШІ
- Microsoft відмовляється від свого моторошного штучного інтелекту, що зчитує емоції.
Відеороликом про цю роботу поділився в мережі YouTuber Карой Жолнаї-Фехер (Károly Zsolnai-Fehér) в рамках своєї чудової серії освітніх відеороликів Two Minute Papers.
“Протягом багатьох років ми навчали нейронні мережі виконувати такі завдання, як розпізнавання облич, дорожніх знаків або рукописного тексту, – розповів нам Жолнаї-Фехер. “Зазвичай, за допомогою мільйонів навчальних прикладів ми показуємо нейромережі, як щось робити, і очікуємо, що вона засвоїть ці концепції, а потім буде добре працювати самостійно. Ця робота зовсім інша: тут нейромережі після навчання здатні створювати щось абсолютно нове – наприклад, синтезувати нові, фотореалістичні зображення з написаного нами тексту. Це відкриває світ можливостей, і я дуже хочу побачити, куди дослідники заведуть цю концепцію в майбутньому”.
Хоча приклади комп’ютерної творчості, безумовно, були і раніше – від “Машини кошмарів” Массачусетського технологічного інституту до проектів, які можуть генерувати передбачуване відео, просто дивлячись на нерухоме зображення, – це, тим не менш, інтригуюча робота. Вона захоплює ще й тому, що двоетапний метод малювання зображень виглядає для нашого способу мислення дуже схожим на те, як художники роблять ескіз твору, а потім роблять другий прохід, щоб додати деталей.
Можливо, ми ще далекі від того, щоб замінити людей-ілюстраторів роботами, але це, тим не менш, захоплюючий стрибок вперед.
Рекомендації редакції
- 10 найкращих АІ-генераторів зображень для створення мистецтва з тексту
- Чому АІ ніколи не буде правити світом
- Як ми дізнаємося, коли штучний інтелект дійсно стане розумним?
- Microsoft загрожує антимонопольне розслідування через купівлю Nuance за $19,7 млрд
- Формула сміху: Чому машинний гумор – це святий грааль ШІ
Source: digitaltrends.com