Каталог статей

Ось як Facebook навчив свій портальний штучний інтелект мислити, як голлівудський режисер

Ось як Facebook навчив свій штучний інтелект Portal мислити, як голлівудський режисер

Коли Марк Цукерберг створював першу версію Facebook в кімнаті свого гуртожитку в Гарварді, він уявляв її як вікно, яке дозволить людям зазирнути в життя інших користувачів. Якщо Google був пошуковою системою для пошуку інформації, то Facebook, навпаки, був пошуковою системою для пошуку людей. П’ятнадцять років по тому Facebook підняв цю амбіцію на новий рівень. Створивши Portal і Portal+, лінійку розумних колонок з розширеним екраном, запущену в листопаді 2018 року, гігант соціальних мереж створив набагато більш буквальне вікно, дозволивши користувачам Facebook здійснювати відеодзвінки один одному.

Розумні колонки Portal буквально втілюють ще одну мрію Facebook. Там, де Facebook був, по суті, пошуковою системою для людей, Portal фактично шукає їх: за допомогою рухомої 12-мегапіксельної камери з 140-градусним полем зору, яка слідує за вами по кімнаті, щоб бачити, що ви робите. Як пише Digital Trends в своєму огляді, “якщо ви зайняті пересуванням по кухні, запитуючи у бабусі, як приготувати її знамениті фрикадельки, ви можете не відволікатися, слухаючи її розмову”.

Що саме являє собою інтелектуальна технологія, яка керує Порталом? І як, на думку Facebook, йому вдалося вирішити завдання зробити звичайний відеочат таким же особистим, як і реальну розмову? Відповідь включає в себе вражаючий штучний інтелект і додатковий людський фактор.

Робимо камери розумнішими

З самого початку Facebook знав, що ядром його порталу буде так звана система “Розумна камера”. Ідея “Розумної камери” полягала в тому, щоб вийти за рамки статичних знімків, які вже багато років пропонують нам такі сервіси, як Skype, і відігравати більш творчу роль у цьому процесі. Подібно до того, як кінорежисер або оператор знає, коли використовувати широкий кадр, а коли наблизити його для інтимної зйомки, так і Facebook поставив перед своїми інженерами завдання імітувати цю ж здатність за допомогою Portal.

Щоб надати цій камері необхідного людського дотику, Facebook працював з кінематографістами, щоб з’ясувати найкращий спосіб перетворити їхню мудрість на інсайти, що піддаються машинному навчанню. В одному випадку компанія попросила їх продемонструвати, як можна зняти сцену, в якій неможливо захопити всю необхідну інформацію з одного фіксованого кута.

Портал складається з надзвичайно ширококутного об’єктива, в якому всі рішення щодо руху і редагування приймаються повністю в цифровому форматі.

В іншому дослідженні інженери Facebook розглянули різні фотографічні елементи, яким оператори надають перевагу при зйомці портретів та пейзажів. Ці спостереження лягли в основу програмних моделей, які намагаються наділити портал деякими особливостями прийняття рішень, які ми зазвичай приписуємо людській творчості.

“Ми хотіли створити відеодзвінки без допомоги рук, які усувають відчуття фізичної дистанції і більше схожі на спільне проведення часу”, – пояснив Digital Trends Ерік Хван (Eric Hwang), один з інженерів, що стоять за створенням Portal.

Отримана система, на створення якої з нуля, за словами Facebook, пішло “менше двох років”, дозволяє Portal приймати рішення, спрямовані на поліпшення потоку розмови. У нещодавно опублікованому дописі в блозі детально описані деякі ілюстрації того, чому це може бути необхідно. Наприклад, якщо ви перебуваєте в переповненій кімнаті, повній людей, які взаємодіють один з одним, він повинен вибрати, коли слідувати за людиною поза кадром або коли зменшити масштаб, щоб вмістити нові об’єкти.

“Захоплення кожного у відеокадрі не є складною інженерною проблемою, оскільки багато інженерів можуть це зробити за допомогою сучасних досягнень комп’ютерного зору”, – сказав він. “Інновація полягає в тому, щоб захоплювати відповідних людей або особу в реальному часі, на пристрої, використовуючи лише невеликий мобільний чіп всередині порталу в якості обчислювальної потужності. Зазвичай такі типи завдань ШІ вимагають виділених великих серверів. [Ми подолали цю перешкоду, стиснувши складні моделі комп’ютерного зору до такого розміру, щоб вони помістились на чіпі, який ми використовуємо для Portal, і при цьому працювали точно і надійно”.

Для цього Portal спирається на довгострокові інвестиції Facebook у штучний інтелект. Він використовує 2D-систему розпізнавання поз, яка працює зі швидкістю 30 кадрів в секунду. Навмисність цих поз допомагає Portal приймати безперервні рішення про те, що роблять його об’єкти – і коли в результаті може знадобитися цифрове панорамування або масштабування. Портал також використовує дослідження глибинних камер, розроблених Facebook Reality Labs в рамках роботи над віртуальною реальністю гіганта соціальних мереж.

Зростаючий ринок

Facebook переконаний, що з порталом Portal він у виграші. Легко зрозуміти, звідки походить ця впевненість. Прямо зараз ринок розумних колонок знаходиться на підйомі. Хоча на ньому в основному домінує лідер ринку Amazon, він зростає більш ніж на 100 відсотків у річному обчисленні. Це хороша новина для технологічних компаній, які шукають наступну велику річ під час вирівнювання продажів смартфонів.

Хоча Facebook був останнім з великої четвірки технологічних гігантів (Amazon, Alphabet, Facebook і Apple), хто приєднався до цієї тенденції, він все ще є одним з перших смарт-колонок, зосереджених навколо екрану в якості комунікаційного пристрою.

“Portal – єдиний продукт на ринку такого роду”, – сказав Хван. “Сьогодні смарт-колонки та дисплеї побудовані навколо інформації та комерції. Portal створений для того, щоб полегшити зв’язок з людьми, які мають найбільше значення: нашими найближчими друзями та родиною. І Portal зосереджений на з’єднанні людей – частина місії Facebook – яка в даний час не дуже добре обслуговується ринком домашніх пристроїв”.

Виклики конфіденційності попереду?

Так що ж заважає зупинити Facebook? Ну, потенційно конфіденційність. Користувачі виявилися напрочуд готовими прийняти “завжди слухаючі” гаджети від таких компаній, як Google, які зацікавлені в даних користувачів. Але пристрій, який і дивиться, і слухає вас, все ж таки є більш інвазивним. Крім того, репутація Facebook все ще страждає після минулорічного скандалу з Cambridge Analytica.

Додавання розумних функцій до камери відеочату Порталу (Facebook)

За кілька днів до публікації цієї статті Washington Post повідомила, що Facebook веде переговори про рекордну, багатомільярдну угоду з FTC за порушення конфіденційності. З огляду на зростаючу негативну реакцію з боку багатьох колишніх користувачів, ще належить з’ясувати, чи чекає на Facebook хіт у стилі Amazon Echo, чи провал у стилі Amazon Fire Phone.

Facebook запевнив нас, що не прослуховує, не переглядає і не зберігає вміст відеодзвінків Portal, які додатково шифруються, щоб уникнути підслуховування. Той факт, що штучний інтелект Portal працює локально на пристрої, а не на серверах Facebook, також означає, що ця інформація не покидає межі вашого будинку. Голосові команди надсилаються в компанію тільки після того, як ви скажете “Привіт, Портал”, а користувачі можуть у будь-який момент видалити свою голосову історію в журналі активності Facebook.

Але не можна обійти той факт, що певний збір даних все ж таки відбувається. “Хоча ми не прослуховуємо, не переглядаємо і не зберігаємо вміст ваших відеодзвінків на Порталі і не використовуємо цю інформацію для таргетування реклами, ми обробляємо деяку інформацію про використання пристроїв, щоб зрозуміти, як використовується Портал, і поліпшити продукт”, – зазначає Facebook. (Політику конфіденційності порталу можна прочитати тут).

Portal пропонує дуже розумну технологію з величезними наслідками для майбутнього відеочату. Немає сумнівів, що компанії вдалося зробити щось дуже вражаюче з технологічної точки зору. Але чи зможе вона переконати потенційних клієнтів у тому, що це саме те рішення, яке їм потрібно в їхньому житті, в кінцевому рахунку, виявиться справжнім досягненням.

Рекомендації редакції

Source: digitaltrends.com

Exit mobile version