fbpx

Каталог статей

Каталог статей для размещения статей информационного характера

Технології

Додай хештег в Instagram — потренуй штучний інтелект

Неймовірно, але факт: хештегі в звичній нам сьогодні формі індексування різних груп повідомлень в соціальних мережах почали використовуватися в 2007 році.
Тоді Кріс Мессіна (Chris Messina) в Twitter запитав, як громадськість ставиться до того, щоб використовувати символ «#» для позначення різних груп. В Америці хештегі стали популярними в 2007 році під час лісових пожеж в Сан-Дієго, коли Нейт Ріттер (Nate Ritter) використовував хештег «#sandiegofire», щоб бути в курсі всіх оновлень, пов’язаних з катастрофою. На міжнародному рівні хештег став практикою для запису повідомлень Twitter в 2009-2010 роках під час іранських виборів. У 2014 році Оксфордський словник зареєстрував слово «хештег», а сьогодні виявляється, що у цього типу маркування з’явилася ще одна навчальна функція. Деталі – в адаптованому перекладі матеріалу з видання Popular Science.
Хештег – підручник для візуальних комп’ютерних систем
Розглянемо хештегі Instagram. Коли людина завантажує фотографію на платформу, що належить компанії Facebook, він може додати хештег. Наприклад, #технології, #мода, #фотодня. Ці мітки ілюструють абстрактні поняття, втім, існує безліч більш конкретних описів, як ось #бурыймедведь, які, як не дивно, супроводжують саме фото ведмедиків.
І хоча хештегі – прекрасний інструмент сортування, що допомагає людям побачити мільйони фотографій подорож в одному місці, розробники Facebook використовували фотографії з ярликами для іншого – тренування ПО розпізнаванню зображень, що є одним з різновидів штучного інтелекту під назвою «комп’ютерне зір», за допомогою якого комп’ютер вчать розпізнавати те, що знаходиться на зображенні. Компанія використала близько 3,5 млрд фотографій з Instagram (з відкритих облікових записів) і 17 тис. хештегів для підготовки системи комп’ютерного зору, яка, на їх думку, нині є кращою із створених ними. Директор за технологіями Facebook Майк Шропфер (Mike Schroepfer) назвав результати «останнім словом техніки».
Слабкий контроль
Щоб зрозуміти, чому цей підхід цікавий, варто з’ясувати різницю між «повністю контрольованим і кілька контрольованим» навчанням AI-технологій. Системи комп’ютерного зору необхідно навчати розпізнавати об’єкти. Покажіть цим системам, наприклад, зображення з позначкою «ведмідь», і вони можуть навчитися виявляти зображення, на яких є ведмеді. Коли дослідники використовують позначені людьми фотографії для навчання систем штучного інтелекту – маємо справу з «повністю контрольованим» навчанням. Зображення чітко позначені, і може вчитися на них.
«Це чудовий, зарекомендував себе спосіб, – каже Манохар Палури (Manohar Paluri), керівник групи комп’ютерного зору відділу прикладного машинного навчання Facebook, який проводив дослідження разом з іншим підрозділом соціальної мережі, що проводить дослідження штучного інтелекту. Єдина проблема з цим підходом полягає в тому, що зображення вже повинні бути марковані, і це – робота людини. – Позначення мільярдів зображень стає нездійсненним завданням».
У світі штучного інтелекту чим більше даних, на яких може вчитися система, тим краще. Важливим аспектом є і їх різноманітність. Якщо ви хочете навчити систему штучного інтелекту розпізнавати, як виглядає весілля, їй варто не тільки показувати фотографії весіль однієї країни, а натомість – весіль зі всього світу.
При «кілька контрольованому навчанні використовуються дані, які не були спеціально промарковані людиною з метою навчання штучного інтелекту. Саме в цьому випадку були використані всі ці мільярди фотографій з Instagram. Хештегі стали способом виконання колективної роботи по маркування зображень. Наприклад, позначка #бурыймедведь в поєднанні з аналогічним тегом #ursusarctos (латинська назва бурого ведмедя) стає меккою для зображень ведмедів.
Шум соцмереж
Користувачі Instagram, самі того не відаючи, перетворилися в маркераторов. Однак, такі дані – неотсортированные і недосконалі. Вони створюють так званий «шум». Наприклад, Палури зазначає, що людина, яка фотографується біля Ейфелевої вежі, може поставити цей тег в Instagram, хоча самій вежі не видно. Такий ярлик має сенс людському контексті, але не допомагає комп’ютеру. За іншим сценарієм фотографія з дня народження, на якій зображений торт, може не містити позначку #торт, що також не є корисним, якщо ви намагаєтеся навчити комп’ютер, як виглядає такий десерт.
Однак, кінцевий результат полягає в тому, що незважаючи на «шум» у вихідних даних такий тип навчання, за словами Палури, теж виявився вдалим. За однією з шкал оцінювання, система, навчена на основі мільярда фотографій Instagram, демонструє точність у 85%. Палури каже, що зараз це – потужна система комп’ютерного зору від Facebook. Якщо ви використовуєте Facebook, ви знаєте, що соціальна мережа може розпізнавати обличчя на завантажених фотографіях і пропонує відзначити на них людину з кола ваших друзів. Це – приклад комп’ютерного зору, в даному випадку – розпізнавання особи. Видима користувачам сторона медалі, хоча є і інша – невидима. Facebook використовує комп’ютерне зір для виявлення не тільки осіб, але і іншого візуального контенту, наприклад, порнографії, яка не дозволена на онлайн-платформі.
Палури каже, що нова, натренований на основі Instagram, технологія вже використовується з метою сортування і виявлення у фотографіях контенту, який не повинен бути на сайті. Коли мова йде про розпізнаванні «небажаного контенту», платформа досягла «значного поліпшення точності».

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *