Алгоритм полювання на ботів “FRAUDAR” називатиме і ганьбитиме фейкових користувачів у соцмережах
Алгоритм полювання на ботів “FRAUDAR” називатиме і ганьбитиме фейкових користувачів у соцмережах
Ні для кого не секрет, що існує дуже багато фейкових акаунтів у Твіттері – і мова йде не лише про людей, які прикидаються знаменитостями, щоб викликати головний біль у піарників.
Новий дослідницький проект, розроблений в Університеті Карнегі-Меллона, покликаний вирішити цю проблему за допомогою алгоритму під назвою FRAUDAR.
“У Твіттері та соціальних мережах популярність має велике значення”, – розповів Digital Trends Крістос Фалуцос, професор машинного навчання та комп’ютерних наук. – “Якщо у мене 500 підписників, то я можу бути популярним. “Якщо у мене 500 підписників, а у вас 10 000, то ви здаєтеся важливішими за мене. Як наслідок, в інтернеті з’явилися компанії, які продають фальшивих підписників. Twitter, Facebook і … інші компанії хочуть придушити таку поведінку. Тому метою нашої роботи було знайти хороший спосіб, який би дозволив їм це зробити”.
FRAUDAR ґрунтується на методі видобутку графів, тобто методі пошуку закономірностей у даних. У цьому випадку він шукає так зване “двостороннє ядро” – тобто групи користувачів, які взаємодіють з членами другої групи, але не взаємодіють один з одним. Це свідчить про те, що це можуть бути шахрайські акаунти, з єдиною метою – фальшиві взаємодії, наприклад, розміщення фальшивих відгуків.
Додатковою проблемою, однак, є те, що ці шахрайські користувачі, як правило, маскують себе – і можуть навіть зайти так далеко, що використовують реальні облікові записи користувачів, які були викрадені. FRAUDAR знімає цей камуфляж, починаючи з облікових записів, які він може впевнено підтвердити як легітимні, а потім працює далі, щоб знайти двостороннє ядро.
Це дуже розумна робота, і вона була нагороджена “Best Paper Award” на конференції Асоціації обчислювальної техніки з виявлення знань і інтелектуального аналізу даних (KDD2016), яка відбулася минулого місяця в Сан-Франциско. В експерименті з використанням даних Twitter для 41,7 мільйона користувачів і 1,47 мільярда підписників FRAUDAR зміг виявити понад 4000 акаунтів, які раніше не були позначені як шахрайські.
Професор Фалуцос і його команда опублікували алгоритм в Інтернеті безкоштовно у вигляді відкритого коду, щоб компанії могли використовувати його за власним бажанням.
“В академічних колах більш [важливим] є кількість цитувань і вплив, який ми маємо”, – так Фалуцос пояснив рішення передати цінний інструмент безкоштовно. “Ми могли б продати 100 примірників і заробити трохи грошей, або ми можемо віддати його компаніям, і це буде хорошим інструментом реклами для студентів, які працювали над ним. Це компроміс між славою та грошима: для нас набагато краще віддати наші дослідження безкоштовно”.
Рекомендації редакції
- Деякі користувачі Twitter з “синьою галочкою” не змогли відредагувати свої імена
- Північнокорейські хакери створили фейковий
Source: digitaltrends.com