Badacze zademonstrowali zautomatyzowane rozwiązanie oparte na algorytmach, które jest porównywalne, a czasem lepsze od ludzi, pod względem poprawnej identyfikacji fałszywych wiadomości. System, który identyfikuje charakterystyczne wskazówki językowe w fałszywych wiadomościach, może zapewnić agregatorom wiadomości i serwisom społecznościowym, takim jak Google News, nową broń w walce z dezinformacją.
Zautomatyzowane rozwiązanie może być ważnym narzędziem dla witryn, które zmagają się z atakiem fałszywych wiadomości, często tworzonych w celu generowania kliknięć lub manipulowania opinią publiczną, powiedziała Rada Mihalcea, profesor Uniwersytetu Michigan odpowiedzialna za projekt..
Nowy system z powodzeniem wykrywał podróbki w 76 procentach czasu, w porównaniu do wskaźnika sukcesu ludzkiego wynoszącego 70 procent, według badania, które ma zostać zaprezentowane 24 sierpnia na Międzynarodowej Konferencji Lingwistyki Obliczeniowej w Santa Fe w Nowym Meksyku..
Naukowcy są przekonani, że ich podejście do analizy językowej można również wykorzystać do zidentyfikowania fałszywych artykułów informacyjnych, które są zbyt nowe, aby je obalić, porównując ich fakty z innymi historiami. Analiza językowa analizuje wymierne atrybuty, takie jak struktura gramatyczna, wybór słów, interpunkcja i złożoność.
Na potrzeby badania zespół Mihalcea stworzył własne dane, pozyskując zespół online, który przekształcił zweryfikowane prawdziwe wiadomości w podróbki. Tak właśnie powstają najbardziej rzeczywiste fałszywe wiadomości, powiedział Mihalcea, przez osoby, które szybko je piszą w zamian za nagrodę pieniężną.
Uczestnikom badania płacono za przekształcanie krótkich, aktualnych wiadomości w podobne, ale fałszywe wiadomości, naśladujące dziennikarski styl artykułów. Pod koniec procesu zespół badawczy dysponował zestawem danych zawierającym 500 prawdziwych i fałszywych wiadomości. Następnie przekazali te oznaczone parami opowieści algorytm, który przeprowadził analizę językową, ucząc się rozróżniać między prawdziwymi a fałszywymi wiadomościami.
Ostatecznie zespół przekształcił algorytmy w zbiór danych prawdziwych i fałszywych wiadomości pobranych bezpośrednio z sieci, uzyskując 76-procentowy wskaźnik sukcesu. Szczegóły nowego systemu i zbioru danych, którego zespół użył do jego zbudowania, mogą zostać wykorzystane przez serwisy informacyjne lub inne podmioty do budowy własnych systemów wykrywania fałszywych wiadomości, powiedział Mihalcea.