Jak zjistíme, které tweety jsou důvěryhodné

Vědci z Gruzínského technologického institutu vyvinuli nový jazykový model ukazující, která slova a fráze pozitivně nebo negativně ovlivňují důvěryhodnost světových událostí hlášených na Twitteru.

Studie, která naskenovala 66 milionů tweetů týkajících se téměř 1400 skutečných událostí, naznačuje, že slova milionů lidí na sociálních médiích mohou nabídnout značné informace o důvěryhodnosti události, i když událost stále probíhá.

"V posledních letech proběhlo mnoho studií o důvěryhodnosti sociálních médií, ale jen velmi málo je známo o tom, jaké typy slov nebo frází vytvářejí vnímání důvěryhodnosti během rychle se rozvíjejících událostí," řekl Tanushree Mitra, Georgia Tech Ph.D. kandidát, který vedl výzkum.

Tým studoval tweety týkající se světových událostí v letech 2014 a 2015, včetně vzniku eboly v západní Africe, útoku Charlie Hebdo v Paříži a smrti Erica Garnera v New Yorku.

Vědci požádali lidi, aby posoudili příspěvky podle jejich důvěryhodnosti (od „jistě přesné“ po „jistě nepřesné“). Poté tým slova přivedl do modelu, který je rozdělil do 15 různých jazykových kategorií. Klasifikace zahrnovala pozitivní a negativní emoce, živé ploty a posilovače a úzkost.

Počítač Georgia Tech poté zkoumal slova, aby posoudil, zda jsou tweety důvěryhodné nebo ne. Odpovídalo názorům lidí asi 68 procent času, což je procento významně vyšší než náhodná výchozí hodnota 25 procent.

„Tweety s doplňujícími slovy, například„ nepopiratelný “, a výrazy pozitivních emocí, jako například„ dychtivý “a„ úžasný “, byly považovány za vysoce důvěryhodné,“ řekl Mitra. „Slova naznačující pozitivní sentiment, ale zesměšňující nepraktičnost události, například„ ha “,„ šklebí se “nebo„ žertují “, byla považována za méně důvěryhodná. Taková byla slova pro zajištění, včetně „určité úrovně“ a „podezřelých“. “

Vyšší počet retweetů byl spojen s nižším skóre důvěryhodnosti.Odpovědi a retweety s delší délkou zprávy byly považovány za důvěryhodnější.

"Je možné, že delší délky zpráv poskytují více informací nebo úvah, takže jsou považovány za důvěryhodnější," řekla. "Na druhou stranu, vyšší počet retweetů, jejichž důvěryhodnost byla nižší, by mohl představovat pokus vyvolat kolektivní uvažování v době krize nebo nejistoty."

Ačkoli tento model zatím nelze nasadit, vědci tvrdí, že mohou nakonec vyvinout aplikaci, která dokáže vypočítat vnímanou důvěryhodnost události, jak se bude odvíjet na sociálních médiích.

"V kombinaci s dalšími signály, jako jsou témata událostí nebo strukturální informace, by náš jazykový výsledek mohl být důležitým stavebním kamenem automatizovaného systému," řekl Dr. Eric Gilbert, Mitraův poradce a odborný asistent na School of Interactive Computing ve společnosti Georgia Tech.

„Twitter je součástí problému šíření nepravdivých zpráv online. Může však být také součástí řešení. “

Zdroj: Georgia Institute of Technology

!-- GDPR -->