Dokáže Twitter předvídat volby? Ještě ne

Výzkumná práce zveřejněná minulý týden naznačuje, že při analýze 435 voleb do Sněmovny reprezentantů USA v roce 2010 se stačí podívat na frekvence jméno kandidáta uvedené na Twitteru bylo možné použít k předpovědi výsledku voleb.

Ale tady je ta šílená věc - nezáleželo na tom, co se o kandidátovi řeklo - pozitivní, negativní nebo neutrální. Důležité bylo, jak moc bylo jméno kandidáta tweetnuto příznivci, nepřáteli nebo jen náhodně.

Vědci mohli předpovědět výsledek u 404 ze 435 závodů - což je neuvěřitelná míra predikce 92,8 procenta.

Ale je tu háček ... a je to velký.

To, co článek a jeho spoluautor sociolog Indiana University Fabio Rojas nezohlednili (nebo alespoň uznali ve svém tisku na toto téma), byla jednoduchá statistická pravděpodobnost. V 19 z posledních 23 voleb skončilo 90 procent úřadujících v znovuzvolení.

Vědci tedy vylepšili naši stávající predikční základnu o 2,8 procenta. Není to úplně nové, když se podíváme na tento druh perspektivy.

Současní operátoři - se stávajícím rozpoznáním jména ve svých okresech a dobře naolejovaným strojem pro získávání finančních prostředků - mají obvykle malé potíže se znovuzvolením.

Nejsem první, kdo přišel s tímto alternativním vysvětlením výsledků výzkumníků, jak poznamenal Stuart Rothenberg:

Jen málo renomovaných politologů přijme Rojasovo tvrzení, že „Nový výzkum v oblasti počítačové vědy, sociologie a politologie ukazuje, že údaje získané z platforem sociálních médií přinášejí přesné měření veřejného mínění.“

"Nikdo, koho znám, neříká nic podobného," napsal Michael S. Lewis-Beck, významný profesor politologie F. Wendell Miller na univerzitě v Iowě a známý odborník na americkou politiku a volební předpovědi. tento týden v e-mailu.

Je trochu znepokojující, že se zdá, že Rojas, sociální vědec, ve svém článku (s odkazem níže) ani nepojednává o alternativních vysvětleních svých zjištění. Vědci mají odpovědnost prezentovat svá zjištění veřejnosti způsobem, který rovněž odhaluje omezení jejich výzkumu - což zahrnuje zmínku o tom, proč tyto předběžné výsledky nemusí obstát, pokud jsou testovány ve více sporných nebo jiných národních politických rasách.

Skutečným testem tohoto predikčního systému bude jeho použití v závodech, kde výkonnost není tak spolehlivým prediktorem. Možná Senát nebo více místních ras (například guvernérů). To může být dobrý výzkum, ale kde je střídmost v diskusi o výsledcích? Kde je kontrola rozumnosti ohledně racionality zjištění? Kde je následná studie ukazující tyto výsledky ve skutečnosti zobecnitelná pro jiné volby?

Do té doby může být Twitter rychlý způsob, jak měřit teplotu voleb. Nebo nemusí.

Ale myslím, že poslední věcí, kterou chce Twitter znát, je výstup na sociální média, kde na obsahu toho, co zveřejňujete, nezáleží.