Hledání nedostatků ve výzkumu sociálních médií

Podle počítačových vědců z McGill University v Montrealu a Carnegie Mellon University v Pittsburghu si vědci musí dávat pozor na vážná úskalí práce s obrovskými datovými soubory sociálních médií.

Chybné výsledky mohou mít obrovské důsledky: Tisíce výzkumných prací každý rok jsou nyní založeny na datech získaných ze sociálních médií.

"Mnoho z těchto článků se používá k informování a ospravedlnění rozhodnutí a investic mezi veřejností, průmyslem a vládou," řekl Dr. Derek Ruths, odborný asistent na McGill's School of Computer Science.

Pro vědce v oblasti chování se růst sociálních médií jeví jako bezprecedentní příležitost zachytit a poté analyzovat velké množství informací o lidském chování.

Mnoho vědců věří, že takové zralé datové soubory mohou pomoci předpovědět lidské chování na úrovni, kterou si dosud nikdo nedokázal představit. V posledních letech studie tvrdí, že je možné předvídat vše od letních trháků po výkyvy na akciovém trhu.

Ale v článku publikovaném v časopise VědaRuths a Dr. Jürgen Pfeffer z Institutu pro výzkum softwaru Carnegie Mellon zdůrazňují několik problémů spojených s používáním datových sad sociálních médií spolu se strategiemi jejich řešení. Mezi výzvy:

  • Různé platformy sociálních médií přitahují různé uživatele - například Pinterestu dominují ženy ve věku 25-34 let - přesto vědci zřídka opravují zkreslený obraz, který mohou tyto populace vytvářet;
  • Veřejně dostupné datové kanály používané ve výzkumu sociálních médií ne vždy poskytují přesnou reprezentaci celkových dat platformy - a vědci jsou obecně v temnotě ohledně toho, kdy a jak poskytovatelé sociálních médií filtrují své datové toky;
  • Návrh platforem sociálních médií může diktovat, jak se uživatelé chovají, a tedy jaké chování lze měřit. Například na Facebooku absence tlačítka „nelíbí se“ ztěžuje detekci negativních odpovědí na obsah než pozitivní „lajky“;
  • Velké množství spammerů a robotů, kteří se maskují jako běžní uživatelé na sociálních médiích, se mylně začleňují do mnoha měření a předpovědí lidského chování;
  • Vědci často uvádějí výsledky pro skupiny snadno klasifikovatelných uživatelů, témat a událostí, díky čemuž se nové metody zdají přesnější, než ve skutečnosti jsou. Například snahy o odvození politické orientace uživatelů Twitteru dosahují u běžných uživatelů sotva 65 procentní přesnosti - i když studie (zaměřené na politicky aktivní uživatele) požadují 90 procentní přesnost. Uživatelé Twitteru dosahují u běžných uživatelů sotva 65% přesnosti - i když studie (zaměřené na politicky aktivní uživatele) uvádějí 90% přesnost.

Vyšetřovatelé tvrdí, že mnoho problémů je společných i pro jiné oblasti, jako je epidemiologie, statistika a strojové učení.

"Společným tématem ve všech těchto otázkách je potřeba, aby si vědci více uvědomovali, co ve skutečnosti analyzují při práci s daty ze sociálních médií," říká Ruths.

Sociální vědci zdokonalili své techniky a standardy, aby se s tímto druhem výzev vyrovnali dříve.

„Neslavný titulek filmu„ Dewey Defeats Truman “z roku 1948 vycházel z telefonních průzkumů, které nedostatečně vzorkovaly příznivce Trumana v běžné populaci,“ poznamenává Ruths.

"Tato do očí bijící chyba místo trvalé diskreditace praxe hlasování vedla k dnešním sofistikovanějším technikám, vyšším standardům a přesnějším průzkumům veřejného mínění." Nyní jsme připraveni na podobný technologický inflexní bod. Při řešení problémů, kterým čelíme, dokážeme realizovat obrovský potenciál dobra, který slibuje výzkum založený na sociálních médiích. “

Zdroj: McGill University

!-- GDPR -->