Tweety poskytují spoustu údajů o veřejném zdraví

Fenomenální růst sociálních médií vytvořil bezprecedentní komunikační prostředek. Samotný Twitter umožňuje milionům fanoušků sociálních médií komentovat 140 znaků nebo méně téměř k čemukoli.

Nové výzkumné úsilí zkoumalo, zda by tento digitální formát mohl být použit ke sledování důležitých trendů v oblasti veřejného zdraví. A podle dvou počítačových vědců z Univerzity Johns Hopkins University je jednoslovný tweet: „Ano!“

Dr. Mark Dredze a Michael J. Paul vložili do počítačů 2 miliardy veřejných tweetů zveřejněných v období od května 2009 do října 2010, poté pomocí softwaru odfiltrovali 1,5 milionu zpráv, které se týkaly zdravotních záležitostí. Totožnost výškových reproduktorů nebyla shromážděna.

"Naším cílem bylo zjistit, zda by příspěvky na Twitteru mohly být užitečným zdrojem informací o veřejném zdraví," řekl Dredze.

"Zjistili jsme, že to skutečně mohou." V některých případech jsme se pravděpodobně dozvěděli některé věci, o kterých si ani lékaři výškových reproduktorů nebyli vědomi, například jaké léky na předpis používají plakáty k léčbě jejich příznaků doma. “

Tříděním těchto tweetů souvisejících se zdravím na elektronické „hromádky“ Dredze a Paul odhalili zajímavé vzorce týkající se alergií, případů chřipky, nespavosti, rakoviny, obezity, deprese, bolesti a dalších onemocnění.

"Byly provedeny některé úzké studie využívající příspěvky na Twitteru, například ke sledování chřipky," řekl Dredze. "Ale pokud víme, nikdo nikdy nepoužil tweety, aby se podíval na tolik zdravotních problémů jako my."

Dredze a Paul představí svou kompletní studii 18. července ve španělské Barceloně na mezinárodní konferenci o weblogech a sociálních médiích, kterou sponzoruje Asociace pro povýšení umělé inteligence.

Vedle zjištění řady zdravotních potíží v příspěvcích na Twitteru byli vědci schopni zaznamenat mnoho léků, které konzumovali nemocní tweetery, a to díky příspěvkům jako: „Musel jsem vyskočit na Benadryl ... alergie jsou nejhorší.“

Další tweety poukazovaly na zneužití léku.

"Zjistili jsme, že někteří lidé tweetovali, že užívají antibiotika na chřipku," řekl Paul. "Ale antibiotika nefungují na chřipku, což je virus, a tato praxe by mohla přispět k narůstajícím problémům s rezistencí na antibiotika." Takže tyto tweety nám ukázaly, že existují nějaké vážné lékařské nepochopení. “

Drtivá většina denních tweetů samozřejmě nemá nic společného s nemocí. Jednoduchým přístupem by bylo filtrování slov, která souvisejí s nemocí, například „bolesti hlavy“ nebo „horečka“, ale tato strategie selhává na tweetech jako „Vysoká cena plynu je pro mé podnikání bolestí hlavy“ nebo „Mám případ Bieber Fever. Milujte jeho novou píseň. “

Aby vědci Johns Hopkins našli příspěvky týkající se zdraví mezi miliardami zpráv v jejich původním fondu, použili systém filtrování a kategorizace, který navrhli. S tímto nástrojem lze počítače naučit ignorovat fráze, které ve skutečnosti nesouvisejí se zdravím člověka, i když obsahují slovo běžně používané v kontextu zdraví.

Jakmile byly nesouvisející tweety odstraněny, zbývající výsledky přinesly překvapivá zjištění.

"Když jsme začínali, ani jsem nevěděl, jestli lidé mluví o alergiích na Twitteru," řekl Paul. "Ale zjistili jsme, že ano." A byla tu jedna věc, kterou jsem nečekal: Systém našel dva různé typy alergií: typ, který způsobuje čichání a kýchání a druh, který způsobuje kožní vyrážky a kopřivku. “

V asi 200 000 tweetů souvisejících se zdravím byli vědci schopni čerpat z veřejných informací poskytnutých uživateli k identifikaci stavu, ze kterého byla zpráva odeslána. To jim umožnilo sledovat některé trendy podle času a místa, například když v různých částech země vrcholily sezóny alergie a chřipky.

"Z tweetů jsme viděli, že sezóna alergií začala dříve v teplejších státech a později na středozápadě a severovýchodě," řekl Dredze.

Dredze a Paul již začali hovořit s vědci v oblasti veřejného zdraví, včetně některých členů Johns Hopkins, kteří tvrdí, že budoucí studie tweetů by mohly odhalit ještě užitečnější údaje, nejen o zdravotních problémech plakátů, ale také o vnímání veřejnosti ohledně nemocí, léků a další zdravotní problémy.

Přesto Dredze a Paul varovali, že pokus o měření teploty národa analýzou tweetů má svá omezení.

Za prvé, většina uživatelů Twitteru nekomentovala více než jednou své konkrétní onemocnění, takže bylo těžké sledovat, jak dlouho nemoc trvala a zda se opakovala. Většina uživatelů Twitteru má navíc tendenci být mladí, což by vyloučilo mnoho seniorů ze studie veřejného zdraví. V tuto chvíli také Twitteru dominují uživatelé, kteří jsou ve Spojených státech, takže je méně užitečný pro výzkum v jiných zemích.

Ačkoli stránky sociálních médií umožňují uživatelům vystavit spoustu osobních údajů přátelům a cizím lidem, výzkum založený na Twitteru může dosáhnout pouze určité hloubky.

"V naší studii," řekl Paul, "jsme se mohli dozvědět jen to, co jsou lidé ochotni sdílet." Myslíme si, že existuje limit toho, co jsou lidé ochotni sdílet na Twitteru. “

Dredze nicméně říká, že z příspěvků na Twitteru stále zbývá spousta užitečných dat. "Lidé, se kterými jsem mluvil, cítili, že se jedná o opravdu zajímavý výzkumný nástroj," řekl, "a mají několik skvělých nápadů, co by se chtěli naučit na Twitteru."

Zdroj: Johns Hopkins University

!-- GDPR -->