Moudrost (vybraných) davů

Stále více společností proniká do moudrosti svých zákazníků a uživatelů - velmi vybraný dav. Dělají to prostřednictvím „velkých dat“ - shromažďují poklady anonymních dat a poté na nich provádějí post-hoc analýzy.

Toto úsilí může vést k několika zajímavým poznatkům. Může to také způsobit, že společnosti navrhnou, že výsledky jsou zobecnitelné pro celou populaci.

A právě tento problém je problém. Protože pokud začnete s vybraným vzorkem, vaše data jsou relevantní pouze pro lidi jako oni - ne pro celou populaci. To je jen jeden z problémů měření - a přijímání opatření - na základě informací od vybraných davů.

Webové stránky provádějí měření „velkých dat“ již téměř 20 let. Pokaždé, když navštívíte web, zanechá na jeho serveru malou stopu dat. Vlastníci serveru tyto údaje berou a spouštějí je prostřednictvím platformy pro analýzu dat (jako je Google Analytics). Poskytuje majiteli webových stránek souhrnné informace o typech lidí, kteří navštěvují jejich webové stránky.

Vzhledem k tomu, že každý web je jedinečný, jsou takové statistiky relevantní pouze pro tento web. Uživatel, který navštíví CNN, může mít například málo společného s uživatelem, který navštíví Match.com.

Problém Select Crowds

V analýze dat statistici nazývají takové vzorkování jako „samy vybraný vzorek“, což má za následek problém „zkreslení vlastního výběru“. Jednoduše řečeno, to znamená, že protože vaše data pocházejí pouze od lidí, kteří používají konkrétní aplikaci nebo druh sociálních médií, nejsou reprezentativní pro populaci jako celek. A protože to není reprezentativní pro populaci jako celek, nelze o datech zobecnit.

Tomu říkám problém „vybrat davy“. Protože pokud získáváte svou moudrost z davu, měli byste se lépe ujistit, že dav je reprezentativní pro populaci, pokud se z ní snažíte získat zobecnitelné poznatky.

Existují celé společnosti, které nedělají nic jiného než analýzu trendů a dat z Twitteru. Pokud se však podíváte na to, kdo používá Twitter - a jak jej používá - okamžitě byste se zajímali o to, co tato data ve skutečnosti znamenají. Například uživatelé Twitteru jsou mnohem mladší než běžná populace a starší lidé jsou značně nedostatečně zastoupeni. Pokud provozujete společnost, která na Twitteru sleduje zdravotní trendy, uvidíte něco úplně jiného, ​​než kdybyste provedli randomizovaný telefonický průzkum.

Jinými slovy, jaké trendy na Twitteru mohou nebo nemusí mít význam pro více než 80 procent Američanů, kteří Twitter nepoužívají.

Aplikace nejsou o nic lepší

Aplikace často rádi shromažďují data svých uživatelů, anonymizují je a poté je používají k porovnání vašeho výkonu s ostatními, kteří aplikaci také používají. Díky tomu budete mít pocit, že jste součástí sociální sítě, která má aplikaci společnou. Je to skvělý nápad.

Protože co když tuto konkrétní aplikaci používá pouze určitý typ člověka? Co když pouze lidé s depresí používají aplikaci pro sledování nálady, která má lidem pomoci vymanit se z deprese tím, že jim pomůže sledovat jejich nálady a porovná jejich pokrok s ostatními, kteří aplikaci také používají? Tyto výsledky by samy o sobě mohly být neúmyslně depresivní.

Dokážete někoho pozitivně motivovat prostřednictvím sociálního srovnání? Výzkum můžete, ale až příliš často, také ukazuje, že taková sociální srovnání vedou lidi k tomu, že se cítí hůře než dříve. Musí to být provedeno mimořádně opatrně - něco, čemu nejtypičtější vývojáři aplikací nerozumí.

Vynechání důležitých věcí k měření

Jakákoli aplikace nebo služba je jen tak dobrá jako ta, kterou se rozhodne měřit. Do výsledků můžete zavést zaujatost - záměrně nebo neúmyslně - tím, co se rozhodnete měřit - a nikoli měřit.

Přemýšlejte o tom takto: uvažujete o přestěhování do nového města s méně deštěm, takže se díváte pouze na průměrné roční množství deště pro různá města. Vyhledali byste město jako Miami a pomysleli jste si: „Víte, já se do Miami nepřestěhuju - za rok tam prší téměř 62 palců! Porovnejte to s hubenými 37 centimetry deště, které Seattle dostane. Seattle musí být slunečnějším a méně deštivým místem. “ Jelikož jste do měření nezahrnuli další důležité metriky, provedli byste nesprávnou volbu na základě příliš omezených informací.

To, co si vývojář aplikace nebo webu myslí při měření něčeho důležitého, nemusí být ve skutečnosti tak důležité jako něco, co vynechali. Představte si aplikaci, která měřila pouze vaši reakci na léky, ale vynechala všechny ostatní důležité faktory, které přispívají k vaší náladě a léčbě.

Léčba neprobíhá ve vakuu s vámi a jediným lékem. Probíhá v bohatém a složitém ekosystému, který může zahrnovat léky, ale zahrnuje také mnoho dalších důležitých věcí, které děláte, abyste se zotavili. Mohlo by to být to, kolik toho cvičíte, nebo ne přemýšlíte, nebo kolik dní jdete, aniž byste měli záchvaty paniky nebo jste ve stresu z člena rodiny nebo práce.

Stručně řečeno, existuje spousta věcí, které by aplikace a další dobře míněné služby měly sledovat, ale nejsou. A to dává zkreslenou perspektivu toho, jak je něco, co se měří, spojeno s náladou nebo pokrokem zotavení. Léčba je při léčbě mnoha lidí skutečně důležitá, ale nemusí - a často není - nejdůležitější věcí.

!-- GDPR -->