Big Data: Můžeme předpovědět populační trendy (jako štěstí) prostřednictvím aplikací pro zdraví?
Před více než pěti lety jsem napsal článek s názvem Spolehlivost a platnost ve světě Web 2.0. Mluvil o obavách ze shromažďování údajů ze zkreslených vzorků - aniž by nejprve pochopil, jakými způsoby mohou být tyto vzorky zkreslené.Nyní, se všudypřítomností aplikací - programů ke stažení pro chytré telefony lidí - vidím stejný problém. Vývojáři a podnikatelé sledují data z těchto aplikací, aniž by pochopili základy dobrého, spolehlivého sběru vědeckých dat. A proč je to důležité - zvláště když začnete chtít analyzovat všechna tato „velká data“ (poněkud hloupý termín ... například v epidemiologii to vědci nazývají „daty“).
Lze tyto aplikace bez zaujatosti shromažďovat osobní údaje o zdraví a nějakým způsobem je transformovat na měření něčeho většího?
Krátká odpověď: ne, není to snadné.
Jistě, existují lidé, kteří jsou součástí hnutí „kvantifikovaného já“ - kteří chtějí sledovat a měřit každý aspekt svého osobního zdraví (a předpokládá se, že i duševního zdraví). Ale tito lidé jsou v současné době1 odlehlé hodnoty a v žádném případě nepředstavují populaci obecně.
Takové menšiny mohou rychle tvořit většinu snah o shromažďování větších souborů dat, aby mohly analyzovat trendy v oblasti zdraví nebo pohody. I když vám výsledné analýzy mohou říci něco o této skupině lidí, bylo by nevhodné navrhovat, aby to zobecňovalo pro zbytek populace (kdo, demograficky a behaviorálně, může vypadat a chovat se velmi odlišně).
To se v dohledné době nezmění, protože většinu zdravotnických aplikací si lidé stáhnou, použijí se jednou nebo dvakrát a poté se opustí. Existuje důvod, proč většina lidí přestává používat aplikace pro zdraví - zejména ty, které mají fungovat jako datový deník. Jsou nudné! Shromažďování údajů o sobě je pro většinu z nás jen velmi nudný úkol zavázat se k aktivní práci každý den (nebo dokonce každý týden).
Komplikovaná odpověď: Aplikace musí být chytřejší, propojené
Aplikace pro zdraví určené ke shromažďování dat nakonec selžou, protože vyžadují aktivní vstup uživatele. To je důvod, proč osobní zdravotní záznamy do značné míry nikdy nevznikly žádným smysluplným způsobem.2 Lidé jsou příliš zaneprázdněni žít svůj život, než aby se obtěžovali sdělením aplikaci3, jaké jsou jejich denní metriky.
Aby aplikace pro zdraví nakonec uspěly tam, kde většina ostatních pokusů o software pro sledování osobního zdraví selhala, je jejich pasivní shromažďování dat. To znamená, že není vyžadován žádný vstup od uživatele.
Od takových metrik poskytujících smysluplná data máme samozřejmě daleko.Jistě, existují běžící zařízení, která sledují, kolik běžíte (samozřejmě od Nike). Běžící aplikace je ale k ničemu, pokud nemluví s mou dietní aplikací, aplikací pro výživu nebo cvičením. Nebo moje všímavost aplikace. Je to jedna aplikace měřící jedinou metriku ve složité bytosti, kterou jsem já. Pokračovat prostě není nic moc.
Důvěra je klíčovým základním kamenem
Přijetí takových síťových aplikací, které sdílejí všechna vaše zdravotní data, má i další, méně technickou překážku - důvěru. Společnosti jako Facebook a Nike nakonec odpovídají pouze jedné skupině lidí - jejich akcionářům. To znamená, že pokud je v jejich nejlepším zájmu analyzovat vaše data na věci, na kterých mohou vydělat peníze, budou.
Start-upy nejsou o nic lepší, protože místo akcionářů odpovídají pouze investorům rizikového kapitálu - půjčovatelům peněz, kteří hledají pouze nejlepší a nejrychlejší návratnost svých investic.
Proč bych chtěl věřit svým zdravotním informacím - údajům, které by mohly být použity proti mně pro budoucí zamítnutí pojištění nebo stanovení mých pojistných sazeb - společnostem, které mají malý zájem na ochraně mého soukromí?
Což nás přivádí zpět k prvnímu bodu - předpojatému vzorku. Lidé, kteří rádi poskytnou veškeré své zdravotní informace neziskovým společnostem, aby je mohli analyzovat, shromáždit a případně spojit s vámi (i když jsou tato data původně anonymizována), nejsou jako většina lidí. Většina z nás se stále stará o to, aby si své zdravotní informace nechala pro sebe, stejně jako většina z nás si stále chce nechat své finanční informace pro sebe.
Kam jdeme odsud
Pokus o shromáždění populačních dat (např. Provádění epidemiologického výzkumu) ze zdravotnických aplikací má určité problémy a příležitosti, které jsem identifikoval:
- Předpojaté vzorkování kvůli malé menšině lidí, kteří aktivně a nepřetržitě používají aplikace pro zdraví
- Vzorkování a další používání by mohlo být vylepšeno pasivní proti aktivní sběr dat
- Vzorkování a používání lze dále vylepšit použitím důvěryhodného orgánu ke shromažďování a ukládání dat (nikoli pro ziskové společnosti nebo spuštění)
- Aplikace, které o sobě navzájem vědí a vyměňují si o mně relevantní zdravotní údaje, jsou další generací - místo současného bohatství utišených, nevědomých (hloupých?) Aplikací
Myslím, že je skvělé, že se vývojáři podívají na zdravotní problém, vyvinou pro něj aplikaci a vydají ji světu. Ale příliš často tyto aplikace nikam nevedou a nemají publikum. Nebo jsou osamoceni původními vývojáři pro nedostatek zájmu. Několik populárních aplikací pro zdraví, které si získávají silné publikum, jsou výjimkou, nikoli pravidlem. A i když získají široké přijetí, stejně jako systémy elektronických lékařských záznamů v naší zemi, navzájem spolu nemluví.
Pokud chcete být schopni říci něco autoritativního nebo smysluplného o datech shromážděných z aplikace, musíte ukázat, že data pocházejí z reprezentativního vzorku populace. Pokud to nemáte, vaše data nám říkají pouze o jedné malé skupině populace - té, která nevypadá jako většina z nás.
Poznámky pod čarou:
- A bude v dohledné budoucnosti [↩]
- A proč Google zítra konečně uzavře svůj osobní rekord v oblasti zdraví. [↩]
- Nebo horší - a častěji - a celá sada aplikací kteří si nejsou vědomi jiného a nemohou si navzájem vyměňovat data [↩]