Mohou profily Facebooku měřit osobnost?
To je otázka, na kterou se pokouší odpovědět interdisciplinární skupina vědců z Pensylvánské univerzity. V současné době psychologové používají k hodnocení osobnosti různé metody, včetně průzkumů a dotazníků, které sami hlásili.
V nedávné studii 75 000 lidí dobrovolně vyplnilo společný osobnostní dotazník prostřednictvím aplikace na Facebooku a zpřístupnilo aktualizace svých statusů na Facebooku pro výzkumné účely. Vědci poté hledali celkové jazykové vzorce v jazyce dobrovolníků.
Studie je publikována v časopise PLOS ONE.
Vyšetřovatelé vytvořili počítačové modely, které dokázali předpovědět věk, pohlaví a jejich odpovědi na základě osobnostních dotazníků.
Tyto predikční modely byly překvapivě přesné. Například vědci měli pravdu 92 procent času, když předpovídali pohlaví uživatelů pouze na základě jazyka jejich aktualizací stavu.
Úspěch tohoto „otevřeného“ přístupu naznačuje nové způsoby výzkumu souvislostí mezi osobnostními rysy a chováním a měření účinnosti psychologických intervencí.
Studie vědců čerpá z dlouhé historie studia slov, která lidé používají jako způsob porozumění jejich pocitům a duševním stavům, ale při analýze dat v jejich jádru zvolila spíše „otevřený“ než „uzavřený“ přístup.
„V přístupu„ uzavřené slovní zásoby “,“ řekla doktorandka Margaret Kernová, „psychologové by si mohli vybrat seznam slov, o kterých si myslí, že signalizují pozitivní emoce, například„ spokojený “,„ nadšený “nebo„ úžasný “a pak podívejte se na frekvenci používání těchto slov člověkem jako způsob, jak měřit, jak šťastná je tato osoba.
Přístupy uzavřené slovní zásoby však mají několik omezení, včetně toho, že ne vždy měří to, co hodlají měřit. “
„Například,“ řekl Ungar, „by se mohlo stát, že energetický sektor používá více negativních emočních slov, jednoduše proto, že více používá slovo„ surový “. To však ukazuje na potřebu používat víceslovné výrazy k pochopení zamýšleného významu.
„Surová ropa“ je jiná než „surová“ a také „nemocná“ se liší od pouhého „nemocného“. ““
Dalším inherentním omezením přístupu uzavřené slovní zásoby je to, že se spoléhá na předem vytvořenou pevnou sadu slov. Taková studie by mohla potvrdit, že depresivní lidé skutečně častěji používají očekávaná slova (jako „smutná“), ale nemohou generovat nové poznatky (že například o sportovních nebo společenských aktivitách mluví méně než o šťastných lidech).
Minulé psychologické jazykové studie se nutně spoléhaly na přístupy uzavřené slovní zásoby, protože jejich malá velikost vzorku učinila otevřené přístupy nepraktickými. Vznik masivních jazykových datových souborů poskytovaných sociálními médii nyní umožňuje kvalitativně odlišné analýzy.
"Většina slov se vyskytuje jen zřídka - jakýkoli vzorek psaní, včetně aktualizací stavu Facebooku, obsahuje pouze malou část průměrné slovní zásoby," uvádí H. Andrew Schwartz, postdoktorand v oboru počítačových a informačních věd.
"To znamená, že pro všechna, kromě nejběžnějších slov, potřebujete psát vzorky od mnoha lidí, abyste mohli navázat spojení s psychologickými rysy." Tradiční studie nalezly zajímavá spojení s předem vybranými kategoriemi slov, jako jsou „pozitivní emoce“ nebo „funkční slova“.
Miliardy instancí slov dostupných v sociálních médiích nám však umožňují najít vzory na mnohem bohatší úrovni. “
Přístup otevřené slovní zásoby naopak odvozuje důležitá slova a fráze ze samotného vzorku. S více než 700 miliony slov, frází a témat vyvrtaných ze vzorku stavových zpráv na Facebooku této studie bylo k dispozici dostatek dat, aby bylo možné kopat stovky běžných slov a frází a najít otevřený jazyk, který smysluplněji koreluje s konkrétními charakteristikami.
Tato velká velikost dat byla rozhodující pro konkrétní techniku, kterou tým použil, známou jako analýza diferenciálního jazyka nebo DLA.
Vědci použili DLA k izolaci slov a frází, které se shlukovaly kolem různých charakteristik, které samy o sobě uvedly v dotaznících dobrovolníků: věk, pohlaví a skóre osobnostních rysů „velké pětky“ - extraverze, příjemnost, svědomitost, neuroticismus a otevřenost.
Byl vybrán model velké pětky, protože se jedná o běžný a dobře prostudovaný způsob kvantifikace osobnostních rysů, ale metodu výzkumníků lze použít u modelů, které měří další charakteristiky, včetně deprese nebo štěstí.
Pro vizualizaci svých výsledků vědci vytvořili cloudy slov, které shrnují jazyk, který statisticky předpovídal danou vlastnost, přičemž korelační síla slova v daném shluku je reprezentována jeho velikostí. Například slovní mrak, který zobrazuje jazyk používaný extravertem, prominentně obsahuje slova a fráze jako „párty“, „skvělá noc“ a „udeř mě“, zatímco slovní mrak pro introverty obsahuje mnoho odkazů na japonská média a emotikony.
"Může se zdát zřejmé, že super extravertovaný člověk by hodně mluvil o večírcích," řekl Eichstaedt, "ale vzato dohromady, tato slova mraků poskytují bezprecedentní okno do psychologického světa lidí s daným rysem." Mnoho věcí se zdá být zřejmé a každá položka má smysl, ale mysleli byste na všechny nebo dokonce na většinu z nich? “
Martin Seligman, programový ředitel vysvětluje: „Když se ptám sám sebe, jaké to je být extrovertem?“ „Jaké to je být dospívající dívkou?“ „Jaké to je být schizofrenikem nebo neurotikem?“ Nebo „Jaké to je být Sedmdesát let starý? “Tato slova mraků přicházejí mnohem blíže k jádru věci než všechny existující dotazníky.“
Aby vědci otestovali, jak přesně zachycují rysy lidí prostřednictvím přístupu v otevřené slovní zásobě, rozdělili dobrovolníky do dvou skupin a zjistili, zda lze použít statistický model získaný z jedné skupiny k odvození vlastností druhé. U tří čtvrtin dobrovolníků použili vědci techniky strojového učení k vytvoření modelu slov a frází, které předpovídají odpovědi na dotazník.
Poté pomocí tohoto modelu předpověděli věk, pohlaví a osobnosti pro zbývající čtvrtletí na základě svých příspěvků na Facebooku.
„Model předpovídal pohlaví dobrovolníka na základě jeho používání jazyka přesně o 92 procent,“ řekl Schwartz, „a věk člověka bychom mohli předpovědět do tří let více než v polovině času.
"Naše osobnostní předpovědi jsou ze své podstaty méně přesné, ale jsou téměř stejně dobré jako používání výsledků dotazníku člověka od jednoho dne k předpovědi jeho odpovědí na stejný dotazník za jiný den."
S přístupem otevřeného slovníku, který se ukázal být stejně nebo více prediktivní než uzavřené přístupy, vědci použili slovo mraky k vytvoření nového vhledu do vztahů mezi slovy a vlastnostmi. Například účastníci, kteří dosáhli nízkého skóre v neurotickém měřítku (tj. Ti s nejvíce emoční stabilitou), použili větší počet slov, která odkazovala na aktivní sociální aktivity, jako je „snowboarding“, „setkání“ nebo „basketbal“.
"To nezaručuje, že díky sportu budeš méně neurotický; mohlo by se stát, že neurotismus způsobuje, že se lidé vyhýbají sportu, “řekl Ungar. "Ale naznačuje to, že bychom měli prozkoumat možnost, že by se neurotičtí jedinci stali emočně stabilnějšími, kdyby více sportovali."
Budováním prediktivního modelu osobnosti založeného na jazyce sociálních médií mohou vědci nyní k těmto otázkám snáze přistupovat. Namísto žádání milionů lidí o vyplnění průzkumů mohou být budoucí studie prováděny tak, že dobrovolníci předloží své kanály z Facebooku nebo Twitteru k anonymizované studii.
"Vědci teoreticky studovali tyto osobnostní rysy po mnoho desetiletí," řekl Eichstaedt, "ale nyní mají jednoduchý pohled na to, jak formují moderní život ve věku Facebooku."
Zdroj: University of Pennsylvania