Bad Research: Popular Sex Search Terms

Lidé mají rádi sex. Mají tak rádi sex, tráví spoustu času hledáním online. Jdi zjistit. (Zde můžete říct, že se chystám ponořit se do opravdu vysokých, opojných věcí ...)

Výzkumníci Ogi Ogas a Sai Gaddam nedávno vydali knihu, Miliarda zlých myšlenek, podrobně analyzující 400 milionů vyhledávání, která shromáždili z vyhledávače Dogpile. Z těchto 400 milionů vyhledávání bylo 13 procent (55 milionů) pro erotický obsah.

Jak se těch 55 milionů vyhledávání rozpadlo? Zjistíme ... ale pojďme se také podívat na metodiku těchto výzkumníků, abychom zjistili, zda jejich zjištění stojí za papír, na který jsou vytištěny. (Pokud si myslíte, že ne, máte pravděpodobně pravdu.)

Tady je tedy to, co lidé na Dogpile hledají, pokud jde o sexuální zájmy. Všimněte si, že níže uvedené výrazy představují obecnou kategorii vyhledávání daného zájmu, která zahrnuje všechny druhy obměn výrazů. Tyto permutace (například „prsa“ pro prsa) nejsou níže uvedeny; použij svou představivost.

  1. Mládež - 13,5 procenta
  2. Gay - 4,7 procenta
  3. MILFs (Mother’s I’d Like to F ***) - 4,3 procenta
  4. Prsa - 4,0 procenta
  5. Podvádění manželky - 3,4 procenta
  6. Vagíny - 2,8 procenta
  7. Penisy - 2,4 procenta

Odpadky, odpadky

V počítačovém programování existuje staré rčení - GIGO: Garbage In, Garbage Out. Platí stejně dobře pro jakékoli vědecké úsilí, které je stejně dobré jako data, která se rozhodnete analyzovat. Pokud začnete s datovou sadou pochybné zobecnitelnosti nebo hodnoty, můžete najít závěry, které mají malou souvislost s realitou.

V tomto případě existuje obrovský problém s údaji z výzkumu, které tito vědci shromáždili. Nepocházejí z Googlu ani z Bingu. Pocházejí z málo známého vyhledávače s názvem „Dogpile“, který ani není vyhledávačem. Co je Dogpile, je jednoduše agregační modul výsledků vyhledávání od Google, Yahoo a Bing (protože Bing nyní poskytuje Yahoo svá vyhledávací data, nejsem si jistý, proč stále existuje tato diferenciace).

To není totéž jako vyhledávání prováděné na Google prostřednictvím Google.com nebo vyhledávání prováděné na Bingu prostřednictvím Bing.com. Ve skutečnosti musíte jít na web Dogpile, abyste získali tyto výsledky - výsledky, které tvořily datovou sadu pro současné výzkumníky. Pokud vyhledáváte na Google.com, vaši výzkumníci by toto vyhledávání neanalyzovali (což dává smysl, protože Google a Bing neposkytují údaje, které shromažďuje při vyhledávání, snadno dostupné výzkumníkům).

Co pravděpodobně dělá Dogpile málo využívaným, je skutečnost, že mísí sponzorované reklamy ve vyhledávání s výsledky organického vyhledávání prakticky bez vizuálního podnětu, který tak dělá. Drobný tisk na konci každého výsledku vyhledávání vám dá vědět, zda se jedná o „sponzorovaný“ výsledek, či nikoli - např. Reklama. Při hledání „deprese“ na Dogpile byly 14 z prvních 20 výsledků vyhledávání reklamy - ne přesně to, co by většina obyčejných lidí snášela velmi dlouho.

Lidé, kteří hledají obsah online, se již dlouho rozhodli opustit používání vyhledávačů, které se pokoušejí promíchat reklamu se skutečnými výsledky. Důvod je jednoduchý - lidé kliknou na reklamu, když mají zájem o nabízený produkt nebo službu. Nelíbí se jim, když se nechají přimět klikat na to, co považovali za výsledek vyhledávání, jen aby zjistili, že se jedná o maskovanou reklamu.

Kdo tedy používá Dogpile? Kdo ví, ale určitě to nebude běžný uživatel internetu. Zatímco více než 150 milionů lidí používá Google a 90 milionů používá Bing.com, Dogpile je ubohých 2–3 miliony lidí měsíčně bledne ve srovnání a je daleko méně než 0,05 procenta z celkového trhu vyhledávačů.

Můžete provést průzkum na tak malém souboru dat a zkusit použít kouř a zrcadla, aby to vypadalo, jako byste ve skutečnosti provedli stejný průkopnický výzkum, jaký provedl Kinseyův institut v 50. a 60. letech? Určitě můžete.

Například Ogi Ogas a Sai Gaddam uvedli, že analyzovali 400 milionů internetových vyhledávání. Porovnejte toto číslo s 3 miliardami vyhledávacích dotazů prováděných každý den, tvrdí společnost Hitwise, online analytická společnost. Najednou 400 milionů - i když se zdá být působivým číslem ve vakuu - vypadá mnohem méně působivě, když je umístěn do jakési datové souvislosti. 400 milionů vyhledávání je ekvivalent toho, co proběhlo za přibližně 3 hodiny. V jeden den.

Kontext je samozřejmě vše, co se týče datových sad, zvláště když je pravděpodobné, že tyto datové sady budou zkreslené způsoby, které jste se nikdy neobtěžovali vyšetřovat. V tomto případě je datová sada předpojatá použitím vyhledávacího modulu Dogpile - malého, specializovaného vyhledávacího modulu, který je pravděpodobnější než nepoužívaný určitou podmnožinou populace, která se liší od zbytku populace.

Vezměte tedy tento seznam s rezervou. Je to zajímavé, ale nejsem si jistý, zda to odráží obecnou populaci. A rozhodně se neoplatí kupovat celou knihu, která se ponoří do této chybné datové sady.

!-- GDPR -->