Dr. Epstein, politická zaujatost a výsledky vyhledávání Google

Jsem trochu zmatený tvrzeními Dr. Roberta Epsteina a jeho tvrzením, založeným na jediné studii 95 účastníků, že Google nějak záměrně ovlivnil výsledky před americkými prezidentskými volbami v roce 2016. A proto pravděpodobně ovlivnil samotné volební výsledky.

To je obrovský tvrzení udělat. Jeden by doufal, že vážený výzkumník, jako je Dr. Epstein, bude mít vědecká data k podpoře. Bohužel to nevidím.

Věda je objektivní až do bodu, kdy vědec uzná a zodpovídá za své předsudky. Věda není založena na přednastaveném programu ani na pokusu o vyrovnání skóre. Nejsem si jistý, zda dr. Epstein držel pod kontrolou své vlastní předsudky při svém zjevném honu na čarodějnice, aby zastavil Google za nabízení „zkreslených“ výsledků vyhledávání.

Vyhledávače byly vždy neobjektivní

Google vždy nabízel neobjektivní výsledky vyhledávání. Pokud tomu nerozumíte v případě jakéhokoli vyhledávače budete možná potřebovat rychlý opakovací kurz o tom, jak vyhledávače fungují.

Neexistují žádné nezaujaté výsledky vyhledávání. Všechny vyhledávače používají proprietární algoritmy obchodního tajemství, aby zajistily, že uvidíte, o čem společnost vyhledávačů věří, že přináší „nejlepší“ výsledky. „Nejlepší“ byl - od začátku online vyhledávačů počátkem 90. let - vždy subjektivním pojmem. Neexistuje jediný objektivní žebříček webů, který by říkal: „Vždy zobrazte tento web jako první pro tento vyhledávací dotaz, protože je to jednoznačně nejlepší výsledek.“

A hádejte co - lidé to milují! Proto je Google na vrcholu hromady vyhledávačů, protože skutečně nabízí výsledky, které jsou pro většinu lidí zjevně nejrelevantnější. V okamžiku, kdy Google přestane nabízet takové relevantní výsledky, může a nahradí nový vyhledávač. (Kdokoli si pamatuje Alta Vista, Excite nebo dokonce Yahoo? [A ne, Yahoo již nehledá - jeho výsledky poskytuje Bing.])

Jak vypadá zkreslení ve výsledcích vyhledávače?

Mnozí lidé nevědí, že vyhledávače nezobrazují přesně stejné výsledky stejného dotazu, který požadují dva různí lidé. Většina vyhledávačů, včetně Google, používá složité personalizační faktory i psychografický profil k dalšímu třídění a prezentaci výsledků, které považuje za pro vás nejrelevantnější.

V praxi to znamená, že moje hledání „příznaků deprese“ může vrátit jinou sadu výsledků než vaše hledání za přesně stejných podmínek. Pokud to ve své metodice pečlivě nekontrolujete, budou vaše výsledky nesmyslné a zkažené.

Epstein & Robertson (2015) nalezli v sérii laboratorních (nikoli reálných) experimentů, kdy umělou manipulací s stránkami s výsledky vyhledávače mohly na krátkou dobu ovlivnit preference voličů subjektů. Nezkoumala žádné skutečné stránky vyhledávače. A to ignorovalo rozložení a vzhled moderních stránek s výsledky vyhledávače. Skutečné stránky s výsledky vyhledávání obsahují více reklam (které si může koupit kdokoli) v horní části stránky před organickými výsledky.

Výsledky těchto výzkumníků nepřekvapují, protože odrážejí to, co by vám řekl jakýkoli odborník na optimalizaci vyhledávacích strojů (SEO) - důležité je umístění na stránce s výsledky vyhledávače. Webové stránky získávají mnohem větší provoz, pokud jsou na druhé stránce výsledků číslo 1, # 2 nebo # 3 oproti # 9 - nebo ještě horší.

Ve druhém laboratorním experimentu stejný výzkumník předvedl metody (opět pomocí zcela falešného vyhledávače - nikoli Google), ve kterých by bylo možné potlačit efekt, který vytvořili - efekt manipulace s vyhledávacím strojem (SEME) (prostřednictvím včasných upozornění zobrazovaných uživatelům ).

Google pomohl Hillary vyhrát?

V roce 2017 se Epstein a Robertson nespokojili s tím, že už nebudou prokazovat zjevné - že na pozicích na hodnocení záleží na stránkách s výsledky vyhledávače. Udělali to o krok dále a provedli studii 95 Američanů (pouze 21 z nich bylo v nadcházejících prezidentských volbách označeno jako „nerozhodnutých“) v roce 2016 a jejich vyhledávací návyky.

V bílé knize publikované pouze na jejich vlastních webových stránkách uvádějí Epstein & Robertson mimořádné tvrzení:

[… Zjistili jsme, že mezi květnem a listopadem 2016 byly výsledky vyhledávání zobrazené v reakci na širokou škálu volebních hledaných výrazů v průměru předpojaté ve prospěch paní Clintonové na všech 10 pozicích výsledků vyhledávání.

Publikováno jako „bílá kniha“ a nikoli jako recenzovaná studie v časopise, to vyvolalo spoustu červených vlajek.1

Ve studii bylo málo metod metod vysvětlených. To nezahrnuje žádné informace o tom, co bylo provedeno za účelem omezení personalizace výsledků vyhledávání (protože chcete ovládat tuto nezávislou proměnnou), ani o tom, jaké vyhledávací výrazy skutečně použili.Ve skutečnosti při čtení dvou předchozích studií, které tito vědci publikovali, není ani jasné, zda si jsou vědomi toho, jak vyhledávače fungují, pokud jde o jejich strategie zpeněžení, týdenní změny algoritmu, které používají, a personalizaci výsledků vyhledávání.

Podle mého názoru je v úsilí výzkumného pracovníka patrná i nějaká nedbalost. Pro konkrétní 25denní období, které zkoumali ve studii, není uvedeno žádné odůvodnění, oproti žádnému jinému časovému období. A ve skutečnosti uznávají, že se na to opravdu tak podrobně nedívali většinu datových bodů, které shromáždili. Vědci ignorovali 7měsíční údaje z výzkumu, aby se soustředili pouze na 3 týdny před volbami

Rovněž se rozhodli, post-hoc, zahodit všechna data založená na Gmail.com kvůli anomáliím v těchto datech. Tyto anomálie nevykazovaly žádnou takovou zaujatost, kterou přisuzovaly buď sadě „robotů“, nebo - počkejte na to - úmyslné sabotáži ze strany Google.

Jelikož existuje značná menšina legitimních uživatelů, kteří používají Gmail, zdají se tyto důvody pro vyhodnocení všech dat odvozených z Gmail.com přinejlepším pochybné. Podle mého názoru je to hrozné rozhodnutí v oblasti výzkumu, které však shodou okolností také zajistilo, že vědci našli v jejich datech význam.

Ale tady je ten pravý kicker:

Extrapolace z matematiky představené v této zprávě, v článcích publikovaných v únoru 2016 a poté, hlavní autor studie PNAS předpověděl, že pro-Clintonova zaujatost ve výsledcích vyhledávání Google v průběhu času posune nejméně 2,6 milionu hlasů na Clintonovou.

V jejich bílé knize je nulová matematika. Tam jsou spousta popisných statistik, ale tyto statistiky stěží hovoří o tom, jaké postupy nebo modelování vědci ve skutečnosti použili, aby dospěli k závěrům, které učinili.

„Důkazy vědců o systematické zaujatosti v prezidentských volbách v roce 2016?“ Malý vzorek dat o modelování založený na 95 Američanech (mínus uživatelé Gmail.com, jejichž data vyhodili post-hoc).

Stručně řečeno, podle mého názoru je to přesně ten druh chatrného, ​​temného a příšerně navrženého výzkumu, který v dnešní době přechází na „důkaz“. Proč by vědci prováděli tak zdánlivě politicky zaujatou studii a také vyvodili závěry, o nichž nemají žádný skutečný přímý důkaz? 3

Možná existuje sekera k mletí?

Vědci jsou lidé. A lidé někdy mají sekeru k broušení. Nemusíte chodit daleko, abyste našli jednu z Epsteinových možných konkrétních os.

Před rokem 2012 projevoval Epstein malý zájem o vyhledávače nebo o to, jak fungovaly. Publikoval o nejrůznějších psychologických tématech, tématech vztahů a duševního zdraví a psal o nich pro běžné webové stránky.

Na začátku roku 2012 byl Epsteinův osobní web příjemcem varování před malwarem, které se objevilo, když se uživatelé pokusili o přístup k jeho webu z Googlu. Google zobrazuje tato upozornění, aby uživatele odvedl od potenciálně škodlivých webů.

Ale tento incident se zjevně nějakým způsobem dostal Epsteinovi pod kůži, protože najednou na podzim roku 2012 psal několik článků o nutnosti regulovat Google. To od výzkumníka, který nikdy předtím nenapsal jediné slovo o vyhledávačích. Načasování mi připadá zajímavé.

Stručně řečeno, Epstein se už sedm let zasazuje o regulaci Google federální vládou. Nebylo by příliš těžké si představit hypotetického výzkumníka, který navrhuje studie na podporu své víry.

Výsledek zkreslení vyhledávače

Vyhledávače byly vždy neobjektivní a vždy tomu tak bude, protože se jedná o subjektivní nástroje, které mají uživatelům pomoci získat informace nebo zábavu. V okamžiku, kdy velká vláda chce začít dohlížet na mé výsledky vyhledávání, je okamžik, kdy se obrátím na vyhledávač, kde takové vládní filtrování neprobíhá.

Pomáhá také mít na paměti hypotetické vměšování versus skutečné vměšování se do politiky USA. Zatímco Epstein naznačuje, že Google manipuluje své výsledky politického vyhledávání, aby upřednostňoval kandidáty, které chce být zvolen do funkce, máme skutečný důkaz o tom, že Facebook manipuluje prezidentské volby v roce 2016 prostřednictvím ruskou sponzorovaných organizací, které na své platformě nakupují falešné reklamy v milionech dolarů.

Je zajímavé, že se o to Epstein nejeví jako velký zájem. Možná je to proto, že Facebook mu nikdy neublížil tak, jako kdysi Google.

Pro další informace

Politický fakt: Donald Trump se mýlí, když Google manipuluje s výsledky voleb

Reference

Epstein a Robertson. (2017). Potlačení efektu manipulace s vyhledávačem (SEME). Proc. ACM Hum.-Comput. Interakce., 1 (2), 42.

Epstein a Robertson. (2017). Metoda pro detekci zaujatosti v žebříčku vyhledávání, s důkazem systematické zaujatosti související s prezidentskými volbami 2016. Bílá kniha publikovaná AIBRT, organizací Epstein.

Epstein a Robertson. (2015). Efekt manipulace s vyhledávačem (SEME) a ​​jeho možný dopad na výsledky voleb. PNAS, 10.1073 / pnas.1419828112

Poznámky pod čarou:

  1. Na otázku ohledně nedostatku recenzovaných studií mi Epstein odpověděl: „Mám také problémy jak s naléhavostí, tak s množstvím: Dokončil jsem nebo mám rozpracováno tolik různých studií nových forem vlivu online (studuji momentálně sedm různých typů vlivu - SEME a šest dalších), že jsem se rozhodl shrnout svá zjištění do konferenčních příspěvků, white paperů a v určitém okamžiku do knižní podoby, místo abych trávil to málo času, bolestně pomalý proces akademických publikací. Když narazím na jinou novou formu online vlivu, pochopení a kvantifikace mi trvá minimálně rok nebo dva. (Nedostal jsem se ani k zahájení experimentů s půl tuctem nových forem vlivu, o kterých vím.) Přidání dalšího roku či dvou k tomuto procesu, který bude publikován v časopise, se zdá být vzhledem k mému věku a vzhledem k tomu, jak jsou tyto objevy potenciálně důležité, nerozvážné. pro lidstvo. “ [↩]
  2. Vědci tvrdili, že to bylo kvůli tomu, co řekli, náborem problémů a zdokonalením jejich postupů. Co si klade otázku - neměly být jejich postupy vylepšeny nejprve v pilotní studii, jak by to udělala většina výzkumníků? [↩]
  3. Nebo chcete-li být pedantští, mít minimální důkaz o malém vzorku pouhých 95 vyhledávání uživatelů - minus určitý počet subjektů na Gmail.com - během 25 dnů. [↩]

!-- GDPR -->