Big Data mohou pomoci počítačům ID emoce svázané s obrázky

Populární stránky jako Twitter a Facebook a další kanály jsou nyní plné obrázků, které člověku pomáhají lépe vyjadřovat myšlenky a pocity. Nový výzkum naznačuje, že „velká data“ - jakoukoli sbírku datových souborů tak velkých nebo složitých, že je obtížné ji zpracovat pomocí tradičních aplikací pro zpracování dat - lze použít k výuce počítačů k interpretaci obsahu a pocitů spojených s obrázky.

Dr. Jiebo Luo, profesor výpočetní techniky na University of Rochester, ve spolupráci s vědci z Adobe Research nedávno představil příspěvek na konferenci Americké asociace pro umělou inteligenci (AAAI), popisující progresivní trénink hluboké konvoluční neurální sítě (CNN) .

Vyškolený počítač lze poté použít k určení, jaké nálady tyto obrázky pravděpodobně vyvolají. Luo říká, že tyto informace by mohly být užitečné pro tak rozmanité věci, jako je měření ekonomických ukazatelů nebo předpovídání voleb.

Úkol je však složitý. Analýza sentimentu textu pomocí počítačů je sama o sobě náročným úkolem. A v sociálních médiích je analýza sentimentu komplikovanější, protože mnoho lidí se vyjadřuje pomocí obrázků a videí, kterým počítač těžší porozumí.

Například během politické kampaně budou voliči často sdílet své názory prostřednictvím obrázků.

Dva různé obrázky mohou ukazovat stejného kandidáta, ale mohou dělat velmi odlišná politická prohlášení. Člověk mohl rozpoznat jeden jako pozitivní portrét kandidáta (např. Kandidát se usmívá a zvedá ruce) a druhý jako negativní (např. Obrázek kandidáta, který vypadá poražený).

Ale žádný člověk se nemohl podívat na každý obrázek sdílený na sociálních médiích - jsou to skutečně „velká data“. Aby bylo možné informovaně odhadovat popularitu kandidáta, je třeba trénovat počítače, aby tato data strávily, což je přístup, který může Luo a jeho spolupracovníci udělat přesněji, než tomu bylo dosud možné.

Vědci považují úkol získávání sentimentu z obrázků za problém klasifikace obrazu. To znamená, že je třeba každý obrázek nějak analyzovat a použít na něj štítky.

K zahájení tréninkového procesu použili Luo a jeho spolupracovníci obrovské množství obrazů Flickr, které byly volně označeny strojovým algoritmem se specifickými sentimenty, v existující databázi známé jako SentiBank (vyvinutá skupinou Dr. Shih-Fu Changa v Columbii Univerzita).

To dává počítači výchozí bod, aby začal chápat, co mohou některé obrázky sdělit.

Ale strojově generované štítky také zahrnují pravděpodobnost, že tento štítek bude pravdivý, to znamená, jak spolehlivý je počítač, že je štítek správný?

Klíčový krok tréninkového procesu přichází dále, když odhodí všechny obrázky, pro které sentiment nebo sentimenty, kterými byly označeny, nemusí být pravdivé. Používají tedy pouze „lépe“ označené obrázky pro další trénink progresivně se zlepšujícím způsobem v rámci silné konvoluční neuronové sítě.

Resaercher zjistil, že tento další krok významně zlepšil přesnost sentimentu, kterým je každý obrázek označen.

Také přizpůsobili tento modul pro analýzu sentimentu několika obrázky extrahovanými z Twitteru. V tomto případě použili „davovou inteligenci“, přičemž více lidí pomohlo kategorizovat snímky prostřednictvím platformy Amazon Mechanical Turk.

K doladění počítače použili jen malý počet obrázků, a přesto použitím tohoto procesu přizpůsobení domény ukázali, že by mohli vylepšit současné nejmodernější metody pro analýzu sentimentu obrázků na Twitteru.

Jedním překvapivým zjištěním je, že přesnost klasifikace obrazového sentimentu překročila přesnost klasifikace textového sentimentu ve stejných zprávách na Twitteru.

Zdroj: University of Rochester

!-- GDPR -->