Může počítač naučit zdravý rozum?
V nepříliš vzdálené minulosti bylo považováno za oxymoron navrhování, že počítač může prokázat „zdravý rozum“. Ale superpočítače, jako je Watson od IBM, mohou pro počítače představovat nové role.V současné době vědci z Carnegie Mellon University provozují počítačový program 24/7 ve snaze zachytit data a učit se zdravému rozumu v masovém měřítku.
Tento program se nazývá Never Ending Image Learner (NEIL), protože software vyhledává na webu obrázky, snaží se je co nejlépe pochopit sám o sobě a při vytváření rostoucí vizuální databáze shromažďuje v širokém měřítku zdravý rozum.
NEIL využívá nedávné pokroky v počítačovém vidění, které počítačovým programům umožňují identifikovat a označovat objekty na obrázcích, charakterizovat scény a rozpoznávat atributy, jako jsou barvy, osvětlení a materiály, a to vše s minimálním lidským dohledem.
Data, která generuje, dále zvýší schopnost počítačů porozumět vizuálnímu světu.
NEIL má výrazný pokrok oproti dřívějším robotickým zařízením, protože dokáže vytvářet asociace mezi věcmi a získávat informace o zdravém rozumu. Informace, které lidé znají téměř intuitivně - že auta se často nacházejí na silnicích, že budovy bývají svislé a že kachny vypadají jako husy.
Na základě textových odkazů by se mohlo zdát, že barva spojená s ovcemi je černá, ale lidé - a nyní NEIL - přesto vědí, že ovce jsou obvykle bílé.
"Snímky jsou nejlepší způsob, jak se naučit vizuální vlastnosti," řekl Abhinav Gupta, Ph.D., asistent profesora výzkumu v Institutu robotiky Carnegie Mellon.
"Obrázky také obsahují spoustu zdravých informací o světě." Lidé se to učí sami a s NEIL doufáme, že to udělají také počítače. “
Počítačový klastr spouští program NEIL od konce července a již analyzoval tři miliony obrázků a identifikoval 1 500 typů objektů v půl milionu obrázků a 1 200 typů scén ve stovkách tisíců obrázků.
Spojil tečky, aby se naučil 2 500 asociací z tisíců případů.
Jednou z motivací projektu NEIL je vytvoření největší vizuální strukturované znalostní základny na světě, kde jsou označeny a katalogizovány objekty, scény, akce, atributy a kontextové vztahy.
"To, co jsme se naučili za posledních 5-10 let výzkumu počítačového vidění, je, že čím více dat máte, tím lepší je počítačové vidění," řekl Gupta.
Některé projekty, například ImageNet a Visipedia, se pokusily tato strukturovaná data zkompilovat s lidskou pomocí.
Rozsah internetu je však tak obrovský - samotný Facebook obsahuje více než 200 miliard obrázků - že jedinou nadějí, jak to všechno analyzovat, je naučit počítače, aby to dělaly převážně samy.
Lidé také NEILU říkají, jaké kategorie objektů, scén atd. Mají hledat a analyzovat. Ale někdy to, co najde NEIL, může překvapit i vědce.
Lze například předpokládat, že hledání „jablka“ může vrátit obrázky ovoce i přenosných počítačů. Gupta a jeho tým, všichni landlubbers, však netušili, že hledání F-18 nezjistí jen snímky stíhačky, ale také katamarány třídy F18.
Jak pokračuje hledání, NEIL vyvíjí podkategorie předmětů - tříkolky mohou být pro děti, pro dospělé a mohou být motorizované, nebo auta přicházejí v různých značkách a modelech.
A začíná si všímat asociací - že zebry se obvykle vyskytují například v savanách a že podlahy obchodování s akciemi jsou obvykle přeplněné.
Než se NEIL může stát jménem domácnosti, bude nutné zmenšit měřítko, protože NEIL je výpočetně intenzivní a program běží na dvou klastrech počítačů, které obsahují 200 procesorových jader.
Zdroj: Carnegie Mellon University