Poslech na ‚Efekt koktejlové párty 'v mozku

Někteří jedinci se mohou soustředit na jednoho reproduktoru navzdory okolnímu prostředí, které zakrývá hlas člověka. Prostředím může být učebna, bar nebo sportovní událost - tato schopnost není jedinečná a psychologové ji popsali jako „efekt koktejlové párty“.

Nové výzkumné úsilí vedené neurochirurgem z University of California - San Francisco a postdoktorandem se zaměřilo na objevení toho, jak selektivní sluch funguje v mozku.

Edward Chang, MD a Nima Mesgarani, Ph.D., pracovali se třemi pacienty, kteří podstoupili operaci mozku pro těžkou epilepsii.

Část této operace zahrnuje určení částí mozku, které jsou odpovědné za deaktivaci záchvatů. Toto cvičení zahrnuje mapování mozkové aktivity po dobu jednoho týdne, přičemž tenká vrstva až 256 elektrod je umístěna pod lebkou na vnějším povrchu nebo kůře mozku. Elektrody zaznamenávají aktivitu ve spánkovém laloku - domovu sluchové kůry.

Chang uvedl, že schopnost bezpečně zaznamenávat intrakraniální záznamy poskytuje jedinečné příležitosti k prohloubení základních znalostí o tom, jak mozek funguje.

"Kombinace mozkových nahrávek s vysokým rozlišením a výkonných dekódovacích algoritmů otevírá okno do subjektivního zážitku mysli, který jsme nikdy předtím neviděli," řekl Chang.

V experimentech si pacienti poslechli dva vzorky řeči, které jim hráli současně, v nichž různé mluvčí mluvili různými frázemi. Byli požádáni, aby identifikovali slova, která slyšeli mluvit jedním ze dvou řečníků.

Autoři poté použili nové dekódovací metody k „rekonstrukci“ toho, co subjekty slyšeli z analýzy svých vzorců mozkové aktivity.

Autoři překvapivě zjistili, že nervové reakce ve sluchové kůře odrážejí pouze odpovědi cíleného mluvčího. Zjistili, že jejich dekódovací algoritmus dokáže na základě těchto neurálních vzorců předpovědět, který reproduktor a dokonce jaká konkrétní slova subjekt poslouchal. Jinými slovy, mohli poznat, kdy pozornost posluchače zabloudila k jinému řečníkovi.

"Algoritmus fungoval tak dobře, že jsme mohli předvídat nejen správné odpovědi, ale i když věnovali pozornost nesprávnému slovu," řekl Chang.

Nové poznatky ukazují, že reprezentace řeči v kůře neodráží pouze celé vnější akustické prostředí, ale pouze to, co opravdu chceme nebo potřebujeme slyšet.

Představují významný pokrok v porozumění tomu, jak lidský mozek zpracovává jazyk, s okamžitými důsledky pro studium poškození během stárnutí, poruchy pozornosti, autismu a poruch učení jazyka.

Kromě toho Chang říká, že jednou budeme moci tuto technologii použít pro neuroprostetická zařízení k dekódování záměrů a myšlenek od paralyzovaných pacientů, kteří nemohou komunikovat.

Pochopení toho, jak jsou naše mozky zapojeny tak, aby upřednostňovaly některé sluchové podněty před ostatními, mohou povzbudit nové přístupy k automatizaci a zdokonalení toho, jak hlasově aktivovaná elektronická rozhraní filtrují zvuky, aby správně detekovaly verbální příkazy.

Metoda, kterou se mozek může tak účinně soustředit na jediný hlas, je oblastí významného zájmu společností, které vyvíjejí elektronická zařízení s hlasově aktivními rozhraními.

Zatímco technologie rozpoznávání hlasu, které umožňují taková rozhraní, jako je Apple Siri, prošly v posledních několika letech dlouhou cestou, zdaleka nejsou tak propracované jako systém lidské řeči. Například průměrný člověk může vstoupit do hlučné místnosti a vést soukromý rozhovor s relativní lehkostí - jako by všechny ostatní hlasy v místnosti byly ztlumené.

Rozpoznávání řeči, řekl Mesgarani, inženýr se znalostí automatického výzkumu rozpoznávání řeči, je „něco, v čem jsou lidé pozoruhodně dobří, ale ukazuje se, že strojová emulace této lidské schopnosti je nesmírně obtížná.“

Článek výzkumu se objeví v časopise Příroda.

Zdroj: University of California, San Francisco (UCSF)

!-- GDPR -->