Analýza řeči AI dokáže detekovat depresi u malých dětí
Nový výzkum naznačuje, že algoritmus strojového učení dokáže detekovat příznaky úzkosti a deprese v řečových vzorcích malých dětí. Tato technika by mohla být rychlejším a snadnějším způsobem detekce obtížně rozpoznatelných poruch u mladých lidí. Včasné odhalení emocionálních problémů je důležité pro zajištění včasné péče.
Vyšetřovatelé vysvětlují, že přibližně jedno z pěti dětí trpí úzkostí a depresí, které se souhrnně nazývají „internalizující poruchy“. Je však obtížné rozpoznat známky poruchy, protože děti mladší osmi let nemohou spolehlivě formulovat své emoční utrpení, takže je obtížné tento stav odhalit.
Potřeba včasné diagnostiky je důležitá, protože přístup k poskytovateli, ať už jde o problémy s plánováním nebo získání ověření pojištění, je často pracný proces.
"Potřebujeme rychlé a objektivní testy, abychom chytili děti, když trpí," řekla Dr. Ellen McGinnisová, klinická psychologka z Vermontského centra pro děti, mládež a rodiny ve Vermontském lékařském centru a hlavní autorka studie. "Většina dětí do 8 let je nediagnostikovaná."
Výzkum se objevuje v Journal of Biomedical and Health Informatics.
Včasná diagnóza je zásadní, protože děti dobře reagují na léčbu, zatímco se jejich mozek stále vyvíjí, ale pokud nebudou léčeny, hrozí jim v pozdějším životě vyšší riziko zneužívání návykových látek a sebevražd.
Standardní diagnóza zahrnuje 60–90 minutový polostrukturovaný rozhovor s vyškoleným klinikem a jejich poskytovatelem primární péče.
McGinnis spolu s biomedicínským inženýrem a hlavním autorem studie Ryanem McGinnisem z University of Vermont hledali způsoby, jak využít umělou inteligenci a strojové učení, aby byla diagnostika rychlejší a spolehlivější.
Vědci použili upravenou verzi úlohy indukce nálady nazvanou Trier-Social Stress Task, která má u subjektu vyvolat pocity stresu a úzkosti.
Skupina 71 dětí ve věku od tří do osmi let byla požádána, aby improvizovala tříminutový příběh, a řekla, že budou souzeni podle toho, jak zajímavé to bylo. Výzkumný pracovník působící jako soudce zůstal po celou dobu projevu přísný a poskytoval pouze neutrální nebo negativní zpětnou vazbu. Po 90 sekundách a znovu po 30 sekundách zazní bzučák a soudce jim řekne, kolik času ještě zbývá.
„Úkol je navržen tak, aby působil stresujícím dojmem a uvedl je do myšlení, že je někdo soudí,“ říká Ellen McGinnisová.
Děti byly také diagnostikovány pomocí strukturovaného klinického rozhovoru a rodičovského dotazníku, což jsou oba dobře zavedené způsoby identifikace internalizujících poruch u dětí.
Vědci použili algoritmus strojového učení k analýze statistických vlastností zvukových záznamů příběhu každého dítěte a jejich propojení s diagnózou dítěte. Zjistili, že algoritmus byl velmi úspěšný při diagnostice dětí a že střední fáze nahrávek mezi dvěma bzučáky byla nejpředvídatelnější pro diagnózu.
"Algoritmus dokázal identifikovat děti s diagnózou internalizující se poruchy s přesností 80 procent a ve většině případů se opravdu dobře porovnal s přesností nadřazeného kontrolního seznamu," říká Ryan McGinnis.
Může také poskytnout výsledky mnohem rychleji - algoritmus vyžaduje jen několik sekund času zpracování, jakmile je úkol dokončen, aby poskytl diagnózu.
Algoritmus identifikoval osm různých zvukových funkcí dětské řeči, ale tři zvláště vynikly jako vysoce indikativní pro internalizační poruchy: nízké hlasy, s opakovatelnými sklony a obsahem řeči a vyšší reakce na překvapivý bzučák.
Ellen McGinnis říká, že tyto funkce dobře vyhovují tomu, co můžete očekávat od někoho, kdo trpí depresí. "Nízký hlas a opakovatelné prvky řeči odrážejí to, na co myslíme, když uvažujeme o depresi: mluvení monotónním hlasem a opakování toho, co říkáte," říká Ellen McGinnis.
Vyšší odezva na bzučák je také podobná odezvě, kterou výzkumníci našli ve své předchozí práci, kde bylo zjištěno, že děti s internalizujícími poruchami vykazují větší odvrácenou odezvu od strašlivého stimulu v úkolu vyvolání strachu.
Hlasová analýza má podobnou přesnost v diagnostice jako analýza pohybu v této dřívější práci, ale Ryan McGinnis si myslí, že by bylo mnohem snazší ji použít v klinickém prostředí.
Úkol strachu vyžaduje potemnělou místnost, hada, pohybové senzory připojené k dítěti a průvodce, zatímco hlasový úkol potřebuje pouze soudce, způsob záznamu řeči a bzučák, který má přerušit. "Nasazení by bylo proveditelnější," říká.
Ellen McGinnis říká, že dalším krokem bude vývoj algoritmu analýzy řeči na univerzální screeningový nástroj pro klinické použití, možná prostřednictvím aplikace pro chytré telefony, která by mohla okamžitě zaznamenávat a analyzovat výsledky.
Hlasovou analýzu lze také kombinovat s pohybovou analýzou do řady diagnostických nástrojů podporovaných technologiemi, které pomohou identifikovat děti ohrožené úzkostí a depresí ještě předtím, než jejich rodiče budou mít podezření, že je něco špatně.
Zdroj: University of Vermont