Nová hlasová aplikace může pomoci při regulaci hmotnosti

Klíčovým nájemcem hubnutí je spočítat každou spotřebovanou kalorii. Zatímco úkol zní snadno, zdokumentování všech kalorií se stává obtížným úkolem při jídle v restauraci, občerstvení na cestách nebo dokonce při posezení u jídla doma.

Tato technika vyžaduje důslednost a přesnost, a pokud selže, je to obvykle proto, že lidé nemají čas ani prostředky k vyhledání a zaznamenání všech potřebných informací.

Nyní vědci z Massachusetts Institute of Technology (MIT) vyvinuli aplikaci, která umožňuje lidem přihlásit se k jídlu a pití, které konzumovali pomocí systému řízeného řečí.

Koncept se objevil před několika lety, když tým odborníků na výživu z Tufts University oslovil vědce MIT s myšlenkou aplikace v mluveném jazyce, která by usnadnila zaznamenávání jídla.

Tento týden na mezinárodní konferenci o akustice, řeči a zpracování signálu v Šanghaji představili vědci MIT svůj webový prototyp systému záznamu výživy řízeného řečí.

S ním uživatel slovně popisuje obsah jídla a systém analyzuje popis a automaticky načte příslušná nutriční data z online databáze spravované americkým ministerstvem zemědělství (USDA).

Data se zobrazují společně s obrázky příslušných potravin a rozbalovacími nabídkami, které uživateli umožňují upřesnit jejich popisy - například vybrat přesné množství potravin. Ale tato upřesnění lze provést také slovně.

Uživatel, který začíná slovy: „K snídani jsem měl misku ovesných vloček, banánů a sklenici pomerančového džusu“, může provést změnu: „Měl jsem polovinu banánu,“ a systém aktualizuje údaje, které zobrazuje o banánech a zbytek ponechat beze změny.

„To, co [odborníci na výživu Tufts] zažili, je to, že aplikace, které tam byly, aby pomohly lidem pokusit se zaznamenávat jídlo, byly trochu zdlouhavé, a proto s nimi lidé nedrželi krok,“ říká James Glass, vedoucí výzkumný pracovník .

"Hledali tedy způsoby, které by byly přesné a snadno vložitelné informace."

První autorkou nového příspěvku je Mandy Korpusik, absolventka MIT v oboru elektrotechniky a informatiky. Přidal se k ní Glass, který je jejím vedoucím diplomové práce; její spolužák Michael Price; a Calvin Huang, vysokoškolský výzkumník ve skupině Glass.

V článku vědci uvádějí výsledky experimentů se systémem rozpoznávání řeči, který vyvinuli speciálně pro zvládnutí terminologie související s potravinami.

To však nebylo hlavním cílem jejich práce, protože online demo jejich systému zaznamenávání jídla místo toho používá bezplatnou aplikaci pro rozpoznávání řeči od Googlu.

Jejich výzkum se soustředil na dva další problémy. Jedním z nich je identifikace funkční role slov: Systém musí uznat, že pokud uživatel zaznamená frázi „mísa z ovesných vloček“, nutriční informace o ovesných vločkách jsou relevantní, ale pokud je fráze „ovesné vločky“, není tomu tak.

Druhým problémem je sladění frázování uživatele s položkami v databázi USDA. Například údaje USDA o ovesných vločkách se zaznamenávají pod nadpisem „oves“; slovo „ovesné vločky“ se v záznamu nikde neobjevuje.

K řešení prvního problému použili vědci strojové učení.

Prostřednictvím crowdsourcingové platformy Amazon Mechanical Turk přijímali pracovníky, kteří jednoduše popsali, co jedli při nedávných jídlech. Poté označili příslušná slova v popisu jako názvy potravin, množství, názvy značek nebo modifikátory názvů potravin.

V „misce z ovesných vloček“ je „mísa“ množství a „ovesné vločky“ je jídlo, ale v „ovesných vločkách“ je ovesná vločka modifikátorem.

Jakmile měli vědci zhruba 10 000 označených popisů jídel, použili algoritmy strojového učení k nalezení vzorů v syntaktických vztazích mezi slovy, které by identifikovaly jejich funkční role.

Vědci poté použili databázi open-source s názvem Freebase k překladu mezi popisy uživatelů a štítky v databázi USDA. Samotná databáze obsahuje záznamy o více než 8 000 běžných potravinách, z nichž mnohé obsahují synonyma.

Tam, kde chyběla synonyma, znovu přijali pracovníky Mechanického Turka, aby je zásobili.

Verze systému představená na konferenci má hlavně demonstrovat životaschopnost jeho přístupu ke zpracování přirozeného jazyka. Systém hlásí počty kalorií, ale ještě je nesčítá automaticky.

Verze, která ano, je však v pracích, a až bude hotová, vědci z Tufts plánují provést uživatelskou studii, aby zjistili, zda skutečně usnadňuje zaznamenávání výživy.

Zdroj: MIT

!-- GDPR -->