Umělá inteligence umí číst myšlenky. Stačí jí k tomu obyčejná magnetická rezonance
ČTENÍ MYŠLENEK
Umělá inteligence by mohla pomáhat lidem, kteří přišli o schopnost mluvit. Vědci na Texaské univerzitě totiž vyvinuli dekodér, jenž umožní takzvaně neinvazivní čtení myšlenek. Zařízení fungující pomocí umělé inteligence dokáže převádět myšlenky na text pomocí snímku mozku, píše zpravodajský list The Guardian.
Dekodér byl schopen rekonstruovat řeč s neuvěřitelnou přesností pouze pomocí snímků z funkční magnetické rezonance (fMRI). Účastníci studie přitom poslouchali příběh, nebo si jej dokonce jen tiše představovali.
Doposud podobná zařízení vyžadovala zavedení chirurgického implantátu, nový způsob je ale neinvazivní a přináší naději, že vzniknou nové metody, jak vrátit řeč lidem, kteří o schopnost mluvit přišli, například v důsledku mrtvice či amyotrofické laterální sklerózy (ALS).
Neurolog Alexander Huth, který studii vedl, poznamenal, že jej přesnost zařízení poněkud šokovala. "Docela nás šokovalo, že to tak dobře funguje. Pracuji na tom 15 let... takže bylo šokující a vzrušující, když to konečně začalo fungovat," uvedl.
Tento úspěch překonává zásadní omezení fMRI, které spočívá v tom, že tato technika sice dokáže zachycovat mozkovou aktivitu v konkrétním místě, a to s neuvěřitelně vysokým rozlišením, avšak má časovou prodlevu, která znemožňuje sledování mozkové aktivity v reálném čase. Zpoždění vzniká proto, že fMRI mapuje neuronální aktivitu nepřímo v návaznosti na změny v prokrvení. "Je to hlučný, pomalý zástupce nervové aktivity," řekl Huth.
Toto omezení ztěžuje schopnost interpretovat mozkovou aktivitu v návaznosti na přirozenou řeč, protože poskytuje "změť informací" rozloženou do několika sekund. Rozvoj takzvaných velkých jazykových modelů, tedy takových, na kterých je založen například chatbot ChatGPT společnosti OpenAI, však otevírá novou cestu. Velké jazykové modely jsou schopny číselně reprezentovat sémantický význam řeči, což vědcům umožnilo sledovat, které vzorce neuronální aktivity odpovídají řetězcům slov s určitým významem, místo aby se pokoušeli číst aktivitu slovo po slově.
Postup byl náročný, každý ze tří dobrovolníků musel strávit 16 hodin v přístroji magnetické rezonance a poslouchat podcasty. Dekodér se naučil přiřazovat k mozkové aktivitě význam pomocí velkého jazykového modelu GPT-1, předchůdce modelu ChatGPT. Později byli stejní účastníci snímáni při poslechu jiného příběhu nebo při představě, že vyprávějí příběh, a dekodér byl použit k vytvoření textu pouze na základě mozkové aktivity. Přibližně v polovině případů se text shodoval, někdy velmi přesně, se zamýšleným významem původních slov.
"Náš systém pracuje na úrovni myšlenek, sémantiky, významu," řekl Huth s tím, že zařízení zachycuje nikoliv přesná slova, ale podstatu sdělení.
Například, když účastník slyšel větu "Ještě nemám řidičský průkaz", dekodér to přeložil jako "Ještě se ani nezačala učit řídit". Jindy naopak slova "Nevěděla jsem, zda mám křičet, brečet nebo utéct. Místo toho jsem řekla: 'Nech mě být!'" přeložil jako "Začala křičet a plakat a pak jen řekla: 'Říkala jsem ti, abys mě nechal na pokoji'".
Účastníci studie také sledovali krátká videa a zařízení je poté na základě jejich mozkové aktivity popsalo. V některých případech se stroj spletl, potíže má zejména s osobními zájmeny. Dekodér byl rovněž personalizovaný, takže měl nesrozumitelný výstup při použití na jiné osobě. Účastníci také mohli systém obelhat tím, že si představovali zvířata či jiný příběh.