O mică regiune a creierului, denumită aria tegmentală ventrală (VTA), joacă un rol esențial în motivație, în special în modul în care percepem recompensele.
O mică zonă din creierul nostru are un rol esențial în motivație. Aceasta produce dopamină, un neuromodulator ce sprijină anticiparea recompenselor viitoare pe baza indiciilor de mediu. O echipă de cercetători de la universitățile din Geneva (UNIGE), Elveția, Harvard, SUA, și McGill, Canada, a demonstrat că VTA funcționează și mai complex: codifica nu doar recompensa anticipată, ci și momentul exact în care aceasta este așteptată.
Această descoperire, posibilă grație unui algoritm de învățare automată, evidențiază importanța integrării Inteligenței Artificiale (AI) cu neuroștiințele.
Studiul a fost publicat în revista Nature.
## O mică zonă din creierul nostru are un rol esențial în motivație
VTA este una dintre componentele fundamentale în circuitele cerebrale responsabile pentru motivație și recompensă. Ca principală sursă de dopamină, acest grup mic de neuroni transmite semnale către alte regiuni ale creierului pentru a genera o reacție la un stimul pozitiv.
„Inițial, VTA era considerată pur și simplu centrul recompensei în creier. Însă în anii ’90, s-a constatat că, de fapt, nu codifica recompensa propriu-zisă, ci predicția acesteia”, afirmă Alexandre Pouget, profesor în Departamentul de Neuroștiințe Fundamentale al Facultății de Medicină de la UNIGE.
Experimentele efectuate pe animale au demonstrat că, atunci când o recompensă urmează constant un semnal luminos, de exemplu, VTA începe să elibereze dopamină nu în momentul primirii recompensei, ci imediat ce apare semnalul. Astfel, răspunsul codifică anticiparea recompensei, nu recompensa în sine.
Acest mecanism de învățare prin întărire (reinforcement learning), care necesită un control minim, este esențial pentru procesul de învățare la oameni. El stă la baza multor algoritmi AI care învață din experiență, precum AlphaGo, primul program care a învins un campion mondial la jocul Go, menționează Medical Xpress.
## Ce noutăți au descoperit cercetătorii?
În studiul recent, echipa lui Pouget, în colaborare cu Naoshige Uchida (Harvard) și Paul Masset (McGill), a demonstrat că sistemul de codificare al VTA este mai sofisticat decât se credea anterior. „VTA nu preconizează o medie ponderată a recompenselor viitoare, ci evoluția acestora în timp. Cu alte cuvinte, fiecare câștig este reprezentat individual, împreună cu momentul precis în care se preconizează că va avea loc”, explică cercetătorul elvețian.
„Era deja cunoscut faptul că neuronii din VTA oferă prioritate recompenselor apropiate temporal în comparație cu cele îndepărtate, conform principiului ‘ce ți-e aproape, nu-i minciună’. Dar am descoperit că unii neuroni operează la scări temporale diferite: unii se concentrează pe recompensele ce ar putea apărea în câteva secunde, alții pe cele care ar putea fi disponibile într-un minut, iar alții pe orizonturi și mai îndepărtate”, afirmă omul de știință.
„Această diversitate permite o codificare detaliată a timpului recompensei, oferind sistemului de învățare o mare flexibilitate. Astfel, organismul poate adapta comportamentul pentru a maximiza fie recompensele imediate, fie pe cele întârziate, în funcție de obiectivele și prioritățile sale”, continuă el.
Descoperirile au rezultat dintr-o colaborare strânsă între neuroștiință și AI. Pouget a dezvoltat un algoritm matematic care integrează aspectele temporale ale recompensei. Între timp, cercetătorii de la Harvard au adunat date neurofiziologice detaliate despre activitatea neuronilor VTA la.