De ce AI-ul nu percepe florile? Chiar și cu toată capacitatea sa de calcul și antrenamentul intens, un sistem de Inteligență Artificială (AI) precum ChatGPT nu poate reprezenta ideea de „floare” în același mod ca un om, conform unui nou studiu.
De ce AI-ul nu percepe florile? Motivul constă în faptul că modelele mari de limbaj (LLM), fundamentale pentru asistenții AI, se bazează preponderent pe limbaj și, uneori, pe imagini.
„Un model de limbaj nu poate simți aroma unui trandafir, nu poate atinge petalele unei margarete și nu poate să pășească printr-un câmp plin de flori sălbatice. Fără aceste experiențe senzoriale și motorii, un AI nu poate să înțeleagă cu adevărat ce înseamnă o floare în întreaga sa complexitate. Același principiu se aplică și altor concepte umane”, a explicat Qihui Xu, autoarea principală a cercetării și cercetătoare postdoctorală în psihologie la Universitatea de Stat din Ohio (SUA).
Studiul a fost publicat în revista Nature Human Behaviour.
AI-ul nu percepe florile așa cum le percep oamenii
Xu afirmă că aceste descoperiri au implicații semnificative pentru modul în care AI-ul interacționează cu oamenii.
„Dacă AI-ul percepe lumea într-un mod fundamental diferit față de oameni, acest lucru ar putea avea un impact major asupra interacțiunilor sale cu noi”, a declarat ea.
În cercetare, Xu și echipa sa au comparat modul în care oamenii și modelele LLM înțeleg 4.442 de cuvinte, variind de la „floare” și „copită” la „amuzant” și „leagăn”.
Au analizat asemănările dintre reprezentările cognitive ale oamenilor și ale patru modele de vârf: două de la OpenAI (GPT-3.5 și GPT-4) și două de la Google (PaLM și Gemini).
Au fost utilizate două tipuri de evaluări. Prima, denumită „Glasgow Norms”, implică evaluarea cuvintelor în funcție de nouă dimensiuni, cum ar fi intensitatea emoțională, gradul de concretizare și capacitatea de a genera imagini mentale. De exemplu, se evaluează cât de emoțional intens este cuvântul „floare” și cât de ușor poate fi vizualizat mental.
Al doilea tip de evaluare, intitulat „Lancaster Norms”, examinează în ce măsură conceptele sunt asociate cu informații senzoriale (atingere, miros, auz, vedere) și cu informații motorii, adică acțiuni realizate cu diverse părți ale corpului, cum ar fi mâinile, brațele sau trunchiul.
De pildă, participanții evaluează în ce măsură o floare este percepută prin miros sau prin mișcările corpului.
Ce au relevat evaluările?
Scopul a fost de a determina cât de bine se aliniază AI-ul cu oamenii în evaluarea acestor concepte. În prima analiză, cercetătorii au verificat dacă există corelații între percepțiile umane și cele generate de AI în ceea ce privește emoționalitatea sau vizualizarea unui cuvânt.
În a doua analiză, au evaluat modul în care oamenii și AI-ul combină diverse dimensi