Inteligența Artificială a trecut cu succes examenul Turing

Inteligența Artificială a trecut cu succes examenul Turing

Inteligența Artificială a depășit testul Turing: ce implică acest lucru?

Recent, un moment semnificativ în dezvoltarea Inteligenței Artificiale (AI) a fost marcat: un model avansat de procesare a limbajului a reușit să treacă testul Turing. Acest test, introdus în 1950 de cunoscutul matematician britanic Alan Turing, a fost mult timp considerat un standard de referință pentru a determina dacă o mașină poate “gândi” ca un om. Conform rezultatelor unui studiu recent, modelul GPT-4.5 de la OpenAI a demonstrat abilitatea de a reuși acest test, ridicând întrebări cu privire la relevanța acestuia în contextul contemporan.

Ce reprezintă testul Turing?

Testul Turing a fost gândit ca un experiment pentru a răspunde întrebării: „Pot mașinile să gândească?” Aceasta implică o evaluare în care un om (denumit „interogator”) discută în scris cu două entități – una umană și alta artificială – fără a le putea vedea sau auzi. Dacă interogatorul nu reușește să facă o distincție clară între cele două, se consideră că AI-ul a trecut testul.

Într-un studiu recent publicat pe platforma academică arXiv, cercetătorii de la UC San Diego au evaluat mai multe modele AI, inclusiv GPT-4.5 (OpenAI), GPT-4o (OpenAI), LLama 3.1-405B (Meta) și celebra chatbot ELIZA, care a fost lansată în anii 1960. Testul a fost realizat online, implicând aproape 300 de participanți care au acționat ca interogatori și martori, între care unii au fost, de fapt, chatboți.

Rezultatele: GPT-4.5, mai uman decât oamenii?

GPT-4.5 a fost identificat greșit ca fiind uman în 73% din cazuri când i s-a atribuit o „personalitate” specifică. În schimb, într-o variantă a testului fără personalitate (unde AI-ului i s-a indicat să convingă că este uman), rata sa de succes a scăzut dramatic la 36%.

Un aspect cu adevărat interesant este că, în testele „cu personalitate”, participanții umani au fost adesea identificați greșit ca AI, în timp ce GPT-4.5 a demonstrat o capacitate mai „convingătoare” de a părea uman. GPT-4o, modelul actual utilizat pentru ChatGPT, a obținut doar 21% în testele fără personalitate, iar ELIZA a reușit 23%.

Cum a fost obținut acest rezultat?

Principala diferență derivă din personalizarea AI-ului. În varianta „cu personalitate”, modelul GPT-4.5 a avut sarcini mai bine definite și un context social adecvat – de exemplu, rolul unui tânăr familiarizat cu cultura online – ceea ce i-a permis să ofere răspunsuri mai „umane” și convingătoare.

Cameron Jones, liderul studiului, a subliniat că rezultatele oamenilor nu au fost mai bune decât o simplă alegere aleatorie atunci când au încercat să facă distincția între om și bot. Acest lucru evidențiază faptul că modelele lingvistice moderne pot depăși capacitatea noastră perceptuală de a detecta artificialitatea într-o conversație scurtă.

Este testul Turing încă semnificativ?

Deși impresionant, succesul GPT-4.5 în testul Turing nu reprezintă o dovadă concludentă a gândirii conștiente sau a unei inteligențe autentice. Mulți specialiști subliniază că testul are limitările sale. „Turing nu a creat acest test ca pe o evaluare riguroasă a inteligenței, ci ca pe o metaforă filosofică”, a comentat François Chollet, cercetător AI la Google, într-un articol publicat în Nature.

Modelul nu are o înțelegere reală a lumii; el funcționează pe baza unor algoritmi probabilistici și a unui vast corp de texte redactate de oameni. Nu raționează sau nu simte, dar poate simula cu mare eficiență conversația umană.