Inteligența Artificială produce glume mai reușite decât oamenii? Ce relevă noua cercetare despre umorul generat de AI
Un recent studiu internațional care a evaluat umorul generat de oameni în comparație cu cel creat de inteligența artificială (AI) a dezvăluit o concluzie surprinzătoare: în medie, modelele de limbaj de mari dimensiuni (LLMs), precum GPT-4o de la OpenAI, sunt capabile să creeze meme mai amuzante, mai inovatoare și mai ușor de distribuit decât cele realizate de oameni — fie individual, fie cu asistență AI.
Cercetarea, prezentată la cea de-a 30-a Conferință Internațională privind Interfețele Inteligente cu Utilizatorul, desfășurată la Cagliari, Italia, și publicată pe platforma arXiv, se aliniază unei serii de studii menite să investigate capacitățile de co-creare ale inteligenței artificiale și să redefinească mai profund granițele creativității umane în era digitală.
O privire asupra experimentului
Cercetătorii de la Institutul Regal de Tehnologie KTH din Suedia, alături de universitatea LMU München și TU Darmstadt din Germania, au desfășurat un experiment în două etape, având ca scop evaluarea colaborării om-AI în crearea de meme — un format de conținut ce combină imagini cu text, reușind adesea să comunice mesaje satirice sau amuzante într-o manieră rapidă și accesibilă.
Prima etapă a implicat recrutarea a 124 de participanți, împărțiți în două grupuri: unul care a realizat meme fără ajutor, și altul care a beneficiat de un chatbot AI pentru brainstorming. Fiecărui grup i s-a atribuit sarcina de a veni cu subtitrări pentru meme bazate pe șabloane populare (precum Doge, Fry din Futurama sau Boromir din „Stăpânul Inelelor”) pe teme precum munca, mâncarea și sportul.
Rezultatul: grupul uman a generat 335 de meme, grupul hibrid (om-AI) a creat 307, iar GPT-4o a realizat, în mod autonom, încă 150.
Evaluarea și rezultatele
Pentru cea de-a doua fază, un alt grup format din 98 de evaluatori a fost responsabil cu calificarea memelor pe baza a trei criterii: gradul de umor, creativitate și potențialul de distribuire în viața reală. Anonimizarea autorului fiecărui meme a fost esențială pentru obținerea obiectivității — evaluatorii nu știau dacă gluma a fost creată de o persoană, de AI sau de o echipă mixtă.
Surprinzător sau nu, memele generate complet de GPT-4o au obținut, în medie, cele mai mari scoruri la toate cele trei categorii. Totuși, cele mai amuzante meme individuale — „vârfurile” de creativitate comică — au fost predominant realizate de oameni, în timp ce colaborările om-AI au excelat în creativitate și potențial de viralizare.
Regândirea creativității: poate AI-ul avea umor?
Profesorul Ethan Mollick de la Wharton University of Pennsylvania, expert în AI generativ, a comentat rezultatele printr-o glumă amară postată pe rețeaua BlueSky: „Regret să anunț că testul Turing pentru meme a fost trecut.”
Inițial conceput în 1950 de Alan Turing, acest test a fost destinat ca măsură a inteligenței unui sistem: dacă un om nu poate face distincția într-o conversație dacă cealaltă entitate este umană sau robotică, atunci AI-ul este considerat de nivel uman. Faptul că AI-ul poate acum să genereze glume plauzibile sau chiar mai amuzante decât cele umane adaugă o dimensiune interesantă acelui test, extinzându-l dincolo de comunicarea lingvistică pură în domeniul subtil și complex al umorului.
O medie înaltă, dar un vârf slab
Cum interpretează autorii aceste rezultate? Rezonanța medie a memelor produse de AI este atribuită imensului volum de date pe care modelele de limbaj le-au „consumat” în procesul de antrenament.