OpenAI a introdus un model de Inteligență Artificială capabil să analizeze și să creeze informații vizuale

OpenAI a introdus un model de Inteligență Artificială capabil să analizeze și să creeze informații vizuale

OpenAI a dezvăluit un nou model de inteligență artificială capabil să „gândească în imagini”

OpenAI, una dintre cele mai avansate companii în domeniul inteligenței artificiale, a anunțat lansarea celui mai nou model AI, numit o3, care oferă capacități avansate de analiză vizuală și raționamente multimodale. Noua versiune se evidențiază prin abilitatea de a „gândi în imagini”, permițând utilizatorilor să interacționeze cu AI-ul prin schițe, tablouri de scris sau diagrame – inclusiv atunci când acestea au o calitate mai slabă.

Capabilități superioare de analiză vizuală

Inovația pe care o aduce modelul o3 constă în abilitatea sa de a interprete imagini complexe și de a le integra în procesele cognitive ale inteligenței artificiale. Utilizatorii pot să încarce schițe realizate de mână, diagrame neclar definite sau capturi de ecrane de tablouri de scris, iar modelul nu doar că le identifică, ci le poate explica, interpreta și extinde într-un mod coerent.

Conform OpenAI, o3 este primul model care „îmbină informațiile vizuale direct în procesul de raționare”, ceea ce indică faptul că AI-ul nu doar extrage date din imagini, ci le utilizează ca element central în înțelegerea și soluționarea unei probleme. Astfel, interacțiunea dintre oameni și mașini devine mai naturală și intuitivă, marcând o progrese semnificativă către inteligența artificială cu adevărat multimodală.

Lansarea modelelor o3 și o4-mini

Pe lângă modelul o3, OpenAI a introdus și o variantă mai compactă și mai rapidă, denumită o4-mini. Aceasta este destinată aplicațiilor care necesită un timp de reacție mai scurt sau o capacitate de procesare mai redusă, păstrând totodată parte din funcționalitatea modelului principal.

Aceste lansări au loc la mai puțin de un an după prezentarea modelului o1, făcută în septembrie 2024. Modelul o1 s-a concentrat pe raționamente logice și pe abilitatea de a rezolva probleme complexe în mai mulți pași. Cu o3, OpenAI avansează, integrând imagini și instrucțiuni vizuale în lanțul decizional al AI-ului.

Un pas crucial spre autonomia AI

Conform declarațiilor oficiale, modelele o3 și o4-mini pot funcționa autonom cu toate instrumentele disponibile în ChatGPT – de la navigarea pe internet la utilizarea limbajului de programare Python sau generarea de imagini. Această integrare completă permite AI-ului nu doar să asiste utilizatorii, ci să acționeze ca un partener inteligent, având capacitatea de a lua decizii bazate pe date, text și imagini.

„Pentru prima dată, modelele noastre de raționare pot utiliza independent toate instrumentele ChatGPT – navigarea web, Python, înțelegerea și generarea de imagini”, a comunicat compania pe blogul său oficial. Această avansare este percepută de experți ca un progres major către autonomia AI, deschizând o diversitate de aplicații în educație, cercetare, inginerie și domeniul medical.

Valoarea companiei și impactul asupra sectorului

OpenAI este evaluată în prezent la aproximativ 300 de miliarde de dolari, cifra reflectând interesul crescut al investitorilor și al comunității tehnologice pentru soluții avansate de inteligență artificială. Odată cu lansarea modelelor o3 și o4-mini, compania își întărește poziția de lider în domeniul AI, furnizând instrumente care combină capacități vizuale cu puterea de înțelegere contextuală a limbajului natural.

Concluzii

Lansarea modelului o3 de către OpenAI reprezintă un moment definitoriu în evoluția inteligenței artificiale. Prin introducerea analizei și înțelegerii imaginilor în procesul de gândire al modelului, OpenAI reușește să dezvolte o platformă AI și mai versatilă și apropiată.