Meta Platforms a lansat un nou ”model AI al lumii”, destinat să îmbunătățească înțelegerea mediului tridimensional și a mișcărilor obiectelor fizice de către roboți și vehicule autonome, relatează CNBC.
Gigantul tehnologic, care deține aplicațiile de social media Facebook și Instagram, a prezentat modelul său open-source V-JEPA 2, capabil să înțeleagă, să prezică și să planifice în lumea fizică.

Acest tip de ”model al lumii” își propune să reproducă logica lumii reale, creând o simulare internă a realității pentru ca inteligența artificială să poată învăța, planifica și lua decizii într-o manieră mai asemănătoare cu cea umană. De exemplu, V-JEPA 2 recunoaște că o minge care cade de pe o masă va atinge pământul sau că un obiect ascuns privirii nu dispare pur și simplu, scrie News.ro.
Inteligența artificială este o prioritate pentru CEO-ul Meta, Mark Zuckerberg, în condițiile în care compania se confruntă cu o concurență acerbă din partea OpenAI, Microsoft și Google.

Conform unor surse citate de CNBC, Meta intenționează să investească 14 miliarde de dolari în firma de AI Scale AI și să-l angajeze pe CEO-ul acesteia, Alexandr Wang, pentru a-și consolida strategia de AI.
Modelul V-JEPA 2 este promovat ca un instrument esențial pentru roboți de livrare și mașini autonome, care trebuie să navigheze în lumea reală în timp real.
Meta a explicat că, spre deosebire de modelele tradiționale care folosesc cantități mari de date etichetate sau filmări video, V-JEPA 2 raționează într-un spațiu simplificat ”latent”, înțelegând cum se mișcă și interacționează obiectele.
”A permite mașinilor să înțeleagă lumea fizică este foarte diferit de a le face să înțeleagă limbajul”, a declarat Yann LeCunn, șeful AI de la Meta, la conferința Viva Tech de la Paris.
El a adăugat că ”un model al lumii este ca un geamăn digital abstract al realității, pe care AI-ul îl poate consulta pentru a înțelege lumea și a prezice consecințele acțiunilor sale, putând astfel să planifice un curs de acțiune pentru a îndeplini o sarcină dată”.
Modelele AI de tip ”world model” au atras tot mai mult interes în comunitatea de cercetare, deoarece specialiștii caută să depășească modelele lingvistice care stau la baza aplicațiilor generative precum ChatGPT de la OpenAI și Gemini de la Google. În septembrie anul trecut, cercetătoarea AI Fei-Fei Li a strâns 230 de milioane de dolari pentru startup-ul World Labs, care își propune să creeze ”modele mari ale lumii” pentru o mai bună înțelegere a structurii mediului fizic.
Între timp, divizia DeepMind a Google dezvoltă propriul model numit Genie, care poate simula jocuri și medii 3D în timp real.