La startup d'intelligence artificielle d'Elon Musk, xAI, aurait intensifié ses efforts pour développer des systèmes d'IA de nouvelle génération connus sous le nom de "modèles du monde".
Ces systèmes avancés visent à aider l'IA à comprendre, concevoir et interagir avec des environnements physiques, un bond significatif au-delà des capacités des modèles de langage existants comme ChatGPT d'OpenAI et le propre chatbot de xAI, Grok.
Selon des sources proches du dossier, xAI a recruté deux chercheurs de premier plan de Nvidia, Zeeshan Patel et Ethan He, tous deux ayant une expérience approfondie dans la formation de systèmes d'IA utilisant des données vidéo et robotiques. Leur expertise s'aligne avec l'ambition de Musk de créer une IA qui ne se contente pas de traiter du texte mais perçoit et répond au monde réel en temps réel.
Cette nouvelle orientation place xAI en concurrence directe avec des géants technologiques comme OpenAI et Google DeepMind, qui explorent également comment l'IA peut apprendre à partir d'environnements 3D et de données multimodales, intégrant texte, images, vidéo et simulations physiques dans une compréhension cohérente.
Le terme modèles du monde fait référence aux systèmes d'IA qui simulent le monde physique pour prédire comment les actions se dérouleront, une base essentielle pour la robotique, les véhicules autonomes et les agents intelligents capables de naviguer dans la réalité.
Nvidia, où Patel et He travaillaient précédemment, a été à l'avant-garde de ce domaine avec ses plateformes Omniverse et Isaac Sim, des outils de simulation utilisés pour former et tester des robots dans des environnements numériques. En s'inspirant des technologies de simulation de Nvidia, xAI espère reproduire la complexité de l'apprentissage du monde réel dans des espaces virtuels, accélérant potentiellement le développement de la robotique et des systèmes d'IA en temps réel.
Conformément à cette vision, xAI a formé ce qu'elle appelle une "Équipe Omni", une unité spécialisée travaillant sur des modèles d'IA qui peuvent traiter et générer du contenu dans des formats d'images, de vidéo et d'audio. Cette initiative signale le désir de Musk de construire des systèmes d'IA qui peuvent voir, entendre et agir, comblant le fossé entre l'intelligence numérique et la capacité du monde réel.
Malgré ses ambitions audacieuses, xAI fait face à des obstacles importants. L'un des plus grands défis est la capacité de calcul, la puissance matérielle brute nécessaire pour former des modèles à grande échelle.
L'entreprise aurait mis fin aux discussions avec Oracle concernant un accord d'infrastructure cloud proposé de 10 milliards de dollars en raison de désaccords sur le calendrier et l'approvisionnement en énergie. Au lieu de cela, xAI travaille maintenant à la construction de ses propres clusters de calcul d'IA utilisant les GPU H100 de Nvidia, les mêmes puces qui alimentent la plupart des systèmes d'IA de pointe aujourd'hui.
Cependant, par rapport aux leaders de l'industrie, les ressources informatiques de xAI restent limitées. OpenAI a déclaré que plus d'un million de GPU seront en ligne d'ici la fin de cette année, et d'autres entreprises comme ByteDance développent agressivement leurs clusters GPU pour une formation d'IA à grande échelle similaire. Pour xAI, rattraper son retard nécessitera non seulement du talent mais aussi un investissement massif en infrastructure.
L'article xAI recrute des ingénieurs Nvidia pour développer une plateforme de "Modèles du Monde" de nouvelle génération est apparu en premier sur CoinCentral.


