- Incroyable.ai
- Posts
- 💡 GPT-5, GR00T, MM1, VLOGGER: L'avenir de l'IA dévoilé !
💡 GPT-5, GR00T, MM1, VLOGGER: L'avenir de l'IA dévoilé !
Hello Ă tous,
Dans cette édition, le multimodal sera mis à l’honneur ! Que ce soit avec VLOGGER de Google qui permet de créer des avatars plus vrai que nature ou avec le modèle de langage MM1 d’Apple qui annonce des résultats ambitieux, aujourd’hui l’intelligence artificielle n’est plus seulement du texte ! Au point, où cela atteint la robotique, avec le projet unique de Nvidia d’apporter une “pensée” aux robots humanoïdes. Ils permettront à coup sûr d’automatiser de nombreuses tâches dans le futur, comme le fait déjà pour nous le plugin AutoGPT, une pépite à découvrir. Sans oublier, l’actualité principale autour des fuites internes sur les performances de GPT-5 !
Temps de lecture: 4 minutes
Au programme
Actualités en très bref
Fuites sur la timeline prévue et les capacités du nouveau GPT-5
Nvidia lance GR00T: Quand les robots apprennent Ă penser
Apple lance MM1, pionnier des modèles d'IA qui combinent vision et langage
De l'image à l'avatar photoréaliste : Google dévoile VLOGGER
AutoGPT : Un GPT puissant conçu pour automatiser votre travail
Actualités en (très) bref
Source : Nvidia
Intel s'équipe d'un superpouvoir à 20 milliards : Le rêve américain de dominer la technologie des semi-conducteurs.
Ubisoft : Ils dévoilent les "Neo NPCs", des personnages de jeux vidéo alimentés par l'IA avec lesquels les joueurs peuvent engager une conversation.
Arabie Saoudite : Un fonds de 40 milliards de dollars va être créé pour investir dans l'IA, en faisant le premier investisseur mondial dans ce secteur.
L'iPhone devient oracle : Apple envisage d'infuser l'IA de Google, Gemini AI, dans son prochain modèle, l’IOS 18.
Le colosse des circuits : Nvidia lance le GB200, une merveille technologique pour une ère nouvelle.
GPT-5
Fuites sur la timeline prévue et les capacités du nouveau GPT-5
Source : Getty Image
De nouvelles fuites provenant de sources internes chez OpenAI ont révélé des détails concernant les capacités du futur modèle GPT-5 ainsi que son calendrier de lancement. Selon ces sources, GPT-5 serait "considérablement meilleur" que son prédécesseur. Il est également rapporté qu'OpenAI a laissé entendre que GPT-5 aurait la capacité de "faire appel à des agents IA" que la société est en train de développer.
Le lancement est prévu pour le milieu de l'année, mais pourrait être retardé en fonction de l'avancement de la formation continue et des tests de sécurité.
Robotique
Nvidia lance GR00T: Quand les robots apprennent Ă penser
Source : Nvidia
Nvidia vient de dévoiler le Projet GR00T, un système d'IA multimodal qui sert d'"esprit" pour les robots humanoïdes avancés, leur permettant d'apprendre des compétences et d'interagir avec le monde réel. GR00T est un modèle de base qui permet aux robots humanoïdes de comprendre le langage, d'imiter les mouvements humains et d'apprendre des compétences.
GR00T pourrait aider à traduire ces capacités de haut niveau en comportements de robot de bas niveau, permettant une IA incarnée capable de percevoir, de raisonner et d'agir de manière plus intelligente et humaine.
Apple
Apple lance MM1, pionnier des modèles d'IA qui combinent vision et langage
Source : Apple
Apple vient de publier un nouveau document dévoilant MM1, une famille de modèles d'IA multimodaux qui combinent la compréhension visuelle et linguistique pour permettre des capacités avancées. Les modèles MM1 ont été entraînés sur un mélange soigneusement sélectionné de légendes d'images, de données texte-image et de données uniquement textuelles.
Actuellement, les benchmarks de MM1 montrent que ce modèle est en concurrence directe avec les modèles multimodaux de pointe tels que GPT-4V et Gemini Pro. Avec un modèle maintenant officiellement capable, est-il enfin temps pour Siri de monter de niveau?
De l'image à l'avatar photoréaliste : Google dévoile VLOGGER
Source : Google
Les chercheurs de Google viennent de développer VLOGGER, un nouveau modèle d'IA capable de générer des vidéos d'avatars parlants photoréalistes. Et ce, à partir d'une simple image fixe et d'un clip audio. VLOGGER crée un avatar contrôlable qui capture les ressemblances et les mouvements. Le modèle a été entraîné sur un grand ensemble de données multimédia contenant 800 000 vidéos de personnes parlant, avec des étiquettes pour chaque partie du visage et du corps.
Les applications potentielles incluent le doublage de vidéos dans d'autres langues, la création d'avatars réalistes pour des jeux ou des assistants et la possibilité de réaliser des chats vidéo à faible bande passante. Des modèles comme VLOGGER annoncent un avenir où les frontières entre nos moi physiques et numériques se brouillent de manières nouvelles.
GPT - AutoGPT
AutoGPT : Un GPT puissant conçu pour automatiser votre travail
Que vous cherchiez à mener à bien un projet de grande envergure ou à rédiger un livre entier, AutoGPT est conçu pour simplifier vos tâches et augmenter votre productivité. En un seul clic, bénéficiez d'un taux de réponse multiplié par cent, vous faisant gagner du temps et de l'effort.
Comment l’utiliser :
Accéder à AutoGPT, puis ouvrez le dans ChatGPT.
Indiquer la tâche : Précisez clairement la tâche que vous souhaitez automatiser. Vous pouvez retrouver une bibliothèque de prompt à utilisé avec ce plugin sur Github.
En un seul clic sur Entrée, observez-le travailler sur votre tâche avec une vitesse remarquable.
En un rien de temps, AutoGPT vous fournira un projet terminé ou un matériel rédigé, prêt pour votre révision.