Pas le temps de lire l'article ? Voici ce qu'il faut retenir.
Google annonce Gemini, son LLM (Large Language Model) multimodal, qui peut interpréter plusieurs types d'éléments tels que du texte, de l'image, de la vidéo et de l'audio.
1
Gemini est multimodal — Le modèle peut gérer du texte, du code, des images, des vidéos et de l'audio, ce qui lui permet de traiter des requêtes de plus en plus complexes.
2
Performances supérieures — Gemini est plus fiable que la plupart des LLM concurrents comme GPT-6.
3
Nom et origine — Le nom Gemini vient du latin et signifie "jumeaux", et fait référence à un protocole de communication client-serveur créé pour servir d'étape dans la construction du web.
💡
Pourquoi c'est important : L'arrivée de Gemini pourrait étendre les possibilités d'usages et de performances de l'intelligence artificielle dans divers domaines.