L’avenir de l’IA générative se joue-t-il ici ? Son plus grand défaut a peut-être été résolu

L'essentiel de l'article

⏱️ Lecture : ~30 secondes

Pas le temps de lire l'article ? Voici ce qu'il faut retenir.

La startup américaine Subquadratic a présenté SubQ, un nouveau modèle de langage reposant sur une attention dite « sous-quadratique ».

Architecture de LLM — SubQ repose sur une architecture d'attention parcimonieuse entièrement sous-quadratique.

Capacité de traitement — La fenêtre de contexte de SubQ peut atteindre 12 millions de tokens.

Coûts de calcul — L'approche promet de réduire drastiquement les coûts de calcul des LLM.

💡

Pourquoi c'est important : Cette nouvelle architecture pourrait bouleverser les LLM tels que nous les connaissons, en leur permettant de gérer des contextes gigantesques à coût réduit.

Lire sur Numerama