Une startup affirme avoir une IA plus rapide et moins chère : promesse crédible ou bluff ?

L'essentiel de l'article

⏱️ Lecture : ~30 secondes

Pas le temps de lire l'article ? Voici ce qu'il faut retenir.

Subquadratic, une startup de Miami, a lancé SubQ, un modèle de langage pensé pour réduire drastiquement le coût de calcul des IA à long contexte, après avoir levé 26,8 millions d’euros.

Gain de vitesse — Appen a mesuré un gain de vitesse de 56 fois sur un million de tokens pour le noyau d’attention de SubQ.

Résultats des tests — SubQ a affiché 100 % de réussite jusqu’à deux millions de tokens sur le test NIAH, puis 98 % à douze millions et 89,7 % au score pass@4 sur un exercice de génération de code.

Architecture sparse — SubQ utilise une architecture dite à attention sparse, qui traite que les associations de mots jugées pertinentes, et non la totalité des paires possibles.

💡

Pourquoi c'est important : Les résultats de SubQ pourraient révolutionner le déploiement des IA à grande échelle, mais les preuves publiques ne justifient pas encore l'affirmation selon laquelle le problème de l'attention quadratique a été résolu.

Lire sur Clubic