Pas le temps de lire l'article ? Voici ce qu'il faut retenir.
DeepSeek, une start-up chinoise, publie son modèle d'IA le plus massif, DeepSeek V4, en deux variantes, Pro et Flash, entraîné et déployé sur les puces Ascend de Huawei.
1
Modèle d'IA massif — DeepSeek V4 est un modèle d'IA de classe frontier avec 1 600 milliards de paramètres au total, dont 49 milliards activés par requête pour la variante Pro.
2
Silicium chinois — Le modèle est entraîné et déployé sur les puces Ascend de Huawei, sans recourir au moindre GPU NVIDIA.
3
Variante compacte — La variante Flash de DeepSeek V4 affiche 284 milliards de paramètres dont 13 milliards actifs.
💡
Pourquoi c'est important : La sortie de DeepSeek V4 confirme que la start-up chinoise a réussi à développer un modèle d'IA de classe frontier entièrement basé sur des puces chinoises, ce qui pourrait avoir des conséquences importantes pour l'industrie de l'IA.