8 ans, 100 dollars, et plus rapide qu’une RTX 3060 pour faire tourner un LLM en local

L'essentiel de l'article

⏱️ Lecture : ~30 secondes

Pas le temps de lire l'article ? Voici ce qu'il faut retenir.

Une carte serveur Nvidia de 2017, payée 100 dollars sur eBay, est capable de faire tourner un LLM en local plus rapidement qu'une RTX 3060.

Carte serveur Nvidia — La Nvidia Tesla V100 SXM2 16 Go, vieille de huit ans, est capable de sortir 130 tokens par seconde sur le modèle gpt-oss-20b via Ollama.

Comparaison avec RTX 3060 — La V100 est plus efficace que la RTX 3060, avec un ratio de 0,55 token par watt contre 0,39.

Prix et performances — Le montage complet, incluant la carte, un adaptateur et un carénage, coûte environ 200 dollars et offre des performances remarquables pour un LLM en local.

💡

Pourquoi c'est important : Cette expérience montre que le matériel enterprise d'occasion peut être un angle mort du marché, offrant des performances intéressantes à des prix abordables.

Lire sur Frandroid