Pas le temps de lire l'article ? Voici ce qu'il faut retenir.
Apple fait tourner une IA géante dans l'iPhone sans saturer la RAM en utilisant la mémoire flash.
1
Technique d'ingénierie — Apple a développé une technique pour stocker les paramètres de l'IA dans la mémoire flash plutôt que dans la RAM.
2
Modèle d'IA — Le modèle AFM 3 Core Advanced compte 20 milliards de paramètres, mais n'en active que 1 à 4 milliards à la fois.
3
Élagage guidé par l'instruction — Apple a développé une technique appelée Instruction-Following Pruning pour limiter les transferts de données entre la mémoire flash et la RAM.
💡
Pourquoi c'est important : Cette technique permet à l'iPhone de faire tourner des modèles d'IA géants sans saturer la RAM, ce qui ouvre la voie à des applications plus complexes et plus performantes.