Machine unlearning : Google Research valide un test d'audit, mais pas encore sur les LLMs

L'essentiel de l'article

⏱️ Lecture : ~30 secondes

Pas le temps de lire l'article ? Voici ce qu'il faut retenir.

Google Research a présenté un test statistique destiné à auditer le machine unlearning, c'est-à-dire l'effacement ciblé de données dans un modèle déjà entraîné.

Test de machine unlearning — Le framework Regularized f-Divergence Kernel Tests détecte des violations avec quelques milliers d'échantillons, contre des millions pour DP-Auditorium.

Limites du test — Le test n'a été validé que sur des benchmarks synthétiques et des jeux de physique des hautes énergies, pas sur les grands modèles de langage.

Défauts des méthodes d'effacement — Trois méthodes - Selective Synaptic Dampening (SSD), pruning et finetuning - ont été jugées incapables d'effacer effectivement les données ciblées.

💡

Pourquoi c'est important : Ce test de machine unlearning pourrait réduire le coût expérimental des audits, mais sa portée reste limitée et les tensions réglementaires autour de l'effacement, de la traçabilité et de la gouvernance des données restent importantes.

Lire sur Actu IA