Nouveau billet de blog : Apprentissage par renforcement pour la confidentialité. Nous formons en post-entrainement de petits modèles de langage (SLMs) à la frontière de l'anonymisation afin qu'ils puissent remplacer les informations sensibles avant que les requêtes ne quittent jamais votre appareil. Objectif : utiliser des LLMs fermés sans renoncer à votre confidentialité. 1/8
45