Close

décembre 4, 2023

Hugging Face

Les données sont le moteur de l’apprentissage automatique moderne et le fondement de chaque grand modèle de langage. Software Heritage nous permet de collecter de grandes quantités de code pour former des modèles de langage de pointe, en particulier pour le code. En même temps, leurs principes garantissent que les modèles résultants profitent à l’ensemble de l’humanité : les modèles sont publiés ouvertement, les données d’entraînement sont rendues transparentes et les propriétaires des données peuvent se retirer de l’entraînement.

— Leandro von Werra,
Ingénieur en apprentissage automatique
Hugging Face et co-directeur de BigCode

décembre 4, 2023