Hugging Face
Los Datos son el motor del aprendizaje automático moderno y la base de todo gran modelo de lenguaje. El archivo Software Heritage nos permite recopilar grandes cantidades de código para entrenar grandes modelos de lenguaje de última generación, especialmente para código. Al mismo tiempo, sus principios garantizan que los modelos resultantes beneficien a toda la humanidad: los modelos se publican abiertamente, los datos de entrenamiento se hacen transparentes y los propietarios de los datos pueden optar por no participar en el entrenamiento.
— Leandro von Werra,
Ingeniero de aprendizaje automático en
Hugging Face y codirector de BigCode