Nous construisons une infrastructure fondamentale, destinée à garantir les trois principales propriétés de l’archive que nous constituerons :
- disponibilité : le code sera stocké, préservé et accessible sur le long terme ;
- traçabilité : chaque composant logiciel recevra un identifiant unique auquel il sera possible de se fier sur le long terme ;
- uniformité : malgré des origines très diverses, tous les codes sources collectés dans notre archive seront accessibles par l’intermédiaire de la même API uniforme.
L’infrastructure de Software Heritage repose sur ces trois piliers, assurant une base solide et pérenne.
Transparence
Les efforts de préservation à long terme ne peuvent pas s’appuyer sur des boîtes noires qui dissimulent le processus derrière une source fermée. Nous sommes développeurs et avocats des logiciels libres/open source depuis longtemps : notre code et nos spécifications seront donc ouverts.
Architecture ouverte
Nous concevons une architecture logicielle complexe. Sa conception et ses spécifications seront rendues publiques.
Logiciels libres/open source
Tout le code développé pour Software Heritage sera distribué sous une licence libre et open source (FOSS).
Développement collaboratif
Nous adoptons un processus de développement ouvert et nous efforçons de créer une communauté de développement autour de tous les composants de l’infrastructure Software Heritage.
Identifiants uniques intrinsèques
Un identifiant unique est attribué à chaque composant et intrinsèquement lié à celui-ci. Comme il ne dépend d’aucune tierce partie, il est persistant et tout le monde peut s’y référer de manière fiable.
Identifiants uniques
Tout artefact logiciel reçoit un identifiant unique. Cette référence unique peut être utilisée dans des manuels, des documentations, des instructions d’assemblage et à bien d’autres emplacements pour construire un Web de connaissances cohérent.
Identifiants intrinsèques
Nous utilisons dans Software Heritage des identifiants intrinsèques qui peuvent être calculés directement par un artefact logiciel. Pas besoin de recourir à un tiers pour savoir si un certain identifiant correspond à un artefact donné.
Infrastructure distribuée et multi-partenariale
« Sauvons ce qui reste : pas en l’enfermant dans des chambres fortes munies de verrous, comme en dehors du temps, pour le soustraire aux yeux du public et en interdire toute utilisation, mais en effectuant un nombre de copies tel que le risque d’un accident s’en trouve éliminé. » — Thomas Jefferson
Aucun point de défaillance unique
Nous planifions une infrastructure distribuée qui permettra de dupliquer tous les contenus parmi un vaste ensemble de nœuds homologues.
C’est essentiel pour empêcher les pertes d’informations et le partage s’en trouvera considérablement simplifié.
Un réseau de pairs multi-partenarial
Nous nous participerons activement au développement d’un réseau de pairs multi-partenarial.
De nouveaux partenaires pourront s’associer facilement à nos efforts en cours de route, grâce à notre code open source et à nos spécifications ouvertes.