Numériser des ouvrages du fonds
Gwendal D., étudiant en master Édition, a effectué un stage dans le cadre de SO PUR (versant Dialogue stratégique de gestion Rennes 2). Il présente son travail dans ce billet.
Depuis le 1er mars 2022 et le lancement du projet SO PUR, l’objectif des Presses universitaires de Rennes est de parvenir à publier et rendre accessible en ligne une très large majorité de son catalogue sur le portail OpenEdition. Dans le cadre du partage de ses publications en libre accès grâce à la diffusion freemium, j’ai pu participer au cours de mon stage, entre juin et septembre 2022, à l’enrichissement de l’offre numérique des PUR en préparant et en vérifiant la numérisation d’ouvrages issus de différentes collections : « Histoire », « Æsthetica », « La Licorne », ainsi que plusieurs manuels de la collection « Didact ».
Du livre imprimé au livre numérique
La première étape de ce processus consiste à fournir au prestataire un tableau présentant leurs métadonnées : l’identité des auteurs s’il s’agit d’une monographie ou des directeurs pour un ouvrage collectif, le titre, la collection, le nombre de pages, les mots-clés, ou encore la date de publication en version papier. Ces métadonnées serviront ensuite au bon référencement de l’ouvrage sur OpenEdition selon son auteur ou les thématiques abordées.
Cependant, il est nécessaire de comprendre que la mise en ligne d’un ouvrage bouleverse considérablement la présentation existante au format papier. C’est pourquoi certains aspects nous apparaissant tout à fait normaux ou anodins en tournant les pages d’un livre peuvent poser problème pendant sa numérisation. Je transmets donc au prestataire un certain nombre de commentaires visant à attirer son attention sur les éléments suivants :
- la bonne disposition des figures et des graphiques, surtout quand leur mise en page est effectuée selon un ordre précis ;
- la présence de caractères issus d’alphabets autre que le latin, tels que le grec ancien ou le chinois, de formules mathématiques ou de notes de musique ;
- la prise en compte d’un ou des cahiers d’illustrations en couleur ;
- les introductions et les conclusions de partie sans titre.
Entièrement complété, le tableau est joint aux fichiers PDF des ouvrages à numériser, puis le dossier est envoyé au prestataire. Son rôle est de transformer un document prêt à être imprimé sous la forme d’un livre en document capable de s’intégrer à l’environnement d’une plateforme telle Open Edition. Tout d’abord, chaque partie de l’ouvrage est stylé sur Word, c’est-à-dire que le texte est préparé en définissant l’ensemble de ses éléments (titre, citation, liste, notes, légende, etc.) selon une codification propre à être reconnue par Lodel, le logiciel d’édition utilisé par OpenEdition pour publier ses contenus. Ensuite, ces fichiers Word sont transcrits en langage XML où chaque élément stylé est mis en valeur par des balises selon un système d’emboitement reproduisant toute l’architecture du texte.
La mise en ligne des ouvrages
De retour aux PUR, l’ouvrage est importé sur OpenEdition où je peux vérifier la qualité de la numérisation. En m’appuyant sur la version papier, je commence par contrôler les métadonnées présentant le livre, mais aussi la conformité de la couverture, du texte de présentation de la publication et de son auteur ou directeur, ainsi que du sommaire. Dans un second temps, j’étends la vérification à chaque chapitre jusqu’à la bibliographie, en passant par les annexes, l’index et la table des illustrations.
Sauf cas exceptionnel de chapitre ou de cahier d’illustrations manquant à l’appel, la numérisation reproduit fidèlement le sens et la structure du texte. Néanmoins, quelques détails doivent être souvent corrigés, notamment les erreurs de petite typographie dans les titres de parties ou chapitres et la présentation des auteurs. Par exemple, les titres d’œuvres doivent être mis en italique et les nombres romains utilisés pour les siècles en petites capitales. De plus, il faut faire attention à l’intégration des caractères issus d’alphabets particuliers, des formules mathématiques, des notes de musique, mais également des citations, des tableaux, des encadrés et des notes de bas de page. Si une modification est nécessaire à l’intérieur du texte, il est possible d’ouvrir le document Word, puis de le recharger sur Lodel.
Lorsque toutes les vérifications ont été effectuées, l’ouvrage est prêt à être publié et diffusé en libre accès sur OpenEdition.
Gwendal