Les archives orales numériques : synthèse documentaire pour le Secours populaire français

Documentation technique

Plan du site / Informations
Accueil > Documentation technique > Aspects techniques
Aspects techniques du traitement des archives orales

Tout d'abord, au cours de la collecte, La qualité de l'enregistrement, qu'il soit audio ou vidéo ne doit pas être négligée, surtout si les témoignages sont destinés par la suite à une consultation publique. Il faut en particulier choisir un bon microphone et un bon enregistreur.

Ensuite, le traitement documentaire et archivistique des données peut se faire selon différentes formes :

  • Indexation segmentée :

Elle consiste à découper le fichier source en plusieurs segments indépendants. Elle est possible avec des logiciels d'édition gratuits (open-source) du type Audacity permettant de ne pas avoir forcément à traiter les enregistrements dans leur globalité, et de pouvoir mettre en ligne des extraits sur un site (type MySQL).

Avantages : Solution simple à mettre en oeuvre, peu onéreuse.

Inconvénients : Les fonds seront plus difficiles à valoriser, ils risquent de rester en « interne ».

  • Traitement global avec métadonnées :

Métadonnées descriptives, administratives, juridiques ou techniques encapsulées dans les sources numérisées : Dublin Core, XML, mpeg7... avec encodage DTD EAD, schéma METS...
En respectant le protocole d'échange OAI-PMH, il serait envisageable de proposer les fichiers à une institution qui fédère des bases de données. Le recueil d'archives orales pourrait ainsi s'intégrer dans un programme plus large de type historique ou sociologique (exemple : plateforme collaborative Telemeta - projet Anthroponet document pdf), pouvant ainsi provoquer l'intérêt de chercheurs, d'universitaires et envisager avec eux une collaboration.

Avantages : Diffusion des fonds vers un large public (spécialistes & grand public); sauvegarde et préservation des données.
Possibilité de trouver des financements

Inconvénients : Solution nécessitant une charge de travail importante.

- Recommandations de l’IFLA relatives à la description bibliographique des non-livres ISBD (NBM)..
- Norme NF Z 44-066 pour le catalogage des enregistrements sonores
- Circulaire du 7 avril1986 : traitement des documents sonores dans les archives départementales et communales(AV)

Enfin, il faut veiller à assurer une conservation des données sur des supports perrènes :

Normes pour organiser et conserver :


Le schéma ci-dessous tente de décrire les étapes d'un recueil et du traitement d'un témoignage oral sous ses aspects techniques :

Définitions

 

XML :

(eXtensible Markup Language) : Langage de balisage dérivé du langage SGML, conçu pour faciliter la modification et la validation des programmes qui en découlent, et principalement utilisé pour l'échange d'information entre des systèmes informatiques hétérogènes. C'est un métalangage qui permet de séparer le contenu d'un document de sa présentation et de définir son propre langage pour décrire ce contenu. Le langage XML a fait l'objet d'une recommandation du consortium W3C. Parmi les nouveaux langages de balisage fondés sur le langage XML, on peut mentionner : RDF, RSS, MathML, XHTML, SVG et cXML.

Définition du Grand Dictionnaire terminologique <www.granddictionnaire.com>

 

 

Dublin Core :

Un ensemble de quinze eléments (titre, auteur, thème, etc.) avec des possibilités d’extension à l’intérieur des éléments (Dublin Core enrichi) par exemple pour les collections vidéo. Le Dublin Core permet de structurer les métadonnées de manière simple et de les échanger. Créé à l’origine pour écrire des ressources Internet, le Dublin Core est cependant toujours plus utilisé par les musées, les archives ou les bibliothèques.

Source : memoriav.ch

Pour plus d’informations sur le Dublin Core: http://dublincore.org/documents/dces/

 

 

MPEG-7

MPEG-7 Multimedia Content Description Interface:
Norme internationale utilisée pour décrire des données multimédia, des images, des vidéos, des documents sonores, etc. Utilise le langage XML pour représenter le contenu, décrire les séquences ou les plans et peut également traiter des métadonnées non textuelles (par exemple indexer les mouvements de caméra, la texture de l’image, etc.)

Source : memoriav.ch

Pour plus d’informations sur MPEG-7: chiariglione.org
MPEG-7 et le Dublin Core pour la vidéo:
Schemas for Video Metadata

 

 

OAI-PMH :

A l'origine, le protocole OAI-PMH a été développé pour la description et l'échange d'articles scientifiques. Rapidement, des institutions du domaine patrimonial, en particulier de grandes bibliothèques, ont repris le protocole OAI-PMH à leur compte pour en faire un outil permettant, par l’intermédiaire de la collecte de métadonnées, de proposer des recherches transversales (recherche à partir d’un sujet, d’un auteur sur des collections d’origines diverses) et multi-sectorielles (recherche dans des bibliothèques et des musées par exemple) et de faire connaître leurs ressources sur le web.
Le protocole OAI-PMH permet le partage de métadonnées et non de ressources. Les ressources restent localisées chez le fournisseur de données. En outre, il ne gère que le transfert des données ; il ne propose aucune fonction de recherche. C’est au fournisseur de services de mettre en place des applications permettant la recherche de notices à partir de l’entrepôt.

Source : Le protocole OAI-PMH et les fonctionnalités de recherche : étude de portails du domaine patrimonial - Mélanie GAUTHIER – Mémoire de diplôme supérieur – INTD 2006-2007

Pour en savoir plus :
http://www.culture.gouv.fr/culture/dll/OAI-PMH.htm

et aussi : http://www.openarchives.org/OAI

 

 

DTD EAD :

Standard d'encodage des instruments de recherche archivistique basé sur le langage XML. L'EAD est utilisé en particulier par les services d’archives, bibliothèques et musées pour décrire des fonds d'archives, des collections de manuscrits et des collections hiérarchisées de de de documents ou d’objets (photographies, microfilms, pièces de musée).

Source : wikipedia

 

 

Schéma METS :

Metadata Encoding and Transmission Standard

Le schéma METS, maintenu par la Bibliothèque du Congrès, est un standard permettant d'encoder les métadonnées descriptives, administratives et de structure spécifique aux objets numériques. (Metadata Encoding and Transmission Standard)

Source : BNF - numérisation & données numériques

 

 

Documents utiles

Documents pdf

memoriav recommandations :

- la sauvegarde des documents sonores

- la sauvegarde de documents video