Bibliothèques d’Asie du Sud-Est

Le Blog d’une conservateur en disponibilité devenue pour un temps « travelling librarian »…

Dublin Core : quelques applications en France novembre 21, 2007

Filed under: Métadonnées,patrimoine — boscaurelie @ 7:45

Il n’est pas très évident de recenser les applications françaises qui utilisent le Dublin Core dans le monde des bibliothèques françaises (le recensement des projets utilisant le Dublin Core sur le site de la DCMI est malheureusement largement lacunaire…, et je ne suis pas abonnée à la liste de diffusion francophone DCMI-FR hébergée par l’INIST). Une rapide recherche m’a donné quelques réponses, que l’on peut répartir en 3 catégories :

  1. Dublin Core pour décrire des ressources numériques dans une bibliothèque numérique (= catalogage),
  2. Dublin Core pour permettre, par une « couche supplémentaire » de description, une recherche fédérée sur des ressources décrites dans des formats différents (convertis en Dublin Core),
  3. Dublin Core pour permettre l’exposition et la collecte de métadonnées via OAI-PHM (avec 1 ou 2).

En France, assez peu de bibliothèques utilisent le Dublin Core :

  • BM de Lille pour la sitothèque et les images de sa bibliothèque numérique bientôt en ligne (nativement décrites avec les métadonnées de l’IPTC, International Press Telecommunications Council, et transformées en Dublin Core)
  • BM de Nantes pour décrire directement les documents de la bibliothèque numérique (manuscrits, imprimés, images, objets), bientôt en ligne

NB : ces 3 bibliothèques utilisent Mediaview d’Ineo Media System.

  • Le Dublin Core est également utilisé par la Bibliothèque intercommunale de Pau-Pyrénées pour sa Bibliothèque numérique des ressources paloises, en cours, par l’Agence de coopération des bibliothèques et centres de documentation en Bretagne (articles de périodiques), par la Bibliothèque de l’Ecole Centrale de Lyon, et l’Enssib pour les documents de sa bibliothèque numérique et les ressources pédagogiques de l’intranet (qui, à terme, pourraient être décrites avec le schéma de métadonnées LOM-FR).
  • Un projet qui me semble très intéressant : le futur portail documentaire de Bourg-en-Bresse (qui ouvrira mi-décembre), regroupant les archives municipales, le musée de Brou et le réseau de lecture publique. La bibliothèque a créé des notices en Dublin Core qualifié pour décrire ses documents patrimoniaux numérisés, dont les notices sont gérées dans le SIGB et la publication par Greenstone (logiciel libre de création de biblitohèque numérique développé entre autres par l’Unesco). Le portail proposera à terme un accès fédéré aux ressources des différents établissements, décrites en Dublin Core, et l’entrepôt OAI-PHM moissonnera et sera moissonné par d’autres entrepôts.

Plusieurs bibliothèques utilisent le Dublin Core pour leur entrepôt OAI-PHM, qui leur permet de moissonner et d’être moissonnées :

  • Medic@, bibliothèque numérique de la Bibliothèque interuniversitaire de médecine :

Les données descriptives des documents de Medic@ (initialement dans un format maison et converties en Dubin Core) sont accessibles via l’entrepôt OAI-PHM. Medic@ est notamment moissonnée par la BnF (Gallica), le CESR (Bibliothèques Virtuelles Humanistes, BVH). Réciproquement, Medic@ moissonne les sets médecine de Gallica, de BVH, de l’Université Louis Pasteur, de la BM de Troyes.

  • CNUM, bibliothèque numérique du Conservatoire National des Arts et Métiers :

Les notices MARC sont converties en Dublin Core ; CNUM est moisonné par Gallica mais ne moissonne pas d’autres sites. Voir la présentation faite lors de la 10e Journée des Pôles Associés de la BnF en décembre 2006.

L’entrepôt OAI, dont les métadonnées Dublin Core sont créées par conversion, est moissonné entre autres par Gallica, et moissonne l’entrepôt de la BM de Troyes.

L’entrepôt est moisonné par Medic@ (pour les livres de médecine), BVH (pour les livres imprimés XV-XVIIIe siècle), et le sera prochainement par Gallica. En projet, la moisson de Gallica pour les documents concernant l’histoire locale. A noter également, la préparation d’un catalogue collectif des incunables numérisés (BM de Troyes : 150 titres actuellement en ligne et 300 titres prévus en 2008), qui pourra utiliser le Dublin Core et l’OAI pour moissonner les biblitohèques numériques des BM de Versailles et de Besançon, intéressées par le projet. Enfin, la BM de Troyes devrait être un site test pour la mise en place de l’EAD dans le cadre de la mise en ligne du Catalogue Général des Manuscrits, et les données descriptives en EAD de ses manuscrits numérisés (1500 manuscrits médiévaux et 920 manuscrits jansénistes) pourraient alors être moissonnées par le futur CGM .

  • BM de Versailles :

L’entrepôt OAI devrait ouvrir sous peu, et ainsi remplacer le mode actuel d’échange avec Gallica (simple échange de notices bibliographiques contenant l’URL des documents numérisés dans le champ 856, dont la mise à jour est difficile). L’entrepôt contiendra, dans un premier temps, le fonds Philidor et tous les manuscrits musicaux (350 documents environ), sera moissonné par Gallica et moissonnera Gallica pour les manuscrits Philidor. Une collaboration avec le Centre de recherche du château de Versailles autour de l’iconographie de la vie de Cour est envisagée sur le même principe.

  • Gallica devrait également moissonner dans l’avenir le CRL de Basse Normandie et la BDIC.

Universités et recherche….

  • HAL, serveur d’archives ouvertes des universités et institutions de recherche

HAL (Hyper Articles en Ligne) est un serveur d’archives ouvertes, qui met gratuitement à disposition des chercheurs et du grand public, des travaux de recherche dans toutes les disciplines. Le serveur donne accès à différents portails : portails génériques (HAL, Hyper Articles en Ligne ; TEL, Thèse En Ligne ; CEL, Cours En Ligne), portails thématiques (Education et technologies de l’information et de la communication, Sciences de l’Homme et de la Société, Langue basque, Sciences de l’Information et de la Communication, Sciences de l’Environnement), portails institutionnels (21 institutions). Les métadonnées de HAL sont en partie en Dublin Core. Maintenu le Centre pour la Communication Scientifique Directe (CCSD) du CNRS, il donne accès à plus de 51000 articles scientifiques en plein texte, moissonnables par OAI.

HAL est également connecté aux plateformes de e-learning des universités et grandes écoles françaises; et à d’autres serveurs d’archives ouvertes (comme arXiv.org et PubMed Central), ce qui permet aux chercheurs qui le souhaitent de déposer leurs travaux dans les deux serveurs.

Enfin HAL fait partie de DRIVER (Digital Repositories Infrastructure Vision for European Research), projet d’infrastructure européenne pour les réservoirs de publications scientifiques.

HAL n’est qu’un exemple parmi bien d’autres réservoirs institutionnels qui utilisent le Dublin Core (cf. en Australie, Australian Digital Theses Program, ADT, et Australian Research Repositories, ARROW).

  • La Jubilothèque, Bibliothèque numérique scientifique de l’Université Pierre et Marie Curie, utilise le Dublin Core et propose un entrepôt OAI (exemple de bibliothèque numérique de bibliothèque universitaire parmi d’autres !).

Musées et Archives

  • Je connais peu l’utilisation du Dublin Core dans les Musées, si ce n’est par les projets recensés dans Patrimoine numérique (le Musée de la lunette, la Section Fédérée de Franche-Comté de l’association générale des Conservateurs de collections publiques de France, le Musée français de la photographie, et le Musée des beaux-arts et d’archéologie de Besançon), ni dans les Archives (hormis à l’Ecole nationale des Chartes, si on peut la classer dans la catégorie « archives », je n’ai pas encore trouvé d’exemple d’utilisation du Dublin Core, mais il y en a très probablement, étant donné l’implication forte des archives dans l’utilisation des métadonnées).
  • Quelques exemples hors de France…

Picture Australia (patrimoine pictural et photographique australien), Internet Culturale (portail patrimonial italien), 24 Hours Museum (musée national virtuel britannique) utilisent le Dublin Core, à la fois pour la description des ressources numériques et pour le moissonnage.

Ce bref aperçu de l’utilisation du Dublin Core dans les bibliothèques françaises est loin d’être exhaustif : commentaires et ajouts bienvenus !

Publicités
 

Dublin Core : introduction novembre 10, 2007

Filed under: Métadonnées — boscaurelie @ 9:57

conf_2007_banner.jpg

J’ai eu la chance de pouvoir assister à la Conférence DC-2007 organisée par la Dublin Core Metadata Initiative, qui s’est tenue du 27 au 31 août 2007 à Singapour. Il était temps d’en faire un bref compte-rendu – occasion que j’ai saisie pour rassembler de la matière sur le Dublin Core à destination des NDCU (=No Dublin Core Users), dont je suis ! La Conférence était truffée d’acronymes anglais que je souhaite éviter… Je ne suis pas une spécialiste du Dublin Core, loin s’en faut, mais je vais tenter, en quelques billets, d’en expliquer succintement les enjeux et l’intérêt, de manière un peu plus élargie que dans l’article que j’ai écrit pour le prochain la revue de l’ABF, Bibliothèque(s).

Mais tout d’abord, le Dublin Core, qu’est-ce c’est ? C’est un ensemble de métadonnées utilisées pour décrire des ressources en ligne, quelles qu’elles soient. Le Dublin Core (DC) est un standard de métadonnées très répandu sur le web, notamment car il est utilisé comme standard minimal (mais il n’est pas le seul) par le protocole OAI-PHM (exposition et collecte de métadonnées). C’est aussi le plus petit dénominateur commun de la description bibliographique sur le web et c’est pour cela qu’il est utilisé dans des applications transversales (par ex. musées, bibliothèques, archives). Il n’est pas destiné à remplacer les formats de description existants (Marc par exemple) mais peut servir comme base de description commune à des documents initialement décrits dans divers formats, et ainsi permettre une recherche fédérée et des échanges et collectes d’information entre différentes applications (via OAI-PHM).

Mais je ne vais pas ré-écrire ce qui l’a déjà été -mieux que je ne pourrais le faire- par d’autres… Voici donc pour commencer quelques définitions :

« La Dublin Core Metadata Initiative (DCMI) est une organisation dédiée à favoriser l’adoption à grande échelle de standards de métadonnées intéropérables et à promouvoir le développement de vocabulaires spécialisés de métadonnées pour décrire des ressources numériques, afin de permettre la mise en place de système d’exploitation de l’information plus intelligents. La première réunion du DC a eu lieu en 1995 à Dublin (Ohio). » (site de la DCMI) J’ajouterai que la DCMI développe, maintient etpromeut le DC, soutient la communauté internationale d’utilisateurs et de développeurs du DC, et œuvre pour l’interopérabilité dans la description, la gestion et l’échange de l’information numérique.

Métadonnées Dublin Core

 

« Les métadonnées DC peuvent servir à décrire tout type de ressources, comme des collections variées de documents et des formes non-électroniques de supports comme les archives de musées ou de bibliothèques. […] Elles sont utilisées pour compléter les méthodes existantes pour trouver et indexer les ressources sur le web, quelque soit la ressource correspondante, document électronique ou objet physique. […] Le but du DC est de fournir un vocabulaire de métadonnées de propriétés essentielles qui puisse fournir une information descriptive de n’importe quelle ressource, quel que soit son format, son aire de spécialité ou son origine culturelle. Les métadonnées DC sont le résultat de plusieurs années de recherche commune pour déterminer un ensemble commun de propriétés universelles pour décrire tout type de ressource. […] Elles sont utilisées comme la base de systèmes de description par différentes communautés : institutions d’enseignement, bibliothèques, institutions gouvernementales, secteur de la recherche scientifique, auteurs de pages web, organisations demandant une plus grande facilité d’interrogation de leur site web, ou avec un important système de knowledge management. » (site de la DCMI)

Dublin Core « simple » ou « non qualifié »

 

« Le Dublin Core [« simple » ou « non qualifié »] compte 15 éléments de base répartis en 3 grandes catégories :

 

Contenu

Propriété intellectuelle

Instanciation*

Couverture

Collaborateur

Date

Description

Créateur

Format

Type

Éditeur

Identifiant

Relation

Droits

Langue

Source

 

 

Sujet

 

 

Titre

 

 

* version spécifique d’un document original

Cet ensemble de base répond à 5 principes fondamentaux :

  1. Tous les éléments sont optionnels.
  2. Tous les éléments sont répétables.
  3. Le Dublin Core est extensible. Il est possible de raffiner la description d’un élément d’une façon normalisée au moyen de sous-éléments. Cela restreint sa signification sans la changer fondamentalement.
  4. Le Dublin Core est multidisciplinaire.
  5. Le Dublin Core est international (on l’utilise dans plus de 20 langues). » (BiblioDoc)

Suite dans le prochain billet.