Interopérabilité - Protocole OAI-PMH
Dès son origine, le portail Persée a mis à disposition une interface OAI pour la diffusion de ses métadonnées. Plusieurs types de données et plusieurs formats sont proposés afin que chaque site souhaitant intégrer des informations issues de Persée puisse le faire de façon aussi complète que possible. Par ailleurs, un petit outil permettant de moissonner Persée afin de reproduire, sur un site tiers, la représentation d'une ou de plusieurs revues est désormais disponible.
Adresse du serveur OAI : http://oai.persee.fr/oai?
Les formats de données
Les métadonnées des documents
Les métadonnées associées à chaque document diffusé par Persée sont disponibles selon 3 modèles distincts : Dublin Core, MODS et MarcXml.
Le contenu des documents
Le contenu de chaque document est également accessible via le protocole OAI-PMH. Ce service est réservé à des utilisateurs identifiés : chercheurs souhaitant effectuer des fouilles de texte, plateformes souhaitant exploiter les collections dans leurs index, etc.
La structure de la collection
L'ensemble des informations permettant de représenter une collection (périodes et changements de titres, liste des numéros, tables des matières) et donc de structurer l'ensemble des documents qui la constituent sont disponibles sur le serveur OAI. Le modèle utilisé est le METS. Il constitue le container idéal pour véhiculer l'ensemble des informations relatives à :
- une collection : ses métadonnées (y compris changements de titre), les liens OAI ou URL vers les numéros qui la constituent, sa structure hiérarchique (périodes, publications parallèles, etc.) ;
- un numéro : ses métadonnées, les liens OAI ou URL vers les documents qui le constituent et sa structure hiérarchique (table des matières).
Les ensembles de données
L'utilisation du paramètre set permet de limiter la portée de la requête à une partie des contenus. Deux catégories de sets sont disponibles :
- les disciplines
- les collections
La liste complète des sets disponibles est accessible par la requête http://oai.persee.fr/oai?verb=ListSets
Exemple de moisson OAI
Compte tenu du grand nombre d'enregistrements disponibles sur le serveur, l'utilisation de l'argument set est vivement recommandée pour toute requête de type ListRecords ou ListIdentifiers.
- Requête pour lister les collections (identifiants de série) disponibles : verb=ListIdentifiers&metadataPrefix=oai_dc&set=persee:serie
- Requête pour moissonner une description de collection : verb=GetRecord&identifier=oai:persee:serie/dha&metadataPrefix=persee_mets
- Lister les contenus dicponibles pour une collection :
- Requête pour obtenir la liste des identifiants (fascicules et documents) associés à une collection : verb=ListIdentifiers&metadataPrefix=oai_dc&set=persee:serie-dha
- Requête pour obtenir la liste des identifiants de fascicules d'une collection : verb=ListIdentifiers&metadataPrefix=oai_dc&set=persee:serie-dha:issue
- Requête pour obtenir la liste des identifiants de documents d'une collection : verb=ListIdentifiers&metadataPrefix=oai_dc&set=persee:serie-dha:doc
- Récupérer les contenus :
- Requête pour obtenir les informations sur un numéro : verb=GetRecord&identifier=oai:persee:issue/dha_0755-7256_2003_num_29_1&metadataPrefix=persee_mets
- Requêtes pour obtenir les métadonnées associées à un article :
- DC : verb=GetRecord&metadataPrefix=oai_dc&identifier=oai:persee:article/dha_0755-7256_2003_num_29_1_1553
- MODS : verb=GetRecord&metadataPrefix=mods&identifier=oai:persee:article/dha_0755-7256_2003_num_29_1_1553
- MARC : verb=GetRecord&metadataPrefix=marc&identifier=oai:persee:article/dha_0755-7256_2003_num_29_1_1553
Note pour une utilisation "machine" de l'entrepôt OAI de Persée
Afin de ne pas surcharger nos équipements, nous nous permettons de vous reciommander :
- d'utiliser les sets pour une première moisson (cela permet de segmenter le corpus) ;
- d'utiliser ensuite le paramètre from pour ne récupérer que les mises à jour depuis votre dernier passage (tous sets confondus).
Note à l'attention des "utilisateurs humains"du serveur OAI de Persée...
Une XSLT est associée à notre entrepôt. Elle facilite une lecture humaine des réponses de notre serveur.
Pour ceux qui souhaiteraient consulter les réponses sans cette mise en page, utilisez la fonction "voir le code source de la page" de votre navigateur.
Pour une présentation plus lisible (avec sauts de ligne et indentation), ajoutez le paramètre &strip=0 à votre requête OAI.
A propos de l'OAI-PMH...
- Le site de l'Open Archives Initiative
- Les spécifications du protocole OAI-PMH (V2)