Les ensembles de données sont un produit et une ressource importants pour les chercheurs de toutes les disciplines. Pour que la communauté puisse accéder et réutiliser efficacement les ensembles de données, une compréhension du stockage et de l'attribution des données est fondamentale. De cette compréhension découle le développement et l'utilisation de protocoles d'échange de données standard. Comment sont ORCID identificateurs intégrés dans les workflows du référentiel de données ? En plus d'un certain nombre d'intégrations récentes par figshare, ANDS et ODIN, Dryade commence des travaux pour piloter l'utilisation de ORCID identifiants dans DSpace, discuté à l'OAI8 Réunion des utilisateurs de DSpace hébergé par @boue.
Options de stockage de données
Les chercheurs disposent aujourd'hui de nombreuses options pour stocker leurs données. Certaines universités de recherche soutiennent les activités de gestion des données, y compris la publication et l'archivage des données via un référentiel de données institutionnel ; cette activité est complétée par Dryade, qui fournit des ressources open source sur la plate-forme DSpace pour archiver les ensembles de données associés aux publications de recherche intégrées dans le processus de soumission et de révision des manuscrits. Des organisations nationales comme l'Australian National Data Service (ET) fournissent un environnement pour la publication, l'archivage, la découverte et la réutilisation des données de recherche. Les plateformes communautaires comme figuier facilitez plus que jamais la tâche des particuliers, des sociétés savantes, des éditeurs, des instituts de recherche et des agences de financement pour promouvoir la préservation et la réutilisation des données, en capturant une grande variété d'objets de recherche, notamment des figures, des tableaux, des feuilles de calcul et des fichiers plats.
Attribution de l'ensemble de données
Il devient de plus en plus possible de gérer l'attribution avec l'attribution de DOI à des ensembles de données. Chacune des organisations mentionnées ci-dessus sert non seulement de référentiel de données, mais en collaboration avec DataCite, ils attribuent et gèrent également des DOI pour les objets de recherche. Les DOI sont utilisés pour l'identification et la citation de publications dans des revues depuis environ une décennie, et l'attribution de DOI pour les ensembles de données signale l'acceptation croissante des données de recherche comme une partie essentielle et légitime du dossier de recherche. Mais il reste le défi de connecter les ensembles de données avec les personnes qui les ont créés et qui les réutilisent.
C'est là que ORCID au fur et à mesure que les DOI des ensembles de données ont augmenté, le nombre de chercheurs qui s'inscrivent pour ORCID identifiants. C'est excitant de voir ces connexions se développer. En tant que ORCID partenaire de lancement, figuier soutient l'enregistrement des déposants de données depuis ORCID a ouvert le registre en octobre 2012. Récemment, figshare a lancé une ORCID l'intégration qui intègre l'authentification OAuth et permet aux utilisateurs d'échanger des métadonnées d'ensemble de données entre figshare et ORCID. ANDS et Dryad prévoient également de mettre en œuvre ORCID enregistrement et échange d'identifiants authentifiés au moment du dépôt du jeu de données.
Interopérabilité et collaboration open source
ODIN, ORCID et DataCite Interoperability Network, ont publié une version bêta du DataCite / ORCID Outil d'intégration, permettant aux chercheurs de rechercher DataCite et d'importer des métadonnées d'objets avec des DOI DataCite vers leur ORCID enregistrer. ODIN est une collaboration de deux ans parrainée par la Commission européenne impliquant ORCID UE, DataCite, British Library, CERN, ANDS, Dryad et Cornell University dans le but d'utiliser les normes existantes pour relier les chercheurs et les ensembles de données. Pour créer cet outil, ODIN s'est appuyé sur du code développé par CrossRef et mis à disposition en open source sur Github, une plateforme de développement collaboratif où ORCID code source ouvert est également hébergé. Le code source de l'outil lui-même est disponible sur https://github.com/mfenner/cr-search. Gudmundur Thorisson, un ORCID participant de l'UE au projet ODIN, a fourni un demo de l'outil d'intégration à ORCID Outreach Meeting, qui s'est tenu à Oxford en mai 2013. Il a déclaré : « Nous avons pu créer un prototype fonctionnel avec moins d'une semaine de temps de développement. Cela en dit long sur les avantages du modèle open source qui est de plus en plus utilisé par les projets et les organisations dans cet espace.
ET est en train de lancer une système de bout en bout qui permet aux chercheurs de rechercher dans le référentiel de données ANDS, d'importer les métadonnées des travaux dans ORCID, et aussi pousser le ORCID dans le système ANDS pour devenir un élément des métadonnées associées à un ensemble de données.
Une autre grande opportunité pour l'interopérabilité et l'attribution est dans DSpace référentiels. Dryade développe actuellement cas d'utilisation et un prototype ORCID l'intégration, et rendra des exemples de code disponibles via leur référentiel open source. Leurs plans incluent l'association des expéditeurs et des co-auteurs d'ensembles de données avec ORCID iDs et exposer ces identifiants dans le référentiel Dryad. Comme Todd Vision, professeur agrégé à l'Université de Caroline du Nord et ORCID Membre d'équipage, expliqué lors de la réunion de l'OAI8, « Notre objectif avec ORCID L'intégration des identifiants doit transcender les silos de données actuels imposés par les identités institutionnelles, la saisie manuelle des données et les recherches de chaînes de noms. Les cas d'utilisation Dryad incluent un premier pilote pour l'utilisation d'OAuth dans la plate-forme DSpace. Ce travail a des implications pour les référentiels institutionnels du monde entier pour l'attribution et l'accès géré aux ensembles de données.