Ouverture fait partie de ORCIDles valeurs fondamentales de et le partage de notre ORCID Le fichier de données publiques est un exemple de notre engagement en faveur de l'ouverture. En fait, il est intégré dans notre principes fondateurs.
Depuis le lancement du ORCID Depuis octobre 2012, nous publions chaque année le fichier de données publiques, accessible gratuitement et ouvertement par tous, afin de garantir à toute partie prenante intéressée un large accès à un ensemble de données qui est devenu un élément essentiel de l'infrastructure de communication scientifique. Nous sommes heureux d'annoncer que nous avons maintenant franchi une étape supplémentaire : rendre le fichier de données publiques plus accessible. accessible — en s’associant à Digital Science pour fournir un moyen d’accéder au fichier d’une manière qui, pour la première fois, facilite l’analyse exploratoire des données.
Temps forts
- ORCID publie le fichier de données publiques chaque année, sans frais, pour assurer un large accès au public ORCID données,
- Cependant, étant donné que le fichier de données publiques est si volumineux, il peut être difficile de travailler avec, inhibant l'analyse exploratoire
- ORCID membre Digital Science accueille généreusement le Fichier de données publiques 2024 sur Google Big Query, rendant le fichier de données publiques facilement accessible pour l'exploration et l'analyse.
Au cours des 12 années qui ont suivi ORCID a partagé le fichier de données publiques, il a été téléchargé plus de 190,000 XNUMX fois, servant de source de données pour une gamme diversifiée de projets tels que l'analyse des relations et des trajectoires individuelles au sein de la communauté de recherche, les migrations scientifiques, les réseaux de collaboration et l'adoption de ORCID Les données sont accessibles à tous, quel que soit leur domaine d'activité ou leur emplacement. Nous sommes toutefois conscients que l'utilisation du fichier de données publiques dans sa forme actuelle requiert un effort considérable. Les utilisateurs potentiels doivent posséder une compréhension et des compétences pour travailler avec un ensemble de données aussi important : comment télécharger, analyser, extraire et charger les données dans un environnement local, avant même que l'analyse puisse commencer.
En nous appuyant sur notre relation actuelle avec Figshare, qui sert de référentiel pour le fichier de données publiques, ORCID Le membre Digital Science a désormais généreusement proposé d'héberger le fichier de données publiques 2024 dans Google Big Query (GBQ) de Dimension, ce qui signifie que les données sont directement disponibles pour l'exploration et l'analyse sans qu'il soit nécessaire de créer au préalable une copie locale.
Google Big Query est une plate-forme d'analyse de données entièrement gérée et basée sur le cloud, optimisée pour gérer efficacement de grands ensembles de données. Cela en fait une plate-forme idéale pour explorer et analyser les données. ORCID Fichier de données publiques, qui contient des millions d'enregistrements. ORCID Le fichier de données publiques a été utilisé pour des projets tels que l'enrichissement des métadonnées, visualiser les connexions entre les auteurs, pratiques de partage de données dans une région particulière, et analyse des schémas de migration des scientifiques.
La version bêta de ce service est désormais disponible, et nous espérons que le moindre effort requis pour l'utiliser permettra à notre communauté d'explorer et de développer de nouveaux cas d'utilisation innovants pour le ORCID des données, telles que des rapports sur les pratiques d’évaluation par les pairs ou des analyses impliquant des liens ORCID données avec les données de la Banque mondiale. Bien que l'ensemble de données lui-même soit et restera disponible gratuitement, ceux qui souhaitent l'utiliser devront créer leur propre compte GBQ ; Google propose un niveau d'utilisation gratuit jusqu'à un certain niveau, mais prélève des frais pour toute utilisation au-delà de ce niveau. Dans le cadre du niveau gratuit, il est possible d'exécuter de nombreuses requêtes avant d'épuiser le quota. Digital Science a également fourni exemple de requêtes d'échantillon qui vous permettent d'interroger efficacement différentes parties du ORCID jeu de données.
Pour être clair, ce service est offert en complément et ne remplace pas les copies d'archives de nos Fichier de données public, qui continuent d'être disponibles en téléchargement à partir de notre référentiel Figshare.
Que contient le ORCID Fichier de données public ?
Comme mentionné sur notre site Internet, L' ORCID Le fichier de données publiques contient toutes les informations accessibles au public pour tous ORCID identifiants dans le registre au moment de la création. ORCID publie le fichier de données public sous un CC0 1.0 Dédicace au domaine public comme décrit plus en détail dans notre Confidentialité. En conséquence, ORCID n'impose pas de restrictions ou de conditions à l'utilisation du fichier de données publiques, mais nous avons publié des normes communautaires recommandées dans notre Politique d'utilisation des fichiers de données publics.
Dans cette version du service, le ORCID Le fichier de données publiques sur Google Big Query reflète les données contenues dans le ORCID fichiers de résumés, ce qui signifie que les détails étendus des métadonnées au niveau du travail (par exemple, l'article) ne sont toujours disponibles que dans les versions téléchargeables ORCID Fichier de données publiques disponible sur Figshare.
ORCID et la Science Numérique vous invite à explore le ORCID Fichier de données public dans Google Big Query. Si vous utilisez les données dans votre projet, nous vous demandons de mentionner Digital Science pour l'outil, en créant un lien vers l'outil.sa pageEt à ORCID comme source du fichier de données public et un lien vers cette page lorsque cela est technologiquement possible, pour faciliter l’accès à d’autres.
Nous aimerions en savoir plus sur la façon dont vous utilisez le ORCID Fichier de données publiques sur l'outil Google Big Query de Dimension, donc s'il vous plaît laissez-nous savoir!