Dieser Blogbeitrag wurde mitverfasst von Paloma Marín Arraiza und Gabriela Mejias.
Letzten Freitag, ORCID Wir sind acht Jahre alt und stehen kurz vor einem weiteren wichtigen Meilenstein: 10 Millionen ORCID IDs! Wie jedes Jahr feiern wir unser Jubiläum und die Open-Access-Woche mit der Veröffentlichung unserer Öffentliche Datendatei.
Das Öffentliche Datendatei 2020 enthält eine Momentaufnahme aller öffentlichen Datensatzdaten im ORCID Registry, wird unter a veröffentlicht CC0-Verzichtund ist für jedermann kostenlos nutzbar. Offenheit ist einer unserer Grundwerte, und als Teil unseres Engagements, Zugangsbarrieren zu beseitigen, veröffentlichen wir die Datei, um sicherzustellen, dass alle Beteiligten breiten Zugang zu einem wichtigen Teil der wissenschaftlichen Kommunikationsinfrastruktur haben. Zum Zeitpunkt des Schreibens war die Öffentliche Datendatei 2019 wurde mehr als 35,000 Mal heruntergeladen.
Die Datei wurde in verschiedenen Projekten als Datenquelle für die Analyse von Beziehungen und individuellen Verläufen innerhalb der Forschungsgemeinschaft, wissenschaftlichen Migrationen, Kooperationsnetzwerken und der Einführung von verwendet ORCID über Disziplinen und Standorte hinweg.
Wie nutzt die Community die Datei?
Wir möchten drei Beispiele für die Verwendung öffentlicher Datendateien vorstellen, um wissenschaftliche Metadaten/Aufzeichnungen zu bereichern und Zusammenhänge zu visualisieren.
dblp – Informatikbibliographie
dblp Bietet offene bibliografische Informationen zu wichtigen Informatikzeitschriften und Tagungsbänden. Im Jahr 2017 starteten sie Anzeige ORCID IDs in Bibliographien und Einzelpublikationen. Die Metadatenanreicherung erfolgt durch das Sammeln von Daten direkt von den Herausgebern und deren Kombination mit den aus der öffentlichen Datendatei erhaltenen Daten. Momentan, 12 % ihrer Einträge haben eine ORCID iD. Für Veröffentlichungen aus dem Jahr 18 steigt die Abdeckung auf 2020 %. Für die Zeitschrift IEEE Control Systems Letters erreicht sie 75 %. Hervorzuheben ist hier auch die Outreach-Arbeit der Deutsch ORCID Konsortium um die Verwendung von promote zu fördern ORCID in dieser Bibliographie.
Digital Humanities Lab – Leibniz-Institut für Europäische Geschichte
Um die Verbindungen zwischen den Autoren des zu visualisieren DHd 2020 (d. h. die Konferenz der Digital Humanities im deutschsprachigen Raum) verwendete das Digital Humanities Lab die Namen der Autoren aus dem Book of Abstracts, dem ORCID Versöhnen Tool von OpenRefine und die Zugehörigkeiten der ORCID IDs gemäß der öffentlichen Datendatei. Nach der Datenverarbeitung und Bereinigung (die vollständige Beschreibung ist auf Deutsch verfügbar). auf diesem Blog) erreichten sie das folgende Personen-Affiliate-Netzwerk:
Grafische Darstellung des Personen-Zugehörigkeits-Netzwerks basierend auf dem Book of Abstracts 2020 und ORCID IDs. 204 Knoten (Person: 110, rot / Institution: 94, blau) und 183 Kanten („verbunden mit“).
Quelle: https://github.com/ieg-dhr/orcidgraph/blob/master/Orcidgraph.png und https://dhlab.hypotheses.org/1467.
Den Quellcode des Skripts finden Sie in GitHub.
OpenAIR
Das OpenAIRE-Forschungsdiagramm ist eine der größten offenen Sammlungen wissenschaftlicher Aufzeichnungen weltweit und spielt eine entscheidende Rolle bei der Förderung von Open Science und der Etablierung ihrer Praktiken. Der Graph ist als öffentliches und transparentes Gut konzipiert und basiert auf Datenquellen, denen Wissenschaftler vertrauen. Ziel ist es, die Entdeckung, Überwachung und Bewertung der Wissenschaft wieder in die Hände der wissenschaftlichen Gemeinschaft zu legen.
In den letzten zehn Jahren hat OpenAIRE daran gearbeitet, das zusammenzustellen OpenAIRE Research Graph-Sammlung von Metadaten und Verknüpfungen zwischen wissenschaftlichen Produkten wie Artikeln, Datensätzen, Software und anderen Forschungsprodukten; Einheiten wie Organisationen, Geldgeber, Finanzierungsströme, Projekte, Communities und Datenquellen. Bis heute umfasst diese riesige Sammlung rund 450 Mio. Metadatensätze mit Links aus mehr als 10,000 Datenquellen, denen Wissenschaftler vertrauen. Nach Bereinigung, feinkörnigen Klassifizierungsprozessen, Deduplizierung und Anreicherung durch Volltext-Mining (~13 Mio. Volltexte) zählt der Graph heute ca. 110 Mio. Veröffentlichungen, ca. 14 Mio. Datensätze, ca. 200 Software-Forschungsprodukte und 8 Mio. andere miteinander verknüpfte Produkte ~1Bi semantische Beziehungen.
ORCID Daten werden von OpenAIRE verwendet, um die Forschungsproduktdatensätze des Diagramms anzureichern. OpenAire nutzt unsere öffentliche Datendatei und Lambda-Datei– Diese Datei wird täglich generiert und enthält eine Liste aller ORCID IDs und ihr letztes Änderungsdatum. Anschließend nutzt es unsere Member-API, um geänderte Datensätze aufzurufen, um neue und aktualisierte Metadaten aus diesen Datensätzen zu importieren.
Diese Integration besteht aus: (i) Addieren ORCID iDs zu Crossref-Datensätzen, die Teil des Diagramms sind, (ii) Importieren von Metadatendatensätzen aus ORCID die keinen DOI haben, (iii) Weitergabe von IDs von Produkten an Produkte, wenn semantische Beziehungen zwischen Produkten die Aktion rechtfertigen (z. B. wenn ein Artikel-Metadatensatz mit einem ORCID iD ist über eine semantische DataCite-Beziehung „supplementedBy/isSupplementTo“ mit einem Datensatz-Metadatensatz verknüpft. OpenAIRE ist in der Lage, an alle Datenquellen zu vermitteln, die Metadaten zum Diagramm beitragen (z. B. Repositories, Herausgeber, Datenrepositorys). ORCID Den zugehörigen Datensätzen zugeordnete IDs.
Openaire war ein ORCID ist seit Anfang 2020 institutionelles Mitglied und plant die Etablierung eines bidirektionalen Datenaustauschs durch den Abschluss eines ORCID Such- und Link-Assistent (derzeit in Entwicklung).
Sind Sie an der Nutzung der öffentlichen Datendatei interessiert?
Wenn Sie an der Verwendung der Datei interessiert sind, können Sie sie hier herunterladen ORCID Repository. Die diesjährige Datei liegt im XML-Format vor und ist zur einfacheren Verwaltung weiter in separate Dateien unterteilt. Eine Datei enthält die vollständige Datensatzzusammenfassung für jeden Datensatz. Der Rest der Daten ist in 11 Dateien unterteilt, die die Aktivitäten für jeden Datensatz einschließlich der vollständigen Arbeitsdaten enthalten. Wenn Sie JSON bevorzugen, können Sie unser verwenden ORCID Konvertierungsbibliothek verfügbar in unserem Github-Repository. Der Konverter ist eine Java-Anwendung und ermöglicht in der Standardversion die Generierung von JSON aus XML ORCID Nachrichtenschemaformat (v2.0 und v2.1).
Wir geben die öffentliche Datendatei im Rahmen einer CC0 1.0 Public Domain Dedication frei und die Nutzung der öffentlichen Daten erfolgt in Übereinstimmung mit unserer Datenschutzrichtlinie. Wir haben außerdem empfohlene Community-Normen für die Verwendung der Datei erstellt.
Wenn Sie die Datei bereits verwenden oder dies planen und Fragen haben, Bitte teilen Sie uns Ihren Anwendungsfall mit. Wir würden gerne von Ihnen hören!