Otwartość Jest to jeden z ORCIDpodstawowe wartości i dzielenie się naszymi corocznymi ORCID Public Data File jest jednym z przykładów naszego zaangażowania w otwartość. W rzeczywistości jest on osadzony w naszym podstawowe zasady.
Od rozpoczęcia realizacji ORCID rejestru w październiku 2012 r., corocznie publikowaliśmy Publiczny Plik Danych, dostępny bezpłatnie i otwarcie dla wszystkich, jako środek mający na celu zapewnienie, że każda zainteresowana strona ma szeroki dostęp do zbioru danych, który stał się istotną częścią infrastruktury komunikacji naukowej. Z przyjemnością ogłaszamy, że posunęliśmy się o krok dalej — aby Publiczny Plik Danych był bardziej dostępny — poprzez współpracę z Digital Science w celu zapewnienia sposobu dostępu do pliku w sposób, który po raz pierwszy ułatwi eksploracyjną analizę danych.
Najważniejsze
- ORCID publikuje Publiczny Plik Danych corocznie, bezpłatnie, aby zapewnić szeroki dostęp do informacji publicznej ORCID dane
- Ponieważ jednak Plik Danych Publicznych jest tak duży, praca z tym może być trudna, hamując analizę eksploracyjną
- ORCID członek Digital Science hojnie gości Plik danych publicznych z 2024 r. w usłudze Google Big Query, dzięki czemu Publiczny Plik Danych jest łatwo dostępny do eksploracji i analizy.
W ciągu 12 lat, które ORCID udostępnia Publiczny Plik Danych, który został pobrany ponad 190,000 XNUMX razy, służąc jako źródło danych dla różnych projektów, takich jak analiza relacji i indywidualnych trajektorii w społeczności badawczej, migracje naukowe, sieci współpracy i przyjmowanie ORCID w różnych dyscyplinach i lokalizacjach. Rozumiemy jednak, że korzystanie z Public Data File w jego obecnej formie wymaga dużego wysiłku. Przyszli użytkownicy muszą posiadać wiedzę i umiejętności pracy z tak obszernym zestawem danych: jak pobierać, analizować, wyodrębniać i przesyłać dane do lokalnego środowiska — zanim analiza w ogóle się rozpocznie.
W oparciu o naszą obecną współpracę z Figshare, która pełni rolę repozytorium pliku danych publicznych, ORCID członek Digital Science hojnie zaoferował możliwość hostowania Publicznego Pliku Danych 2024 w usłudze Google Big Query (GBQ) firmy Dimension, co oznacza, że dane są bezpośrednio dostępne do eksploracji i analizy bez konieczności wcześniejszego tworzenia lokalnej kopii.
Google Big Query to oparta na chmurze, w pełni zarządzana platforma analityki danych, zoptymalizowana pod kątem wydajnego przetwarzania dużych zestawów danych. Dzięki temu jest idealną platformą do eksploracji i analizowania ORCID Public Data File, który zawiera miliony rekordów. ORCID Plik danych publicznych był używany w projektach takich jak wzbogacanie metadanych, wizualizacja połączeń między autorami, praktyki udostępniania danych w danym regionie, i analiza wzorców migracji naukowców.
Wersja beta tej usługi jest już dostępnai mamy nadzieję, że mniejszy wysiłek wymagany do jego wykorzystania pozwoli naszej społeczności na eksplorację i opracowywanie nowych innowacyjnych przypadków użycia ORCID dane, takie jak raporty dotyczące praktyk recenzji eksperckich lub analizy obejmujące łączenie ORCID dane z danymi z Banku Światowego. Podczas gdy sam zbiór danych jest i pozostanie swobodnie dostępny, osoby chcące z niego korzystać będą musiały założyć własne konto GBQ; Google oferuje bezpłatny poziom użytkowania do pewnego poziomu, ale pobiera opłaty za użytkowanie powyżej tego poziomu. W ramach bezpłatnego poziomu możliwe jest uruchomienie wielu zapytań przed wyczerpaniem limitu. Digital Science zapewniło również przykładowe przykładowe zapytania które umożliwiają efektywne przeszukiwanie różnych części ORCID zestaw danych.
Aby było jasne, usługa ta jest oferowana dodatkowo, a nie zastępuje kopii archiwalnych naszych Plik danych publicznych, które nadal można pobrać z naszego repozytorium Figshare.
Co jest w ORCID Publiczny plik danych?
Jak wspomniano na naszej stronie, ORCID Plik danych publicznych zawiera wszystkie publicznie dostępne informacje dla wszystkich ORCID identyfikatory w rejestrze w momencie utworzenia. ORCID udostępnia plik danych publicznych pod a CC0 1.0 Dedykacja domeny publicznej jak opisano bardziej szczegółowo w naszym Polityce prywatności. Odpowiednio, ORCID nie nakłada ograniczeń ani warunków na korzystanie z Publicznego Pliku Danych, ale opublikowaliśmy zalecane normy społecznościowe w naszym Zasady korzystania z plików danych publicznych.
W tej wersji usługi, ORCID Publiczny plik danych w usłudze Google Big Query odzwierciedla dane zawarte w ORCID pliki podsumowań, co oznacza, że rozszerzone szczegóły dotyczące metadanych poziomu pracy (np. artykułu) są nadal dostępne tylko w wersjach do pobrania ORCID Publiczny plik danych dostępny na Figshare.
ORCID i Digital Science zapraszają do poznaj ORCID Plik danych publicznych w Google Big Query. Jeśli wykorzystasz dane w swoim projekcie, prosimy o podanie źródła Digital Science dla tego narzędzia, linkując z powrotem do tjego stronaOraz ORCID jako źródło pliku danych publicznych i link do niego tutaj tam, gdzie jest to technologicznie możliwe, aby ułatwić innym dostęp.
Chcielibyśmy dowiedzieć się, jak korzystasz z ORCID Publiczny plik danych w narzędziu Google Big Query firmy Dimension, więc Daj nam znać!