Otevřenost je jeden z ORCID's základní hodnoty a sdílení naší výroční ORCID Public Data File je jedním z příkladů našeho závazku k otevřenosti. Ve skutečnosti je to zakotveno v našem zakládající principy.
Od zahájení z ORCID rejstříku v říjnu 2012 jsme každoročně zveřejňovali veřejný datový soubor, který je volně a otevřeně přístupný všem, jako prostředek k zajištění širokého přístupu všech zúčastněných stran k datovému souboru, který se stal důležitou součástí vědecké komunikační infrastruktury. S potěšením oznamujeme, že jsme to nyní udělali ještě o krok dále – aby byl veřejný datový soubor více přístupné — partnerstvím s Digital Science s cílem poskytnout prostředky pro přístup k souboru způsobem, který vůbec poprvé usnadní průzkumnou analýzu dat.
Highlights
- ORCID zveřejňuje veřejný datový soubor každý rok bezplatně, aby byl zajištěn široký přístup veřejnosti ORCID datum
- Protože je však soubor veřejných dat tak velký, může být obtížné s tím pracovatinhibující průzkumnou analýzu
- ORCID člen Digitální věda velkoryse hostí Veřejný datový soubor 2024 na Google Big Query, čímž je soubor veřejných dat snadno dostupný pro průzkum a analýzu.
Za těch 12 let ORCID sdílí veřejný datový soubor, byl stažen více než 190,000 XNUMXkrát a slouží jako zdroj dat pro různé projekty, jako je analýza vztahů a individuálních trajektorií v rámci výzkumné komunity, vědecké migrace, sítě pro spolupráci a přijetí ORCID napříč obory a lokalitami. Chápeme však, že používání souboru veřejných dat v jeho současné podobě vyžaduje velké množství úsilí. Případní uživatelé musí mít znalosti a dovednosti s prací s tak rozsáhlým souborem dat: jak stahovat, analyzovat, extrahovat a nahrávat data do místního prostředí – ještě předtím, než může začít analýza.
Na základě našeho současného vztahu se společností Figshare, která slouží jako úložiště pro veřejný datový soubor, ORCID Člen Digital Science nyní velkoryse nabídl hostování veřejného datového souboru 2024 do Google Big Query (GBQ) společnosti Dimension, což znamená, že data jsou přímo dostupná pro průzkum a analýzu, aniž by bylo nutné nejprve vytvořit místní kopii.
Google Big Query je cloudová, plně spravovaná platforma pro analýzu dat, optimalizovaná pro efektivní zpracování velkých datových sad. To z něj dělá ideální platformu pro zkoumání a analýzu ORCID Public Data File, který obsahuje miliony záznamů. The ORCID Public Data File byl použit pro projekty, jako je obohacování metadat, vizualizace spojení mezi autory, postupy sdílení dat v konkrétním regionu, a analýza vzorců migrace vědců.
Nyní je k dispozici beta verze této službya doufáme, že menší úsilí potřebné k jeho používání umožní naší komunitě prozkoumat a vyvinout nové inovativní případy použití pro ORCID data, jako jsou zprávy o postupech vzájemného hodnocení nebo analýzy, které zahrnují propojení ORCID údaje s údaji ze Světové banky. Zatímco samotný datový soubor je a zůstane volně dostupný, ti, kteří jej chtějí používat, si budou muset založit svůj vlastní GBQ účet; Google nabízí bezplatnou úroveň používání do určité úrovně, ale za použití nad rámec této úrovně účtuje poplatky. V rámci bezplatné úrovně je možné spustit mnoho dotazů před vyčerpáním kvóty. Digitální věda také poskytla příklady vzorových dotazů které vám umožní efektivně dotazovat různé části ORCID datový soubor.
Aby bylo jasno, tato služba je nabízena jako doplněk k našim archivním kopiím a nenahrazuje je Veřejný datový soubor, které jsou nadále dostupné ke stažení z našeho úložiště Figshare.
Co je v ORCID Veřejný datový soubor?
Jak bylo zmíněno na našich webových stránkách, ORCID Public Data File obsahuje všechny veřejně dostupné informace pro všechny ORCID ID v registru v době vytvoření. ORCID zveřejňuje veřejný datový soubor pod a CC0 1.0 Věnování veřejné domény jak je dále popsáno v našem Zásady Ochrany Soukromí. V souladu s tím ORCID neukládá omezení ani podmínky pro použití souboru veřejných dat, ale publikovali jsme doporučené normy komunity v našem Zásady používání veřejných datových souborů.
V této verzi služby je ORCID Veřejný datový soubor na Google Big Query odráží data, která jsou obsažena v ORCID souhrny, což znamená, že rozšířené podrobnosti o metadatech pracovní úrovně (např. článek) jsou stále dostupné pouze ve verzích ke stažení ORCID Veřejný datový soubor dostupný na Figshare.
ORCID a Digitální věda vás zve prozkoumat ORCID Veřejný datový soubor v Google Big Query. Pokud ve svém projektu využíváte data, žádáme vás, abyste za tento nástroj uvedli zdroj Digital Science, který odkazuje zpět na tjeho stránka, A na ORCID jako zdroj veřejného datového souboru a odkaz zpět na tato stránka tam, kde je to technologicky možné, usnadnit přístup ostatním.
Rádi bychom se dozvěděli, jak používáte ORCID Soubor veřejných dat v nástroji Google Big Query společnosti Dimension, takže prosím, dejte nám vědět!