ORCID sdílí a Veřejný datový soubor alespoň jednou ročně k výročí našeho počátečního spuštění v říjnu 2012. Sdílení každoročního souboru veřejných údajů je jednou z našich klíčových zásad. Vydáváme soubor, abychom zajistili, že všechny zúčastněné strany, včetně organizací, které nejsou členy ORCID, mít široký přístup k tomu, co se, jak doufáme, stane důležitou součástí vědecké komunikační infrastruktury.
Použití údajů v souboru se řídí podmínky použití datového souboru a naše Zásady ochrany osobních údajů (výňatek níže):
ORCID vydává veřejný datový soubor pod CC0 1.0 Public Domain Dedication vyvinutým Creative Commons. V souladu s tím ORCID nebude ukládat omezení nebo podmínky (včetně těch, které jsou obsaženy v podmínkách použití a členské smlouvě) na používání veřejného datového souboru, ale zveřejnil doporučené komunitní normy pro použití.
Stáhněte si veřejný datový soubor
Chcete-li stáhnout roční veřejný datový soubor, navštivte níže uvedené odkazy.
- 2023 ORCID Veřejné Data Soubor
- 2022 ORCID Veřejný datový soubor
- 2021 ORCID Veřejný datový soubor
- 2020 ORCID Veřejný datový soubor
V rozsahu povoleném zákonem ORCID, Inc se vzdal veškerých autorských práv a souvisejících nebo souvisejících práv ORCID Veřejný datový soubor. Tato práce byla publikována z: USA.
Software pro přístup k souboru
- Windows: Nástroj pro rozbalení souborů tar, jako je WinRAR or 7zip
- Mac: Není potřeba žádný další software
- Převod XML-JSON: Od roku 2018 je soubor poskytován pouze ve formátu XML. Čtěte dále a dozvíte se, jak generovat verze souboru JSON.
Proces
- Stáhněte si soubor z výše uvedených odkazů. Datový soubor každého roku může obsahovat více souborů tar.gz. Například soubor 2018 obsahuje jeden archiv tar.gz pro všechny ORCID záznamů a jeden archiv tar.gz pro všechny aktivity záznamů.
- Windows: Pomocí nástroje (Winrar nebo 7zip), který jste si stáhli, rozbalte soubor tar.gz; výsledkem bude jeden soubor .tar (který se může zobrazit bez přípony). Možná budete muset soubor rozbalit a spustit jej podruhé v souboru .tar.
Mac: Poklepáním na soubor tar.gz jej rozbalíte; výsledkem bude jeden soubor .tar (který se může zobrazit bez přípony). Dvakrát klikněte na soubor .tar a rozbalte jej. - Výstupní složka pro každý soubor se bude lišit v závislosti na roce, ve kterém byl soubor vygenerován, a verzi XSD.
- 2013-2017: Uvnitř vygenerované složky najdete více složek, například json / a xml /. Uvnitř každé složky je jeden soubor pro každou ORCID záznam ve specifikovaném formátu a verzi XSD.
- 2018+, soubor záznamů: Uvnitř vygenerované složky najdete jednu složku, souhrn /, která obsahuje více složek obsahujících jednotlivé ORCID záznamy ve formátu XML. Záznamy jsou agregovány do podsložek na základě sdílených posledních tří číslic souboru ORCID id.
- 2018+, soubor aktivit: Uvnitř vygenerované složky najdete pro každou více složek ORCID záznam. Každá složka bude obsahovat úplné aktivity na každé z nich ORCID záznam ve formátu XML, oddělený podsekcí aktivity.
Rekordní souhrny Soubory
Soubor souhrnů je soubor tar, který obsahuje souhrny veřejných záznamů pro všechny existující ORCID v té době dostupné záznamy ORCID vygeneroval soubor. Soubor je soubor tar s kořenovou složkou ORCID_RRRR_MM_summaries.tar.gz.
Hierarchie složek bude definována posledními třemi číslicemi ORCID iD podle obrázku níže:
Níže jsou uvedeny příklady struktury složek některých ORCID iD:
ORCID iD | Cesta do souboru výpisu |
0000-0000-0000-0001 | /ORCID_2020_10_summaries/001/0000-0000-0000-0001-summary.xml |
0000-0000-0000-0002 | /ORCID_2020_10_summaries/002/0000-0000-0000-0002-summary.xml |
0000-0000-0000-001X | /ORCID_2020_10_summaries/01X/0000-0000-0000-001X-summary.xml |
0000-0000-0001-001X | /ORCID_2020_10_summaries/01X/0000-0000-0001-001X-summary.xml |
0000-0000-0003-0001 | /ORCID_2020_10_summaries/001/0000-0000-0003-0001-summary.xml |
0001-0000-0003-9991 | /ORCID_2020_10_summaries/991/0001-0000-0003-9991-summary.xml |
0001-0000-0005-1234 | /ORCID_2020_10_summaries/234/0001-0000-0005-1234-summary.xml |
9999-9999-9999-9991 | /ORCID_2020_10_summaries/991/9999-9999-9999-9991-summary.xml |
Níže jsou uvedeny příklady toho, jak bude hierarchie složek vypadat uvnitř souboru s výpisem stavu paměti:
Soubor aktivit
Soubor aktivit se skládá z jedenácti různých komprimovaných souborů, z nichž každý obsahuje podmnožinu veřejných aktivit dostupných v době generování souborů.
Každý komprimovaný soubor bude obsahovat podmnožinu veřejných aktivit na základě posledních 3 číslic souboru ORCID id.
Například tam bude soubor ORCID_YYYY_MM_activities.tar.gz obsahující veřejné aktivity pro všechny ORCID zaznamenejte, kde je číslice kontrolního součtu 0.
Pomocí veřejného souboru
Soubor obsahuje veřejné informace spojené s údaji každého uživatele ORCID záznam. Každý záznam je zahrnut jako samostatný soubor v JSON i XML v souborech 2013-2017. V souboru 2018 je každý záznam zahrnut jako samostatný soubor v XML a každá část úplné aktivity pro každý záznam je zahrnuta jako samostatný soubor v XML. Pro ty, kteří dávají přednost JSON, použijte ORCID Knihovna konverzí převést soubory XML na JSON.
Informace o souboru XSD požadovaném k interpretaci souborů naleznete v části ο ORCID Úložiště GitHub.
Podívejte se prosím Synchronizace s ORCID o způsobech, jak můžete rozvíjet svou integraci, abyste mohli sledovat výzkumné pracovníky a jejich aktivity.