Otevřenost je klíč ORCID hodnota, a dodržovat tuto zásadu a oslavovat Týden otevřeného přístupukaždý rok vydáváme náš roční veřejný datový soubor. Soubor 2019, který je nyní k dispozici, obsahuje přehled všech ORCID zaznamenávat data, která výzkumníci označili jako veřejná v ORCID Registr v době, kdy byl soubor vytvořen 1. října 2019. Náš veřejný datový soubor je publikován pod a CC0 prominutí a je pro každého zdarma - v době psaní tohoto článku, loňský spis byly zobrazeny více než 5,000 3,200krát a staženy více než XNUMX XNUMXkrát.
Jak je rok 2019 ORCIDRok výzkumného pracovníka, tentokrát jsme rádi, že se s vámi můžeme podělit o dva příklady výzkumných pracovníků, kteří pro účely svého výzkumu používají data z našich veřejných datových souborů.
Dario Rodighiero (Postdoctoral Associate ve společnosti MIT, Faculty of Comparative Media Studies / Writing)
Jedno Celosvětová mapa výzkumu je projekt, který analyzuje výzkumnou komunitu z hlediska vztahů a jednotlivých trajektorií. Spoléhá se na ORCID veřejný datový soubor - dobrý příklad toho, jak může nezisková organizace podpořit otevření výzkumu a přístupný všem - a také moje cesta mimo podporu ORCID iniciativa. Projekt pochází z mého Disertační práce který ilustruje vizuální metodu, která představuje fakultu EPFL. Díky podpoře Švýcarská národní vědecká nadace, můj výzkum se nyní rozšířil v rozsahu, od jednotlivých členů fakulty k analýze světových institucí a univerzit. Můj interdisciplinární přístup mi umožňuje zkoumat ORCID datová sada ze dvou hledisek. První je čistě vizuální a zaměřuje se na způsob, jakým mohou být jednotlivci a instituce správně a spravedlivě reprezentováni pomocí grafického designu. Druhá je o zpracování dat s využitím nejnovějšího vývoje v oblasti zpracování přirozeného jazyka a umělé inteligence k získání smysluplných informací. Průsečík těchto dvou perspektiv umožňuje nový způsob provádění výzkumu tím, že se současně uvažuje o výpočtu, vizualizaci a interpretaci dat. Tento konkrétní projekt se zaměřuje na tři jednoduché kroky: 1) studium spolupráce mezi institucemi (viz obrázek níže), 2) analýza jednotlivých trajektorií vědců přes ústavy v čase a 3) vytvoření systému doporučení založeného na shromážděné a generované údaje. Jsem vděčný svému nadřízenému Kurtu Fendtovi, MIT a mým kolegům, Ringgold za to, že mi umožnil používat jejich databázi, Harvard MetaLab za jejich intelektuální podporu Mauro Martino (IBM) a Paolo Ciuccarelli (Northeastern University) za radu a Abram Turner (MIT) za pomoc poskytnutou během jeho stáže.
Robert Eyre (PhD kandidát na University of Bristol, Department of Engineering Mathematics)
Ze všech možných kariérních cest mají akademičtí vědci možná největší příležitost cestovat a migrovat na mezinárodní úrovni, protože vytvářejí nové vazby a vztahy spolupráce. Pro studium jejich migrací lze zkoumat výstupy akademických pracovníků, aby se vytvořila trajektorie přidružení v průběhu času. To však může být obtížné, když vědci sdílejí stejný název, což je běžný problém v migračních studiích, které používají bibliometrická data. Abychom tomu zabránili, můžeme z veřejnosti získat životopisy milionů výzkumných pracovníků ORCID veřejný datový soubor. Tato sada dat je více než 300krát větší než největší známá e-mailová studie o vědecké migraci, kterou provedl Franzoni a kol. v roce 2012.
Plánujeme rozšířit naše používání ORCID Veřejný datový soubor k identifikaci dopadu vybraných událostí (jako je Brexit nebo krize eurozóny) na migraci ve výzkumné komunitě. Pracujeme na metodě, jak se vyhnout nesrovnalostem v datech, jako je nadměrné zastoupení lidí, kteří nedávno získali doktorát, a nadměrné a nedostatečné zastoupení jednotlivých zemí. Toho bude dosaženo vytvořením randomizovaných referenčních modelů pro pozorovaná data a porovnáním těchto modelů s naším pozorovaným získáním časové sítě p-hodnoty pro každé možné rozhodnutí o migraci v každém roce. Tato skóre nám umožní určit, ve kterých letech došlo k neobvyklému počtu migrací.
Více o ORCID veřejný datový soubor
Pokud máte zájem o použití našeho veřejného souboru dat, můžete si jej stáhnout z ORCID Sklad. Letošní spis je k dispozici ve formátu XML a je pro snadnější správu dále rozdělen do samostatných souborů. Jeden soubor obsahuje úplné shrnutí záznamu pro každý záznam. Zbytek dat je rozdělen do 11 souborů, které obsahují aktivity pro každý záznam včetně úplných pracovních dat.
Veřejný datový soubor vydáváme pod a CC0 1.0 Věnování veřejné domény a používání veřejných údajů je v souladu s našimi Zásady ochrany osobních údajů. Vytvořili jsme doporučené komunitní normy použít soubor.
Pokud plánujete nebo již používáte veřejný datový soubor pro svůj výzkum, prosím Dej nám vědět, rádi bychom vás slyšeli!