這篇博文的共同作者是 帕洛瑪·馬林·阿拉薩 和 加布里埃拉·梅吉亞斯.
上週五, ORCID 八歲了,我們即將達到另一個重要的里程碑:10 萬 ORCID ID! 正如我們每年所做的那樣,我們通過發布我們的 公共數據文件.
2020年公共數據文件 包含所有公共記錄數據的快照 ORCID 註冊表,是在 CC0 豁免,並且免費供所有人使用。 開放是我們的基本價值觀之一,作為我們消除訪問障礙的承諾的一部分,我們發布該文件以確保所有利益相關者都能廣泛訪問學術交流基礎設施的重要部分。 在撰寫本文時, 2019年公共數據文件 下載次數超過 35,000 次。
該文件已在不同的項目中用作數據源,用於分析研究社區內的關係和個人軌跡、科學遷移、協作網絡以及採用 ORCID 跨學科和地點。
社區如何使用該文件?
我們想介紹公共數據文件使用的三個示例,以幫助豐富學術元數據/記錄並可視化連接。
dblp——計算機科學參考書目
數據庫 提供主要計算機科學期刊和會議論文集的開放書目信息。 2017年,他們開始 展示 ORCID 身份證 在參考書目和個人出版物中。 元數據豐富是通過直接從發布者處獲取數據並將其與從公共數據文件獲得的數據相結合來完成的。 現在, 12% 的參賽作品有 ORCID iD。 18 年出版物的覆蓋率高達 2020%。 對於 IEEE Control Systems Letters 期刊,這一比例達到 75%。 在此強調一下由以下機構開展的外展工作也很重要: 德語 ORCID 財團 促進使用 ORCID 在本參考書目中。
數字人文實驗室 – 萊布尼茨歐洲歷史研究所
可視化作者之間的聯繫 DH 2020 (即德語區數字人文會議),數字人文實驗室使用了從摘要書中提取的作者姓名, ORCID 調和 OpenRefine 工具以及其隸屬關係 ORCID 根據公共數據文件的 iD。 數據處理和清理後(完整的描述有德語版) 在這個博客上),他們到達了以下個人附屬網絡:
基於 Book of Abstracts 2020 的人員隸屬關係網絡的圖形表示和 ORCID ID。 204 個節點(人:110,紅色/機構:94,藍色)和 183 個邊(“隸屬”)。
資源: https://github.com/ieg-dhr/orcidgraph/blob/master/Orcidgraph.png 和 https://dhlab.hypotheses.org/1467.
該腳本的源代碼可以在 GitHub上.
露天
OpenAIRE 研究圖 是全球最大的開放學術記錄收藏之一,對於促進開放科學和建立其實踐至關重要。 Graph 被認為是一種公共且透明的商品,由科學家信任的數據源填充,旨在將科學的發現、監測和評估重新交到科學界手中。
在過去的十年中,OpenAIRE 一直致力於組裝 OpenAIRE 研究圖集 元數據以及科學產品(例如文章、數據集、軟件和其他研究產品)之間的鏈接; 組織、資助者、資金流、項目、社區和數據源等實體。 截至目前,這個龐大的集合匯總了大約 450Mi 元數據記錄,以及從科學家信任的 10,000 多個數據源收集的鏈接。 經過清理、細粒度分類過程、重複數據刪除和通過全文挖掘(~13Mi 全文)進行豐富之後,今天該圖統計了~110Mi 出版物、~14Mi 數據集、~200K 軟件研究產品、8Mi 鏈接在一起的其他產品~1Bi 語義關係。
ORCID OpenAIRE 使用數據來豐富圖表的研究產品記錄。 OpenAire 正在使用我們的公共數據文件並且 拉姆達文件—每天生成,該文件包含所有的列表 ORCID iD 及其最後修改日期。 然後,它使用我們的會員 API 調用已修改的記錄,以從這些記錄中導入新的和更新的元數據。
該集成包括:(i) 添加 ORCID 作為圖表一部分的 iD 到 Crossref 記錄,(ii) 從 ORCID 沒有 DOI,(iii) 當產品之間的語義關係證明該操作合理時,將 ID 從產品傳播到產品(例如,如果文章元數據記錄帶有 ORCID iD 通過 DataCite 語義關係“supplementedBy/isSupplementTo”鏈接到數據集元數據記錄。 OpenAIRE 能夠代理向圖表貢獻元數據的所有數據源(例如存儲庫、發布者、數據存儲庫) ORCID 與相關記錄關聯的 ID。
Openaire 一直是 ORCID 自 2020 年初以來成為機構成員,併計劃通過完成 ORCID 搜索和鏈接嚮導(目前正在開發中)。
有興趣使用公共數據文件嗎?
如果您有興趣使用該文件,可以從以下位置下載: ORCID 存儲庫。 今年的文件採用 XML 格式,並進一步分為單獨的文件,以便於管理。 一個文件包含每條記錄的完整記錄摘要。 其餘數據分為 11 個文件,其中包含每個記錄的活動,包括完整的工作數據。 如果您更喜歡 JSON,您可以使用我們的 ORCID 我們的 Github 存儲庫中提供了轉換庫。 該轉換器是一個 Java 應用程序,在默認版本中可以從 XML 生成 JSON ORCID 消息架構格式(v2.0 和 v2.1)。
我們根據 CC0 1.0 公共領域奉獻發佈公共數據文件,並且公共數據的使用符合我們的隱私政策。 我們還創建了使用該文件的推薦社區規範。
如果您已經在使用該文件,或者打算使用該文件並有疑問, 請告訴我們您的用例。 我們很樂意聽取您的意見!