このブログ投稿は次の共同執筆者です パロマ マリン アレイサ や ガブリエラメジアス.
先週の金曜日、 ORCID 10歳になり、もうXNUMXつの重要なマイルストーンであるXNUMX万に到達しようとしています。 ORCID アイディーズ! 毎年のように、私たちは周年とオープンアクセス週間を祝って、 公開データファイル.
また, 2020年公開データファイル すべての公開記録データのスナップショットが含まれています。 ORCID レジストリは、 CC0免除、誰でも無料で使用できます。 オープン性は私たちの基本的な価値観の XNUMX つであり、アクセスの障壁を取り除く取り組みの一環として、すべての関係者が学術コミュニケーション インフラストラクチャの重要な部分に幅広くアクセスできるようにするためにファイルをリリースします。 執筆時点では、 2019年公開データファイル 35,000回以上ダウンロードされました。
このファイルは、研究コミュニティ内の関係や個人の軌跡、科学者の移動、コラボレーション ネットワーク、および研究機関の導入を分析するためのデータ ソースとして、さまざまなプロジェクトで使用されています。 ORCID 分野や場所を超えて。
コミュニティはファイルをどのように使用していますか?
学術メタデータ/記録を充実させ、つながりを視覚化するために役立つパブリック データ ファイルの使用例を XNUMX つ紹介します。
dblp – コンピューター サイエンス参考文献
dblp 主要なコンピュータ サイエンスのジャーナルおよび論文に関する公開書誌情報を提供します。 2017年に彼らは始めました 表示 ORCID iD 参考文献や個々の出版物で。 メタデータの強化は、パブリッシャーから直接データを収集し、それを公開データ ファイルから取得したデータと組み合わせることで行われます。 現在、 エントリの 12% には、 ORCID iD。 18 年の出版物では、カバー率は 2020% まで増加します。 ジャーナル IEEE Control Systems Letters では、その割合は 75% に達します。 ここで、政府が実施した支援活動を強調することも重要です。 ドイツ語 ORCID コンソーシアム の使用を促進する ORCID この参考文献では。
デジタル ヒューマニティーズ ラボ – ライプニッツヨーロッパ史研究所
著者間のつながりを視覚化する DHD 2020 (つまり、ドイツ語圏におけるデジタル ヒューマニティーの会議)、デジタル ヒューマニティー ラボは、抄録集から抽出した著者の名前を使用しました。 ORCID 調整 OpenRefine のツールとその提携関係 ORCID iD は公開データ ファイルに基づいています。 データ処理とクリーニング後 (完全な説明はドイツ語でご覧いただけます) このブログで)、彼らは次の個人とアフィリエイトのネットワークに到達しました。
Book of Abstracts 2020 に基づく個人-所属-ネットワークのグラフ表現と ORCID iD。 204 ノード (個人: 110、赤 / 機関: 94、青) と 183 エッジ (「所属」)。
ソース: https://github.com/ieg-dhr/orcidgraph/blob/master/Orcidgraph.png や https://dhlab.hypotheses.org/1467.
スクリプトのソースコードは次の場所にあります。 GitHubの.
オープンエア
また, OpenAIREリサーチグラフ は世界最大のオープン学術記録コレクションの XNUMX つであり、オープン サイエンスを促進し、その実践を確立する上で鍵となります。 科学者が信頼するデータ ソースからデータを取り込み、透明性の高い公共財として構想された Graph は、科学の発見、監視、評価を科学コミュニティの手に取り戻すことを目的としています。
過去 XNUMX 年間、OpenAIRE は、 OpenAIREリサーチグラフコレクション メタデータと、論文、データセット、ソフトウェア、その他の研究製品などの科学製品間のリンク。 組織、資金提供者、資金の流れ、プロジェクト、コミュニティ、データ ソースなどのエンティティ。 現在、この大規模なコレクションには、科学者が信頼する 450 以上のデータ ソースから収集したリンクを含む約 10,000Mi のメタデータ レコードが集約されています。 クリーニング、きめ細かい分類プロセス、重複排除、およびフルテキスト マイニング (最大 13Mi のフルテキスト) による強化を経て、現在 Graph には、最大 110 億 14 万の出版物、最大 200Mi のデータセット、最大 8 万のソフトウェア研究製品、およびリンクされているその他の製品 1Mi がカウントされています。 ~XNUMX 双方の意味関係。
ORCID データは、グラフの研究製品レコードを充実させるために OpenAIRE によって使用されます。 OpenAire は公開データ ファイルを使用しており、 ラムダファイル—毎日生成され、このファイルにはすべてのリストが含まれます ORCID iD とその最終変更日。 次に、メンバー API を使用して変更されたレコードを呼び出し、それらのレコードから新規および更新されたメタデータをインポートします。
この統合は以下で構成されます: (i) 追加 ORCID グラフの一部である Crossref レコードへの iD、(ii) からのメタデータ レコードのインポート ORCID DOI を持たないもの、(iii) 製品間の意味論的な関係がアクションを正当化する場合 (例: 記事のメタデータ レコードが ORCID iD DataCite のセマンティック関係「supplementedBy/isSupplementTo」を介してデータセットのメタデータ レコードにリンクされます。 OpenAIRE は、グラフにメタデータを提供するすべてのデータ ソース (リポジトリ、パブリッシャー、データ リポジトリなど) を仲介することができます。 ORCID 関連レコードに関連付けられた iD。
オープンネアは、 ORCID 2020 年初頭から機関メンバーとして活動しており、協定を完了することで双方向のデータ交換を確立する予定です ORCID 検索とリンク ウィザード (現在開発中)。
公開データ ファイルの使用に興味がありますか?
ファイルの使用に興味がある場合は、からダウンロードできます。 ORCID リポジトリ。 今年のファイルは XML 形式で提供されており、管理しやすいようにさらに別のファイルに分割されています。 11 つのファイルには、各レコードの完全なレコード概要が含まれています。 残りのデータは XNUMX 個のファイルに分割されており、完全な作業データを含む各レコードのアクティビティが含まれています。 JSON を使用したい場合は、 ORCID 変換ライブラリは Github リポジトリで入手できます。 コンバーターは Java アプリケーションであり、デフォルト バージョンで XML から JSON を生成できます。 ORCID メッセージ スキーマ形式 (v2.0 および v2.1)。
当社は、CC0 1.0 パブリック ドメインの提供に基づいてパブリック データ ファイルをリリースしており、パブリック データの使用は当社のプライバシー ポリシーに従って行われます。 また、このファイルを使用するための推奨コミュニティ規範も作成しました。
すでにファイルを使用している場合、または使用する予定で質問がある場合は、 あなたのユースケースについて教えてください。 あなたからの御一報をお待ちしています!