このブログ投稿は、 PalomaMarínArraiza 及び ガブリエラメジアス.
先週の金曜日、 ORCID 10歳になり、もうXNUMXつの重要なマイルストーンであるXNUMX万に到達しようとしています。 ORCID iD! 毎年のように、私たちは私たちの記念日とオープンアクセスウィークをリリースすることで祝っています 公開データファイル.
世界 2020年公開データファイル 内のすべての公開レコードデータのスナップショットが含まれています ORCID レジストリは、 CC0免除、そして誰でも無料で使用できます。 オープン性は私たちの基本的な価値観のXNUMXつであり、アクセスの障壁を取り除く取り組みの一環として、すべての利害関係者が学術コミュニケーションインフラストラクチャの重要な部分に幅広くアクセスできるようにファイルをリリースします。 執筆時点では、 2019年公開データファイル 35,000回以上ダウンロードされました。
このファイルは、研究コミュニティ内の関係と個々の軌道の分析、科学的移行、コラボレーションネットワーク、および ORCID 分野や場所を超えて。
コミュニティはファイルをどのように使用していますか?
学術的なメタデータ/レコードを充実させ、つながりを視覚化するのに役立つパブリックデータファイルの使用例をXNUMXつ紹介します。
dblp –コンピュータサイエンスの書誌
dblp 主要なコンピュータサイエンスジャーナルおよび議事録に関するオープンな書誌情報を提供します。 2017年に、彼らは始めました 表示 ORCID iD 参考文献や個々の出版物で。 メタデータの強化は、発行者から直接データを収集し、それを公開データファイルから取得したデータと組み合わせることによって行われます。 現在、 エントリの12%に ORCID iD。 18年の出版物のカバー率は最大2020%になります。 ジャーナルIEEEControl Systems Lettersの場合、75%に達します。 ここで、 ドイツ語 ORCID コンソーシアム の使用を促進するために ORCID この参考文献で。
デジタルヒューマニティーズラボ–欧州歴史研究所ライプニッツ
の作者間のつながりを視覚化するには DHd 2020 (すなわち、ドイツ語圏でのデジタルヒューマニティーズの会議)、デジタルヒューマニティーズラボは、抄録集から抽出された著者の名前を使用しました。 ORCID 調整 OpenRefineのツール、およびの所属 ORCID 公開データファイルによるiD。 データ処理とクリーニングの後(完全な説明はドイツ語で入手可能です このブログで)、彼らは次の個人-アフィリエイトネットワークに到達しました:
Book of Abstracts2020およびに基づく個人-所属-ネットワークのグラフ表現 ORCID iD。 204ノード(人:110、赤/機関:94、青)と183エッジ(「提携」)。
ソース: https://github.com/ieg-dhr/orcidgraph/blob/master/Orcidgraph.png 及び https://dhlab.hypotheses.org/1467.
スクリプトのソースコードは次の場所にあります。 GitHubの.
OpenAIRE
世界 OpenAIREリサーチグラフ は、世界最大のオープン学術記録コレクションのXNUMXつであり、オープンサイエンスの育成とその実践の確立の鍵を握っています。 グラフは、科学者が信頼するデータソースから作成された、公的で透明性の高い商品として考案され、科学の発見、監視、評価を科学界の手に戻すことを目的としています。
過去XNUMX年間、OpenAIREは OpenAIREリサーチグラフコレクション 記事、データセット、ソフトウェア、その他の研究製品などの科学製品間のメタデータとリンク。 組織、資金提供者、資金調達の流れ、プロジェクト、コミュニティ、データソースなどのエンティティ。 今日の時点で、この大規模なコレクションは、科学者によって信頼されている450以上のデータソースから収集されたリンクを含む約10,000Miのメタデータレコードを集約しています。 フルテキストマイニング(〜13Miフルテキスト)によるクリーニング、きめ細かい分類プロセス、重複排除、および強化の後、今日、グラフは〜110Miの出版物、〜14Miのデータセット、〜200Kのソフトウェア研究製品、8Miの他の製品をカウントします。 〜1Biの意味関係。
ORCID データは、グラフの研究製品レコードを充実させるためにOpenAIREによって使用されます。 OpenAireは公開データファイルを使用しており、 ラムダファイル-毎日生成され、このファイルにはすべてのリストが含まれています ORCID iDとその最終変更日。 次に、メンバーAPIを使用して、変更されたレコードを呼び出し、それらのレコードから新しいメタデータと更新されたメタデータをインポートします。
この統合は次のもので構成されます。(i)追加 ORCID グラフの一部であるCrossrefレコードへのiD、(ii)からのメタデータレコードのインポート ORCID DOIを持たないもの、(iii)製品間のセマンティック関係がアクションを正当化する場合(たとえば、記事のメタデータレコードに ORCID iD DataCiteセマンティックリレーションシップ「supplementedBy / isSupplementTo」を介してデータセットメタデータレコードにリンクされています。 OpenAIREは、グラフにメタデータを提供するすべてのデータソース(リポジトリ、パブリッシャー、データリポジトリなど)に仲介することができます。 ORCID 関連レコードに関連付けられたiD。
Openaireは ORCID 2020年初頭から機関会員であり、 ORCID 検索とリンクウィザード(現在開発中)。
公開データファイルの使用に興味がありますか?
ファイルの使用に興味がある場合は、からダウンロードできます。 ORCID リポジトリ。 今年のファイルはXML形式で入手でき、管理を容易にするためにさらに個別のファイルに分割されています。 11つのファイルには、各レコードの完全なレコードの要約が含まれています。 残りのデータはXNUMX個のファイルに分割され、完全な作業データを含む各レコードのアクティビティが含まれています。 JSONをご希望の場合は、 ORCID Githubリポジトリで利用可能な変換ライブラリ。 コンバーターはJavaアプリケーションであり、デフォルトバージョンでXMLからJSONを生成できます。 ORCID メッセージスキーマ形式(v2.0およびv2.1)。
パブリックデータファイルはCC0 Public Domain Dedicationの下でリリースされ、パブリックデータの使用はプライバシーポリシーに準拠しています。 また、ファイルを使用するための推奨コミュニティ基準も作成しました。
すでにファイルを使用している場合、または使用する予定で質問がある場合は、 ユースケースについてお知らせください。 あなたからの御一報をお待ちしています!