ORCID 共享一个 公共数据文件 至少每年在我们 2012 年 XNUMX 月首次发布的周年纪念日。共享年度公共数据文件是我们的主要原则之一。 我们发布文件以确保所有利益相关者,包括非成员组织 ORCID,可以广泛访问我们希望成为学术交流基础设施重要组成部分的内容。
文件中数据的使用受 数据文件使用条款 和我们的 隐私政策 (摘录如下):
ORCID 正在根据知识共享开发的 CC0 1.0 公共领域奉献发布公共数据文件。 因此, ORCID 不会对公共数据文件的使用施加限制或条件(包括使用条款和条件和会员协议中包含的限制或条件),但已张贴 推荐使用的社区规范.
下载公共数据文件
访问以下链接以下载年度公共数据文件。
在法律允许的范围内, ORCID,Inc 已放弃所有版权和相关或邻接权 ORCID 公共数据文件。 本作品发表于:美国。
访问文件的软件
- Windows上: 解压tar文件的工具,例如 WinRAR的 or 7zip
- 苹果: 不需要额外的软件
- XML-JSON 转换:从 2018 年开始,该文件仅以 XML 格式提供。 继续阅读以了解如何生成文件的 JSON 版本。
工艺
- 从上面的链接下载文件。 每年的数据文件可能包含多个 tar.gz 文件。 例如,2018 年文件包含一个 tar.gz 存档,用于所有 ORCID 记录和一个用于所有记录活动的 tar.gz 存档。
- Windows上: 使用您下载的工具(Winrar 或 7zip)解压 tar.gz 文件; 这将产生一个单一的 .tar 文件(它可能没有扩展名)。 您可能需要在 .tar 文件上再次运行该工具以解压缩它。
苹果: 双击tar.gz文件解压; 这将产生一个单一的 .tar 文件(它可能没有扩展名)。 双击 .tar 文件将其解压缩。 - 每个文件的输出文件夹将根据生成文件的年份和 XSD 版本而有所不同。
- 2013-2017:在生成的文件夹中,您会发现多个文件夹,例如 json/ 和 xml/。 每个文件夹内都有一个文件 ORCID 以指定的格式和 XSD 版本记录。
- 2018+,记录文件:在生成的文件夹中,你会发现一个文件夹,summary/,其中包含多个文件夹,其中包含个人 ORCID XML 格式的记录。 记录根据共享的最后三位数字聚合到子文件夹中 ORCID ID。
- 2018+,活动文件:在生成的文件夹中,您会发现每个文件夹都有多个文件夹 ORCID 记录。 每个文件夹将包含每个文件夹的完整活动 ORCID XML 格式的记录,由活动小节分隔。
记录摘要y个文件
摘要文件是一个 tar 文件,其中包含所有现有的公共记录摘要 ORCID 当时可用的记录 ORCID 生成了文件。 该文件是带有根文件夹的 tar 文件 ORCID_YYYY_MM_summaries.tar.gz.
文件夹层次结构将由文件夹的最后三位数字定义 ORCID iD 如下图所示:
下面是一些文件夹结构的例子 ORCID 身份证:
ORCID iD | 转储文件中的路径 |
0000-0000-0000-0001 | /ORCID_2020_10_summaries/001/0000-0000-0000-0001-summary.xml |
0000-0000-0000-0002 | /ORCID_2020_10_summaries/002/0000-0000-0000-0002-summary.xml |
0000-0000-0000-001X | /ORCID_2020_10_summaries/01X/0000-0000-0000-001X-summary.xml |
0000-0000-0001-001X | /ORCID_2020_10_summaries/01X/0000-0000-0001-001X-summary.xml |
0000-0000-0003-0001 | /ORCID_2020_10_summaries/001/0000-0000-0003-0001-summary.xml |
0001-0000-0003-9991 | /ORCID_2020_10_summaries/991/0001-0000-0003-9991-summary.xml |
0001-0000-0005-1234 | /ORCID_2020_10_summaries/234/0001-0000-0005-1234-summary.xml |
9999-9999-9999-9991 | /ORCID_2020_10_summaries/991/9999-9999-9999-9991-summary.xml |
以下是文件夹层次结构在转储文件中的外观示例:
活动档案
活动文件由 XNUMX 个不同的压缩文件组成,每个文件都包含生成文件时可用的公共活动的子集。
每个压缩文件将包含公共活动的子集,基于文件的最后 3 位数字 ORCID ID。
比如会有一个文件 ORCID_YYYY_MM_activities.tar.gz 包含每个人的公共活动 ORCID 记录校验和位为 0 的位置。
使用公共文件
该文件包含与每个用户相关联的公共信息 ORCID 记录。 每条记录都作为单独的文件包含在 2013-2017 文件的 JSON 和 XML 中。 在 2018 年的文件中,每条记录都作为单独的 XML 文件包含在内,每条记录的每个完整活动部分都作为单独的 XML 文件包含在内。 对于那些喜欢 JSON 的人,请使用 ORCID 转换库 将 XML 文件转换为 JSON。
有关解释文件所需的 XSD,请参阅 此 ORCID GitHub 存储库。
请参阅 同步 ORCID 开发集成的方式,使您能够跟踪研究人员及其活动。