透明度 是其中一个 ORCID的基本价值观,并分享我们每年的 ORCID 公共数据文件是我们致力于开放的一个例子。事实上,它嵌入在我们的 创始原则.
自推出以来 ORCID 自2012年XNUMX月注册以来,我们每年都会发布公共数据文件,供所有人免费公开访问,以确保任何感兴趣的利益相关者都能广泛访问已成为学术交流基础设施重要组成部分的数据集。我们很高兴地宣布,我们又迈出了一步——使公共数据文件更加 无障碍 — 通过与 Digital Science 合作,首次提供一种访问文件的方法,以促进探索性数据分析。
核心亮点
- ORCID 每年免费发布公共数据文件确保公众广泛参与 ORCID data
- 然而,由于公共数据文件太大, 可能很难合作,抑制探索性分析
- ORCID 会员 数字科学慷慨主办 Google Big Query 上的 2023、2024 和 2025 年公共数据文件,使公共数据文件易于探索和分析.
在这12年里 ORCID 自从开始共享公共数据文件以来,它已被下载了超过 190,000 万次,成为各种项目的数据源,例如研究界内的关系和个人轨迹分析、科学迁移、合作网络以及采用 ORCID 跨学科和跨地区。但是,我们知道使用当前形式的公共数据文件需要付出大量努力。潜在用户必须具备对如此庞大的数据集的理解和处理技能:如何下载、解析、提取和上传数据到本地环境——然后才能开始分析。
基于我们目前与 Figshare(作为公共数据文件存储库)的关系, ORCID 成员 Digital Science 现已慷慨地将 2024 年公共数据文件托管到 Dimension 的 Google Big Query (GBQ) 中,这意味着可以直接使用数据进行探索和分析,而无需先创建本地副本。
Google Big Query 是一个基于云的、完全托管的数据分析平台,针对高效处理大型数据集进行了优化。这使其成为探索和分析 ORCID 公共数据文件,其中包含数百万条记录。 ORCID 公共数据文件已用于元数据丰富等项目, 可视化作者之间的联系, 特定区域的数据共享实践, 及科学家迁移模式分析.
该服务的测试版现已推出我们希望使用它所需的较少努力将使我们的社区能够探索和开发新的创新用例 ORCID 数据,例如同行评审实践报告,或涉及链接的分析 ORCID 数据与世界银行的数据相结合。虽然数据集本身是免费提供的,并且将继续免费提供,但希望使用它的人需要建立自己的 GBQ 帐户;谷歌提供一定水平的免费使用套餐,但超过该水平的使用则收取费用。在免费套餐内,可以在配额用完之前运行许多查询。Digital Science 还提供了 示例查询 可以让你高效地查询 ORCID 数据集。
需要明确的是,这项服务是对我们存档副本的补充,而不是替代。 公共数据文件,您可以继续从我们的 Figshare 存储库下载。
里面有什么 ORCID 公共数据文件?
如上所述 在我们的网站,“ ORCID 公共数据文件包含所有人的所有公开可用信息 ORCID 创建时注册表内的 iD。 ORCID 发布公共数据文件 CC0 1.0 公有领域奉献 正如我们进一步描述的 隐私政策。 因此, ORCID 不对公共数据文件的使用施加限制或条件,但我们已在我们的网站上发布了推荐的社区规范 公共数据文件使用政策.
在此版本的服务中, ORCID Google Big Query 上的公共数据文件反映了 ORCID 摘要文件,这意味着工作级别(例如文章)元数据的扩展细节仍然只能在可下载的版本中使用 ORCID 公共数据文件可在 Figshare 上获取。
ORCID 数字科学邀请您 探索 ORCID 公共数据文件 在 Google Big Query 中。如果您在项目中使用数据,我们要求您将该工具归功于 Digital Science,并链接回他的页面,和 ORCID 作为公共数据文件的来源并链接回 这页 在技术可行的情况下,方便其他人访问。
我们很想了解您如何使用 ORCID Dimension 的 Google Big Query 工具上的公共数据文件,因此 请告诉我们!