Открытость один из ORCIDосновополагающие ценности и разделяем наши ежегодные ORCID Public Data File — один из примеров нашей приверженности открытости. Фактически, он встроен в нашу основополагающие принципы.
С момента запуска ORCID реестр в октябре 2012 года, мы ежегодно публикуем Public Data File, доступный всем свободно и открыто, как средство обеспечения того, чтобы любой заинтересованный участник имел широкий доступ к набору данных, который стал важной частью инфраструктуры научной коммуникации. Мы рады сообщить, что теперь мы сделали еще один шаг вперед — чтобы сделать Public Data File более доступной — в сотрудничестве с Digital Science мы обеспечиваем доступ к файлу таким образом, который впервые упрощает исследовательский анализ данных.
Основные моменты:
- ORCID ежегодно публикует файл публичных данных бесплатно, чтобы обеспечить широкий доступ к общественным ORCID данным
- Однако, поскольку файл публичных данных очень большой, с этим может быть трудно работать, препятствуя исследовательскому анализу
- ORCID член Digital Science щедро принимает Публичный файл данных 2024 года в Google Big Query, что делает файл публичных данных легко доступным для изучения и анализа.
За 12 лет, что ORCID распространяет файл публичных данных, он был загружен более 190,000 XNUMX раз, служа источником данных для разнообразных проектов, таких как анализ взаимосвязей и индивидуальных траекторий в рамках исследовательского сообщества, научные миграции, сети сотрудничества и принятие ORCID по дисциплинам и местоположениям. Однако мы понимаем, что использование Public Data File в его нынешнем виде требует больших усилий. Потенциальные пользователи должны обладать пониманием и навыками работы с таким значительным набором данных: как загружать, анализировать, извлекать и загружать данные в локальную среду — еще до начала анализа.
Опираясь на наши текущие отношения с Figshare, который служит хранилищем публичного файла данных, ORCID Член Digital Science теперь великодушно предложил разместить публичный файл данных 2024 года в Google Big Query (GBQ) Dimension, что означает, что данные будут доступны для изучения и анализа напрямую, без необходимости предварительного создания локальной копии.
Google Big Query — это облачная, полностью управляемая платформа анализа данных, оптимизированная для эффективной обработки больших наборов данных. Это делает ее идеальной платформой для исследования и анализа ORCID Публичный файл данных, содержащий миллионы записей. ORCID Публичный файл данных использовался для таких проектов, как обогащение метаданных, визуализация связей между авторами, практика обмена данными в определенном регионе, и анализ схем миграции ученых.
Бета-версия этого сервиса уже доступна, и мы надеемся, что меньшие усилия, необходимые для его использования, позволят нашему сообществу исследовать и разрабатывать новые инновационные варианты использования ORCID данные, такие как отчеты о практике экспертной оценки или анализ, включающий связывание ORCID данные с данными Всемирного банка. Хотя сам набор данных находится и будет оставаться в свободном доступе, желающим его использовать необходимо будет создать собственную учетную запись GBQ; Google предлагает бесплатный уровень использования до определенного уровня, но взимает плату за использование сверх этого. В рамках бесплатного уровня можно выполнить много запросов, прежде чем закончится квота. Digital Science также предоставила пример образцы запросов которые позволяют вам эффективно запрашивать различные части ORCID набор данных.
Для ясности: эта услуга предлагается в дополнение к архивным копиям наших Файл общедоступных данных, которые по-прежнему доступны для загрузки из нашего репозитория Figshare.
Что в ORCID Публичный файл данных?
Как упоминалось на нашем сайте, ORCID Файл публичных данных содержит всю общедоступную информацию для всех ORCID идентификаторы в реестре на момент создания. ORCID выпускает файл общедоступных данных под CC0 1.0 Посвящение общественному достоянию как описано далее в нашем Персональные данные, Соответственно, ORCID не накладывает ограничений или условий на использование Публичного файла данных, но мы опубликовали рекомендуемые нормы сообщества в нашем Политика использования файлов общедоступных данных.
В этой версии сервиса ORCID Публичный файл данных в Google Big Query отражает данные, которые содержатся в ORCID файлы резюме, что означает, что расширенные сведения о метаданных уровня работы (например, статьи) по-прежнему доступны только в загружаемых версиях ORCID Публичный файл данных доступен на Figshare.
ORCID и цифровая наука приглашает вас исследовать ORCID Файл общедоступных данных в Google Big Query. Если вы используете данные в своем проекте, мы просим вас указать ссылку на Digital Science для инструмента, ссылаясь на tего страницаИ ORCID в качестве источника файла общедоступных данных и ссылку на эту страницу где это технически возможно, для облегчения доступа другим лицам.
Мы хотели бы узнать, как вы используете ORCID Публичный файл данных в инструменте Google Big Query компании Dimension, поэтому пожалуйста дай нам знать!