Соавтором этого сообщения в блоге является Палома Марин Аррайса и Габриэла Мехиас.
Прошлая пятница, ORCID исполнилось восемь лет, и мы приближаемся к еще одной важной вехе: 10 миллионов ORCID iDs! Как и каждый год, мы празднуем нашу годовщину и Неделю открытого доступа, выпуская Файл общедоступных данных.
Команда Файл общедоступных данных 2020 г. содержит снимок всех данных общедоступных записей в ORCID Реестр публикуется под CC0 отказ, и им может пользоваться каждый. Открытость - одна из наших основополагающих ценностей, и в рамках нашего обязательства по устранению барьеров для доступа мы публикуем файл, чтобы гарантировать всем заинтересованным сторонам широкий доступ к жизненно важной части инфраструктуры научных коммуникаций. На момент написания Файл общедоступных данных 2019 г. был скачан более 35,000 XNUMX раз.
Этот файл использовался в различных проектах в качестве источника данных для анализа взаимоотношений и индивидуальных траекторий в рамках исследовательского сообщества, научных миграций, сетей сотрудничества и принятия ORCID по дисциплинам и локациям.
Как сообщество использует файл?
Мы хотели бы представить три примера использования файлов общедоступных данных, чтобы помочь обогатить научные метаданные / записи и визуализировать связи.
dblp - Библиография по информатике
дблп предоставляет открытую библиографическую информацию по основным журналам и материалам по информатике. В 2017 году они начали отображать ORCID ID в библиографиях и отдельных публикациях. Обогащение метаданных осуществляется путем сбора данных непосредственно от издателей и объединения их с данными, полученными из файла общедоступных данных. В настоящее время, 12% их работ имеют ORCID iD. Для публикаций 18 года охват увеличивается до 2020%. Для журнала IEEE Control Systems Letters он достигает 75%. Здесь также важно выделить разъяснительную работу, проводимую Немецкий ORCID консорциум продвигать использование ORCID в этой библиографии.
Лаборатория цифровых гуманитарных наук - Институт европейской истории им. Лейбница
Чтобы визуализировать связи между авторами ДХд 2020 (т. е. конференция цифровых гуманитарных наук в немецкоязычном пространстве), Digital Humanities Lab использовала имена авторов, взятые из Книги рефератов, ORCID Примириться инструмент OpenRefine, а также сведения о филиалах ORCID iD в соответствии с файлом общедоступных данных. После обработки и очистки данных (полное описание доступно на немецком языке). в этом блоге), они достигли следующей партнерской сети:
Графическое представление персонально-аффилированной сети на основе Рефератов 2020 и ORCID IDs. 204 узла (человек: 110, красный / учреждение: 94, синий) и 183 ребра («связанные с»).
Источник: https://github.com/ieg-dhr/orcidgraph/blob/master/Orcidgraph.png и https://dhlab.hypotheses.org/1467.
Исходный код скрипта можно найти в GitHub.
OpenAire
Команда График исследований OpenAIRE - одна из крупнейших открытых коллекций научных записей во всем мире, играющая ключевую роль в развитии Открытой науки и установлении ее практик. Задуманный как публичный и прозрачный товар, созданный на основе источников данных, которым доверяют ученые, Graph направлен на то, чтобы вернуть научные открытия, мониторинг и оценку в руки научного сообщества.
Последние десять лет OpenAIRE работал над сборкой Коллекция OpenAIRE Research Graph метаданных и связей между научными продуктами, такими как статьи, наборы данных, программное обеспечение и другие исследовательские продукты; такие субъекты, как организации, спонсоры, потоки финансирования, проекты, сообщества и источники данных. На сегодняшний день эта огромная коллекция объединяет около 450 миллионов записей метаданных со ссылками, полученными из более чем 10,000 13 источников данных, которым доверяют ученые. После очистки, детализированных процессов классификации, дедупликации и обогащения с помощью полнотекстового анализа (~ 110 млн полных текстов) сегодня Graph насчитывает ~ 14 млн публикаций, ~ 200 млн наборов данных, ~ 8 тыс. Продуктов для исследования программного обеспечения, 1 млн других продуктов, связанных вместе с Семантические отношения ~ XNUMXBi.
ORCID Данные используются OpenAIRE для обогащения записей о результатах исследований на графике. OpenAire использует наш общедоступный файл данных и лямбда-файл- создается ежедневно, этот файл содержит список всех ORCID ID и дата последнего изменения. Затем он использует наш API-интерфейс для вызова записей, которые были изменены для импорта новых и обновленных метаданных из этих записей.
Эта интеграция состоит из: (i) добавления ORCID iDs в записи Crossref, которые являются частью графика, (ii) импорт записей метаданных из ORCID которые не имеют DOI, (iii) распространение iD от продуктов к продуктам, когда семантические отношения между продуктами оправдывают действие (например, если запись метаданных статьи с ORCID iD связан с записью метаданных набора данных через семантическую связь DataCite «addedBy / isSupplementTo»). OpenAIRE может служить посредником для всех источников данных, передающих метаданные в график (например, репозиториев, издателей, репозиториев данных) ORCID iD, связанные со связанными записями.
Openaire был ORCID институционального члена с начала 2020 года и планирует наладить двусторонний обмен данными, завершив ORCID Мастер поиска и ссылок (в настоящее время в разработке).
Заинтересованы в использовании файла общедоступных данных?
Если вы заинтересованы в использовании файла, вы можете скачать его с ORCID репозиторий. Файл этого года доступен в формате XML и разделен на отдельные файлы для упрощения управления. Один файл содержит полную сводку каждой записи. Остальные данные разделены на 11 файлов, которые содержат действия для каждой записи, включая полные рабочие данные. Если вы предпочитаете JSON, вы можете использовать наш ORCID Библиотека преобразования доступна в нашем репозитории Github. Конвертер представляет собой приложение Java и позволяет генерировать JSON из XML в версии по умолчанию. ORCID формат схемы сообщения (v2.0 и v2.1).
Мы выпускаем общедоступный файл данных в соответствии с CC0 1.0 Public Domain Dedication, и использование общедоступных данных осуществляется в соответствии с нашей Политикой конфиденциальности. Мы также создали рекомендуемые нормы сообщества для использования файла.
Если вы уже используете файл или планируете и у вас есть вопросы, пожалуйста, дайте нам знать о вашем варианте использования. Мы хотели бы услышать от вас!