이 블로그 게시물은 다음과 같이 공동 작성되었습니다. 팔로마 마린 아라이자 와 가브리엘라 메지 아스.
지난 금요일, ORCID 10 살이되었고, 우리는 또 다른 중요한 이정표 인 천만 ORCID 아이즈! 매년 그렇듯이 우리는 기념일과 오픈 액세스 주간을 기념하여 공용 데이터 파일.
XNUMXD덴탈의 2020 공공 데이터 파일 에 있는 모든 공개 기록 데이터의 스냅샷을 포함합니다. ORCID 레지스트리는 CC0 면제, 누구나 무료로 사용할 수 있습니다. 개방성은 우리의 기본 가치 중 하나이며 액세스 장벽을 제거하기 위한 노력의 일환으로 모든 이해 관계자가 학술 커뮤니케이션 인프라의 중요한 부분에 광범위하게 액세스할 수 있도록 파일을 공개합니다. 작성 당시, 2019 공공 데이터 파일 35,000회 이상 다운로드되었습니다.
이 파일은 연구 커뮤니티 내 관계 및 개별 궤적 분석, 과학적 마이그레이션, 협업 네트워크 및 ORCID 분야와 위치에 걸쳐.
커뮤니티는 파일을 어떻게 사용합니까?
학술 메타데이터/레코드를 풍부하게 하고 연결을 시각화하는 데 도움이 되는 공용 데이터 파일 사용의 세 가지 예를 제시하고자 합니다.
dblp – 컴퓨터 과학 참고 문헌
DBLP 주요 컴퓨터 과학 저널 및 절차에 대한 공개 서지 정보를 제공합니다. 2017년, 그들은 시작했다 표시 ORCID iD 참고 문헌 및 개별 출판물에서. 메타데이터 보강은 게시자로부터 직접 데이터를 수집하고 공개 데이터 파일에서 얻은 데이터와 결합하여 수행됩니다. 현재, 출품작의 12%는 ORCID iD. 18년 간행물의 경우 적용 범위가 최대 2020%까지 올라갑니다. 저널 IEEE Control Systems Letters의 경우 75%에 이릅니다. 여기에서 수행한 아웃리치 작업을 강조하는 것도 중요합니다. 독일 사람 ORCID 협회 사용을 촉진하기 위해 ORCID 이 참고 문헌에서.
디지털 인문학 연구실 – 라이프니츠 유럽사 연구소
저자 간의 연결을 시각화하려면 DHD 2020 (즉, 독일어권 공간에서의 디지털 인문학 학회), 디지털 인문학 연구실은 초록집에서 추출한 저자명을 사용하였고, ORCID 조정하기 OpenRefine의 도구 및 제휴 ORCID 공개 데이터 파일에 따른 ID. 데이터 처리 및 청소 후(전체 설명은 독일어로 제공됨) 이 블로그에), 그들은 다음 개인 제휴 네트워크에 도달했습니다.
Book of Abstracts 2020 및 ORCID 아이디. 204개의 노드(사람: 110, 빨간색 / 기관: 94, 파란색) 및 183개의 에지("관련").
출처: https://github.com/ieg-dhr/orcidgraph/blob/master/Orcidgraph.png 와 https://dhlab.hypotheses.org/1467.
스크립트의 소스 코드는 다음에서 찾을 수 있습니다. GitHub의.
오픈에어
XNUMXD덴탈의 OpenAIRE 연구 그래프 전 세계에서 가장 큰 개방형 학술 기록 컬렉션 중 하나이며 개방형 과학을 육성하고 그 관행을 확립하는 데 핵심입니다. 과학자들이 신뢰하는 데이터 소스로 채워진 공공적이고 투명한 상품으로 생각되는 Graph는 과학 커뮤니티의 손에 과학의 발견, 모니터링 및 평가를 다시 제공하는 것을 목표로 합니다.
지난 XNUMX년 동안 OpenAIRE는 OpenAIRE 연구 그래프 컬렉션 기사, 데이터 세트, 소프트웨어 및 기타 연구 제품과 같은 과학 제품 간의 메타데이터 및 링크; 조직, 자금 제공자, 자금 흐름, 프로젝트, 커뮤니티 및 데이터 소스와 같은 엔터티. 현재 이 방대한 컬렉션은 과학자들이 신뢰하는 450개 이상의 데이터 소스에서 수집한 링크와 함께 약 10,000Mi 메타데이터 레코드를 집계합니다. 전체 텍스트 마이닝(~13Mi 전체 텍스트)을 통한 정리, 세분화된 분류 프로세스, 중복 제거 및 보강 후 현재 Graph는 ~110Mi 간행물, ~14Mi 데이터 세트, ~200K 소프트웨어 연구 제품, ~8Bi 시맨틱 관계와 함께 연결된 1Mi 기타 제품을 계산합니다.
ORCID 데이터는 OpenAIRE에서 그래프의 연구 제품 기록을 풍부하게 하는 데 사용됩니다. OpenAire는 공개 데이터 파일을 사용하고 있으며 람다 파일—매일 생성되며 이 파일에는 모든 ORCID iD 및 최종 수정 날짜. 그런 다음 회원 API를 사용하여 해당 레코드에서 새롭고 업데이트된 메타데이터를 가져오도록 수정된 레코드를 호출합니다.
이 통합은 다음으로 구성됩니다. (i) 추가 ORCID iD를 그래프의 일부인 Crossref 레코드로, (ii) 메타데이터 레코드 가져오기 ORCID (iii) 제품 간의 의미론적 관계가 작업을 정당화할 때 제품에서 제품으로 iD 전파(예: 문서 메타데이터가 ORCID iD DataCite 시맨틱 관계 "supplementedBy/isSupplementTo"를 통해 데이터 세트 메타데이터 레코드에 연결됩니다. OpenAIRE는 그래프에 메타데이터를 제공하는 모든 데이터 소스(예: 리포지토리, 게시자, 데이터 리포지토리)를 중개할 수 있습니다. ORCID 관련 레코드와 연결된 iD입니다.
오픈네어는 ORCID 2020년 초부터 기관회원으로 가입되어 있으며, ORCID 검색 및 연결 마법사(현재 개발 중).
공개 데이터 파일 사용에 관심이 있으십니까?
파일 사용에 관심이 있는 경우 다음에서 다운로드할 수 있습니다. ORCID 저장소. 올해의 파일은 XML 형식으로 제공되며 더 쉽게 관리할 수 있도록 별도의 파일로 나뉩니다. 하나의 파일에는 각 레코드에 대한 전체 레코드 요약이 포함되어 있습니다. 나머지 데이터는 전체 작업 데이터를 포함하여 각 기록에 대한 활동을 포함하는 11개의 파일로 나뉩니다. JSON을 선호하는 경우 다음을 사용할 수 있습니다. ORCID Github 리포지토리에서 사용할 수 있는 변환 라이브러리입니다. 변환기는 Java 애플리케이션이며 기본 버전의 XML에서 JSON을 생성할 수 있습니다. ORCID 메시지 스키마 형식(v2.0 및 v2.1).
우리는 CC0 1.0 공개 도메인 기부에 따라 공개 데이터 파일을 공개하며 공개 데이터의 사용은 개인 정보 보호 정책에 따릅니다. 또한 파일을 사용하기 위한 권장 커뮤니티 규범을 만들었습니다.
이미 파일을 사용 중이거나 질문이있는 경우 사용 사례에 대해 알려주십시오.. 우리는 당신의 의견을 듣고 싶습니다!