Bu blog gönderisinin ortak yazarı Paloma Marin Arraiza ve Gabriela Mejias.
Geçen cuma, ORCID sekiz yaşına girdik ve önemli bir kilometre taşına daha ulaşmak üzereyiz: 10 milyon ORCID Kimlikler! Her yıl olduğu gibi yıl dönümümüzü ve Açık Erişim Haftasını kutluyoruz. Genel Veri Dosyası.
The 2020 Kamu Veri Dosyası içindeki tüm genel kayıt verilerinin bir anlık görüntüsünü içerir. ORCID Kayıt, bir altında yayınlanır CC0 feragat, ve herkesin kullanması ücretsizdir. Açıklık temel değerlerimizden biridir ve erişimin önündeki engelleri kaldırma taahhüdümüzün bir parçası olarak, tüm paydaşların bilimsel iletişim altyapısının hayati bir parçasına geniş erişime sahip olmasını sağlamak için dosyayı yayınlıyoruz. Yazma sırasında, 2019 Kamu Veri Dosyası 35,000'den fazla kez indirildi.
Dosya, araştırma topluluğu içindeki ilişkilerin ve bireysel yörüngelerin analizi, bilimsel geçişler, işbirliği ağları ve benimsenmesi için bir veri kaynağı olarak farklı projelerde kullanılmıştır. ORCID disiplinler ve konumlar arasında.
Topluluk dosyayı nasıl kullanıyor?
Bilimsel meta verileri/kayıtları zenginleştirmeye ve bağlantıları görselleştirmeye yardımcı olmak için Kamu Veri Dosyasının kullanımına ilişkin üç örnek sunmak istiyoruz.
dblp - Bilgisayar Bilimi Kaynakçası
çift taraflı başlıca bilgisayar bilimi dergileri ve tutanakları hakkında açık bibliyografik bilgiler sağlar. 2017'de başladılar sergileyen ORCID kimlikler bibliyografyalarda ve bireysel yayınlarda. Meta veri zenginleştirmesi, verileri doğrudan yayıncılardan toplayarak ve bunları genel veri dosyasından elde edilen verilerle birleştirerek yapılır. Şu anda, Girişlerinin %12'sinde ORCID iD. Kapsam, 18 yayınları için %2020'e kadar çıkıyor. IEEE Control Systems Letters dergisi için %75'e ulaşıyor. tarafından yürütülen sosyal yardım çalışmalarını da burada vurgulamak önemlidir. Almanca ORCID konsorsiyum kullanımını teşvik etmek ORCID bu bibliyografyada
Dijital Beşeri Bilimler Laboratuvarı – Leibniz Avrupa Tarihi Enstitüsü
Yazarlar arasındaki bağlantıları görselleştirmek için DHd 2020 (yani, Almanca konuşulan alanda dijital beşeri bilimler konferansı), Digital Humanities Lab, Özetler Kitabından alınan yazarların adlarını kullandı. ORCID uzlaştırmak OpenRefine aracı ve ORCID Genel Veri Dosyasına göre kimlikler. Veri işleme ve temizlemeden sonra (tam açıklama Almanca olarak mevcuttur) Bu blogda), aşağıdaki kişi-bağlı kuruluş ağına ulaştılar:
Özetler Kitabı 2020'ye dayalı kişi-bağlılık-ağının grafik gösterimi ve ORCID Kimlikler. 204 düğüm (kişi: 110, kırmızı / kurum: 94, mavi) ve 183 kenar (“bağlı”).
Kaynak: https://github.com/ieg-dhr/orcidgraph/blob/master/Orcidgraph.png ve https://dhlab.hypotheses.org/1467.
Komut dosyasının kaynak kodu şurada bulunabilir: GitHub.
Açık hava
The OpenAIRE Araştırma Grafiği dünya çapındaki en büyük açık bilimsel kayıt koleksiyonlarından biridir ve Açık Bilimi geliştirmede ve uygulamalarını oluşturmada kilit rol oynar. Kamuya açık ve şeffaf bir ürün olarak tasarlanan, bilim adamlarının güvendiği veri kaynaklarından oluşan Graph, bilimin keşfini, izlenmesini ve değerlendirilmesini bilim camiasının eline geri getirmeyi amaçlıyor.
Son on yıldır OpenAIRE, OpenAIRE Araştırma Grafiği koleksiyonu makaleler, veri kümeleri, yazılımlar ve diğer araştırma ürünleri gibi bilimsel ürünler arasındaki meta veriler ve bağlantılar; kuruluşlar, fon sağlayıcılar, fon akışları, projeler, topluluklar ve veri kaynakları gibi varlıklar. Bugün itibariyle, bu büyük koleksiyon, bilim adamlarının güvendiği 450'den fazla veri kaynağından toplanan bağlantılarla yaklaşık 10,000Mi meta veri kaydını bir araya getiriyor. Temizleme, ayrıntılı sınıflandırma süreçleri, veri tekilleştirme ve tam metin madenciliği (~13Mi tam metin) yoluyla zenginleştirmeden sonra, bugün Grafik ~110Milyon yayın, ~14Milyon veri seti, ~200K yazılım araştırma ürünü, birbiriyle bağlantılı 8Mi diğer ürünü sayar. ~1Bi anlamsal ilişkiler.
ORCID veriler OpenAIRE tarafından grafiğin araştırma ürünü kayıtlarını zenginleştirmek için kullanılır. OpenAire, genel veri dosyamızı kullanıyor ve lambda dosyası—günlük olarak oluşturulur, bu dosya tüm ORCID Kimlikler ve son değiştirilme tarihleri. Daha sonra, bu kayıtlardan yeni ve güncellenmiş meta verileri içe aktarmak üzere değiştirilmiş kayıtları aramak için Üye API'mizi kullanır.
Bu entegrasyon şunlardan oluşur: (i) ekleme ORCID Grafiğin parçası olan Crossref kayıtlarına iD'ler, (ii) meta veri kayıtlarını ORCID DOI'si olmayan, (iii) ürünler arasındaki anlamsal ilişkiler eylemi haklı çıkardığında kimlikleri ürünlerden ürünlere yaymak (örn. ORCID iD DataCite semantik ilişkisi "supplementedBy/isSupplementTo" aracılığıyla bir veri kümesi meta veri kaydına bağlıdır. OpenAIRE, grafiğe meta veri sağlayan tüm veri kaynaklarına (örneğin, havuzlar, yayıncılar, veri havuzları) aracılık etme yeteneğine sahiptir. ORCID İlgili kayıtlarla ilişkili kimlikler.
Openaire bir oldu ORCID 2020'nin başından beri kurumsal üye ve bir tamamlayarak çift yönlü bir veri alışverişi kurmayı planlıyor. ORCID Arama ve Bağlantı sihirbazı (şu anda geliştirme aşamasındadır).
Genel Veri Dosyasını kullanmakla ilgileniyor musunuz?
Dosyayı kullanmakla ilgileniyorsanız, şu adresten indirebilirsiniz: ORCID depo. Bu yılki dosya XML formatında mevcuttur ve daha kolay yönetim için ayrı dosyalara bölünmüştür. Bir dosya, her kayıt için tam kayıt özetini içerir. Verilerin geri kalanı, tam çalışma verilerini içeren her bir kayıt için etkinlikleri içeren 11 dosyaya bölünmüştür. JSON'u tercih ederseniz, bizim ORCID Github depomuzda bulunan Dönüşüm Kitaplığı. Dönüştürücü bir Java uygulamasıdır ve varsayılan sürümde XML'den JSON oluşturulmasını sağlar ORCID mesaj şeması formatı (v2.0 ve v2.1).
Kamuya açık veri dosyasını bir CC0 1.0 Kamusal Alan Ayırma kapsamında yayınlıyoruz ve kamuya açık verilerin kullanımı Gizlilik Politikamıza uygundur. Dosyayı kullanmak için önerilen topluluk normlarını da oluşturduk.
Dosyayı zaten kullanıyorsanız veya kullanmayı planlıyorsanız ve sorularınız varsa, lütfen kullanım durumunuz hakkında bize bilgi verin. Sizden haber almak isteriz!