شارك في تأليف هذه المدونة بالوما مارين أرايزا غابرييلا ميخياس.
الجمعة الماضية، ORCID في الثامنة ، ونحن على وشك الوصول إلى معلم هام آخر: 10 ملايين ORCID معرفات! كما نفعل كل عام ، نحتفل بالذكرى السنوية وأسبوع الوصول المفتوح من خلال إصدار ملف البيانات العامة.
إنّ 2020 ملف البيانات العامة يحتوي على لقطة لجميع بيانات السجل العام في ملف ORCID السجل ، يتم نشره تحت أ تنازل CC0، وهو مجاني للاستخدام للجميع. الانفتاح هو أحد قيمنا التأسيسية ، وكجزء من التزامنا بإزالة العوائق التي تحول دون الوصول ، نصدر الملف للتأكد من أن جميع أصحاب المصلحة لديهم وصول واسع إلى جزء حيوي من البنية التحتية للتواصل العلمي في وقت كتابة هذا التقرير ، كان 2019 ملف البيانات العامة تم تنزيله أكثر من 35,000 مرة.
تم استخدام الملف في مشاريع مختلفة كمصدر بيانات لتحليل العلاقات والمسارات الفردية داخل مجتمع البحث ، والترحيلات العلمية ، وشبكات التعاون ، واعتماد ORCID عبر التخصصات والمواقع.
كيف يستخدم المجتمع الملف؟
نود أن نقدم ثلاثة أمثلة لاستخدامات ملف البيانات العامة للمساعدة في إثراء البيانات الوصفية / السجلات العلمية وتصور الاتصالات.
dblp - ببليوغرافيا علوم الحاسوب
com.dblp يوفر معلومات ببليوغرافية مفتوحة حول مجلات علوم الكمبيوتر الرئيسية ووقائعها. في عام 2017 ، بدأوا عرض ORCID معرفات في الببليوجرافيات والمنشورات الفردية. يتم إثراء البيانات الوصفية عن طريق جمع البيانات مباشرة من الناشرين ودمجها مع البيانات التي تم الحصول عليها من ملف البيانات العامة. حاليا، 12٪ من إدخالاتهم تحتوي على ORCID iD. تصل التغطية إلى 18٪ لإصدارات 2020. بالنسبة لمجلة IEEE Control Systems Letters ، تصل النسبة إلى 75٪. من المهم أيضًا تسليط الضوء هنا على عمل التوعية الذي يقوم به الألمانيّة ORCID جمعية للترويج لاستخدام ORCID في هذه الببليوغرافيا.
مختبر العلوم الإنسانية الرقمية - معهد لايبنيز للتاريخ الأوروبي
لتصور الروابط بين مؤلفي درهم 2020 (على سبيل المثال ، مؤتمر العلوم الإنسانية الرقمية في الفضاء الناطق بالألمانية) ، استخدم مختبر العلوم الإنسانية الرقمية أسماء المؤلفين المستخرجة من كتاب الملخصات ، ORCID التصالح أداة OpenRefine ، والانتماءات الخاصة بـ ORCID iDs وفقًا لملف البيانات العامة. بعد معالجة البيانات وتنظيفها (يتوفر الوصف الكامل باللغة الألمانية على هذا بلوق) ، وصلوا إلى شبكة الأفلييت التالية:
تمثيل الرسم البياني لشبكة الانتماء الشخصي بناءً على كتاب الملخصات 2020 و ORCID معرفات. 204 عقدة (الشخص: 110 ، أحمر / مؤسسة: 94 ، أزرق) و 183 حافة ("تابعة لـ").
المصدر https://github.com/ieg-dhr/orcidgraph/blob/master/Orcidgraph.png https://dhlab.hypotheses.org/1467.
يمكن العثور على الكود المصدري للبرنامج النصي بتنسيق GitHub جيثب:.
أوبنير
إنّ الرسم البياني لأبحاث OpenAIRE هي واحدة من أكبر مجموعات السجلات العلمية المفتوحة في جميع أنحاء العالم ، وهي أساسية في تعزيز العلوم المفتوحة وتأسيس ممارساتها. نظرًا لتصوره على أنه سلعة عامة وشفافة ، مأهولة من مصادر البيانات الموثوقة من قبل العلماء ، يهدف الرسم البياني إلى إعادة اكتشاف العلم ومراقبته وتقييمه إلى أيدي المجتمع العلمي.
على مدار السنوات العشر الماضية ، تعمل OpenAIRE على تجميع ملفات مجموعة OpenAIRE Research Graph للبيانات الوصفية والروابط بين المنتجات العلمية مثل المقالات ومجموعات البيانات والبرمجيات ومنتجات البحث الأخرى ؛ كيانات مثل المنظمات والممولين وتدفقات التمويل والمشاريع والمجتمعات ومصادر البيانات. اعتبارًا من اليوم ، تجمع هذه المجموعة الضخمة حوالي 450Mi من سجلات البيانات الوصفية مع روابط تجمع من أكثر من 10,000 مصدر بيانات موثوق به من قبل العلماء. بعد التنظيف ، وعمليات التصنيف الدقيقة ، وإزالة البيانات المكررة ، والإثراء من خلال التنقيب عن النص الكامل (حوالي 13 مليون نص كامل) ، يحسب الرسم البياني اليوم حوالي 110 منشورات مي ، ومجموعات بيانات 14 مي ، وحوالي 200 ألف منتج بحث برمجي ، و 8 مي منتجات أخرى مرتبطة معًا ~ 1Bi العلاقات الدلالية.
ORCID يتم استخدام البيانات بواسطة OpenAIRE لإثراء سجلات منتجات البحث للرسم البياني. يستخدم OpenAire ملف البيانات العامة و ملف لامدا—يحتوي هذا الملف الذي يتم إنشاؤه يوميًا على قائمة بكل شيء ORCID معرفات iDs وتاريخ التعديل الأخير. ثم يستخدم عضو API الخاص بنا لاستدعاء السجلات التي تم تعديلها لاستيراد بيانات وصفية جديدة ومحدثة من تلك السجلات.
يتكون هذا التكامل من: (XNUMX) الإضافة ORCID iDs إلى سجلات Crossref التي تعد جزءًا من الرسم البياني ، (XNUMX) استيراد سجلات البيانات الوصفية من ORCID التي لا تحتوي على DOI ، (XNUMX) نشر معرفات iD من المنتجات إلى المنتجات عندما تبرر العلاقات الدلالية بين المنتجات الإجراء (على سبيل المثال ، إذا كان سجل بيانات تعريف المقالة مع ORCID iD مرتبط بسجل البيانات الوصفية لمجموعة البيانات عبر علاقة دلالات DataCite "تكملة بواسطة / isSupplementTo"). OpenAIRE قادر على التوسط في جميع مصادر البيانات التي تساهم في البيانات الوصفية للرسم البياني (على سبيل المثال ، المستودعات والناشرين ومستودعات البيانات) ORCID معرفات مرتبطة بالسجلات ذات الصلة.
لقد كان Openaire ORCID عضو مؤسسي منذ أوائل عام 2020 وتخطط لإنشاء تبادل بيانات ثنائي الاتجاه من خلال إكمال ORCID معالج البحث والارتباط (قيد التطوير حاليًا).
هل أنت مهتم باستخدام ملف البيانات العامة؟
إذا كنت مهتمًا باستخدام الملف ، فيمكنك تنزيله من ملف ORCID مخزن. يتوفر ملف هذا العام بتنسيق XML وهو مقسم إلى ملفات منفصلة لتسهيل إدارته. يحتوي ملف واحد على ملخص السجل الكامل لكل سجل. يتم تقسيم باقي البيانات إلى 11 ملفًا تحتوي على الأنشطة لكل سجل بما في ذلك بيانات العمل الكاملة. إذا كنت تفضل JSON ، فيمكنك استخدام ملف ORCID مكتبة التحويل متوفرة في مستودع جيثب الخاص بنا. المحول هو تطبيق Java ويتيح إنشاء JSON من XML في الإصدار الافتراضي ORCID تنسيق مخطط الرسالة (v2.0 و v2.1).
نصدر ملف البيانات العامة بموجب CC0 1.0 Public Domain Dedication ، ويتم استخدام البيانات العامة وفقًا لسياسة الخصوصية الخاصة بنا. لقد أنشأنا أيضًا معايير المجتمع الموصى بها لاستخدام الملف.
إذا كنت تستخدم الملف بالفعل ، أو تخطط لذلك ولديك أسئلة ، يرجى إعلامنا بحالة الاستخدام الخاصة بك. نحن نحب أن نسمع منك!