Los conjuntos de datos son un producto y un recurso importantes para los investigadores de todas las disciplinas. Para que la comunidad acceda y reutilice de manera efectiva los conjuntos de datos, es fundamental comprender el almacenamiento y la atribución de datos. De esa comprensión fluye el desarrollo y uso de protocolos estándar de intercambio de datos. Como son ORCID identificadores integrados en los flujos de trabajo del repositorio de datos? Además de una serie de integraciones recientes de figshare, ANDS y ODIN, Dríada está comenzando a trabajar para probar el uso de ORCID identificadores en DSpace, discutidos en el OAI8 Reunión de usuarios de DSpace alojado por @fango.
Opciones de almacenamiento de datos
Los investigadores de hoy tienen numerosas opciones para almacenar sus datos. Algunas universidades de investigación apoyan actividades de gestión de datos, incluida la publicación y el archivo de datos a través de un depósito de datos institucional; esta actividad se complementa con Dríada, que proporciona recursos de código abierto en la plataforma DSpace para archivar conjuntos de datos asociados con publicaciones de investigación integrados en el proceso de envío y revisión de manuscritos. Organizaciones nacionales como el Servicio Nacional de Datos de Australia (ANDES) proporcionan un entorno para la publicación, archivo, descubrimiento y reutilización de datos de investigación. Plataformas comunitarias como higo compartido hacen que sea más fácil que nunca para los individuos, las sociedades académicas, los editores, las instituciones de investigación y las agencias de financiamiento promover la preservación y la reutilización de datos, mediante la captura de una amplia variedad de objetos de investigación, incluidas figuras, tablas, hojas de cálculo y archivos planos.
Atribución del conjunto de datos
Cada vez es más posible gestionar la atribución con la asignación de DOI a conjuntos de datos. Cada una de las organizaciones mencionadas anteriormente no solo sirve como repositorios de datos, sino a través de la colaboración con DataCite, también asignan y gestionan DOI para objetos de investigación. Los DOI se han utilizado para la identificación y citación de publicaciones de revistas durante aproximadamente una década, y la asignación de DOI para conjuntos de datos indica la creciente aceptación de los datos de investigación como una parte esencial y legítima del registro de investigación. Pero aún existe el desafío de conectar los conjuntos de datos con las personas que los han creado y que los están reutilizando.
Ahí es donde ORCID entra. A medida que los DOI de conjuntos de datos han ido creciendo, también lo ha hecho el número de investigadores que se están registrando para ORCID identificadores. Es emocionante ver crecer estas conexiones. Como un ORCID socio de lanzamiento, higo compartido ha estado apoyando el registro de depositantes de datos desde ORCID abrió el registro en octubre de 2012. Recientemente, figshare lanzó un ORCID integración que incorpora la autenticación OAuth y permite a los usuarios intercambiar metadatos de conjuntos de datos entre figshare y ORCID. Tanto ANDS como Dryad también planean implementar ORCID registro e intercambio de identificadores autenticados en el momento de la deposición del conjunto de datos.
Interoperabilidad y colaboración de código abierto
ODIN, la ORCID y DataCite Interoperability Network, lanzó una versión beta del Cita de datos / ORCID Herramienta de integración, permitiendo a los investigadores buscar en DataCite e importar metadatos de objetos con DOI de DataCite a sus ORCID registro. ODIN es una colaboración de dos años patrocinada por la Comisión Europea que involucra ORCID EU, DataCite, British Library, CERN, ANDS, Dryad y Cornell University con el objetivo de utilizar estándares existentes para vincular investigadores y conjuntos de datos. Para crear esta herramienta, ODIN se basó en código desarrollado por CrossRef y disponible como código abierto en Github, una plataforma de desarrollo colaborativo donde ORCID código fuente abierto también está alojado. El código fuente de la herramienta en sí está disponible en https://github.com/mfenner/cr-search. Gudmundur Thorisson, un ORCID Participante de la UE en el proyecto ODIN, proporcionó un manifestación de la herramienta de integración en ORCID Reunión de divulgación, celebrada en Oxford en mayo de 2013. Comentó: “Pudimos crear un prototipo funcional con menos de una semana de tiempo de desarrollador. Esto dice mucho sobre las ventajas del modelo de código abierto, que los proyectos y organizaciones utilizan cada vez más en este espacio ”.
ANDES está en proceso de lanzar un sistema de extremo a extremo que permite a los investigadores buscar en el repositorio de datos de ANDS, importar metadatos de trabajos a ORCID, y también empujar el ORCID identificador en el sistema ANDS para convertirse en una parte de los metadatos asociados con un conjunto de datos.
Otra gran oportunidad para la interoperabilidad y la atribución está en Despacio repositorios. Dríada se está desarrollando actualmente casos de uso y un prototipo ORCID integración, y hará que las muestras de código estén disponibles a través de su repositorio de código abierto. Sus planes incluyen asociar a los remitentes y coautores de conjuntos de datos con ORCID iDs y exponer estos identificadores en el repositorio Dryad. Como Todd Vision, profesor asociado de la Universidad de Carolina del Norte y ORCID Miembro de la Junta, explicado en la reunión OAI8, "Nuestro objetivo con ORCID La integración de identificadores es trascender los silos de datos actuales impuestos por las identidades institucionales, la entrada manual de datos y las búsquedas de cadenas de nombres " Los casos de uso de Dryad incluyen un primer piloto para el uso de OAuth en la plataforma DSpace. Este trabajo tiene implicaciones para los repositorios institucionales de todo el mundo para la atribución y el acceso administrado a los conjuntos de datos.