2021 es el quinto aniversario de ORCIDTrust Program y lo celebramos con una serie de publicaciones de blog que describen nuestro pensamiento sobre cómo equilibramos las prioridades a veces contrapuestas del control del investigador y la calidad de los datos, mientras nos adherimos a nuestros valores de apertura, confianza e inclusión.
Como adopción de ORCID crece, constantemente se nos presentan nuevas oportunidades y desafíos a medida que buscamos cumplir nuestra misión de Permitir conexiones transparentes y confiables entre los investigadores, sus contribuciones y sus afiliaciones.. Hemos aprendido que en nuestros esfuerzos por lograr nuestra visión de un un mundo donde todos los que participan en la investigación, la erudición y la innovación están identificados y conectados de manera única con sus contribuciones a través de disciplinas, fronteras y tiempos ".confianza ”es el eje. Cómo ORCID piensa y se acerca a la confianza (control individual, responsabilidad a través del escrutinio público e integridad a través del seguimiento estricto de la procedencia) ha cambiado muy poco desde ORCID fue fundada por primera vez, o desde que lanzó nuestro Programa de Confianza en 2016. El hecho de que somos una comunidad y estamos gobernados por Consejo Directivo representante de nuestra membresía asegura que continuemos contando con la confianza y la aceptación de la comunidad a la que servimos.
Esta publicación de blog es la primera de una serie que celebra cinco años del ORCID Programa de confianza. En esta publicación, nuestro objetivo es volver a familiarizar a los usuarios con nuestro Programa de Confianza y aclarar nuestro pensamiento sobre cómo equilibramos las prioridades a veces contrapuestas del control del investigador y la calidad de los datos, al tiempo que nos adherimos a nuestros valores de apertura, confianza e inclusión. Discutiremos los desafíos emergentes presentados por ORCIDLos crecientes niveles de participación (sí, estamos hablando de spam). Aprenderá qué tipo de spam experimentamos, qué hemos estado haciendo para abordarlo y por qué es más una molestia que una barrera práctica para ORCIDuso. También hablaremos sobre nuestro enfoque para manejar reclamos fraudulentos en ORCID registros y resolución de disputas. Finalmente, cubriremos cómo los marcadores de confianza en ORCID registros, agregados por ORCID organizaciones miembro, permitir ORCID usuarios de datos para determinar por sí mismos en qué registros confiar.
En publicaciones posteriores, cubriremos cómo los investigadores pueden optimizar sus propios ORCID registro para garantizar que proporcione el máximo valor, cómo las instituciones pueden alentar a sus investigadores a interactuar con sus ORCID integraciones y te ayudaremos ORCID los usuarios de datos interpretan la información que pueden encontrar en el ORCID registro.
Manteniendo al investigador (colaborador, académico, usuario) en el centro de todo lo que hacemos
En 2016, ORCID comprometido con expertos en privacidad y seguridad de datos de la comunidad para ayudarnos a revisar y perfeccionar las prácticas y políticas que sustentan la confiabilidad de ORCID. A partir de este trabajo, desarrollamos el ORCID Programa de confianza Brindar transparencia sobre los controles, políticas y prácticas que implementamos para garantizar que las conexiones sean controladas por investigadores y que la fuente de cada conexión se articule abiertamente. Como todo lo que hacemos, el ORCID Trust Program tiene sus raíces en ORCID, Diez principios fundamentales, dos de los cuales abordan directamente nuestro compromiso con el control del investigador.
Las definiciones de investigador, eruditoy contribuyente evolucionan con el tiempo y pueden variar de un campo a otro y de un país a otro. Independientemente de cómo se consideren los usuarios de nuestro registro, ORCID siempre se ha comprometido a mantenerlos en el centro de todo lo que hacemos. Los investigadores siempre podrán crear, editar y mantener un ORCID identificador y registro de forma gratuita. Los investigadores controlan quién puede ver sus datos y con quién comparten el control (para escribir, leer y actualizar sus registros) y durante cuánto tiempo.
ORCID estaba destinado a resolver ambigüedad del nombre
A pesar de lo individuales que somos, nuestros nombres en realidad no son tan únicos, y los intentos de vincular las actividades de investigación y los resultados con el nombre de una persona han provocado una confusión sin fin en el pasado. Incluso en la misma disciplina, cientos o incluso miles de investigadores pueden tener nombres iguales o similares. Puede haber infinitas variaciones de nombres, que pueden cambiar con el tiempo: Sofia Maria Hernandez Garcia, Sofia Garcia, SM Garcia, S. Hernandez Garcia. Los investigadores aprendieron hace mucho tiempo que los nombres no son suficientes para garantizar el crédito por su trabajo.
ORCID, como identificador de persona independiente del nombre, se fundó específicamente para ayudar a resolver el problema de ambigüedad del nombre en la investigación, y permitir conexiones transparentes y confiables entre los investigadores, sus contribuciones y sus afiliaciones.
Para cumplir con este caso de uso, las características importantes de ORCID Los iD son que son únicos, persistentes y controlados por un solo individuo del mundo real. Unico para que las personas con el mismo nombre se puedan distinguir unas de otras; persistente para que un individuo pueda mantener el mismo ORCID iD a lo largo de toda su carrera; controlado por un solo individuo para que los usuarios de ORCID los datos pueden estar razonablemente seguros de que los datos contenidos en el ORCID registro son los datos que el poseedor del registro desea presentar al mundo sobre sí mismo. No es necesario para nuestro caso de uso para la disponibilidad de ORCIDs estar restringido a una clase específica de individuos, ni para que alguna autoridad controle quién puede obtener un ORCID. Y, como veremos más adelante, imponer estas limitaciones en realidad nos dificultaría lograr nuestros objetivos mientras mantenemos la adhesión a nuestros valores.
Es importante reiterar que nuestra intención siempre ha sido proporcionar un mecanismo mediante el cual los investigadores pueden conectarse con organizaciones confiables que actualizan sus registros a través de flujos de trabajo validados, no para ser un mecanismo por el cual los investigadores son validados como investigadores simplemente por tener un ORCID identificación.
Dicho de otra manera, la existencia de un ORCID El registro en sí mismo no es indicativo de la validez de un investigador más de lo que la presencia de un ISBN en la parte posterior de un libro asegura que ese libro es una buena lectura. Al igual que el contenido del libro que determina su calidad, el contenido de los datos en un ORCID record puede decirle mucho sobre su confiabilidad. En el caso de ORCID, proporcionamos un mecanismo para los usuarios de ORCID datos para juzgar el origen y la confiabilidad de la información en ORCID registros por sí mismos registrando y revelando la procedencia de todas y cada una de las afirmaciones presentes en un registro.
ORCID está abierto a todos los que puedan encontrar ORCID eficiente
Para simplificar, a menudo usamos la palabra "investigador" cuando nos referimos a un ORCID poseedor del récord, pero recuerde la "C" en ORCID significa "colaborador": nuestros usuarios provienen de un contexto mucho más amplio del que puede abarcar una sola palabra. De echo, ORCID permite a todos los que puedan beneficiarse del uso de la ORCID Registro para poder obtener y utilizar un ORCID identificación. Cualquier definición rígida de quién "calificaría" para una iD probablemente excluiría involuntariamente a personas para quienes un ORCID iD Sería útil debido a la amplia diversidad de circunstancias en las que se encuentran los investigadores en todo el mundo. Además, con alrededor de 10,000 nuevos registros creados cada día, representaría una enorme pérdida de recursos que la comunidad académica contribuye colectivamente a financiar. ORCID al tratar de hacer cumplir dicha validación previa, con pocas ventajas.
Específicamente, al no establecer ningún criterio de este tipo sobre quién puede registrarse para un ORCID dejar constancia de que garantizamos la inclusión y fomentamos la persistencia de ORCID iDs. Queremos animar a los investigadores en ciernes a establecer sus ORCID iD tan pronto como sea posible en sus carreras, como estudiantes universitarios, o incluso estudiantes de secundaria o preparatoria, incluso si aún no han creado resultados de investigación formalmente reconocidos. Del mismo modo, no deseamos excluir a los investigadores independientes, como los científicos ciudadanos o aquellos que actualmente no están afiliados a una institución académica formal debido a interrupciones en la carrera o jubilación.
Una consecuencia natural de este enfoque es que los malos actores pueden optar por autoafirmar la información en ORCID registros que son falsos, ya sea en la búsqueda de ganancias financieras o con el propósito de cometer fraude académico (o ambos). Creemos que es nuestro compromiso con estos valores de apertura e inclusión lo que ha dado como resultado un repositorio abierto y ampliamente adoptado de datos generados por los usuarios que ORCID se ha convertido. La otra cara de esa apertura e inclusión es la inevitable inclusión de personas que pueden no ser consideradas por la comunidad académica en general como investigadores legítimos y que algunos de los datos que eligen compartir en sus registros pueden no ser considerados por otros. objetivamente cierto.
Con más de 11 millones de registros en el momento de escribir este artículo, sería sorprendente que no pudiéramos presumir de registros de contenido o calidad académica cuestionable, y claramente ese no es el caso. Encontramos que los registros problemáticos vienen en dos tipos principales: SEO o "spam" de enlaces e intentos descarados de reclamar registros académicos falsos. Tenemos distintos enfoques para manejar cada caso, como detallaremos más adelante.
La optimización de motores de búsqueda no es una ORCID caso de uso
En gran parte debido a nuestro éxito en lograr la adopción y el uso generalizado por parte de la comunidad académica, orcid.org ha acumulado una participación no despreciable en Internet: estamos clasificados entre los 5,000 sitios principales a nivel mundial según Alexa.com. Como resultado, como la mayoría de los otros sitios de alto tráfico que permiten contenido generado por el usuario, somos un honeypot para aquellos que intentan jugar con los algoritmos de los motores de búsqueda al explotar nuestra influencia relativamente alta en las clasificaciones de los motores de búsqueda (también conocido como "link juice" o autoridad de dominio ”) para intentar mejorar la clasificación de sus propios sitios. Esta práctica se conoce como "spam de enlaces" o "spam de SEO (optimización de motores de búsqueda)" y a menudo es perpetuada por los llamados "agricultores de enlaces" o "operativos SEO de sombrero negro".
Irónicamente, este ejercicio es en gran medida inútil, ya que los enlaces a otros sitios de ORCID los registros están etiquetados con códigos "NoFollow". En su mayor parte, esto evita que estos registros de spam presten un mayor valor de SEO a los sitios vinculados en primer lugar. Sin embargo, el spam continúa, sospechamos que porque los productores de enlaces son compensados de acuerdo con el volumen de spam creado en lugar del valor de los resultados obtenidos. Lástima para los posibles clientes de los agricultores de enlaces, pero la optimización de SEO para las empresas de fregaderos de cocina nunca ha sido un caso de uso para ORCID!
Un juego interminable de whack-a-mole

El spam de enlaces, aunque es una molestia, no afecta a los registros que aparecen en el flujos de trabajo autenticados que alentamos, ya que un spammer no tiene ningún incentivo para usar sus registros para iniciar sesión o conectarse a servicios y sistemas académicos legítimos. Aun así, entendemos por qué estos registros generan alarma y ponen en duda el valor general y la confiabilidad de ORCID.
Trabajamos arduamente para monitorear y "bloquear" constantemente los registros de spam sospechosos, de modo que no sean visibles para nadie más que para el titular del registro. Regularmente ejecutamos heurísticas para detectar registros de spam, y nuestro equipo de soporte al usuario generalmente bloquea miles de registros cada mes. También tomamos medidas estándar para limitar la creación automática de spam por parte de los bots, como requerir la realización de un CAPTCHA antes de la creación del registro.
Desafortunadamente, nuestro enfoque heurístico actual requiere mucha mano de obra: ya que puede generar falsos positivos, revisamos cuidadosamente cada registro de spam sospechoso para asegurarnos de que no estemos impactando inadvertidamente a investigadores que podrían estar trabajando en temas que coinciden con los "intereses" de los spammers , como la moneda cibernética o la sexualidad humana. Considerando el crecimiento de la ORCID registro, nos espera un juego interminable de whack-a-mole, pero estamos preparados para el desafío.
Recientemente, hemos experimentado con un enfoque de aprendizaje automático para detectar spam, que está dando resultados muy prometedores. Creemos que este enfoque reduciría la necesidad de una revisión manual y nos permitiría bloquear los registros de correo no deseado de manera más oportuna y continua. Si bien aún no estamos firmemente en nuestra hoja de ruta, esperamos poder anunciar más avances en esto en el próximo año, sujeto, por supuesto, a una evaluación exhaustiva de la privacidad. Como paso intermedio, estamos tomando medidas para mejorar la relevancia de nuestros resultados de búsqueda con el fin de mitigar el impacto de los registros de spam en los usuarios legítimos.
La luz del sol es el mejor desinfectante
El segundo tipo de registro problemático es más problemático, pero afortunadamente mucho más raro. Este tipo implica intentos flagrantes de fraude académico y proviene de personas que crean información falsa o engañosa. ORCID registros, ya sea en la creencia equivocada de que el mero hecho de tener un ORCID iD transmite cierto grado de legitimidad, o en un intento de reclamar falsamente crédito por el trabajo de otros. Este comportamiento es objetable y claramente prohibido por nuestro Términos de Uso.
Sin embargo, como proveedor de infraestructura neutral e inclusivo, no sería apropiado que adoptemos una posición editorial sobre la veracidad de las afirmaciones en ORCID registros, ni sería factible para nosotros curar proactivamente los ORCID registro o control de registros fraudulentos. En cambio, es la misma franqueza lo que se ha incorporado ORCID desde su fundación que permite que los reclamos hechos por los poseedores de registros sean sometidos al escrutinio público, permitiendo a su vez a la comunidad monitorear e informar cualquier reclamo relacionado.
Si tiene inquietudes acerca de los datos en el ORCID Registro o la intención del titular del registro, recomendamos como primer curso de acción que se comunique directamente con esa persona. De lo contrario, nuestro equipo de atención al usuario puede ayudar a resolver la queja siguiendo los pasos descritos en nuestra Procedimientos de disputa. Cuando recibimos un informe de datos sospechosos, el equipo de atención al usuario trabaja inicialmente con la parte contendiente y el titular del registro para resolver el problema mediante un diálogo de buena fe. En las raras ocasiones en que esto no tiene éxito, seguimos los pasos de escalamiento descritos en nuestro procedimiento de disputa y, en última instancia, nos reservamos el derecho de bloquear el registro incorrecto y marcarlo como disputado si el titular del registro no acepta hacer correcciones. Mantenemos un registro de cuándo y por quién se agregan, editan o eliminan los datos en el registro para ayudar en este proceso.
El control del investigador y las conexiones de alta fidelidad generan confianza
Since ORCIDfundación, ha habido una escuela de pensamiento que ORCID - u otros terceros autorizados - deben arbitrar qué datos se pueden colocar en un ORCID registro. Después de todo, hay muchas otras bases de datos biográficas que funcionan de esta manera, siguiendo el enfoque tradicional de “archivo de autoridad”. Y si ese tipo de datos altamente administrados y curados es mejor para su caso de uso, le recomendamos que trabaje con uno de ellos.
Sin embargo, ORCID es y siempre estuvo destinado a ser diferente. Hemos descubierto que adherirse estrictamente a nuestra Principio fundacional del control del investigador ha sido esencial para ganarse la confianza y la participación de los propios interesados, y esto, a su vez, ha sido esencial para la amplia aceptación y utilización de ORCID por investigadores de todo el mundo, incluso si esto significa dejar de lado la idea de autoridad central.
Los metadatos autorizados todavía juegan un papel muy importante en ORCID sin emabargo. En lugar de que una parte mantenga los datos de forma centralizada en ORCID registros, hemos implementado un modelo de confianza distribuida que permite que fuentes de datos confiables y confiables de todas las formas y tipos estén conectadas, con el permiso del titular del registro, a sus ORCID registro. Mantenemos metadatos estrictos sobre la procedencia de todas y cada una de las afirmaciones en un ORCID registrar y divulgar esto en la interfaz de usuario del Registro, a través de nuestra API y en nuestro archivo de datos públicos. De esta forma, los usuarios de ORCID los datos pueden determinar por sí mismos, en qué afirmaciones confían y qué tipos de afirmaciones consideran "marcadores de confianza" para su caso de uso específico, por ejemplo, afiliaciones que han sido autenticadas por instituciones de investigación o publicaciones que han sido autenticadas por editores.
Nuestros flujos de trabajo autenticados garantizan que un registro se pueda conectar a una actividad, idea u organización solo con el permiso directo del titular del registro. Además, solo ORCID las organizaciones miembros autentican reclamaciones en ORCID registros, asegurando que estén sujetos a nuestro escrutinio y sujetos a los términos incorporados en nuestro acuerdo de membresía.
Una vez establecidas, estas conexiones de alta fidelidad crean un bucle que se refuerza a sí mismo: en flujos de trabajo en los que los investigadores obtienen muchos beneficios de tener un ORCID iD, por ejemplo, al evitar la entrada repetitiva de datos, es más probable que interactúen y conecten sus registros, lo que lleva a una población más completa y precisa de ORCID registros con metadatos confiables. Hemos descubierto que, si bien el 48% de los registros en general tienen algún elemento de metadatos adjuntos, ese número aumenta, hasta el 56%, para los registros conectados a al menos un sistema externo. Además, para los registros conectados a sistemas en lugares con políticas nacionales coherentes y soporte para la infraestructura PID, por ejemplo, Australia, el número aumenta al 88%. Una de nuestras prioridades clave para los próximos años es fomentar la adopción de estrategias PID nacionales de manera más amplia, y la integración de ORCID con infraestructura de investigación nacional clave en lugares donde ese no es el caso en la actualidad.
A continuación: interpretar "marcadores de confianza" en ORCID archivos
ORCIDEl compromiso fundamental con el control de los investigadores ha demostrado ser esencial para ganarse la confianza y la participación de los investigadores, lo que a su vez ha sido esencial para la amplia aceptación y utilización de ORCID por investigadores y organizaciones de todo el mundo. Como la mayoría de los otros sitios de alto tráfico que permiten contenido generado por el usuario, nuestro éxito nos ha convertido en un objetivo atractivo para aquellos que crearían registros en la búsqueda de ganancias financieras o con el propósito de cometer fraude académico (o ambos). Discutimos nuestros distintos enfoques para manejar cada caso, así como los planes que tenemos para mejorar nuestras habilidades para manejar el spam en el futuro.
Para equilibrar las prioridades a veces contrapuestas del control del investigador y la calidad de los datos, ORCID utiliza un modelo de confianza distribuido que permite que las fuentes de datos confiables y confiables se conecten a través de flujos de trabajo autenticados a un ORCID grabar con el permiso del titular del registro. Además, al registrar y divulgar la procedencia de todas y cada una de las afirmaciones presentes en un registro, proporcionamos un mecanismo para los usuarios de ORCID datos para juzgar la veracidad y confiabilidad de la información en ORCID registros por sí mismos.
Ayudar a los usuarios a comprender cómo interpretar la información almacenada en un ORCID El registro es un elemento de nuestro Programa de Confianza. En nuestra próxima publicación de blog de esta serie, continuamos con la celebración del quinto aniversario de la ORCID Trust Program introduciendo el concepto de "marcadores de confianza" en un ORCID registrar y discutir cómo los usuarios de ORCID Los datos pueden determinar por sí mismos en qué aserciones confían y qué tipos de aserciones consideran marcadores de confianza para su caso de uso específico.
Enlaces asociados
- Vías de garantía de afirmación: ¿qué son y por qué son importantes?
- ORCID Confianza
- Actualizaciones automáticas: ahorro de tiempo y fomento de la confianza
- Construyendo una infraestructura de investigación robusta, un PID a la vez
- Acceso abierto en contexto: conexión de autores, publicaciones y flujos de trabajo mediante ORCID Identificadores
- Gracias a ORCID, DOI y otros identificadores abiertos en la evaluación de la investigación
- ¿Qué tiene de especial registrarse?