2021 est le cinquième anniversaire de ORCIDTrust Program et nous célébrons avec une série d'articles de blog qui décrivent notre réflexion sur la façon dont nous équilibrons les priorités parfois concurrentes du contrôle des chercheurs et de la qualité des données, tout en adhérant à nos valeurs d'ouverture, de confiance et d'inclusivité.
Comme adoption de ORCID grandit, nous sommes constamment confrontés à de nouvelles opportunités et de nouveaux défis alors que nous cherchons à remplir notre mission de permettant des connexions transparentes et dignes de confiance entre les chercheurs, leurs contributions et leurs affiliations. Nous avons appris que dans nos efforts pour réaliser notre vision d'un monde où tous ceux qui participent à la recherche, à l'érudition et à l'innovation sont identifiés de manière unique et liés à leurs contributions à travers les disciplines, les frontières et le temps, "confiance » est la clé de voûte. Comment ORCID pense et aborde la confiance - contrôle individuel, responsabilité via un examen public et intégrité via un suivi strict de la provenance - a très peu changé depuis ORCID a été fondée, ou depuis que nous a lancé notre programme de confiance en 2016. Le fait que nous soyons construits par la communauté et régis par un Conseil d'administration représentant de nos membres s'assure que nous continuons à avoir la confiance et l'adhésion de la communauté que nous servons.
Ce billet de blog est le premier d'une série célébrant les cinq ans de la ORCID Programme de confiance. Dans cet article, nous visons à familiariser les utilisateurs avec notre programme de confiance et à clarifier notre réflexion sur la façon dont nous équilibrons les priorités parfois concurrentes du contrôle des chercheurs et de la qualité des données, tout en adhérant à nos valeurs d'ouverture, de confiance et d'inclusivité. Nous discuterons des défis émergents présentés par ORCIDles niveaux de participation croissants (oui, nous parlons de spam). Vous découvrirez quel type de spam nous rencontrons, ce que nous avons fait pour y remédier et pourquoi c'est plus une gêne qu'un obstacle pratique à ORCIDl'utilisation. Nous parlerons également de notre approche du traitement des réclamations frauduleuses dans ORCID dossiers et résolution des litiges. Enfin, nous verrons comment les marqueurs de confiance dans ORCID enregistrements, ajoutés par ORCID organisations membres, permettent ORCID aux utilisateurs de données de déterminer eux-mêmes à quels enregistrements se fier.
Dans les articles suivants, nous verrons comment les chercheurs peuvent optimiser leur propre ORCID dossier pour s'assurer qu'il offre une valeur maximale, comment les établissements peuvent encourager leurs chercheurs à s'engager avec leurs ORCID intégrations, et nous vous aiderons ORCID les utilisateurs de données interprètent les informations qu'ils peuvent trouver dans le ORCID enregistrement.
Toujours garder le chercheur (contributeur, universitaire, utilisateur) au centre de tout ce que nous faisons
En 2016, ORCID engagé avec experts en confidentialité et sécurité des données de la communauté pour nous aider à revoir et à affiner les pratiques et les politiques qui sous-tendent la fiabilité de ORCID. A partir de ce travail, nous avons développé le ORCID Programme de confiance pour assurer la transparence sur les contrôles, les politiques et les pratiques que nous mettons en place pour garantir que les connexions sont contrôlées par les chercheurs et que la source de chaque connexion est ouvertement articulée. Comme tout ce que nous faisons, le ORCID Le programme de confiance est enraciné dans ORCID's 10 principes fondateurs, dont deux concernent directement notre engagement envers le contrôle des chercheurs.
Les définitions de chercheur, savantet contributeur évoluent dans le temps et peuvent varier d'un domaine à l'autre et d'un pays à l'autre. Indépendamment de la façon dont nos utilisateurs de registre se perçoivent, ORCID s'est toujours engagé à les garder au centre de tout ce que nous faisons. Les chercheurs pourront toujours créer, éditer et maintenir un ORCID identifiant et enregistrement gratuitement. Les chercheurs contrôlent qui peut voir leurs données et avec qui ils partagent le contrôle — pour écrire, lire et mettre à jour leurs enregistrements — et pour combien de temps.
ORCID était censé résoudre ambiguïté du nom
Aussi individuels que nous soyons tous, nos noms ne sont vraiment pas si uniques, et les tentatives de lier les activités et les résultats de la recherche au nom d'une personne ont conduit à une confusion sans fin dans le passé. Même dans une même discipline, des centaines voire des milliers de chercheurs peuvent avoir des noms identiques ou similaires. Il peut y avoir des variations infinies de noms, qui peuvent changer avec le temps : Sofia Maria Hernandez Garcia, Sofia Garcia, SM Garcia, S. Hernandez Garcia. Les chercheurs ont appris il y a longtemps que les noms ne suffisent pas à garantir le crédit de leur travail.
ORCID, en tant qu'identifiant de personne indépendant du nom, a été créé spécifiquement pour aider à résoudre le problème de ambiguïté du nom dans la recherche, et pour permettre des connexions transparentes et dignes de confiance entre les chercheurs, leurs contributions et leurs affiliations.
Pour répondre à ce cas d'utilisation, les caractéristiques importantes de ORCID Les iD sont qu'ils sont uniques, persistants et contrôlés par un seul individu du monde réel. Unique afin que les personnes portant le même nom puissent être distinguées les unes des autres ; persistant afin qu'un individu puisse maintenir le même ORCID iD tout au long de leur carrière ; contrôlé par un seul individu afin que les utilisateurs de ORCID les données peuvent être raisonnablement sûrs que les données contenues dans le ORCID record sont les données que le détenteur du record souhaite présenter au monde sur lui-même. Il n'est pas nécessaire pour notre cas d'utilisation pour la disponibilité de ORCIDs pour être limité à une catégorie spécifique d'individus, ni pour une certaine autorité pour contrôler qui peut obtenir un ORCID. Et, comme nous le verrons plus loin, imposer ces contraintes rendrait en réalité plus difficile pour nous d'atteindre nos objectifs tout en maintenant l'adhésion à nos valeurs.
Il est important de réitérer que notre intention a toujours été de fournir un mécanisme par lequel les chercheurs peuvent se connecter avec des organisations de confiance qui mettent à jour leurs dossiers via des flux de travail validés, pour ne pas être un mécanisme par lequel les chercheurs sont validés en tant que chercheurs simplement en ayant un ORCID identifiant.
En d'autres termes, l'existence d'un ORCID Le dossier en soi n'est pas révélateur de la validité d'un chercheur, pas plus que la présence d'un ISBN au dos d'un livre ne garantit que ce livre est une bonne lecture. Tout comme le contenu du livre qui détermine sa qualité, le contenu des données d'un ORCID record peut vous en dire long sur sa fiabilité. Dans le cas de ORCID, nous fournissons un mécanisme pour les utilisateurs de ORCID données pour juger de l'origine et de la fiabilité des informations dans ORCID dossiers pour eux-mêmes en enregistrant et en divulguant la provenance de chaque affirmation présente dans un dossier.
ORCID est ouvert à tous ceux qui peuvent trouver ORCID incontournable
Par souci de simplicité, nous utilisons souvent le mot « chercheur » pour désigner un ORCID détenteur du record, mais souvenez-vous du « C » dans ORCID signifie « contributeur » - nos utilisateurs viennent d'un contexte bien plus large qu'un seul mot ne peut englober. En fait, ORCID permet à tous ceux qui pourraient tirer profit de l'utilisation du ORCID Registre pour pouvoir obtenir et utiliser un ORCID identifiant. Toute définition rigide de qui serait « qualifié » pour un iD exclurait probablement involontairement les personnes pour lesquelles un ORCID iD serait utile en raison de la grande diversité des circonstances dans lesquelles les chercheurs se trouvent dans le monde. De plus, avec environ 10,000 XNUMX nouveaux dossiers créés chaque jour, cela représenterait une énorme ponction sur les ressources que la communauté universitaire contribue collectivement à financer. ORCID en essayant d'imposer une telle pré-validation, avec peu d'avantages.
C'est précisément en ne fixant pas de tels critères sur qui peut s'inscrire à un ORCID enregistrer que nous assurons l'inclusivité et encourageons la persistance de ORCID identifiants. Nous voulons encourager les chercheurs en herbe à établir leur ORCID Les iD le plus tôt possible dans leur carrière, en tant qu'étudiants de premier cycle ou même du secondaire ou du secondaire, même s'ils n'ont pas encore créé de résultats de recherche officiellement reconnus. De même, nous ne souhaitons pas exclure les chercheurs indépendants tels que les scientifiques citoyens ou ceux actuellement non affiliés à une institution académique formelle en raison d'interruptions de carrière ou de retraite.
Une conséquence naturelle de cette approche est que les mauvais acteurs peuvent choisir de s'auto-affirmer ORCID enregistrements qui sont faux, soit dans le but de réaliser un gain financier, soit dans le but de commettre une fraude académique (ou les deux). Nous pensons que c'est notre engagement envers ces valeurs d'ouverture et d'inclusivité qui a abouti au référentiel ouvert et largement adopté de données générées par les utilisateurs qui ORCID est devenu. Le revers de cette ouverture et de cette inclusion est l'inclusion inévitable d'individus qui peuvent ne pas être considérés par la communauté universitaire au sens large comme des chercheurs légitimes et que certaines des données qu'ils choisissent de partager dans leurs dossiers peuvent ne pas être considérées par d'autres comme étant objectivement vrai.
Avec plus de 11 millions d'enregistrements au moment d'écrire ces lignes, il serait surprenant que nous ne puissions nous vanter d'aucun enregistrement d'un contenu ou d'une qualité scientifique douteux, et ce n'est clairement pas le cas. Nous constatons que les dossiers problématiques sont de deux types principaux : le référencement ou le « spam » de lien et les tentatives flagrantes de réclamer de faux dossiers académiques. Nous avons des approches distinctes pour traiter chaque cas, comme nous le détaillerons plus en détail ci-dessous.
L'optimisation des moteurs de recherche n'est pas une ORCID cas d'utilisation
En grande partie en raison de notre succès dans l'adoption et l'utilisation généralisée par la communauté scientifique, orcid.org a accumulé un engagement non négligeable sur Internet : nous nous classons parmi les 5,000 XNUMX meilleurs sites au monde selon Alexa.com. En conséquence, comme la plupart des autres sites à fort trafic qui autorisent le contenu généré par les utilisateurs, nous sommes un pot de miel pour ceux qui tentent de jouer avec les algorithmes des moteurs de recherche en exploitant notre influence relativement élevée sur les classements des moteurs de recherche (autrement connu sous le nom de "jus de lien" ou " autorité de domaine") pour tenter d'améliorer le classement de leurs propres sites. Cette pratique est connue sous le nom de « link spamming » ou « spamming SEO (Search Engine Optimization) » et est souvent perpétuée par ce que l’on appelle les « agriculteurs de liens » ou les « opérateurs de référencement au chapeau noir ».
Ironiquement, cet exercice est en grande partie futile, car les liens vers d'autres sites de ORCID les enregistrements sont étiquetés avec des codes « NoFollow ». Pour la plupart, cela empêche ces enregistrements de spam de prêter une valeur SEO accrue aux sites liés en premier lieu. Néanmoins, le spam continue – nous pensons que les producteurs de liens sont rémunérés en fonction du volume de spam créé plutôt que de la valeur des résultats obtenus. Dommage pour les clients potentiels des agriculteurs, mais l'optimisation du référencement pour les entreprises d'évier de cuisine n'a jamais été un cas d'utilisation pour ORCID!
Un jeu sans fin de whack-a-mole

Le spam de lien, bien qu'il soit une nuisance, n'affecte pas les enregistrements apparus dans le workflows authentifiés que nous encourageons, car un spammeur n'a aucune incitation à utiliser ses enregistrements pour se connecter ou se connecter à des services et systèmes savants légitimes. Malgré cela, nous comprenons pourquoi ces enregistrements sonnent l'alarme et jettent le doute sur la valeur globale et la fiabilité de ORCID.
Nous travaillons dur pour surveiller et « verrouiller » en permanence les enregistrements de spam suspectés, de sorte qu'ils ne soient visibles par personne d'autre que le détenteur de l'enregistrement. Nous exécutons régulièrement des heuristiques pour détecter les enregistrements de spam, et notre équipe d'assistance aux utilisateurs verrouille généralement des milliers d'enregistrements chaque mois. Nous prenons également des mesures standard pour limiter la création automatique de spam par des robots, par exemple en exigeant l'achèvement d'un CAPTCHA avant la création de l'enregistrement.
Malheureusement, notre approche heuristique actuelle est très laborieuse - car elle peut entraîner des faux positifs, nous examinons attentivement chaque enregistrement de spam suspecté pour nous assurer que nous n'impactons pas par inadvertance les chercheurs qui pourraient travailler sur des sujets qui coïncident avec les "intérêts" des spammeurs. , comme la cybermonnaie ou la sexualité humaine. Compte tenu de la croissance de la ORCID registre, nous sommes prêts pour un jeu sans fin de taupe, mais nous sommes prêts à relever le défi.
Nous avons récemment expérimenté une approche de Machine Learning pour détecter le spam, qui donne des résultats très prometteurs. Nous pensons qu'une telle approche réduirait le besoin d'examen manuel et nous permettrait de verrouiller les enregistrements de spam de manière plus opportune et continue. Bien que n'étant pas encore fermement sur notre feuille de route, nous espérons être en mesure d'annoncer davantage de progrès à ce sujet au cours de l'année à venir, sous réserve bien sûr d'une évaluation approfondie de la confidentialité. Dans l'intervalle, nous prenons des mesures pour améliorer la pertinence de nos résultats de recherche afin d'atténuer l'impact des enregistrements de spam sur les utilisateurs légitimes.
La lumière du soleil est le meilleur désinfectant
Le deuxième type de dossier problématique est plus gênant, mais heureusement beaucoup plus rare. Ce type implique des tentatives flagrantes de fraude académique et provient de personnes qui créent de faux ou trompeurs ORCID enregistre soit dans la croyance erronée que le simple fait d'avoir un ORCID iD transmet un certain degré de légitimité, ou dans une tentative de revendiquer à tort le mérite du travail des autres. Ce comportement est répréhensible et clairement interdit par notre conditions d'utilisation.
En tant que fournisseur d'infrastructure neutre et inclusif, cependant, il ne serait pas approprié pour nous de prendre une position éditoriale sur la véracité des allégations dans ORCID dossiers, et il ne nous serait pas non plus possible de gérer de manière proactive les ORCID registre ou surveiller les enregistrements frauduleux. Au lieu de cela, c'est l'ouverture même qui a été ORCID depuis sa fondation qui permet aux réclamations faites par les détenteurs de records d'être soumises à un examen public, permettant à son tour à la communauté de surveiller et de signaler toute réclamation préoccupante.
Si vous avez des inquiétudes concernant les données contenues dans le compte d'une autre personne ORCID Record ou l'intention du détenteur du record, nous vous recommandons comme premier plan d'action de contacter directement cette personne. À défaut, notre équipe d'assistance aux utilisateurs peut vous aider à résoudre la plainte en suivant les étapes décrites dans notre Procédures de contestation. Lorsque nous recevons un rapport de données suspectes, l'équipe d'assistance aux utilisateurs travaille d'abord avec la partie contestante et le détenteur du dossier pour résoudre le problème via un dialogue de bonne foi. Dans les rares cas où cela n'aboutit pas, nous suivons les étapes d'escalade décrites dans notre procédure de contestation et, finalement, nous nous réservons le droit de verrouiller le dossier incorrect et de le marquer comme contesté si le détenteur du dossier n'accepte pas d'apporter des corrections. Nous tenons un journal indiquant quand et par qui les données du registre sont ajoutées, modifiées ou supprimées pour faciliter ce processus.
Le contrôle des chercheurs et les connexions haute fidélité engendrent la confiance
Depuis que ORCIDfondation, il y a eu une école de pensée qui ORCID — ou d'autres tiers faisant autorité — devraient arbitrer quelles données peuvent être placées dans un ORCID enregistrer. Il existe, après tout, de nombreuses autres bases de données biographiques qui fonctionnent de cette manière, suivant l'approche traditionnelle du « fichier d'autorité ». Et si ce type de données hautement gérées et organisées convient le mieux à votre cas d'utilisation, nous vous recommandons de travailler avec l'une d'entre elles.
Toutefois, ORCID est et a toujours été censé être différent. Nous avons constaté qu'en adhérant strictement à nos Principe fondateur du contrôle du chercheur a été essentiel pour gagner la confiance et la participation des personnes concernées elles-mêmes, et cela à son tour a été essentiel pour l'adoption et l'utilisation à grande échelle de ORCID par des chercheurs du monde entier, quitte à abandonner l'idée d'autorité centrale.
Les métadonnées faisant autorité jouent toujours un rôle très important dans ORCID pourtant. Plutôt qu'une partie centralisant la gestion des données dans ORCID enregistrements, nous avons mis en place un modèle de confiance distribué qui permet à des sources de données fiables et dignes de confiance de toutes sortes et de tous types d'être connectées, avec la permission du détenteur de l'enregistrement, à leurs ORCID enregistrer. Nous maintenons des métadonnées strictes sur la provenance de chaque affirmation dans un ORCID enregistrer et divulguer cela dans l'interface utilisateur du registre, via notre API et dans notre fichier de données public. De cette façon, les utilisateurs de ORCID les données peuvent déterminer par elles-mêmes les affirmations auxquelles elles font confiance et les types d'affirmations qu'elles considèrent comme des « marqueurs de confiance » pour leur cas d'utilisation spécifique, par exemple des affiliations qui ont été authentifiées par des instituts de recherche ou des publications qui ont été authentifiées par des éditeurs.
Nos flux de travail authentifiés garantissent qu'un enregistrement peut être connecté à une activité, une idée ou une organisation uniquement avec l'autorisation directe du détenteur de l'enregistrement. De plus, seulement ORCID les organisations membres authentifient les réclamations dans ORCID dossiers, en veillant à ce qu'ils soient soumis à notre examen minutieux et tenus aux conditions énoncées dans nos contrat d'adhésion.
Une fois établies, ces connexions haute fidélité créent une boucle d'auto-renforcement : dans les flux de travail où les chercheurs tirent beaucoup d'avantages d'un ORCID iD, par exemple en évitant la saisie de données répétitive, ils sont plus susceptibles de s'engager avec et de connecter leurs dossiers, conduisant à une population plus complète et précise de ORCID enregistrements avec des métadonnées fiables. Nous avons constaté que si 48 % des enregistrements dans l'ensemble sont associés à un élément de métadonnées, ce nombre augmente - à 56 % - pour les enregistrements connectés à au moins un système externe. En outre, pour les enregistrements connectés à des systèmes dans des endroits dotés de politiques nationales cohérentes et d'une prise en charge de l'infrastructure PID, par exemple en Australie, le nombre passe à 88 %. L'une de nos principales priorités pour les années à venir est d'encourager l'adoption plus large de stratégies nationales PID et l'intégration de ORCID avec une infrastructure de recherche nationale clé dans des endroits où ce n'est pas le cas aujourd'hui.
Prochaine étape : interpréter les « marqueurs de confiance » dans ORCID Articles
ORCIDl'engagement fondamental de s envers le contrôle des chercheurs s'est avéré essentiel pour gagner la confiance et la participation des chercheurs, ce qui a à son tour été essentiel à l'adoption et à l'utilisation à grande échelle de ORCID par des chercheurs et des organisations du monde entier. Comme la plupart des autres sites à fort trafic qui autorisent le contenu généré par les utilisateurs, notre succès a fait de nous une cible attrayante pour ceux qui créeraient des enregistrements dans le but de réaliser un gain financier ou dans le but de commettre une fraude académique (ou les deux). Nous avons discuté de nos approches distinctes pour traiter chaque cas, ainsi que des plans que nous avons pour améliorer nos capacités à gérer le spam à l'avenir.
Afin d'équilibrer les priorités parfois concurrentes du contrôle des chercheurs et de la qualité des données, ORCID utilise un modèle de confiance distribué qui permet à des sources de données fiables et dignes de confiance d'être connectées via des workflows authentifiés à un ORCID record avec la permission du détenteur du record. De plus, en enregistrant et en divulguant la provenance de chaque affirmation présente dans un enregistrement, nous fournissons un mécanisme pour les utilisateurs de ORCID données pour juger de la véracité et de la fiabilité des informations ORCID dossiers pour eux-mêmes.
Aider les utilisateurs à comprendre comment interpréter les informations stockées dans un ORCID record est un élément de notre programme de confiance. Dans notre prochain article de blog de cette série, nous poursuivons notre célébration du cinquième anniversaire de la ORCID Trust Program en introduisant le concept de « marqueurs de confiance » dans un ORCID enregistrer et discuter de la façon dont les utilisateurs de ORCID les données peuvent déterminer elles-mêmes les assertions auxquelles elles font confiance et les types d'assertions qu'elles considèrent comme des marqueurs de confiance pour leur cas d'utilisation spécifique.
Liens associés
- Parcours d'assurance d'assertion : que sont-ils et pourquoi sont-ils importants ?
- ORCID La confiance
- Mises à jour automatiques : gain de temps et renforcement de la confiance
- Construire une infrastructure de recherche robuste, un PID à la fois
- Open Access in Context : connecter les auteurs, les publications et les flux de travail à l'aide de ORCID Identifiants
- En utilisant ORCID, DOI et autres identifiants ouverts dans l'évaluation de la recherche
- Qu'y a-t-il de si spécial dans la connexion ?