Il 2021 è il quinto anniversario di ORCID's Trust Program e stiamo celebrando con una serie di post sul blog che delineano il nostro pensiero su come bilanciare le priorità a volte in competizione del controllo dei ricercatori e della qualità dei dati, aderendo al contempo ai nostri valori di apertura, fiducia e inclusività.
Come adozione di ORCID cresce, ci vengono costantemente presentate nuove opportunità e sfide mentre cerchiamo di realizzare la nostra missione di consentire connessioni trasparenti e affidabili tra i ricercatori, i loro contributi e le loro affiliazioni. Abbiamo imparato che nei nostri sforzi per raggiungere la nostra visione di a mondo in cui tutti coloro che partecipano alla ricerca, alla borsa di studio e all'innovazione sono identificati in modo univoco e collegati ai loro contributi attraverso discipline, confini e tempo, "fiducia” è il fulcro. Come ORCID pensa e si avvicina alla fiducia - controllo individuale, responsabilità attraverso il controllo pubblico e integrità attraverso un rigoroso monitoraggio della provenienza - è cambiato molto poco da quando ORCID è stata fondata per la prima volta, o da quando noi ha lanciato il nostro programma di fiducia nel 2016. Il fatto che siamo costruiti dalla comunità e governati da a Consiglio di Amministrazione rappresentante dei nostri membri garantisce che continuiamo ad avere la fiducia e il consenso della comunità che serviamo.
Questo post sul blog è il primo di una serie che celebra i cinque anni della ORCID Programma di fiducia. In questo post miriamo a far conoscere agli utenti il nostro Trust Program e chiarire il nostro pensiero su come bilanciare le priorità a volte in competizione del controllo dei ricercatori e della qualità dei dati, aderendo ai nostri valori di apertura, fiducia e inclusività. Discuteremo le sfide emergenti presentate da ORCIDi crescenti livelli di partecipazione (sì, stiamo parlando di spam). Imparerai che tipo di spam abbiamo riscontrato, cosa abbiamo fatto per affrontarlo e perché è più un fastidio che una barriera pratica per ORCIDuso. Parleremo anche del nostro approccio alla gestione dei reclami fraudolenti in ORCID registrazioni e risoluzione delle controversie. Infine, tratteremo come fidarsi dei marcatori in ORCID record, aggiunto da ORCID organizzazioni membri, consentire ORCID gli utenti dei dati per determinare da soli quali record fidarsi.
Nei post successivi tratteremo come i ricercatori possono ottimizzare i propri their ORCID record per garantire che fornisca il massimo valore, come le istituzioni possono incoraggiare i loro ricercatori a impegnarsi con i loro ORCID integrazioni, e noi ti aiuteremo ORCID gli utenti dei dati interpretano le informazioni che possono trovare nel ORCID Registro di sistema.
Sempre mantenendo il ricercatore (collaboratore, studioso, utente) al centro di tutto ciò che facciamo
Nel 2016, ORCID fidanzato con esperti di privacy e sicurezza dei dati dalla comunità per aiutarci a rivedere e perfezionare le pratiche e le politiche alla base dell'affidabilità di ORCID. Da questo lavoro abbiamo sviluppato il ORCID Programma di fiducia fornire trasparenza sui controlli, le politiche e le pratiche che mettiamo in atto per garantire che le connessioni siano controllate dai ricercatori e che la fonte di ciascuna connessione sia apertamente articolata. Come tutto ciò che facciamo, il ORCID Il Trust Program è radicato in ORCID'S 10 Principi Fondanti, due dei quali riguardano direttamente il nostro impegno per il controllo dei ricercatori.
Le definizioni di ricercatore, studiosoe collaboratore evolvere nel tempo e può variare da campo a campo e da paese a paese. Indipendentemente da come i nostri utenti del registro pensano di se stessi, ORCID da sempre si impegna a tenerli al centro di tutto ciò che facciamo. I ricercatori saranno sempre in grado di creare, modificare e mantenere un ORCID identificatore e registro gratuito. I ricercatori controllano chi può vedere i propri dati e con chi condividono il controllo (per scrivere, leggere e aggiornare i propri record) e per quanto tempo.
ORCID doveva risolvere ambiguità del nome
Per quanto individuali siamo tutti, i nostri nomi non sono poi così unici e i tentativi di collegare le attività di ricerca e i risultati al nome di una persona hanno portato a una confusione infinita in passato. Anche nella stessa disciplina, centinaia o addirittura migliaia di ricercatori possono avere nomi uguali o simili. Ci possono essere infinite varianti di nomi, che possono cambiare nel tempo: Sofia Maria Hernandez Garcia, Sofia Garcia, SM Garcia, S. Hernandez Garcia. I ricercatori hanno imparato molto tempo fa che i nomi non sono sufficienti per garantire il credito per il loro lavoro.
ORCID, come identificatore di persona indipendente dal nome, è stato fondato specificamente per aiutare a risolvere il problema di ambiguità del nome nella ricerca e per consentire connessioni trasparenti e affidabili tra i ricercatori, i loro contributi e le loro affiliazioni.
Per soddisfare questo caso d'uso, le importanti caratteristiche di ORCID Gli iD sono che sono unici, persistenti e controllati da un singolo individuo del mondo reale. Unico in modo che le persone con lo stesso nome possano essere distinte l'una dall'altra; persistere in modo che un individuo possa mantenere lo stesso ORCID iD per tutta la loro carriera; controllato da un singolo individuo in modo che gli utenti di ORCID dati possono essere ragionevolmente sicuri che i dati contenuti nel ORCID record sono i dati che il detentore del record desidera presentare al mondo su se stesso. Non è necessario per il nostro caso d'uso per la disponibilità di ORCIDs per essere ristretto a una specifica classe di individui, né per qualche autorità di controllo che può ottenere un ORCID. E, come vedremo in seguito, imporre questi vincoli renderebbe effettivamente più difficile per noi raggiungere i nostri obiettivi pur mantenendo l'adesione ai nostri valori.
È importante ribadire che il nostro intento è sempre stato quello di fornire un meccanismo con cui i ricercatori possono connettersi con organizzazioni fidate che aggiornano i loro record attraverso flussi di lavoro convalidati, non per essere un meccanismo per cui i ricercatori sono convalidati come ricercatori semplicemente avendo un ORCID ID.
In altre parole, l'esistenza di an of ORCID record in sé non è indicativo della validità di un ricercatore, così come la presenza di un ISBN sul retro di un libro assicura che quel libro sia una buona lettura. Proprio come il contenuto del libro che ne determina la qualità, il contenuto dei dati in un ORCID record può dirti molto sulla sua affidabilità. In caso di ORCID, forniamo un meccanismo per gli utenti di ORCID dati per giudicare l'origine e l'attendibilità delle informazioni in ORCID registra per se stesso registrando e rivelando la provenienza di ogni singola asserzione presente in un record.
ORCID è aperto a tutti coloro che possono trovare ORCID utile
Per semplicità usiamo spesso la parola “ricercatore” quando ci riferiamo ad un ORCID detentore del record, ma ricorda la “C” in ORCID sta per "contributore": i nostri utenti provengono da un contesto molto più ampio di quello che una sola parola può comprendere. Infatti, ORCID consente a tutti coloro che potrebbero trarre vantaggio dall'utilizzo del ORCID Registro di poter ottenere e utilizzare un ORCID ID. Qualsiasi definizione rigida di chi sarebbe "qualificato" per un iD probabilmente escluderebbe involontariamente le persone per le quali un ORCID iD sarebbe utile a causa dell'ampia diversità di circostanze in cui si trovano i ricercatori in tutto il mondo. Inoltre, con circa 10,000 nuovi record creati ogni giorno, rappresenterebbe un enorme salasso per le risorse che la comunità accademica collettivamente contribuisce a finanziare ORCID nel tentativo di imporre tale pre-convalida, con scarso vantaggio.
È specificamente non impostando tali criteri su chi può registrarsi per un ORCID registrare che garantiamo l'inclusività e incoraggiamo la persistenza di ORCID ID. Vogliamo incoraggiare i ricercatori in erba a stabilire il loro ORCID iD il più presto possibile nella loro carriera, come studenti universitari o persino studenti delle scuole secondarie o superiori, anche se non hanno ancora creato alcun prodotto di ricerca formalmente riconosciuto. Allo stesso modo, non desideriamo escludere ricercatori indipendenti come scienziati cittadini o quelli attualmente non affiliati a un'istituzione accademica formale a causa di interruzioni di carriera o pensionamento.
Una conseguenza naturale di questo approccio è che i cattivi attori possono scegliere di auto-affermare le informazioni in ORCID registrazioni false, sia per il perseguimento di un guadagno finanziario sia per commettere frodi accademiche (o entrambe le cose). Riteniamo che sia il nostro impegno per questi valori di apertura e inclusività che ha portato a un repository aperto e ampiamente adottato di dati generati dagli utenti che ORCID è diventato. Il rovescio della medaglia di tale apertura e inclusività è l'inevitabile inclusione di individui che potrebbero non essere considerati dalla più ampia comunità accademica come ricercatori legittimi e che alcuni dei dati che scelgono di condividere nei loro registri potrebbero non essere considerati da altri oggettivamente vero.
Con oltre 11 milioni di record al momento in cui scriviamo, sarebbe sorprendente se non fossimo in grado di vantare record di contenuto accademico o qualità discutibili, e chiaramente non è così. Scopriamo che i record problematici sono di due tipi principali: SEO o link "spam" e palesi tentativi di rivendicare documenti accademici falsi. Abbiamo approcci distinti per gestire ogni caso, come approfondiremo di seguito.
L'ottimizzazione per i motori di ricerca non è un'impresa ORCID caso d'uso
In gran parte grazie al nostro successo nel raggiungere l'adozione e un ampio utilizzo da parte della comunità accademica, orcid.org ha accumulato un coinvolgimento non trascurabile su Internet: ci posizioniamo tra i primi 5,000 siti a livello globale secondo Alexa.com. Di conseguenza, come la maggior parte degli altri siti ad alto traffico che consentono contenuti generati dagli utenti, siamo un miele per coloro che tentano di ingannare gli algoritmi dei motori di ricerca sfruttando la nostra influenza relativamente alta sulle classifiche dei motori di ricerca (altrimenti nota come "link juice" o " autorità di dominio”) per tentare di aumentare il ranking dei propri siti. Questa pratica è conosciuta come "link spamming" o "SEO (Search Engine Optimization) spamming" ed è spesso perpetuata dai cosiddetti "link farmer" o "operatori SEO black-hat".
Ironia della sorte, questo esercizio è in gran parte inutile, poiché i collegamenti ad altri siti da ORCID i record sono contrassegnati con codici "NoFollow". Per la maggior parte, ciò impedisce a questi record di spam di conferire un maggiore valore SEO ai siti collegati in primo luogo. Tuttavia, lo spamming continua — sospettiamo perché gli agricoltori di link vengono compensati in base al volume di spam creato piuttosto che al valore dei risultati ottenuti. Peccato per i potenziali clienti degli agricoltori di collegamento, ma l'ottimizzazione SEO per le aziende di lavelli da cucina non è mai stata un caso d'uso per ORCID!
Un gioco infinito di whack-a-mole
Lo spam dei link, anche se fastidioso, non influisce sui record emersi nel flussi di lavoro autenticati che incoraggiamo, poiché uno spammer non ha alcun incentivo a utilizzare i propri record per accedere o connettersi a servizi e sistemi accademici legittimi. Anche così, comprendiamo perché questi documenti destano allarme e mettono in dubbio il valore complessivo e l'affidabilità di ORCID.
Lavoriamo duramente per monitorare e "bloccare" costantemente i record sospetti di spam, in modo che non siano visibili a nessuno tranne che al detentore del record. Eseguiamo regolarmente l'euristica per rilevare i record di spam e il nostro team di assistenza agli utenti in genere blocca migliaia di record ogni mese. Adottiamo inoltre misure standard per limitare la creazione automatica di spam da parte dei bot, ad esempio richiedendo il completamento di un CAPTCHA prima della creazione del record.
Sfortunatamente, il nostro attuale approccio euristico è molto laborioso: poiché può portare a falsi positivi, esaminiamo attentamente ogni record sospetto di spam per assicurarci di non avere un impatto inavvertitamente sui ricercatori che potrebbero lavorare su argomenti che coincidono con gli "interessi" degli spammer , come la valuta informatica o la sessualità umana. Considerando la crescita del ORCID Registro di sistema, siamo pronti per una partita infinita di whack-a-mole, ma siamo pronti per la sfida.
Abbiamo recentemente sperimentato un approccio di Machine Learning per rilevare lo spam, che sta dando risultati molto promettenti. Riteniamo che un tale approccio ridurrebbe la necessità di revisione manuale e ci consentirebbe di bloccare i record di spam in modo più tempestivo e continuo. Sebbene non siano ancora saldamente sulla nostra tabella di marcia, speriamo di essere in grado di annunciare ulteriori progressi al riguardo nel prossimo anno, ovviamente soggetti a un'approfondita valutazione della privacy. Come passaggio intermedio, stiamo adottando misure per migliorare la pertinenza dei nostri risultati di ricerca al fine di mitigare l'impatto dei record di spam sugli utenti legittimi.
La luce del sole è il miglior disinfettante
Il secondo tipo di record problematico è più problematico, ma fortunatamente molto più raro. Questo tipo comporta palesi tentativi di frode accademica e proviene da persone che creano falsi o ingannevoli ORCID registra sia nella convinzione errata che semplicemente avere un ORCID iD trasmette un certo grado di legittimità, o nel tentativo di rivendicare falsamente credito per il lavoro di altri. Questo comportamento è discutibile e chiaramente proibito dal nostro Condizioni d'uso.
In qualità di fornitore di infrastrutture neutrale e inclusivo, tuttavia, non sarebbe appropriato per noi assumere una posizione editoriale sulla veridicità delle affermazioni in ORCID record, né sarebbe possibile per noi curare in modo proattivo il ORCID registro o monitorare i record fraudolenti. Invece, è proprio l'apertura che è stata cotta in ORCID fin dalla sua fondazione che consente di sottoporre al vaglio pubblico le affermazioni dei detentori del record, consentendo a sua volta alla comunità di monitorare e segnalare eventuali reclami relativi.
Se hai dubbi sui dati in un'altra persona ORCID Record o l'intento del detentore del record, raccomandiamo come prima linea d'azione di contattare direttamente quella persona. In caso contrario, il nostro team di assistenza agli utenti può aiutare a risolvere il reclamo seguendo i passaggi descritti nel nostro Procedure di controversia. Quando riceviamo una segnalazione di dati sospetti, il team di assistenza agli utenti inizialmente collabora con la parte della controversia e il titolare del record per risolvere il problema tramite un dialogo in buona fede. Nelle rare occasioni in cui ciò non ha esito positivo, seguiamo i passaggi di escalation delineati nella nostra procedura di contestazione e, in definitiva, ci riserviamo il diritto di bloccare il record errato e contrassegnarlo come contestato se il titolare del record non accetta di apportare correzioni. Manteniamo un registro di quando e da chi i dati nel registro vengono aggiunti, modificati o eliminati per facilitare questo processo.
Il controllo del ricercatore e le connessioni ad alta fedeltà generano fiducia
Dal ORCIDfondazione, c'è stata una scuola di pensiero che ORCID — o altre terze parti autorevoli — dovrebbero arbitrare quali dati possono essere inseriti in un ORCID disco. Ci sono, dopo tutto, molti altri database biografici che funzionano in questo modo, seguendo il tradizionale approccio "archivio di autorità". E se quel tipo di dati altamente gestiti e curati è il migliore per il tuo caso d'uso, ti consigliamo di lavorare con uno di essi.
Però, i ORCID è ed è sempre stato pensato per essere diverso. Abbiamo scoperto che aderendo rigorosamente al nostro Principio Fondatore del controllo del ricercatore è stato essenziale per conquistare la fiducia e la partecipazione degli stessi interessati, e questo a sua volta è stato essenziale per l'ampia diffusione e l'utilizzo di ORCID dai ricercatori di tutto il mondo, anche se questo significa abbandonare l'idea di autorità centrale.
I metadati autorevoli svolgono ancora un ruolo molto importante in ORCID tuttavia. Piuttosto che una parte che mantiene centralmente i dati in ORCID record, abbiamo implementato un modello di fiducia distribuita che consente di collegare fonti di dati affidabili e affidabili di tutti i modi e tipi, con il permesso del titolare del record, ai loro ORCID disco. Manteniamo metadati rigorosi sulla provenienza di ogni singola asserzione in un ORCID registrarlo e divulgarlo nell'interfaccia utente del Registro, tramite la nostra API e nel nostro file di dati pubblici. In questo modo, gli utenti di ORCID i dati possono determinare da soli quali asserzioni si fidano e quali tipi di asserzioni considerano "marcatori di fiducia" per il loro caso d'uso specifico, ad esempio affiliazioni che sono state autenticate da istituti di ricerca o pubblicazioni che sono state autenticate da editori.
I nostri flussi di lavoro autenticati garantiscono che un record possa essere collegato a un'attività, un'idea o un'organizzazione solo con il permesso diretto del titolare del record. Inoltre, solo ORCID le organizzazioni membri autenticano i reclami in ORCID registri, assicurando che siano soggetti al nostro controllo e mantenuti ai termini incorporati nel nostro contratto di affiliazione.
Una volta stabilite, queste connessioni ad alta fedeltà creano un circuito che si auto-rafforza: nei flussi di lavoro in cui i ricercatori traggono molti vantaggi dall'avere un ORCID iD, ad esempio, evitando l'immissione di dati ripetitivi, è più probabile che interagiscano con e colleghino i loro record, portando a una popolazione più completa e accurata di ORCID record con metadati affidabili. Abbiamo scoperto che mentre il 48% dei record in generale ha alcuni elementi di metadati collegati, quel numero sale - fino al 56% - per i record collegati ad almeno un sistema esterno. Inoltre, per i record collegati a sistemi in luoghi con politiche nazionali coerenti e supporto per l'infrastruttura PID, ad esempio l'Australia, il numero sale all'88%. Una delle nostre priorità chiave per i prossimi anni è incoraggiare l'adozione di strategie PID nazionali in modo più ampio e l'integrazione di ORCID con le principali infrastrutture di ricerca nazionali in luoghi dove oggi non è così.
Prossimo: interpretare i "marcatori di fiducia" in ORCID record
ORCIDl'impegno fondamentale del ricercatore nel controllo si è dimostrato essenziale per conquistare la fiducia e la partecipazione dei ricercatori, che a sua volta è stata essenziale per l'ampia diffusione e l'utilizzo di ORCID da ricercatori e organizzazioni di tutto il mondo. Come la maggior parte degli altri siti ad alto traffico che consentono contenuti generati dagli utenti, il nostro successo ci ha reso un obiettivo attraente per coloro che creerebbero record nel perseguimento di guadagni finanziari o allo scopo di commettere frodi accademiche (o entrambi). Abbiamo discusso dei nostri diversi approcci alla gestione di ogni caso, nonché dei piani che abbiamo per migliorare le nostre capacità di gestire lo spam in futuro.
Al fine di bilanciare le priorità talvolta in competizione tra il controllo del ricercatore e la qualità dei dati, ORCID utilizza un modello di fiducia distribuito che consente di collegare fonti di dati affidabili e affidabili tramite flussi di lavoro autenticati a un ORCID registrare con il permesso del titolare del record. Inoltre, registrando e divulgando la provenienza di ogni singola asserzione presente in un record, forniamo un meccanismo per gli utenti di ORCID dati per giudicare la veridicità e l'attendibilità delle informazioni in ORCID record per se stessi.
Aiutare gli utenti a capire come interpretare le informazioni memorizzate in un ORCID record è un elemento del nostro Trust Program. Nel nostro prossimo post sul blog di questa serie, continuiamo la nostra celebrazione del quinto anniversario del ORCID Trust Program introducendo il concetto di "marcatori di fiducia" in un ORCID registrare e discutere come gli utenti di ORCID i dati possono determinare da soli di quali asserzioni si fidano e quali tipi di asserzioni considerano indicatori di fiducia per il loro caso d'uso specifico.
Link associati
- Assertion Assurance Pathways: cosa sono e perché sono importanti?
- ORCID Affidati ad
- Aggiornamenti automatici: risparmio di tempo e rafforzamento della fiducia
- Costruire una solida infrastruttura di ricerca, un PID alla volta
- Accesso aperto nel contesto: collegamento di autori, pubblicazioni e flussi di lavoro utilizzando ORCID Identificatori
- utilizzando ORCID, DOI e altri identificatori aperti nella valutazione della ricerca
- Cosa c'è di così speciale nell'accesso?