2021 é o quinto aniversário de ORCIDdo Trust Program e estamos comemorando com uma série de postagens de blog que descrevem nosso pensamento sobre como equilibramos as prioridades às vezes concorrentes de controle do pesquisador e qualidade de dados, ao mesmo tempo que aderimos aos nossos valores de abertura, confiança e inclusão.
Como adoção de ORCID cresce, somos constantemente apresentados a novas oportunidades e desafios à medida que buscamos cumprir nossa missão de permitindo conexões transparentes e confiáveis entre pesquisadores, suas contribuições e suas afiliações. Aprendemos que em nossos esforços para alcançar nossa visão de um mundo onde todos os que participam da pesquisa, bolsa de estudos e inovação são exclusivamente identificados e conectados às suas contribuições através de disciplinas, fronteiras e tempo, “confiança ”é o eixo. Como ORCID pensa e aborda a confiança - controle individual, responsabilidade por meio de escrutínio público e integridade por meio de rastreamento de proveniência estrito - mudou muito pouco desde então ORCID foi fundada pela primeira vez, ou desde que nós lançou nosso programa de confiança em 2016. O fato de sermos construídos por uma comunidade e governados por um Conselho de Administração representante de nossos membros garante que continuemos a ter a confiança e aceitação da comunidade que servimos.
Esta postagem do blog é a primeira de uma série que comemora os cinco anos do ORCID Programa de confiança. Nesta postagem, pretendemos familiarizar novamente os usuários com nosso Programa de Confiança e esclarecer nosso pensamento sobre como equilibramos as prioridades às vezes concorrentes de controle do pesquisador e qualidade de dados, ao mesmo tempo que aderimos aos nossos valores de abertura, confiança e inclusão. Discutiremos os desafios emergentes apresentados por ORCIDos níveis de participação crescentes do (sim, estamos falando de spam). Você aprenderá que tipo de spam experimentamos, o que temos feito para resolvê-lo e por que é mais um aborrecimento do que uma barreira prática para ORCIDuso de. Também falaremos sobre nossa abordagem para lidar com reclamações fraudulentas em ORCID registros e resolução de disputas. Por fim, abordaremos como os marcadores de confiança em ORCID registros, adicionados por ORCID organizações membros, permitir ORCID usuários de dados para determinar por si próprios em quais registros confiar.
Em postagens subsequentes, cobriremos como os pesquisadores podem otimizar seus próprios ORCID registro para garantir que forneça valor máximo, como as instituições podem incentivar seus pesquisadores a se envolver ORCID integrações, e nós ajudaremos ORCID os usuários de dados interpretam as informações que podem encontrar no ORCID registro.
Ainda mantendo o pesquisador (contribuidor, acadêmico, usuário) no centro de tudo o que fazemos
Em 2016, ORCID Casado com especialistas em privacidade e segurança de dados da comunidade para nos ajudar a revisar e refinar as práticas e políticas que sustentam a confiabilidade de ORCID. A partir desse trabalho, desenvolvemos o ORCID Programa de Confiança para fornecer transparência sobre os controles, políticas e práticas que implementamos para garantir que as conexões sejam controladas por pesquisadores e a fonte de cada conexão seja abertamente articulada. Como tudo o que fazemos, o ORCID O programa de confiança está enraizado em ORCID'S 10 princípios fundamentais, dois dos quais abordam diretamente nosso compromisso com o controle do pesquisador.
As definições de investigador, estudiosoe contribuinte evoluem com o tempo e podem variar de campo para campo e de país para país. Independentemente de como nossos usuários de registro pensam sobre si mesmos, ORCID sempre se comprometeu a mantê-los no centro de tudo o que fazemos. Os pesquisadores sempre serão capazes de criar, editar e manter um ORCID identificador e registro gratuitos. Os pesquisadores controlam quem pode ver seus dados e com quem eles compartilham o controle - para escrever, ler e atualizar seus registros - e por quanto tempo.
ORCID foi feito para resolver ambigüidade de nome
Tão individuais como todos nós somos, nossos nomes não são realmente únicos, e as tentativas de vincular atividades e resultados de pesquisa ao nome de uma pessoa levaram a uma confusão sem fim no passado. Mesmo na mesma disciplina, centenas ou mesmo milhares de pesquisadores podem ter nomes iguais ou semelhantes. Pode haver infinitas variações de nomes, que podem mudar com o tempo: Sofia Maria Hernandez Garcia, Sofia Garcia, SM Garcia, S. Hernandez Garcia. Os pesquisadores aprenderam há muito tempo que os nomes não são suficientes para garantir o crédito por seu trabalho.
ORCID, como um identificador de pessoa independente de nome, foi fundado especificamente para ajudar a resolver o problema de ambigüidade de nome na pesquisa, e para permitir conexões transparentes e confiáveis entre pesquisadores, suas contribuições e suas afiliações.
Para atender a este caso de uso, as características importantes do ORCID IDs significam que são únicos, persistentes e controlados por um único indivíduo do mundo real. Único para que pessoas com o mesmo nome possam ser distinguidas umas das outras; persistente para que um indivíduo possa manter o mesmo ORCID iD ao longo de toda a sua carreira; controlado por um único indivíduo para que os usuários de ORCID dados podem ser razoavelmente seguros de que os dados contidos no ORCID registro são os dados que o detentor do registro deseja apresentar ao mundo sobre si mesmo. Não é necessário para nosso caso de uso para a disponibilidade de ORCIDs para ser restrito a uma classe específica de indivíduos, nem para alguma autoridade controlar quem pode obter um ORCID. E, como veremos mais tarde, impor essas restrições tornaria realmente mais difícil para nós atingirmos nossos objetivos, mantendo a aderência aos nossos valores.
É importante reiterar que nossa intenção sempre foi fornecer um mecanismo pelo qual os pesquisadores podem se conectar com organizações confiáveis que atualizam seus registros por meio de fluxos de trabalho validados, não para seja um mecanismo pelo qual os pesquisadores são validados como pesquisadores simplesmente por ter um ORCID eu ia.
Dito de outra forma, a existência de um ORCID o registro em si não é indicativo da validade de um pesquisador mais do que a presença de um ISBN no verso de um livro garante que aquele livro seja uma boa leitura. Muito parecido com o conteúdo do livro que determina sua qualidade, o conteúdo dos dados em um ORCID o registro pode dizer muito sobre sua confiabilidade. No caso de ORCID, nós fornecemos um mecanismo para usuários de ORCID dados para julgar a origem e confiabilidade das informações em ORCID registros para si próprios, registrando e divulgando a proveniência de cada uma das afirmações presentes em um registro.
ORCID está aberto a todos que possam encontrar ORCID útil
Para simplificar, costumamos usar a palavra "pesquisador" quando nos referimos a um ORCID detentor do recorde, mas lembre-se do "C" em ORCID significa “contribuidor” - nossos usuários vêm de um contexto muito mais amplo do que apenas uma palavra pode abranger. Na verdade, ORCID permite que todos que possam encontrar benefícios em usar o ORCID Registro para poder obter e usar um ORCID eu ia. Qualquer definição rígida de quem se "qualificaria" para um iD provavelmente excluiria involuntariamente pessoas para quem um ORCID iD seria útil devido à grande diversidade de circunstâncias em que os pesquisadores se encontram ao redor do mundo. Além disso, com cerca de 10,000 novos registros criados todos os dias, isso representaria um enorme dreno nos recursos que a comunidade acadêmica contribui coletivamente para financiar ORCID em tentar impor tal pré-validação, com pouca vantagem.
É especificamente por não definir tais critérios sobre quem pode se registrar para um ORCID registrar que garantimos a inclusão e encorajamos a persistência de ORCID IDs. Queremos encorajar pesquisadores iniciantes a estabelecer seus ORCID IDs o mais cedo possível em suas carreiras, como estudantes de graduação, ou mesmo alunos do ensino médio ou secundário - mesmo que ainda não tenham criado quaisquer resultados de pesquisa formalmente reconhecidos. Da mesma forma, não queremos excluir pesquisadores independentes, como cientistas cidadãos ou aqueles atualmente não afiliados a uma instituição acadêmica formal, devido a interrupções na carreira ou aposentadoria.
Uma conseqüência natural desta abordagem é que maus atores podem optar por auto-afirmar informações em ORCID registros que sejam falsos, seja na busca de ganhos financeiros ou com o propósito de cometer fraude acadêmica (ou ambos). Acreditamos que é nosso compromisso com esses valores de abertura e inclusão que resultou no repositório aberto e amplamente adotado de dados gerados por usuários que ORCID se tornou. O outro lado dessa abertura e inclusão é a inclusão inevitável de indivíduos que podem não ser considerados pela comunidade acadêmica mais ampla como pesquisadores legítimos e que alguns dos dados que eles optam por compartilhar em seus registros podem não ser considerados por outros como objetivamente verdadeiro.
Com mais de 11 milhões de registros no momento em que este livro foi escrito, seria surpreendente se não pudéssemos ostentar nenhum registro de conteúdo ou qualidade acadêmica questionável, o que claramente não é o caso. Descobrimos que os registros problemáticos vêm em dois tipos principais: SEO ou link “spam” e tentativas flagrantes de reivindicar registros acadêmicos falsos. Temos abordagens distintas para lidar com cada caso, conforme detalharemos mais a seguir.
A otimização do mecanismo de pesquisa não é um ORCID caso de uso
Em grande parte devido ao nosso sucesso em conseguir adoção e amplo uso pela comunidade acadêmica, orcid.org acumulou engajamento considerável na internet: classificamos entre os 5,000 principais sites globalmente de acordo com Alexa.com. Como resultado, como a maioria dos outros sites de alto tráfego que permitem conteúdo gerado pelo usuário, somos um honeypot para aqueles que tentam manipular os algoritmos do mecanismo de pesquisa, explorando nossa influência relativamente alta nas classificações do mecanismo de pesquisa (também conhecido como “link juice” ou “ autoridade de domínio ”) para tentar aumentar a classificação de seus próprios sites. Esta prática é conhecida como “link spamming” ou “SEO (Search Engine Optimization) spamming” e é frequentemente perpetuada pelos chamados “link makers” ou “black-hat SEO operatives”.
Ironicamente, este exercício é amplamente fútil, já que links para outros sites de ORCID os registros são marcados com códigos “NoFollow”. Na maior parte, isso evita que esses registros de spam emprestem maior valor de SEO aos sites vinculados. No entanto, o spam continua - suspeitamos porque os criadores de links são compensados de acordo com o volume de spam criado, e não com o valor dos resultados alcançados. Muito ruim para os possíveis clientes dos produtores de links, mas a otimização de SEO para empresas de pia de cozinha nunca foi um caso de uso para ORCID!
Um jogo interminável de whack-a-mole

O spam de links, embora seja um incômodo, não afeta os registros encontrados no fluxos de trabalho autenticados que encorajamos, pois um spammer não tem incentivos para usar seus registros para entrar ou se conectar a sistemas e serviços acadêmicos legítimos. Mesmo assim, entendemos por que esses registros levantam alarme e lançam dúvidas sobre o valor geral e a confiabilidade de ORCID.
Trabalhamos muito para monitorar e “bloquear” constantemente os registros de suspeita de spam, de forma que eles não sejam visíveis a ninguém além do detentor do registro. Executamos heurísticas regularmente para detectar registros de spam e nossa equipe de suporte ao usuário normalmente bloqueia milhares de registros todos os meses. Também tomamos medidas padrão para limitar a criação automática de spam por bots, como exigir a conclusão de um CAPTCHA antes da criação do registro.
Infelizmente, nossa abordagem heurística atual é muito trabalhosa - como pode resultar em falsos positivos, revisamos cuidadosamente cada registro de spam suspeito para garantir que não estamos afetando inadvertidamente os pesquisadores que podem estar trabalhando em tópicos que coincidem com os "interesses" dos spammers , como moeda cibernética ou sexualidade humana. Considerando o crescimento do ORCID registro, estamos prestes a um jogo interminável de whack-a-mole, mas estamos prontos para o desafio.
Recentemente, experimentamos uma abordagem de aprendizado de máquina para detectar spam, que está produzindo resultados muito promissores. Acreditamos que tal abordagem reduziria a necessidade de revisão manual e nos permitiria bloquear registros de spam de forma mais oportuna e contínua. Embora ainda não esteja firme em nosso roteiro, esperamos poder anunciar mais progresso nisso no próximo ano, sujeito, é claro, a uma avaliação de privacidade completa. Como uma etapa provisória, estamos tomando medidas para melhorar a relevância de nossos resultados de pesquisa a fim de mitigar o impacto dos registros de spam em usuários legítimos.
A luz solar é o melhor desinfetante
O segundo tipo de registro problemático é mais problemático, mas felizmente muito mais raro. Este tipo envolve tentativas flagrantes de fraude acadêmica e vem de pessoas que criam falsas ou enganosas ORCID registros tanto na crença equivocada de que apenas ter um ORCID iD transmite algum grau de legitimidade, ou em uma tentativa de reivindicar falsamente o crédito pelo trabalho de outros. Este comportamento é questionável e claramente proibido por nosso termos de uso.
Como um provedor de infraestrutura neutro e inclusivo, no entanto, não seria apropriado tomarmos uma posição editorial sobre a veracidade das reivindicações em ORCID registros, nem seria viável para nós curar proativamente o ORCID registro ou monitoramento de registros fraudulentos. Em vez disso, é a própria abertura que foi incorporada ORCID desde sua fundação que permite que as reivindicações feitas por detentores de registro sejam submetidas ao escrutínio público, por sua vez permitindo que a comunidade monitore e relate quaisquer reivindicações pertinentes.
Se você tiver dúvidas sobre os dados em outra pessoa ORCID Registro ou intenção do detentor do registro, recomendamos como primeiro curso de ação que você contate essa pessoa diretamente. Caso contrário, nossa equipe de Suporte ao Usuário pode ajudar a resolver a reclamação seguindo as etapas descritas em nosso Procedimentos de disputa. Quando recebemos um relatório de dados suspeitos, a equipe de Suporte ao Usuário trabalha inicialmente com a parte contestante e o detentor do registro para resolver o problema por meio de um diálogo de boa fé. Nas raras ocasiões em que isso não é bem-sucedido, seguimos as etapas de escalonamento descritas em nosso procedimento de disputa e, em última análise, nos reservamos o direito de bloquear o registro incorreto e marcá-lo como disputado se o detentor do registro não concordar em fazer as correções. Mantemos um registro de quando e por quem os dados no registro são adicionados, editados ou excluídos para ajudar nesse processo.
O controle do pesquisador e as conexões de alta fidelidade geram confiança
Como ORCIDfundação, tem havido uma escola de pensamento que ORCID - ou outros terceiros autorizados - devem arbitrar quais dados podem ser colocados em um ORCID registro. Afinal, existem muitos outros bancos de dados biográficos que funcionam dessa forma, seguindo a abordagem tradicional do “arquivo de autoridade”. E se esse tipo de dados altamente gerenciados e selecionados for o melhor para seu caso de uso, recomendamos que você trabalhe com um deles.
O Mercado Pago não havia executado campanhas de Performance anteriormente nessas plataformas. Alcançar uma campanha de sucesso exigiria ORCID é e sempre foi feito para ser diferente. Descobrimos que seguir estritamente a nossa Princípio Fundador do controle do pesquisador foi essencial para ganhar a confiança e a participação dos próprios titulares dos dados, e isso, por sua vez, foi essencial para a ampla aceitação e utilização dos ORCID por pesquisadores de todo o mundo, mesmo que isso signifique abrir mão da ideia de autoridade central.
Metadados oficiais ainda desempenham um papel muito importante na ORCID Contudo. Em vez de uma parte manter centralmente os dados em ORCID registros, implementamos um modelo de confiança distribuída que permite que fontes de dados confiáveis e confiáveis de todos os modos e tipos sejam conectadas, com a permissão do titular do registro, a seus ORCID registro. Mantemos metadados estritos sobre a proveniência de cada afirmação em um ORCID registre e divulgue isso na UI do Registro, por meio de nossa API e em nosso arquivo de dados públicos. Dessa forma, os usuários de ORCID os dados podem determinar por si próprios, quais afirmações eles confiam e quais tipos de afirmações eles consideram ser “marcadores de confiança” para seu caso de uso específico - por exemplo, afiliações que foram autenticadas por instituições de pesquisa ou publicações que foram autenticadas por editores.
Nossos fluxos de trabalho autenticados garantem que um registro possa ser conectado a uma atividade, ideia ou organização apenas com a permissão direta do detentor do registro. Além disso, apenas ORCID organizações membros autenticam reivindicações em ORCID registros, garantindo que estejam sujeitos ao nosso escrutínio e mantidos de acordo com os termos incorporados em nosso acordo de associação.
Uma vez estabelecidas, essas conexões de alta fidelidade criam um loop de auto-reforço: em fluxos de trabalho onde os pesquisadores obtêm muitos benefícios por ter um ORCID iD, por exemplo, evitando a entrada de dados repetitivos, eles são mais propensos a se envolver e conectar seus registros, levando a uma população mais completa e precisa de ORCID registros com metadados confiáveis. Descobrimos que, embora 48% dos registros em geral tenham algum item de metadados anexado a eles, esse número sobe - para 56% - para registros conectados a pelo menos um sistema externo. Além disso, para registros conectados a sistemas em locais com políticas nacionais coerentes e suporte para infraestrutura de PID, por exemplo, Austrália, o número aumenta para 88%. Uma das nossas principais prioridades para os próximos anos é incentivar a adoção de estratégias nacionais de PID de forma mais ampla e a integração de ORCID com infraestrutura de pesquisa nacional chave em lugares onde isso não é o caso hoje.
A seguir: interpretar "marcadores de confiança" em ORCID registros
ORCIDO compromisso fundamental da empresa com o controle do pesquisador provou ser essencial para ganhar a confiança e participação dos pesquisadores, o que por sua vez foi essencial para a ampla aceitação e utilização dos ORCID por pesquisadores e organizações em todo o mundo. Como a maioria dos outros sites de alto tráfego que permitem conteúdo gerado pelo usuário, nosso sucesso nos tornou um alvo atraente para aqueles que criariam registros em busca de ganho financeiro ou com o propósito de cometer fraude acadêmica (ou ambos). Discutimos nossas abordagens distintas para lidar com cada caso, bem como os planos que temos para melhorar nossas habilidades para lidar com spam no futuro.
A fim de equilibrar as prioridades às vezes concorrentes de controle do pesquisador e qualidade de dados, ORCID utiliza um modelo de confiança distribuído que permite que fontes de dados confiáveis sejam conectadas por meio de fluxos de trabalho autenticados a um ORCID registro com a permissão do titular do registro. Além disso, ao registrar e divulgar a proveniência de cada uma das afirmações presentes em um registro, fornecemos um mecanismo para os usuários de ORCID dados para julgar a veracidade e confiabilidade das informações em ORCID registros para si próprios.
Ajudando os usuários a entender como interpretar as informações armazenadas em um ORCID registro é um elemento de nosso Programa de Confiança. Em nossa próxima postagem no blog desta série, continuamos nossa celebração de cinco anos de aniversário do ORCID Programa de confiança, introduzindo o conceito de "marcadores de confiança" em um ORCID registrar e discutir como os usuários de ORCID os dados podem determinar por si próprios em quais asserções eles confiam e quais tipos de asserções eles consideram marcadores de confiança para seu caso de uso específico.
Links Associados
- Caminhos de garantia de asserção: o que são e por que são importantes?
- ORCID Confiança
- Atualizações automáticas: economia de tempo e construção de confiança
- Construindo uma infraestrutura de pesquisa robusta, um PID de cada vez
- Acesso aberto no contexto: conectando autores, publicações e fluxos de trabalho usando ORCID Identificadores
- utilização ORCID, DOI e outros identificadores abertos na avaliação de pesquisa
- O que há de tão especial no login?