2021 to piąta rocznica ORCIDTrust Program i świętujemy to serią postów na blogu, które przedstawiają nasze myślenie o tym, jak równoważymy czasami sprzeczne priorytety kontroli badaczy i jakości danych, jednocześnie przestrzegając naszych wartości otwartości, zaufania i integracji.
Jako przyjęcie ORCID rośnie, ciągle pojawiają się nowe możliwości i wyzwania, gdy staramy się realizować naszą misję umożliwianie przejrzystych i godnych zaufania powiązań między naukowcami, ich wkładu i przynależności. Nauczyliśmy się, że w naszych wysiłkach zmierzających do osiągnięcia naszej wizji świat, w którym wszyscy, którzy uczestniczą w badaniach, stypendiach i innowacjach, są jednoznacznie identyfikowani i powiązani z ich wkładem ponad dyscyplinami, granicami i czasem”,zaufanie” jest filarem. Jak ORCID myśli o zaufaniu i podchodzi do niego — indywidualna kontrola, odpowiedzialność poprzez kontrolę publiczną i uczciwość poprzez ścisłe śledzenie pochodzenia — od tamtej pory niewiele się zmieniło ORCID został założony po raz pierwszy, lub odkąd my uruchomiliśmy nasz program zaufania w 2016 r. Fakt, że jesteśmy zbudowani przez społeczność i zarządzani przez a Zarząd przedstawiciel naszych członków zapewnia, że nadal cieszymy się zaufaniem i poparciem społeczności, której służymy.
Ten wpis na blogu jest pierwszym z serii poświęconej pięciu latom ORCID Program zaufania. W tym poście naszym celem jest ponowne zapoznanie użytkowników z naszym Programem zaufania i wyjaśnienie naszego sposobu myślenia o tym, w jaki sposób równoważymy czasami konkurujące ze sobą priorytety kontroli badaczy i jakości danych, jednocześnie przestrzegając naszych wartości otwartości, zaufania i integracji. Omówimy pojawiające się wyzwania przedstawione przez ORCIDrosnące poziomy uczestnictwa (tak, mówimy o spamie). Dowiesz się, jakiego rodzaju spamu doświadczamy, co robimy, aby go rozwiązać i dlaczego jest to bardziej irytujące niż praktyczna bariera ORCIDużycie. Porozmawiamy również o naszym podejściu do obsługi fałszywych roszczeń w ORCID ewidencji i rozstrzygania sporów. Na koniec omówimy, w jaki sposób znaczniki zaufania w ORCID rekordy, dodane przez ORCID organizacje członkowskie, zezwól ORCID użytkownikom danych, aby sami określali, którym rekordom ufać.
W kolejnych postach omówimy, w jaki sposób badacze mogą zoptymalizować swoje własne ORCID rejestr, aby zapewnić maksymalną wartość, w jaki sposób instytucje mogą zachęcać swoich badaczy do angażowania się w ich badania ORCID integracje, a my pomożemy ORCID użytkownicy danych interpretują informacje, które mogą znaleźć w ORCID rejestr.
Nadal utrzymujemy badacza (współpracownika, naukowca, użytkownika) w centrum wszystkiego, co robimy
W 2016, ORCID zaręczony z eksperci ds. prywatności i bezpieczeństwa danych od społeczności, aby pomóc nam przejrzeć i udoskonalić praktyki i zasady leżące u podstaw wiarygodności ORCID. Na podstawie tej pracy opracowaliśmy tzw ORCID Program zaufania aby zapewnić przejrzystość w zakresie kontroli, zasad i praktyk, które wprowadzamy, aby upewnić się, że połączenia są kontrolowane przez badaczy, a źródło każdego połączenia jest otwarcie artykułowane. Jak wszystko, co robimy, tzw ORCID Program zaufania jest zakorzeniony w ORCID'S 10 zasad założycielskich, z których dwa bezpośrednio odnoszą się do naszego zaangażowania w kontrolę badaczy.
Definicje badacz, uczony, współpracownik ewoluują w czasie i mogą różnić się w zależności od dziedziny i kraju. Niezależnie od tego, jak nasi użytkownicy rejestru myślą o sobie, ORCID zawsze starała się, aby były one w centrum wszystkiego, co robimy. Badacze zawsze będą mogli tworzyć, edytować i utrzymywać plik ORCID identyfikator i zapis bezpłatnie. Badacze kontrolują, kto może przeglądać ich dane i komu udostępniać kontrolę — pisać, czytać i aktualizować swoje dane — i na jak długo.
ORCID miał rozwiązać dwuznaczność nazwy
Choć wszyscy jesteśmy indywidualni, nasze imiona naprawdę nie są tak wyjątkowe, a próby powiązania działań badawczych i wyników z nazwiskiem osoby prowadziły w przeszłości do niekończącego się zamieszania. Nawet w tej samej dyscyplinie setki, a nawet tysiące naukowców mogą mieć takie same lub podobne nazwiska. Mogą istnieć nieskończone odmiany imion, które mogą się zmieniać w czasie: Sofia Maria Hernandez Garcia, Sofia Garcia, SM Garcia, S. Hernandez Garcia. Badacze już dawno przekonali się, że nazwiska nie wystarczą, aby zapewnić uznanie dla ich pracy.
ORCID, jako niezależny od imienia i nazwiska identyfikator osoby, został założony specjalnie w celu rozwiązania problemu dwuznaczność nazwy w badaniach oraz umożliwienie przejrzystych i godnych zaufania powiązań między naukowcami, ich wkładu i przynależności.
Aby spełnić ten przypadek użycia, ważne cechy ORCID Identyfikatory są unikalne, trwałe i kontrolowane przez jedną osobę z prawdziwego świata. Wyjątkowy aby można było odróżnić osoby o tym samym imieniu; uporczywy aby jedna osoba mogła utrzymać to samo ORCID iD przez całą karierę; kontrolowane przez jedną osobę dzięki czemu użytkownicy ORCID można mieć wystarczającą pewność, że dane zawarte w ORCID rekord to dane, które posiadacz rekordu chce przedstawić światu o sobie. W naszym przypadku użycia nie jest konieczne zapewnienie dostępności ORCIDs być ograniczone do określonej klasy jednostek, ani też dla jakiegoś organu kontrolującego, kto może je uzyskać ORCID. Jak zobaczymy później, nałożenie tych ograniczeń w rzeczywistości utrudniłoby nam osiągnięcie naszych celów przy jednoczesnym przestrzeganiu naszych wartości.
Ważne jest, aby powtórzyć, że naszym zamiarem zawsze było dostarczyć mechanizm dzięki któremu badacze mogą łączyć się z zaufanymi organizacjami, które aktualizują swoje dane za pomocą zatwierdzonych przepływów pracy, a nie do być mechanizmem w którym badacze są potwierdzani jako badacze po prostu przez posiadanie ORCID ID.
Innymi słowy, istnienie an ORCID rekord sam w sobie nie wskazuje na ważność badacza, podobnie jak obecność numeru ISBN na odwrocie książki nie zapewnia, że książkę tę dobrze się czyta. Podobnie jak treść książki, która decyduje o jej jakości, zawartość danych w an ORCID rekord może wiele powiedzieć o jego wiarygodności. W przypadku ORCIDudostępniamy mechanizm dla użytkowników ORCID danych w celu oceny pochodzenia i wiarygodności informacji ORCID zapisy dla siebie, zapisując i ujawniając pochodzenie każdego twierdzenia zawartego w zapisie.
ORCID jest otwarty dla każdego, kto może znaleźć ORCID użyteczny
Dla uproszczenia często używamy słowa „badacz” w odniesieniu do an ORCID rekordzista, ale pamiętaj o „C” w ORCID oznacza „kontrybutor” — nasi użytkownicy pochodzą z dużo szerszego kontekstu, niż może objąć jedno słowo. W rzeczywistości, ORCID umożliwia wszystkim, którzy mogą odnieść korzyści z korzystania z ORCID Rejestru, aby móc uzyskać i używać ORCID ID. Jakakolwiek sztywna definicja tego, kto „kwalifikuje się” do iD prawdopodobnie nieumyślnie wykluczyłoby osoby, dla których an ORCID iD byłoby przydatne ze względu na dużą różnorodność okoliczności, w jakich znajdują się badacze na całym świecie. Co więcej, każdego dnia tworzonych jest około 10,000 XNUMX nowych rekordów, co spowodowałoby ogromne wyczerpanie zasobów, które społeczność naukowa wspólnie finansuje ORCID próbując wyegzekwować taką wstępną walidację, z niewielką przewagą.
Chodzi konkretnie o to, że nie ustala się żadnych kryteriów dotyczących tego, kto może się zarejestrować ORCID zapis, że zapewniamy integrację i zachęcamy do wytrwałości ORCID identyfikatory. Chcemy zachęcić początkujących naukowców do zakładania własnych ORCID iDs na jak najwcześniejszym etapie kariery, jako studenci, a nawet uczniowie szkół średnich lub ponadgimnazjalnych — nawet jeśli nie stworzyli jeszcze formalnie uznanych wyników badań. Podobnie nie chcemy wykluczać niezależnych badaczy, takich jak naukowcy-obywatele lub ci, którzy obecnie nie są związani z formalną instytucją akademicką z powodu przerwy w karierze lub przejścia na emeryturę.
Naturalną konsekwencją takiego podejścia jest to, że źli aktorzy mogą zdecydować się na samopotwierdzenie informacji ORCID rejestry, które są fałszywe, w pogoni za zyskiem finansowym lub w celu popełnienia oszustwa akademickiego (lub obu). Wierzymy, że to nasze zaangażowanie w te wartości otwartości i integracji zaowocowało szeroko przyjętym, otwartym repozytorium danych generowanych przez użytkowników, które ORCID stało się. Drugą stroną tej otwartości i inkluzywności jest nieuchronne włączenie osób, które mogą nie być uważane przez szerszą społeczność naukową za prawowitych badaczy oraz to, że niektóre dane, które zdecydują się udostępnić w swoich rejestrach, mogą nie być uważane przez innych za obiektywnie prawdziwe.
Przy ponad 11 milionach rekordów w chwili pisania tego tekstu byłoby zaskakujące, gdybyśmy mogli pochwalić się żadnymi zapisami o wątpliwej treści lub jakości naukowej, a tak nie jest. Odkryliśmy, że problematyczne rekordy występują w dwóch głównych typach: SEO lub „spam” z linkami oraz rażące próby uzyskania fałszywych rekordów akademickich. Mamy różne podejścia do rozpatrywania każdej sprawy, jak szczegółowo omówimy poniżej.
Search Engine Optimization nie jest ORCID przypadek użycia
W dużej mierze dzięki naszemu sukcesowi w przyjęciu i szerokim zastosowaniu przez społeczność naukową, orcid.org zgromadził spore zaangażowanie w Internecie: plasujemy się wśród 5,000 najlepszych witryn na świecie według Alexa.com. W rezultacie, podobnie jak większość innych witryn o dużym natężeniu ruchu, które pozwalają na treści generowane przez użytkowników, jesteśmy pułapką dla tych, którzy próbują oszukać algorytmy wyszukiwarek, wykorzystując nasz stosunkowo duży wpływ na rankingi w wyszukiwarkach (znany również jako „sok z linków” lub „sok z linków”). domain Authority”), aby spróbować podnieść ranking własnych witryn. Ta praktyka jest znana jako „spamowanie linków” lub „spamowanie SEO (Search Engine Optimization)” i jest często utrwalana przez tak zwanych „farmerów linków” lub „czarnych agentów SEO”.
Jak na ironię, to ćwiczenie jest w dużej mierze daremne, ponieważ linki do innych stron z ORCID rekordy są oznaczone kodami „NoFollow”. W przeważającej części zapobiega to przede wszystkim nadaniu przez te rekordy spamu zwiększonej wartości SEO połączonym witrynom. Niemniej jednak spamowanie trwa nadal — podejrzewamy, że hodowcy linków są wynagradzani w zależności od ilości utworzonego spamu, a nie wartości osiągniętych wyników. Szkoda dla potencjalnych klientów hodowców linków, ale optymalizacja SEO dla firm zajmujących się zlewozmywakami kuchennymi nigdy nie była użyteczna ORCID!
Niekończąca się gra w walnięcie w kreta
Spamowanie linków, choć uciążliwe, nie wpływa na rekordy pojawiające się w uwierzytelnione przepływy pracy do których zachęcamy, ponieważ spamer nie ma motywacji do używania swoich danych do logowania się lub łączenia z legalnymi usługami i systemami naukowymi. Mimo to rozumiemy, dlaczego te zapisy budzą niepokój i podają w wątpliwość ogólną wartość i wiarygodność ORCID.
Ciężko pracujemy, aby stale monitorować i „blokować” rekordy podejrzane o spam, tak aby nie były one widoczne dla nikogo poza posiadaczem rekordu. Regularnie przeprowadzamy heurystykę w celu wykrycia rekordów spamu, a nasz zespół obsługi użytkowników zazwyczaj blokuje tysiące rekordów każdego miesiąca. Podejmujemy również standardowe środki w celu ograniczenia automatycznego tworzenia spamu przez boty, takie jak wymaganie zakończenia CAPTCHA przed utworzeniem rekordu.
Niestety nasze obecne podejście heurystyczne jest bardzo pracochłonne — ponieważ może skutkować fałszywymi alarmami, dokładnie przeglądamy każdy podejrzany rekord spamu, aby upewnić się, że nie wpływamy nieumyślnie na badaczy, którzy mogą pracować nad tematami pokrywającymi się z „zainteresowaniami” spamerów , takich jak waluta cybernetyczna czy ludzka seksualność. Biorąc pod uwagę wzrost tzw ORCID rejestrze, czeka nas niekończąca się gra w walenie kreta, ale jesteśmy gotowi podjąć wyzwanie.
Niedawno eksperymentowaliśmy z podejściem uczenia maszynowego do wykrywania spamu, co daje bardzo obiecujące wyniki. Uważamy, że takie podejście ograniczyłoby potrzebę ręcznego sprawdzania i umożliwiłoby nam blokowanie rejestrów spamu w bardziej terminowy i ciągły sposób. Chociaż nasz plan działania nie jest jeszcze ustalony, mamy nadzieję, że będziemy mogli ogłosić dalsze postępy w tym zakresie w nadchodzącym roku, oczywiście z zastrzeżeniem dokładnej oceny prywatności. Jako krok przejściowy podejmujemy działania mające na celu poprawę trafności naszych wyników wyszukiwania w celu złagodzenia wpływu rejestrów spamu na legalnych użytkowników.
Światło słoneczne to najlepszy środek dezynfekujący
Drugi typ problematycznych zapisów jest bardziej kłopotliwy, ale na szczęście dużo rzadszy. Ten typ obejmuje rażące próby oszustwa akademickiego i pochodzi od osób, które tworzą fałszywe lub zwodnicze ORCID zapisy albo w błędnym przekonaniu, że samo posiadanie ORCID iD przekazuje pewien stopień zasadności lub stanowi próbę fałszywego przypisywania sobie uznania za pracę innych osób. Takie zachowanie jest niedopuszczalne i wyraźnie zabronione przez nasze Warunkami korzystania.
Jako neutralny, inkluzywny dostawca infrastruktury nie byłoby jednak właściwe, abyśmy zajmowali stanowisko redakcyjne w sprawie prawdziwości twierdzeń w ORCID zapisów, ani nie byłoby możliwe, abyśmy proaktywnie opiekowali się nimi ORCID rejestru lub monitorowania pod kątem fałszywych zapisów. Zamiast tego, jest to sama otwartość, w którą się upieczono ORCID od momentu powstania, która umożliwia publicznemu badaniu roszczenia posiadaczy rekordów, co z kolei pozwala społeczności monitorować i zgłaszać wszelkie dotyczące roszczeń.
Jeśli masz obawy dotyczące danych innej osoby ORCID rekordu lub intencji posiadacza rekordu, zalecamy w pierwszej kolejności skontaktowanie się bezpośrednio z tą osobą. W przeciwnym razie nasz zespół obsługi użytkownika może pomóc w rozwiązaniu reklamacji, postępując zgodnie z krokami opisanymi w naszym Procedury rozstrzygania sporów. Po otrzymaniu zgłoszenia o podejrzanych danych zespół obsługi użytkownika początkowo współpracuje ze stroną sporu i posiadaczem danych w celu rozwiązania problemu w drodze dialogu prowadzonego w dobrej wierze. W rzadkich przypadkach, gdy to się nie powiedzie, postępujemy zgodnie z krokami eskalacji opisanymi w naszej procedurze rozstrzygania sporów i ostatecznie zastrzegamy sobie prawo do zablokowania nieprawidłowego zapisu i oznaczenia go jako spornego, jeśli posiadacz rekordu nie zgodzi się na wprowadzenie poprawek. Aby pomóc w tym procesie, prowadzimy rejestr określający, kiedy i przez kogo dane w rejestrze są dodawane, edytowane lub usuwane.
Kontrola naukowca i połączenia o wysokiej wierności budzą zaufanie
Ponieważ ORCIDfundacji, istniała szkoła myślenia, że ORCID — lub inne autorytatywne strony trzecie — powinny rozstrzygnąć, jakie dane można umieścić w pliku ORCID nagrywać. W końcu istnieje wiele innych baz danych biograficznych, które działają w ten sposób, zgodnie z tradycyjnym podejściem „dokumentów urzędowych”. A jeśli tego rodzaju wysoce zarządzane i wyselekcjonowane dane są najlepsze w twoim przypadku użycia, zalecamy pracę z jednym z nich.
Jednakże, ORCID jest i zawsze miał być inny. Przekonaliśmy się, że ściśle przestrzegając naszych Zasada założycielska kontroli badaczy było niezbędne do zdobycia zaufania i udziału samych osób, których dane dotyczą, a to z kolei było niezbędne do szerokiego przyjęcia i wykorzystania ORCID przez badaczy na całym świecie, nawet jeśli oznacza to porzucenie idei władzy centralnej.
Autorytatywne metadane nadal odgrywają bardzo ważną rolę ORCID Jednakże. Zamiast jednej strony centralnie przechowującej dane w ORCID rekordów, wdrożyliśmy model rozproszonego zaufania, który umożliwia łączenie wiarygodnych i godnych zaufania źródeł danych wszelkiego rodzaju i sposobów, za zgodą posiadacza rekordu, z ich ORCID nagrywać. Utrzymujemy ścisłe metadane dotyczące pochodzenia każdego twierdzenia w an ORCID rejestrować i ujawniać to w interfejsie Rejestru, za pośrednictwem naszego interfejsu API oraz w naszym publicznym pliku danych. W ten sposób użytkownicy ORCID dane mogą same określić, którym stwierdzeniom ufają i jakie rodzaje stwierdzeń uważają za „znaczniki zaufania” dla ich konkretnego przypadku użycia — na przykład powiązania, które zostały uwierzytelnione przez instytucje badawcze lub publikacje, które zostały uwierzytelnione przez wydawców.
Nasze uwierzytelnione przepływy pracy zapewniają, że rekord można powiązać z działaniem, pomysłem lub organizacją tylko za bezpośrednią zgodą posiadacza rekordu. Co więcej, tylko ORCID organizacje członkowskie uwierzytelniają roszczenia w ORCID rejestrów, upewniając się, że podlegają one naszej kontroli i są przechowywane zgodnie z warunkami zawartymi w naszych dokumentach umowa członkowska.
Po ustanowieniu tych połączeń o wysokiej wierności tworzy się samonapędzająca się pętla: w przepływach pracy, w których badacze czerpią wiele korzyści z posiadania ORCID iD, na przykład unikając powtarzalnego wprowadzania danych, są bardziej skłonni do angażowania się i łączenia swoich rekordów, co prowadzi do pełniejszej i dokładniejszej populacji ORCID rekordy z wiarygodnymi metadanymi. Odkryliśmy, że podczas gdy ogólnie 48% rekordów ma dołączony jakiś element metadanych, liczba ta wzrasta — do 56% — w przypadku rekordów podłączonych do co najmniej jednego systemu zewnętrznego. Ponadto dla rekordów podłączonych do systemów w miejscach o spójnych politykach krajowych i wsparciu dla infrastruktury PID, np. w Australii, liczba ta wzrasta do 88%. Jednym z naszych kluczowych priorytetów na nadchodzące lata jest zachęcanie do szerszego przyjmowania narodowych strategii PID oraz ich integracji ORCID z kluczową krajową infrastrukturą badawczą w miejscach, gdzie obecnie tak nie jest.
Dalej: interpretacja „znaczników zaufania” w ORCID dokumentacja
ORCIDfundamentalne zaangażowanie firmy w kontrolę naukowców okazało się niezbędne do zdobycia zaufania i udziału naukowców, co z kolei było niezbędne do szerokiego przyjęcia i wykorzystania ORCID przez badaczy i organizacje z całego świata. Podobnie jak większość innych witryn o dużym natężeniu ruchu, które pozwalają na tworzenie treści przez użytkowników, nasz sukces sprawił, że staliśmy się atrakcyjnym celem dla tych, którzy tworzą rekordy w pogoni za korzyściami finansowymi lub w celu popełnienia oszustwa akademickiego (lub obu). Omówiliśmy nasze różne podejścia do rozpatrywania każdej sprawy, a także plany, które mamy w celu poprawy naszych możliwości radzenia sobie ze spamem w przyszłości.
Aby zrównoważyć czasami konkurujące ze sobą priorytety kontroli badaczy i jakości danych, ORCID wykorzystuje rozproszony model zaufania, który umożliwia łączenie niezawodnych i godnych zaufania źródeł danych za pośrednictwem uwierzytelnionych przepływów pracy z ORCID rekord za zgodą właściciela rekordu. Ponadto, rejestrując i ujawniając pochodzenie każdego twierdzenia zawartego w zapisie, zapewniamy mechanizm dla użytkowników ORCID danych w celu oceny prawdziwości i wiarygodności informacji ORCID rekordy dla siebie.
Pomaganie użytkownikom zrozumieć, jak interpretować informacje przechowywane w pliku ORCID rekord jest elementem naszego Programu Zaufania. W naszym kolejnym wpisie na blogu z tej serii kontynuujemy obchody piątej rocznicy istnienia firmy ORCID Program zaufania poprzez wprowadzenie koncepcji „znaczników zaufania” w ORCID nagrywać i omawiać, w jaki sposób użytkownicy ORCID dane mogą same określić, którym twierdzeniom ufają i jakie rodzaje twierdzeń uważają za znaczniki zaufania dla ich konkretnego przypadku użycia.
Powiązane linki
- Ścieżki zapewniania asercji: czym są i dlaczego mają znaczenie?
- ORCID Zaufaj
- Automatyczne aktualizacje: oszczędność czasu i budowanie zaufania
- Budowa solidnej infrastruktury badawczej, jeden PID na raz
- Otwarty dostęp w kontekście: łączenie autorów, publikacji i przepływów pracy za pomocą ORCID Identyfikatory
- Korzystanie z ORCID, DOI i inne otwarte identyfikatory w ocenie badań
- Co jest takiego specjalnego w logowaniu?