Rok 2021 je pátým výročím roku ORCIDProgram důvěry a oslavujeme řadou příspěvků na blogu, které nastiňují naše myšlení o tom, jak vyvažujeme někdy protichůdné priority kontroly výzkumníků a kvality dat, přičemž dodržujeme naše hodnoty otevřenosti, důvěry a inkluzivity.
Jako přijetí ORCID roste, neustále se nám předkládají nové příležitosti a výzvy, když se snažíme plnit své poslání umožnění transparentních a důvěryhodných spojení mezi výzkumnými pracovníky, jejich příspěvky a jejich přidruženími. Dozvěděli jsme se, že v našem úsilí dosáhnout naší vize a svět, kde jsou všichni, kteří se podílejí na výzkumu, stipendiu a inovacích, jedinečně identifikováni a spojeni s jejich příspěvky napříč obory, hranicemi a časem, “důvěra “je základním pilířem. Jak ORCID myslí na důvěru a přistupuje k ní - individuální kontrola, odpovědnost prostřednictvím veřejné kontroly a integrita prostřednictvím přísného sledování provenience - se od té doby změnilo jen velmi málo ORCID byl poprvé založen, nebo protože jsme zahájila náš program důvěryhodnosti v roce 2016. Skutečnost, že jsme vytvořeni komunitou a řídí nás a Správní rada zástupce našeho členství zajišťuje, že budeme mít i nadále důvěru a buy-in od komunity, které sloužíme.
Tento blogový příspěvek je prvním ze série oslavující pět let existence ORCID Program důvěry. V tomto příspěvku se snažíme znovu seznámit uživatele s naším programem důvěryhodnosti a vyjasnit naše myšlení o tom, jak vyvažujeme někdy konkurenční priority kontroly výzkumníků a kvality dat při dodržování našich hodnot otevřenosti, důvěry a inkluzivity. Budeme diskutovat o nově vznikajících výzvách ORCIDroste úroveň účasti (ano, mluvíme o spamu). Dozvíte se, jaký druh spamu zažíváme, co jsme dělali, abychom jej vyřešili, a proč je to spíše nepříjemnost než praktická překážka ORCIDpoužití. Budeme také hovořit o našem přístupu k řešení podvodných reklamací v ORCID záznamy a řešení sporů. Nakonec se budeme zabývat tím, jak se označují značky důvěry ORCID záznamy, přidal ORCID členské organizace, povol ORCID uživatelé dat, aby sami určili, kterým záznamům mají důvěřovat.
V následujících příspěvcích se budeme zabývat tím, jak mohou výzkumní pracovníci optimalizovat své vlastní ORCID záznam, aby bylo zajištěno, že poskytuje maximální hodnotu, jak mohou instituce povzbudit své výzkumné pracovníky, aby se zapojili ORCID integrace a my vám pomůžeme ORCID uživatelé dat interpretují informace, které mohou najít v ORCID registru.
Stále držíme výzkumného pracovníka (přispěvatele, vědce, uživatele) v centru všeho, co děláme
V 2016, ORCID zasnoubený s odborníci na ochranu soukromí a dat od komunity, aby nám pomohla zkontrolovat a vylepšit postupy a zásady, na nichž je založena důvěryhodnost ORCID. Z této práce jsme vyvinuli ORCID Program důvěry poskytnout transparentnost ohledně ovládacích prvků, zásad a postupů, které zavádíme, abychom zajistili, že připojení budou kontrolována výzkumníky a zdroj každého připojení bude otevřeně vyjádřen. Jako všechno, co děláme, i ORCID Program důvěryhodnosti má kořeny ORCIDJe 10 Zásady zakládání, z nichž dva přímo řeší náš závazek ke kontrole výzkumných pracovníků.
Definice výzkumník, učenec, a přispěvatel se vyvíjejí v průběhu času a mohou se lišit od pole k poli a zemi od země. Bez ohledu na to, jak si o nás uživatelé registru myslí, ORCID byla vždy odhodlána držet je v centru všeho, co děláme. Vědci budou vždy schopni vytvářet, upravovat a udržovat ORCID identifikátor a záznam zdarma. Výzkumníci určují, kdo může jejich data vidět a s kým sdílí kontrolu - jak zapisovat a číst a aktualizovat své záznamy - a na jak dlouho.
ORCID měl vyřešit nejednoznačnost názvu
Jakkoli jsme všichni individuální, naše jména opravdu nejsou tak jedinečná a pokusy spojit výzkumné aktivity a výsledky se jménem osoby vedly v minulosti k nekonečnému zmatku. I ve stejné disciplíně mohou mít stovky nebo dokonce tisíce vědců stejná nebo podobná jména. Může existovat nekonečná variace jmen, která se mohou časem měnit: Sofia Maria Hernandez Garcia, Sofia Garcia, SM Garcia, S. Hernandez Garcia. Vědci se už dávno dozvěděli, že jména nestačí k tomu, aby byla zajištěna zásluha jejich práce.
ORCID, jako identifikátor osoby nezávislé na jménu, byl založen speciálně za účelem řešení problému nejednoznačnost názvu ve výzkumu a umožnit transparentní a důvěryhodné vztahy mezi výzkumnými pracovníky, jejich příspěvky a jejich přidruženími.
Pro splnění tohoto případu použití jsou důležité vlastnosti ORCID ID jsou v tom, že jsou jedinečná, vytrvalá a ovládaná jediným jedincem v reálném světě. Unikátní aby lidé se stejným jménem byli navzájem odlišitelní; vytrvalý aby si jeden jedinec mohl udržovat to samé ORCID iD po celou dobu své kariéry; ovládán jedinou osobou takže uživatelé ORCID údaje lze důvodně spolehnout, že údaje obsažené v ORCID záznam je údaj, který držitel záznamu chce o sobě světu představit. Pro náš případ použití není nutná dostupnost ORCIDs být omezen na konkrétní třídu jednotlivců, ani na nějakou autoritu kontrolovat, kdo může získat ORCID. A jak uvidíme později, zavedení těchto omezení by nám ve skutečnosti znesnadnilo dosažení našich cílů při zachování dodržování našich hodnot.
Je důležité znovu zdůraznit, že naším záměrem vždy bylo poskytnout mechanismus kterým se vědci mohou spojit s důvěryhodnými organizacemi, které aktualizují své záznamy prostřednictvím ověřených pracovních postupů, nikoli do být mechanismem kterým jsou výzkumní pracovníci ověřováni jako výzkumní pracovníci jednoduše tím, že mají ORCID id.
Jinými slovy, existence ORCID záznam sám o sobě nenaznačuje platnost výzkumného pracovníka o nic víc než přítomnost čísla ISBN na zadní straně knihy zaručuje, že je tato kniha dobře čitelná. Stejně jako obsah knihy, který určuje její kvalitu, obsah dat v ORCID záznam vám může hodně říci o jeho důvěryhodnosti. V případě ORCID, poskytujeme mechanismus pro uživatele ORCID údaje k posouzení původu a důvěryhodnosti informací v systému Windows ORCID zaznamenávají pro sebe tím, že zaznamenávají a zveřejňují původ každého tvrzení přítomného v záznamu.
ORCID je otevřen všem, kteří mohou najít ORCID užitečný
Pro zjednodušení často používáme slovo „výzkumník“, když se odkazuje na ORCID držitel záznamu, ale pamatujte na „C“ v ORCID znamená „přispěvatel“ - naši uživatelé pocházejí z mnohem širšího kontextu, než jaké může obsáhnout jen jedno slovo. Ve skutečnosti, ORCID umožňuje každému, kdo by mohl mít prospěch z používání ORCID Registr, aby bylo možné získat a používat ORCID iD. Jakákoli rigidní definice toho, kdo by se „kvalifikoval“ pro iD pravděpodobně neúmyslně vyloučí lidi, pro které ORCID iD by bylo užitečné vzhledem k široké rozmanitosti okolností, ve kterých se výzkumníci nacházejí po celém světě. Navíc s přibližně 10,000 XNUMX novými záznamy vytvořenými každý den by to znamenalo obrovský odliv zdrojů, které vědecká komunita společně přispívá na financování ORCID ve snaze prosadit takovou předběžnou validaci, s malou výhodou.
Je to konkrétně tím, že nestanovíte žádná taková kritéria, kdo se může zaregistrovat ORCID zaznamenat, že zajišťujeme inkluzivitu a podporujeme vytrvalost ORCID ID. Chceme povzbudit začínající výzkumníky, aby si založili své ORCID iDs co nejdříve ve své kariéře, jako studenti nižšího stupně, nebo dokonce studenti středních nebo středních škol - i když dosud nevytvořili žádné formálně uznávané výzkumné výstupy. Stejně tak nechceme vyloučit nezávislé výzkumné pracovníky, jako jsou občanští vědci nebo ti, kteří v současné době nejsou spojeni s formální akademickou institucí kvůli přerušení kariéry nebo odchodu do důchodu.
Přirozeným důsledkem tohoto přístupu je, že špatní aktéři se mohou rozhodnout v sobě prosazovat informace ORCID záznamy, které jsou nepravdivé, ať už za účelem získání finančního zisku, nebo za účelem spáchání akademického podvodu (nebo obojího). Věříme, že právě náš závazek k těmto hodnotám otevřenosti a inkluzivity vyústil v široce přijaté otevřené úložiště dat generovaných uživateli, které ORCID stal se. Odvrácenou stranou této otevřenosti a inkluzivity je nevyhnutelné zahrnutí jednotlivců, kteří nemusí být širší vědeckou komunitou považováni za legitimní výzkumníky a že některá data, která se rozhodnou sdílet na svých záznamech, nemusí ostatní považovat za objektivně pravda.
S více než 11 miliony záznamů v době psaní tohoto článku by bylo překvapivé, kdybychom se nemohli chlubit žádnými záznamy o pochybném vědeckém obsahu nebo kvalitě, a to zjevně není tento případ. Zjistili jsme, že problematické záznamy přicházejí ve dvou hlavních typech: SEO nebo „spamový“ odkaz a do očí bijící pokusy o získání falešných akademických záznamů. K řešení jednotlivých případů máme odlišné přístupy, jak budeme dále podrobněji popisovat.
Optimalizace pro vyhledávače není ORCID případ použití
V nemalé míře díky našemu úspěchu při dosahování přijetí a širokého využití vědeckou komunitou, orcid.org nashromáždil nezanedbatelné zapojení na internetu: řadíme se mezi 5,000 XNUMX nejlepších stránek na celém světě podle Alexa.com. Výsledkem je, že stejně jako většina ostatních webů s vysokou návštěvností, které umožňují obsah vytvářený uživateli, jsme honeypotem pro ty, kteří se pokoušejí používat algoritmy vyhledávacích her tím, že využívají náš relativně vysoký vliv na hodnocení vyhledávačů (jinak známé jako „link juice“ nebo autorita domény “) ve snaze posílit hodnocení jejich vlastních stránek. Tato praxe je známá jako „spamování odkazů“ nebo „spamování SEO (optimalizace pro vyhledávače)“ a je často udržována takzvanými „link farmáři“ nebo „black-hat SEO agenty“.
Je ironií, že toto cvičení je do značné míry marné, stejně jako odkazy na jiné stránky z ORCID záznamy jsou označeny kódy „NoFollow“. Většinou to zabrání tomu, aby tyto spamové záznamy zapůjčily zvýšenou hodnotu SEO propojeným webům. Přesto spamování pokračuje - máme podezření, že farmáři odkazů jsou kompenzováni spíše podle objemu vytvořeného spamu než podle hodnoty dosažených výsledků. Škoda pro potenciální zákazníky farmářů, ale SEO optimalizace pro podniky s kuchyňskými dřezy nikdy nebyla případem použití ORCID!
Nekonečná hra rána-krtek
Propojený spam, i když je to nepříjemné, neovlivňuje záznamy, které se objevily na internetu ověřené pracovní postupy které doporučujeme, protože spammer nemá žádnou motivaci používat své záznamy k přihlášení nebo připojení k legitimním vědeckým službám a systémům. Přesto chápeme, proč tyto záznamy vyvolávají poplach a zpochybňují celkovou hodnotu a důvěryhodnost ORCID.
Usilovně pracujeme na neustálém sledování a „zamykání“ podezřelých spamových záznamů tak, aby je neviděl nikdo jiný než držitel záznamu. Pravidelně provádíme heuristiku ke zjišťování spamových záznamů a náš tým uživatelské podpory obvykle každý měsíc zamkne tisíce záznamů. Rovněž přijímáme standardní opatření, abychom zabránili automatickému vytváření spamu roboty, jako je požadavek na dokončení CAPTCHA před vytvořením záznamu.
Náš současný heuristický přístup je bohužel velmi náročný na práci - protože může vést k falešným poplachům, pečlivě kontrolujeme každý podezřelý záznam spamu, abychom zajistili, že neovlivníme neúmyslně výzkumníky, kteří by mohli pracovat na tématech, která se shodují se „zájmy“ spammerů , jako je kybernetická měna nebo lidská sexualita. Vzhledem k růstu ORCID registru, čeká nás nekonečná hra rána-krtek, ale máme tu výzvu.
Nedávno jsme experimentovali s přístupem Machine Learning k detekci spamu, který přináší velmi slibné výsledky. Věříme, že takový přístup by snížil potřebu manuální kontroly a umožnil nám uzamknout spamové záznamy včasněji a nepřetržitěji. I když ještě nejsme pevně na našem plánu, doufáme, že budeme moci v příštím roce oznámit další pokrok v této oblasti, samozřejmě s důkladným posouzením soukromí. V mezidobí přijímáme opatření ke zvýšení relevance našich výsledků vyhledávání, abychom zmírnili dopad spamových záznamů na legitimní uživatele.
Sluneční světlo je nejlepší dezinfekční prostředek
Druhý typ problematického záznamu je problematičtější, ale naštěstí mnohem vzácnější. Tento typ zahrnuje do očí bijící pokusy o akademické podvody a pochází od lidí, kteří vytvářejí falešné nebo klamavé stránky ORCID zaznamenává buď v zavádějící víře, že pouze má ORCID iD vyjadřuje určitý stupeň legitimity nebo ve snaze falešně požadovat úvěr za práci ostatních. Toto chování je nežádoucí a naše jednoznačně je zakázáno podmínky použití.
Jako neutrální poskytovatel inkluzivní infrastruktury by však nebylo vhodné, abychom zaujali redakční stanovisko k pravdivosti tvrzení v ORCID záznamů, ani by nebylo možné proaktivně kurátorovat ORCID registrovat nebo sledovat podvodné záznamy. Místo toho je to právě otevřenost ORCID od svého založení, které umožňuje, aby byly nároky vznesené držiteli záznamů zastaveny před veřejnou kontrolou, což komunitě zase umožňuje sledovat a hlásit jakékoli související nároky.
Pokud máte obavy z údajů v jiné osobě ORCID Záznam nebo záměr držitele záznamu, doporučujeme jako první postup kontaktovat tuto osobu přímo. V opačném případě může náš tým podpory uživatelů vyřešit stížnost podle pokynů uvedených v našem Postupy sporů. Když obdržíme hlášení o podezřelých datech, tým podpory uživatelů nejprve spolupracuje se stranou sporu a držitelem záznamu na vyřešení problému prostřednictvím dialogu v dobré víře. Ve výjimečných případech, kdy to není úspěšné, postupujeme podle kroků eskalace uvedených v našem postupu při řešení sporů a nakonec si vyhrazujeme právo uzamknout nesprávný záznam a označit jej jako sporný, pokud držitel záznamu nebude souhlasit s provedením oprav. Udržujeme protokol o tom, kdy a kým jsou údaje v registru přidávány, upravovány nebo mazány, aby se usnadnil tento proces.
Kontrola výzkumných pracovníků a spojení s vysokou věrností vytvářejí důvěru
Od ORCIDnadace, existuje myšlenkový směr ORCID - nebo jiné autoritativní třetí strany - by měly rozhodovat o tom, jaké údaje lze vložit do ORCID záznam. Koneckonců existuje mnoho dalších biografických databází, které fungují tímto způsobem, podle tradičního přístupu „autoritativního souboru“. A pokud je tento druh vysoce spravovaných a správných dat pro váš případ použití nejlepší, doporučujeme vám pracovat s jedním z nich.
Nicméně, ORCID je a vždy měl být jiný. Zjistili jsme, že se přísně dodržuje naše Zásada zakládání kontroly výzkumných pracovníků je zásadní pro získání důvěry a účasti samotných subjektů údajů, což je zase zásadní pro široké využívání a využívání ORCID výzkumníky z celého světa, i když to znamená opuštění myšlenky ústřední autority.
Autoritativní metadata stále hrají velmi důležitou roli ORCID nicméně. Spíše než jedna strana centrálně udržující data v ORCID záznamů jsme implementovali model distribuované důvěryhodnosti, který umožňuje připojení spolehlivých a důvěryhodných zdrojů dat všech způsobů a typů se souhlasem držitele záznamu k jejich ORCID záznam. Udržujeme přísná metadata o původu každého tvrzení v ORCID zaznamenat a zveřejnit to v uživatelském rozhraní registru, prostřednictvím našeho API a v našem veřejném datovém souboru. Tímto způsobem uživatelé ORCID údaje mohou samy určit, kterým tvrzením důvěřují a jaké druhy tvrzení považují za „značky důvěryhodnosti“ pro jejich konkrétní případ použití - například přidružení, která byla ověřena výzkumnými institucemi nebo publikace, které byly ověřeny vydavateli.
Naše ověřené pracovní postupy zajišťují, že záznam lze připojit k aktivitě, nápadu nebo organizaci pouze s přímým svolením držitele záznamu. Navíc pouze ORCID členské organizace ověřují nároky v ORCID záznamy, zajišťující, aby podléhaly naší kontrole a byly drženy za podmínek obsažených v našich dohoda o členství.
Jakmile jsou tato vysoce kvalitní spojení vytvořena, vytvářejí samoposilňující smyčku: v pracovních postupech, kde mají výzkumníci velkou výhodu v tom, že mají ORCID iD, například tím, že se vyhnou opakovanému zadávání dat, je pravděpodobnější, že se zapojí do svých záznamů a spojí je, což povede k úplnější a přesnější populaci ORCID záznamy se spolehlivými metadaty. Zjistili jsme, že zatímco 48% záznamů má celkově připojenou nějakou položku metadat, toto číslo stoupá - na 56% - u záznamů připojených k alespoň jednomu externímu systému. U záznamů připojených k systémům na místech s koherentní národní politikou a podporou infrastruktury PID, například Austrálie, se jejich počet zvyšuje na 88%. Jednou z našich klíčových priorit pro nadcházející roky je širší podpora přijetí národních strategií PID a integrace ORCID s klíčovou národní výzkumnou infrastrukturou v místech, kde tomu tak dnes není.
Další na řadě: interpretace „značek důvěryhodnosti“ v ORCID evidence
ORCIDUkázalo se, že základní závazek ke kontrole výzkumných pracovníků je nezbytný pro získání důvěry a účasti výzkumných pracovníků, což bylo zásadní pro široké zavádění a využívání ORCID výzkumníky a organizacemi z celého světa. Stejně jako většina ostatních webů s vysokou návštěvností, které umožňují obsah vytvářený uživateli, náš úspěch nás učinil atraktivním cílem pro ty, kteří by vytvářeli záznamy ve snaze o finanční zisk nebo za účelem spáchání akademického podvodu (nebo obojího). Diskutovali jsme o našich odlišných přístupech k řešení každého případu, stejně jako o plánech, které musíme zlepšit v budoucnu, abychom mohli zvládnout spam.
Aby bylo možné vyvážit někdy protichůdné priority kontroly výzkumníků a kvality dat, ORCID využívá model distribuované důvěryhodnosti, který umožňuje připojení spolehlivých a důvěryhodných zdrojů dat prostřednictvím ověřených pracovních postupů k ORCID záznam se svolením držitele záznamu. Dále zaznamenáváním a zveřejňováním původu každého tvrzení přítomného v záznamu poskytujeme mechanismus pro uživatele ORCID údaje k posouzení pravdivosti a důvěryhodnosti informací v ORCID záznamy pro sebe.
Pomáháme uživatelům pochopit, jak interpretovat informace uložené v souboru ORCID záznam je součástí našeho programu důvěryhodnosti. V našem dalším blogovém příspěvku v této sérii pokračujeme v naší oslavě pětiletého výročí ORCID Program důvěry zavedením pojmu „značky důvěryhodnosti“ v ORCID zaznamenávat a diskutovat o tom, jak uživatelé ORCID data mohou sami určit, kterým tvrzením důvěřují a jaké druhy tvrzení považují za značky důvěryhodnosti pro svůj konkrétní případ použití.
Přidružené odkazy
- Cesty k zajištění tvrzení: Co jsou zač a proč jsou důležité?
- ORCID Věřte
- Automatické aktualizace: úspora času a budování důvěry
- Budování robustní výzkumné infrastruktury, jeden PID po druhém
- Otevřený přístup v kontextu: Připojení autorů, publikací a pracovních postupů pomocí ORCID Identifikátory
- Použití ORCID, DOI a další otevřené identifikátory v hodnocení výzkumu
- Co je tak zvláštního na přihlášení?