2021年是五週年 ORCID的信任計劃,我們正在慶祝一系列博客文章,這些文章概述了我們如何平衡研究人員控制和數據質量有時相互競爭的優先事項,同時堅持我們的開放性、信任和包容性價值觀。
作為採用 ORCID 隨著我們不斷成長,我們在尋求實現我們的使命時不斷面臨新的機遇和挑戰 在研究人員、他們的貢獻和他們的從屬關係之間建立透明和可信賴的聯繫. 我們了解到,在我們努力實現我們的願景 在這個世界裡,所有參與研究、學術和創新的人都被獨特地識別出來,並與他們跨越學科、國界和時間的貢獻相關聯,“信任”是關鍵。 如何 ORCID 考慮和接近信任——個人控制、通過公眾監督進行問責,以及通過嚴格的出處追踪實現誠信——自那時以來幾乎沒有變化 ORCID 成立之初,或者自從我們 啟動我們的信託計劃 在 2016 年。事實上,我們是由社區建立和管理的 董事會 我們的會員代表確保我們繼續得到我們所服務社區的信任和支持。
這篇博文是慶祝 XNUMX 週年的系列文章中的第一篇。 ORCID 信託計劃。 在這篇文章中,我們旨在讓用戶重新熟悉我們的信任計劃,並闡明我們如何平衡研究人員控制和數據質量有時相互競爭的優先事項,同時堅持我們的開放性、信任和包容性價值觀。 我們將討論由 ORCID的參與水平不斷提高(是的,我們正在談論垃圾郵件)。 您將了解我們遇到了什麼樣的垃圾郵件,我們一直在做什麼來解決它,以及為什麼它比實際障礙更令人煩惱 ORCID的使用。 我們還將討論我們處理欺詐性索賠的方法 ORCID 記錄和解決糾紛。 最後,我們將介紹信任標記在 ORCID 記錄,由 ORCID 成員組織,允許 ORCID 數據用戶自行決定信任哪些記錄。
在隨後的帖子中,我們將介紹研究人員如何優化自己的 ORCID 記錄以確保它提供最大價值,機構如何鼓勵他們的研究人員參與他們的工作 ORCID 集成,我們將提供幫助 ORCID 數據用戶解釋他們可能在數據中找到的信息 ORCID 註冊表中。
仍然以研究人員(貢獻者、學者、用戶)為中心
在2016, ORCID 從事 隱私和數據安全專家 來自社區,以幫助我們審查和完善支持可信度的實踐和政策 ORCID. 從這項工作中,我們開發了 ORCID 信託計劃 為我們實施的控制、政策和實踐提供透明度,以確保研究人員控制連接,並且公開闡明每個連接的來源。 就像我們所做的一切一樣, ORCID 信任計劃植根於 ORCID“ 10 項創始原則,其中兩個直接體現了我們對研究人員控制的承諾。
的定義 研究員, 學者和 貢獻者 隨著時間的推移而發展,並且可能因領域和國家而異。 不管我們的註冊用戶如何看待自己, ORCID 一直致力於將它們置於我們所做一切的中心。 研究人員將始終能夠創建、編輯和維護一個 ORCID 標識符和記錄免費。 研究人員控制誰可以查看他們的數據以及與誰共享控制權——寫入、讀取和更新他們的記錄——以及持續多長時間。
ORCID 是為了解決 名稱歧義
儘管我們每個人都是個體,但我們的名字並不是那麼獨特,過去試圖將研究活動和結果與一個人的名字聯繫起來導致了無休止的混亂。 即使在同一學科中,數百甚至數千名研究人員的名字也可能相同或相似。 名字可以有無窮無盡的變化,它們會隨著時間的推移而改變:Sofia Maria Hernandez Garcia、Sofia Garcia、SM Garcia、S. Hernandez Garcia。 研究人員很久以前就了解到,名字不足以確保他們的工作獲得榮譽。
ORCID,作為獨立於姓名的人名標識符,專為幫助解決 名稱歧義 在研究中,並在研究人員、他們的貢獻和他們的從屬關係之間建立透明和可信賴的聯繫。
為了滿足這個用例,重要的特性 ORCID iD 是獨一無二的、持久的,並且由單個現實世界的個人控制。 獨特 以便可以區分同名的人; 一貫 這樣一個人就可以保持相同的 ORCID iD 在他們的整個職業生涯中; 由一個人控制 以便用戶 ORCID 數據可以合理地確信包含在 ORCID 記錄是記錄持有者希望向世界展示的關於他們自己的數據。 對於我們的用例來說,可用性不是必需的 ORCIDs 僅限於特定類別的個人,也沒有某些權力來控制誰可以獲得 ORCID. 而且,正如我們稍後將看到的,強加這些限制實際上會使我們更難實現我們的目標,同時保持對我們價值觀的堅持。
重要的是要重申我們的意圖一直是 提供機制 研究人員可以通過這種方式與可信賴的組織建立聯繫,這些組織通過經過驗證的工作流程更新他們的記錄,而不是為了 成為一種機制 研究人員僅通過擁有一個研究人員就可以證明其為研究人員 ORCID ID。
換句話說,存在一個 ORCID 記錄本身並不表明研究人員的有效性,就像書背面的 ISBN 可以確保該書是一本好書一樣。 很像決定其質量的書的內容,數據的內容 ORCID 記錄可以告訴你很多關於它的可信度。 如果是 ORCID,我們為用戶提供了一種機制 ORCID 數據來判斷信息的來源和可信度 ORCID 通過記錄和披露記錄中存在的每個斷言的出處來為自己記錄。
ORCID 對所有可能找到的人開放 ORCID 有用
為簡單起見,我們經常在提及某個研究人員時使用“研究人員”一詞。 ORCID 記錄保持者,但請記住中的“C” ORCID 代表“貢獻者”——我們的用戶來自更廣泛的背景,而不僅僅是一個詞可以涵蓋。 實際上, ORCID 使每個可能從使用中受益的人 ORCID 註冊表能夠獲取和使用 ORCID ID。 誰將“有資格”獲得任何嚴格的定義 iD 可能會無意中排除那些 ORCID iD 由於研究人員發現自己在世界各地的情況多種多樣,因此將很有用。 此外,每天創建大約 10,000 條新記錄,這將對學術界共同資助的資源造成巨大消耗。 ORCID 在試圖強制執行這種預驗證時,幾乎沒有優勢。
具體來說,是沒有設置任何此類標準來確定誰可以註冊 ORCID 記錄我們確保包容性並鼓勵堅持 ORCID 身份證。 我們希望鼓勵嶄露頭角的研究人員建立他們的 ORCID iD 盡可能早地在他們的職業生涯中,作為本科生,甚至是中學生或高中生——即使他們還沒有創造任何正式認可的研究成果。 同樣,我們不希望排除獨立研究人員,例如公民科學家或由於職業中斷或退休而目前與正式學術機構無關的研究人員。
這種方法的一個自然結果是,不良行為者可能會選擇在 ORCID 虛假記錄,無論是為了謀取經濟利益,還是出於學術欺詐(或兩者兼有)的目的。 我們相信,正是我們對這些開放性和包容性價值觀的承諾導致了廣泛採用的用戶生成數據的開放存儲庫, ORCID 已經成為。 這種開放性和包容性的另一面是不可避免地包含可能不被更廣泛的學術界視為合法研究人員的個人,並且他們選擇在其記錄中共享的某些數據可能不被其他人認為是合法的研究人員客觀真實。
在撰寫本文時,擁有超過 11 萬條記錄,如果我們能夠吹噓沒有任何學術內容或質量有問題的記錄,那將是令人驚訝的,而事實顯然並非如此。 我們發現有問題的記錄有兩種主要類型:搜索引擎優化或鏈接“垃圾郵件”,以及公然聲稱虛假學術記錄的企圖。 我們有不同的方法來處理每種情況,我們將在下面進一步詳細說明。
搜索引擎優化不是 ORCID 用例
很大程度上是由於我們成功地實現了學術界的採用和廣泛使用, orcid.org 在互聯網上積累了相當多的參與度:我們在全球排名前 5,000 的網站中名列前茅 Alexa.com. 因此,與大多數其他允許用戶生成內容的高流量網站一樣,對於那些試圖通過利用我們對搜索引擎排名相對較高的影響(也稱為“鏈接汁”或“域權威”) 以嘗試提高自己網站的排名。 這種做法被稱為“鏈接垃圾郵件”或“SEO(搜索引擎優化)垃圾郵件”,通常被所謂的“鏈接農民”或“黑帽 SEO 操作員”延續下去。
具有諷刺意味的是,這個練習在很大程度上是徒勞的,因為鏈接到其他網站 ORCID 記錄標有“NoFollow”代碼。 在大多數情況下,這首先可以防止這些垃圾郵件記錄為鏈接站點增加 SEO 價值。 儘管如此,垃圾郵件仍在繼續——我們懷疑是因為鏈接農民根據產生的垃圾郵件數量而不是所取得成果的價值獲得補償。 對於潛在的鏈接農民客戶來說太糟糕了,但廚房水槽業務的 SEO 優化從來都不是一個用例 ORCID!
無盡的打地鼠遊戲
鏈接垃圾郵件雖然令人討厭,但不會影響出現在 經過身份驗證的工作流程 我們鼓勵這樣做,因為垃圾郵件發送者沒有動機使用他們的記錄登錄或連接到合法的學術服務和系統。 即便如此,我們還是理解為什麼這些記錄會引起警覺並讓人懷疑其整體價值和可信度。 ORCID.
我們努力不斷地監控和“鎖定”可疑的垃圾郵件記錄,以便記錄持有者以外的任何人都看不到它們。 我們定期運行試探法來檢測垃圾郵件記錄,我們的用戶支持團隊通常每月鎖定數千條記錄。 我們還採取標準措施來限制機器人自動創建垃圾郵件,例如要求在創建記錄之前完成驗證碼。
不幸的是,我們目前的啟發式方法是非常費力的——因為它可能導致誤報,我們仔細審查每個可疑的垃圾郵件記錄,以確保我們不會無意中影響可能正在研究與垃圾郵件發送者“興趣”相符的主題的研究人員,例如網絡貨幣或人類性行為。 考慮到增長 ORCID 註冊表,我們正在玩無休止的打鼴鼠遊戲,但我們已準備好迎接挑戰。
我們最近嘗試使用機器學習方法來檢測垃圾郵件,並產生了非常有希望的結果。 我們相信這種方法將減少人工審查的需要,並使我們能夠更及時、持續地鎖定垃圾郵件記錄。 雖然尚未確定在我們的路線圖上,但我們希望能夠在來年宣布更多進展,當然這需要進行徹底的隱私評估。 作為臨時步驟,我們正在採取措施提高搜索結果的相關性,以減輕垃圾郵件記錄對合法用戶的影響。
陽光是最好的消毒劑
第二種有問題的記錄比較麻煩,但好在少之又少。 這種類型涉及公然企圖進行學術欺詐,並且來自製造虛假或欺騙性的人 ORCID 要么錯誤地認為僅僅有一個 ORCID iD 傳達某種程度的合法性,或試圖錯誤地聲稱他人的工作受到讚揚。 這種行為是令人反感的,我們明確禁止 使用條款.
然而,作為一個中立的、包容性的基礎設施提供商,我們對聲明的真實性採取編輯立場是不合適的。 ORCID 記錄,我們也不可能主動策劃 ORCID 註冊或監控欺詐記錄。 相反,正是這種開放性已經融入 ORCID 因為它的基礎使記錄持有者提出的主張能夠接受公眾監督,反過來又允許社區監控和報告任何相關的主張。
如果您擔心他人的數據 ORCID 根據記錄或記錄持有者的意圖,我們建議您首先直接聯繫該人。 否則,我們的用戶支持團隊可以按照我們的 爭議程序. 當我們收到可疑數據報告時,用戶支持團隊首先與爭議方和記錄持有者合作,通過真誠對話解決問題。 在此過程不成功的極少數情況下,我們會遵循爭議程序中概述的升級步驟,最終,如果記錄持有者不同意進行更正,我們保留鎖定錯誤記錄並將其標記為有爭議的權利。 我們維護一個日誌,記錄何時以及由誰添加、編輯或刪除註冊表中的數據,以幫助完成此過程。
研究人員控制和高保真連接產生信任
自 ORCID的基礎上,曾有一種學派認為 ORCID — 或其他權威第三方 — 應仲裁哪些數據可以放在 ORCID 記錄。 畢竟,還有許多其他傳記數據庫以這種方式工作,遵循傳統的“權威文件”方法。 如果這種高度管理和策劃的數據最適合您的用例,我們建議您使用其中之一。
然而, ORCID 是並且總是意味著不同。 我們發現,嚴格遵守我們的 創始原則 研究人員控制對於贏得數據主體本身的信任和參與至關重要,而這反過來又對於廣泛採用和利用 ORCID 世界各地的研究人員,即使這意味著放棄中央權威的想法。
權威元數據仍然扮演著非常重要的角色 ORCID 然而。 而不是一方集中維護數據 ORCID 記錄,我們已經實施了一個分佈式信任模型,該模型允許在記錄持有者的許可下,將各種方式和類型的可靠和可信賴的數據源連接到他們的 ORCID 記錄。 我們維護關於每個斷言出處的嚴格元數據 ORCID 通過我們的 API 和我們的公共數據文件在註冊表 UI 中記錄和披露這一點。 這樣,用戶 ORCID 數據可以自行確定,他們信任哪些斷言,以及他們認為哪些類型的斷言是其特定用例的“信任標記”——例如,已經過研究機構認證的附屬機構或已經過出版商認證的出版物。
我們經過身份驗證的工作流程確保只有在記錄持有者的直接許可下,記錄才能與活動、想法或組織相關聯。 而且,只有 ORCID 成員組織在 ORCID 記錄,確保它們受到我們的審查並遵守我們的 會員協議.
一旦建立,這些高保真連接就會創建一個自我強化的循環:在研究人員從擁有一個 ORCID iD,例如通過避免重複輸入數據,他們更有可能參與和連接他們的記錄,從而導致更完整和準確的人口 ORCID 具有可靠元數據的記錄。 我們發現,雖然 48% 的記錄總體上附加了一些元數據項,但對於連接到至少一個外部系統的記錄,這一數字上升到 56%。 此外,對於連接到具有一致國家政策和支持 PID 基礎設施的地方的系統的記錄,例如澳大利亞,這個數字增加到 88%。 我們未來幾年的主要優先事項之一是鼓勵更廣泛地採用國家 PID 戰略,並將 ORCID 在今天並非如此的地方擁有重要的國家研究基礎設施。
下一步:解釋“信任標記” ORCID 記錄
ORCID對研究人員控制的基本承諾已證明對於贏得研究人員的信任和參與至關重要,而這反過來又對廣泛採用和利用 ORCID 來自全球的研究人員和組織。 與大多數其他允許用戶生成內容的高流量網站一樣,我們的成功使我們成為那些為了追求經濟利益或出於學術欺詐(或兩者兼而有之)而創建記錄的人的有吸引力的目標。 我們討論了我們處理每個案例的獨特方法,以及我們必須在未來提高處理垃圾郵件能力的計劃。
為了平衡研究人員控制和數據質量有時相互競爭的優先事項, ORCID 利用分佈式信任模型,該模型允許可靠且值得信賴的數據源通過經過身份驗證的工作流連接到 ORCID 經記錄持有者許可進行記錄。 此外,通過記錄和披露記錄中存在的每個斷言的出處,我們為用戶提供了一種機制 ORCID 數據來判斷信息的真實性和可信度 ORCID 為自己記錄。
幫助用戶了解如何解釋存儲在 ORCID 記錄是我們信任計劃的一個要素。 在本系列的下一篇博文中,我們將繼續我們的五週年慶典 ORCID 信任計劃通過在一個項目中引入“信任標記”的概念 ORCID 記錄和討論用戶如何 ORCID 數據可以自行確定他們信任哪些斷言,以及他們認為哪些類型的斷言是其特定用例的信任標記。