2021 год - пятая годовщина ORCID'Trust Programme, и мы празднуем это серией сообщений в блогах, в которых изложены наши взгляды на то, как мы уравновешиваем иногда конкурирующие приоритеты контроля со стороны исследователей и качества данных, при этом придерживаясь наших ценностей открытости, доверия и инклюзивности.
По мере принятия ORCID растет, мы постоянно сталкиваемся с новыми возможностями и проблемами, поскольку мы стремимся выполнить нашу миссию обеспечение прозрачных и надежных связей между исследователями, их вкладом и принадлежностью. Мы узнали, что в наших усилиях по реализации нашего видения мир, в котором все, кто участвует в исследованиях, стипендиях и инновациях, уникально идентифицированы и связаны со своим вкладом в разных дисциплинах, границах и времени »,доверие »- это стержень. Как ORCID думает о доверии и приближается к нему - индивидуальный контроль, подотчетность через общественный контроль и честность через строгое отслеживание происхождения - с тех пор мало что изменилось. ORCID была основана, или с тех пор, как мы запустила нашу программу доверия в 2016 году. Тот факт, что мы построены сообществом и управляем Член Совета директоров Представитель наших членов гарантирует, что мы и дальше будем пользоваться доверием и поддержкой сообщества, которому мы служим.
Это сообщение в блоге - первое из серии, посвященной пятилетию ORCID Программа доверия. В этом посте мы стремимся повторно познакомить пользователей с нашей Программой доверия и прояснить наши взгляды на то, как мы уравновешиваем иногда конкурирующие приоритеты контроля исследователя и качества данных, придерживаясь наших ценностей открытости, доверия и инклюзивности. Мы обсудим возникающие проблемы, представленные ORCIDрост уровня участия (да, мы говорим о спаме). Вы узнаете, с какими видами спама мы сталкиваемся, что мы делаем для его устранения и почему это больше раздражает, чем препятствует практическому использованию. ORCIDпользуюсь. Мы также поговорим о нашем подходе к обработке мошеннических претензий в ORCID записи и разрешение споров. Наконец, мы рассмотрим, как маркеры доверия в ORCID записи, добавленные ORCID членские организации, разрешите ORCID пользователи данных, чтобы определить для себя, каким записям доверять.
В следующих статьях мы расскажем, как исследователи могут оптимизировать свои собственные ORCID записи, чтобы обеспечить максимальную ценность, как учреждения могут поощрять своих исследователей к взаимодействию с их ORCID интеграции, и мы поможем ORCID пользователи данных интерпретируют информацию, которую они могут найти в ORCID реестр.
По-прежнему держать исследователя (участника, ученого, пользователя) в центре всего, что мы делаем
В 2016 ORCID помолвлен с эксперты по конфиденциальности и безопасности данных от сообщества, чтобы помочь нам проанализировать и усовершенствовать практики и политики, лежащие в основе надежности ORCID. На основе этой работы мы разработали ORCID Программа доверия чтобы обеспечить прозрачность в отношении средств контроля, политик и практик, которые мы применяем для обеспечения того, чтобы соединения контролировались исследователями, а источник каждого соединения был открыто сформулирован. Как и все, что мы делаем, ORCID Программа доверия основана на ORCIDАвтора 10 основополагающих принципов, два из которых напрямую касаются наших обязательств по контролю со стороны исследователей.
Определения исследователь, ученыйи участник со временем развиваются и могут варьироваться от поля к отрасли и от страны к стране. Независимо от того, как наши пользователи реестра думают о себе, ORCID всегда стремился держать их в центре всего, что мы делаем. Исследователи всегда смогут создавать, редактировать и поддерживать ORCID идентификатор и запись бесплатно. Исследователи контролируют, кто может видеть свои данные и с кем они делятся контролем - для записи, чтения и обновления своих записей - и на какой срок.
ORCID должен был решить двусмысленность имени
Какими бы индивидуальными ни были мы, наши имена на самом деле не так уж уникальны, и попытки связать исследовательскую деятельность и результаты с именем человека в прошлом приводили к бесконечной путанице. Даже в одной и той же дисциплине сотни или даже тысячи исследователей могут иметь одинаковые или похожие имена. Могут быть бесконечные вариации имен, которые могут меняться со временем: София Мария Эрнандес Гарсия, София Гарсия, С. М. Гарсия, С. Эрнандес Гарсия. Исследователи давно узнали, что имен недостаточно, чтобы гарантировать признание их работы.
ORCID, как независимый от имени идентификатор человека, был создан специально для решения проблемы двусмысленность имени в исследованиях, а также для обеспечения прозрачных и надежных связей между исследователями, их вкладом и принадлежностью.
Чтобы соответствовать этому варианту использования, важные характеристики ORCID Идентификационные данные заключаются в том, что они уникальны, постоянны и контролируются одним реальным человеком. Уникальное Произведение чтобы людей с одинаковыми именами можно было отличить друг от друга; стойкий так что один человек может поддерживать то же самое ORCID iD на протяжении всей карьеры; контролируется одним человеком так что пользователи ORCID данные могут быть достаточно уверены в том, что данные, содержащиеся в ORCID Рекорд - это данные, которые рекордсмен желает представить миру о себе. Для нашего варианта использования наличие ORCIDs быть ограниченным определенным классом лиц, ни для какого-то органа власти контролировать, кто может получить ORCID. И, как мы увидим позже, введение этих ограничений фактически затруднит нам достижение наших целей при сохранении приверженности нашим ценностям.
Важно повторить, что мы всегда стремились обеспечить механизм с помощью которых исследователи могут связаться с доверенными организациями, которые обновляют свои записи с помощью проверенных рабочих процессов, а не к быть механизмом с помощью которого исследователи признаются исследователями, просто имея ORCID я бы.
Другими словами, существование ORCID Сама по себе запись не свидетельствует о достоверности исследователя, как и наличие ISBN на обратной стороне книги не гарантирует, что эту книгу хорошо прочитали. Подобно содержанию книги, определяющему ее качество, содержание данных в ORCID запись может многое сказать о ее надежности. В случае ORCID, мы предоставляем механизм для пользователей ORCID данные для оценки происхождения и достоверности информации в ORCID записывает для себя, записывая и раскрывая происхождение каждого утверждения, присутствующего в записи.
ORCID открыт для всех, кто может найти ORCID полезный
Для простоты мы часто используем слово «исследователь», когда говорим о ORCID рекордсмен, но помните букву «C» в ORCID означает «участник» - наши пользователи происходят из гораздо более широкого контекста, чем можно охватить одним словом. По факту, ORCID позволяет всем, кто может извлечь выгоду из использования ORCID Реестр, чтобы иметь возможность получать и использовать ORCID я бы. Любое жесткое определение того, кто «имеет право» на получение iD вероятно, непреднамеренно исключит людей, для которых ORCID iD было бы полезно из-за большого разнообразия обстоятельств, в которых находятся исследователи по всему миру. Более того, если каждый день создается около 10,000 XNUMX новых записей, это приведет к огромной утечке ресурсов, которые научное сообщество коллективно вносит в финансирование. ORCID в попытке обеспечить такую предварительную проверку с небольшим преимуществом.
В частности, не устанавливая никаких критериев того, кто может зарегистрироваться на ORCID отметьте, что мы обеспечиваем инклюзивность и поощряем постоянство ORCID IDs. Мы хотим побудить начинающих исследователей установить свои ORCID iDs как можно раньше в своей карьере, будучи студентами или даже учащимися средней или старшей школы, даже если они еще не создали официально признанных результатов исследований. Точно так же мы не хотим исключать независимых исследователей, таких как гражданские ученые или тех, кто в настоящее время не связан с официальным академическим учреждением из-за перерывов в карьере или выхода на пенсию.
Естественным следствием этого подхода является то, что злоумышленники могут выбрать самоутверждение информации в ORCID записи, которые являются ложными, либо с целью получения финансовой выгоды, либо с целью совершения академического мошенничества (или и того, и другого). Мы считаем, что именно наша приверженность этим ценностям открытости и инклюзивности привела к широко принятому открытому репозиторию данных, созданных пользователями, которые ORCID стал. Обратной стороной такой открытости и инклюзивности является неизбежное включение людей, которых широкое научное сообщество может не рассматривать как законных исследователей, и что некоторые данные, которыми они решают поделиться в своих записях, могут не рассматриваться другими как объективно верно.
На момент написания этой статьи было более 11 миллионов записей, и было бы удивительно, если бы мы не смогли похвастаться записями сомнительного научного содержания или качества, а это явно не так. Мы обнаружили, что проблемные записи бывают двух основных типов: SEO или ссылочный «спам» и явные попытки заявить о ложных академических записях. У нас есть разные подходы к каждому случаю, о чем мы подробнее расскажем ниже.
Поисковая оптимизация - это не ORCID прецедент
В немалой степени благодаря нашему успеху в принятии и широком использовании научным сообществом, orcid.org привлек немало внимания в Интернете: мы входим в число 5,000 лучших сайтов в мире по версии Alexa.com. В результате, как и большинство других сайтов с высоким трафиком, которые позволяют создавать пользовательский контент, мы являемся ловушкой для тех, кто пытается обыгрывать алгоритмы поисковых систем, используя наше относительно высокое влияние на рейтинг в поисковых системах (также известное как «ссылочный сок» или « авторитет домена »), чтобы попытаться повысить рейтинг своих сайтов. Эта практика известна как «ссылочный спам» или «SEO-спам (поисковая оптимизация)» и часто поддерживается так называемыми «фермерами ссылок» или «специалистами по поисковой оптимизации».
По иронии судьбы, это упражнение в значительной степени бесполезно, поскольку ссылки на другие сайты с ORCID записи помечены кодами «NoFollow». По большей части это препятствует тому, чтобы эти спам-записи в первую очередь повышали ценность SEO для связанных сайтов. Тем не менее, рассылка спама продолжается - мы подозреваем, потому что производители ссылок получают компенсацию в соответствии с объемом созданного спама, а не стоимостью достигнутых результатов. Жалко для потенциальных клиентов-фермеров, но SEO-оптимизация для предприятий по производству кухонных мойок никогда не использовалась ORCID!
Бесконечная игра в удар крота
Ссылочный спам, хотя и доставляет неудобства, не влияет на записи, отображаемые в аутентифицированные рабочие процессы что мы поощряем, поскольку у спамера нет стимула использовать свои записи для входа в систему или подключения к законным научным службам и системам. Тем не менее, мы понимаем, почему эти записи вызывают тревогу и ставят под сомнение общую ценность и надежность ORCID.
Мы прилагаем все усилия, чтобы постоянно отслеживать и «блокировать» записи о подозрении на спам, чтобы они не были видны никому, кроме владельца записи. Мы регулярно запускаем эвристику для обнаружения записей спама, и наша группа поддержки пользователей обычно блокирует тысячи записей каждый месяц. Мы также принимаем стандартные меры для ограничения автоматического создания спама ботами, например, требование завершения CAPTCHA перед созданием записи.
К сожалению, наш текущий эвристический подход очень трудоемок - поскольку он может привести к ложным срабатываниям, мы тщательно проверяем каждую запись о предполагаемом спаме, чтобы случайно не повлиять на исследователей, которые могут работать над темами, которые совпадают с «интересами» спамеров. , например, кибервалюта или человеческая сексуальность. Учитывая рост ORCID Registry, нас ждет бесконечная игра в «ударь крота», но мы готовы принять вызов.
Недавно мы экспериментировали с подходом машинного обучения к обнаружению спама, который дал очень многообещающие результаты. Мы считаем, что такой подход снизит потребность в проверке вручную и позволит нам блокировать спам-записи более своевременно и на постоянной основе. Хотя наша дорожная карта еще не определена, мы надеемся, что сможем сообщить о дальнейшем прогрессе в этом направлении в следующем году, при условии, конечно, тщательной оценки конфиденциальности. В качестве промежуточного шага мы принимаем меры по повышению релевантности наших результатов поиска, чтобы уменьшить влияние спам-записей на законных пользователей.
Солнечный свет - лучшее дезинфицирующее средство
Второй тип проблемной записи более проблематичен, но, к счастью, встречается гораздо реже. Этот тип включает в себя вопиющие попытки академического мошенничества и исходит от людей, которые создают фальшивые или вводящие в заблуждение ORCID записывает либо ошибочное убеждение, что просто имея ORCID iD передает некоторую степень легитимности или является попыткой ложно заявить о признании работы других. Такое поведение является нежелательным и явно запрещено нашими Условия использования бонуса.
Однако, как нейтральный поставщик инклюзивной инфраструктуры, нам было бы неуместно занимать редакционную позицию в отношении правдивости утверждений в ORCID записей, и мы не сможем активно курировать ORCID регистрировать или отслеживать мошеннические записи. Напротив, это та самая открытость, которая была запечена в ORCID с момента своего основания, что позволяет рассматривать претензии, предъявляемые рекордсменами, до общественного контроля, что, в свою очередь, позволяет сообществу отслеживать и сообщать о любых касающихся претензий.
Если у вас есть сомнения по поводу данных в чужом ORCID Запись или намерение держателя рекорда, мы рекомендуем в качестве первого курса действий напрямую связаться с этим человеком. В противном случае наша команда поддержки пользователей может помочь разрешить жалобу, выполнив действия, описанные в нашем Процедуры разрешения споров. Когда мы получаем сообщение о подозрительных данных, группа поддержки пользователей сначала работает со стороной спора и владельцем записи, чтобы решить проблему путем добросовестного диалога. В редких случаях, когда это не удается, мы выполняем шаги по эскалации, описанные в нашей процедуре разрешения споров, и в конечном итоге мы оставляем за собой право заблокировать неправильную запись и пометить ее как оспариваемую, если владелец записи не согласится внести исправления. Мы ведем журнал, когда и кем данные в реестре добавляются, редактируются или удаляются, чтобы помочь в этом процессе.
Контроль исследователя и надежные связи вызывают доверие
С ORCIDоснования, была школа мысли, которая ORCID - или другие авторитетные третьи стороны - должны решать, какие данные могут быть помещены в ORCID записывать. В конце концов, существует множество других биографических баз данных, которые работают таким образом, следуя традиционному подходу «авторитетных файлов». И если такие хорошо управляемые и тщательно отобранные данные лучше всего подходят для вашего варианта использования, мы рекомендуем вам работать с одним из них.
Однако ORCID есть и всегда должно было быть по-другому. Мы обнаружили, что строго соблюдая наши Основополагающий принцип контроля со стороны исследователей был важен для завоевания доверия и участия самих субъектов данных, а это, в свою очередь, было важно для широкого распространения и использования ORCID исследователями по всему миру, даже если это означает отказ от идеи центральной власти.
Авторитетные метаданные по-прежнему играют очень важную роль в ORCID тем не мение. Вместо того, чтобы централизованно хранить данные в одной стороне ORCID записей, мы внедрили распределенную модель доверия, которая позволяет надежным и заслуживающим доверия источникам данных всех способов и типов быть подключенными с разрешения владельца записи к их ORCID записывать. Мы поддерживаем строгие метаданные о происхождении каждого утверждения в ORCID записывать и раскрывать это в пользовательском интерфейсе реестра, через наш API и в нашем общедоступном файле данных. Таким образом, пользователи ORCID данные могут определять для себя, каким утверждениям они доверяют и какие утверждения они считают «маркерами доверия» для своего конкретного случая использования - например, принадлежность, подтвержденная исследовательскими учреждениями, или публикации, аутентифицированные издателями.
Наши аутентифицированные рабочие процессы гарантируют, что запись может быть связана с действием, идеей или организацией только с прямого разрешения владельца записи. Причем только ORCID организации-члены подтверждают утверждения в ORCID записи, гарантируя, что они подлежат нашей проверке и соответствуют условиям, изложенным в наших соглашение о членстве.
После установления эти высокоточные связи создают самоусиливающуюся петлю: в рабочих процессах, где исследователи получают большую выгоду от наличия ORCID iD, например, избегая повторного ввода данных, они с большей вероятностью будут взаимодействовать со своими записями и связывать их, что приводит к более полному и точному заполнению ORCID записи с надежными метаданными. Мы обнаружили, что хотя 48% записей в целом имеют прикрепленные к ним метаданные, это число возрастает - до 56% - для записей, подключенных по крайней мере к одной внешней системе. Кроме того, для записей, подключенных к системам в местах с согласованной национальной политикой и поддержкой инфраструктуры PID, например, в Австралии, число увеличивается до 88%. Одним из наших ключевых приоритетов на ближайшие годы является поощрение принятия национальных стратегий PID в более широком смысле и интеграции ORCID с ключевой национальной исследовательской инфраструктурой там, где сегодня это не так.
Далее: интерпретация «маркеров доверия» в ORCID учет
ORCIDфундаментальная приверженность исследователей контролю оказалась необходимой для завоевания доверия и участия исследователей, что, в свою очередь, сыграло важную роль в широком распространении и использовании ORCID исследователями и организациями по всему миру. Как и большинство других сайтов с высокой посещаемостью, которые позволяют создавать пользовательский контент, наш успех сделал нас привлекательной мишенью для тех, кто хотел бы создавать записи с целью получения финансовой выгоды или с целью совершения академического мошенничества (или того и другого). Мы обсудили наши индивидуальные подходы к обработке каждого случая, а также планы, которые у нас есть по улучшению наших возможностей по обработке спама в будущем.
Чтобы сбалансировать иногда конкурирующие приоритеты контроля исследователя и качества данных, ORCID использует модель распределенного доверия, которая позволяет подключать надежные и заслуживающие доверия источники данных через аутентифицированные рабочие процессы к ORCID запись с разрешения рекордсмена. Кроме того, записывая и раскрывая происхождение каждого утверждения, присутствующего в записи, мы предоставляем механизм для пользователей ORCID данные для оценки правдивости и достоверности информации в ORCID записи для себя.
Помогая пользователям понять, как интерпретировать информацию, хранящуюся в ORCID record является элементом нашей Программы доверия. В следующем посте из этой серии мы продолжим празднование пятилетнего юбилея ORCID Программа доверия, вводя понятие «маркеры доверия» в ORCID записывать и обсуждать, как пользователи ORCID данные могут определять для себя, каким утверждениям они доверяют, и какие утверждения они считают маркерами доверия для своего конкретного варианта использования.
Связанные ссылки
- Пути обеспечения уверенности: что это такое и почему они имеют значение?
- ORCID Доверие
- Автообновления: экономия времени и укрепление доверия
- Создание надежной исследовательской инфраструктуры, по одному PID за раз
- Открытый доступ в контексте: объединение авторов, публикаций и рабочих процессов с помощью ORCID Идентификаторы
- . ORCID, DOI и другие открытые идентификаторы в оценке исследований
- Что такого особенного в входе в систему?