FAIR-данные
FAIR-данные — это данные, соответствующие принципам Findability, Accessibility, Interoperability, Reusability — находимости, доступности, совместимости и переиспользования[1], акроним FAIR можно также перевести как «честные», «справедливые». Данные принципы были представлены в мартовской статье 2016 года в журнале Scientific Data консорциумом из нескольких ученых и организаций.[1]
Принципы FAIR фокусируются на возможностях автоматической обработки — то есть способность вычислительных систем находить, получать доступ, взаимодействовать и повторно использовать данные без вмешательства человека, или с минимальным его участием — это необходимо в связи с постоянным ростом объёма, сложности и скорости возникновения информации.[2]
Аббревиатура FAIR/O подразумевает добавление к описанным выше принципам явного указания открытой лицензии (Open license) на данные.
Принципы FAIR, опубликованные GO FAIR
Оригинал на https://www.go-fair.org/fair-principles/
Findable — находимость
Первый шаг в (пере)использовании данных — это их поиск. Метаданные и данные должны быть легко обнаружимы как для людей, так и для компьютеров. Машиночитаемые метаданные необходимы для автоматического обнаружения наборов данных и сервисов, это важный компонент процесса FAIRфикации.
- F1. (Мета)данным присваивается глобальный уникальный и постоянный идентификатор
- F2. Данные описываются с помощью расширенных метаданных (определяются ниже в пункте R1).
- F3. Метаданные чётко и явно включают идентификатор данных, которые они описывают
- F4. (Мета)данные регистрируются или индексируются в системе с поисковыми возможностями
Оригинальный текст (англ.)[показатьскрыть]The first step in (re)using data is to find them. Metadata and data should be easy to find for both humans and computers. Machine-readable metadata are essential for automatic discovery of datasets and services, so this is an essential component of the FAIRification process.
- F1. (Meta)data are assigned a globally unique and persistent identifier
- F2. Data are described with rich metadata (defined by R1 below)
- F3. Metadata clearly and explicitly include the identifier of the data they describe
- F4. (Meta)data are registered or indexed in a searchable resource
Accessible — доступность
Как только пользователь находит необходимые данные, ему становится нужно понять, как получить к ним доступ, возможно, с учётом аутентификации и авторизации.
- A1. (Мета)данные могут быть получены по их идентификатору с использованием стандартизированного протокола связи
- A1.1 Протокол является открытым, бесплатным и универсально реализуемым
- A1.2 Протокол допускает процедуру аутентификации и авторизации, где это необходимо
- A2. Метаданные остаются доступны, даже если сами данные больше недоступны
Оригинальный текст (англ.)[показатьскрыть]Once the user finds the required data, they need to know how they can be accessed, possibly including authentication and authorisation.
- A1. (Meta)data are retrievable by their identifier using a standardised communications protocol
- A1.1 The protocol is open, free, and universally implementable
- A1.2 The protocol allows for an authentication and authorisation procedure, where necessary
- A2. Metadata are accessible, even when the data are no longer available
Interoperable — совместимость
Данные обычно должны соединяться с другими данными. Кроме того, данные должны взаимодействовать с приложениями или рабочими процессами для анализа, хранения и обработки.
- I1. (Мета)данные используют формальный, доступный, общий и широко применяемый язык для представления знаний.
- I2. (Мета)данные используют словари, которые следуют FAIR-принципам
- I3. (Мета)данные включают квалифицированные ссылки на другие (мета)данные
Оригинальный текст (англ.)[показатьскрыть]The data usually need to be integrated with other data. In addition, the data need to interoperate with applications or workflows for analysis, storage, and processing.
- I1. (Meta)data use a formal, accessible, shared, and broadly applicable language for knowledge representation.
- I2. (Meta)data use vocabularies that follow FAIR principles
- I3. (Meta)data include qualified references to other (meta)data
Reusable — переиспользование
Конечная цель FAIR — оптимизировать повторное использование данных. Для достижения этой цели метаданные и данные должны быть хорошо описаны, чтобы их можно было копировать и/или комбинировать в различных условиях.
- R1. Мета(данные) подробно описаны с множеством точных и уместных свойств
- R1.1. (Мета)данные публикуются с чёткой разрешающей использование лицензией
- R1.2. (Мета)данные связаны с подробным описанием происхождения
- R1.3. (Мета)данные соответствуют стандартам сообщества, относящимся к данной предметной области
Оригинальный текст (англ.)[показатьскрыть]The ultimate goal of FAIR is to optimise the reuse of data. To achieve this, metadata and data should be well-described so that they can be replicated and/or combined in different settings.
- R1. Meta(data) are richly described with a plurality of accurate and relevant attributes
- R1.1. (Meta)data are released with a clear and accessible data usage license
- R1.2. (Meta)data are associated with detailed provenance
- R1.3. (Meta)data meet domain-relevant community standards
Принципы относятся к трём типам объектов: данным (или любому цифровому объекту), метаданным (информация об этом цифровом объекте) и инфраструктуре. Например, принцип F4 определяет, что и метаданные, и данные регистрируются или индексируются в системе с поисковыми возможностями (часть инфраструктуры).
Оригинальный текст (англ.)[показатьскрыть]The principles refer to three types of entities: data (or any digital object), metadata (information about that digital object), and infrastructure. For instance, principle F4 defines that both metadata and data are registered or indexed in a searchable resource (the infrastructure component).
Принятие и внедрение принципов FAIR-данных
Одна из первых статей, в которой обсуждались аналогичные идеи, была опубликована ещё в 2007 году.[3]
На саммите G20 в Ханчжоу в 2016 году лидеры Большой двадцатки выступили с заявлением, в котором одобрили применение FAIR-принципов в исследованиях.[4][5]
В 2016 году группа австралийских организаций разработала Заявление о FAIR-доступе к Результатам исследований Австралии (Australia's Research Outputs), которое расширяло использование принципов на результаты исследований.[6]
В 2017 году Германия, Нидерланды и Франция договорились о создании[7] международного офиса поддержки FAIR-инициативы – GO FAIR International Support and Coordination Office.
Другие международные организации, действующие в экосистеме исследовательских данных, такие как CODATA или Альянс исследовательских данных (RDA), также поддерживают внедрение FAIR своими членами. Оценка реализации FAIR-принципов проводится Рабочей группой по модели зрелости FAIR-данных в составе RDA[8]. Стратегическая десятилетняя программа CODATA «Данные для планеты: использование данных для решения междоменных задач»[9] упоминает принципы FAIR-данных как фундаментальное свойство основанных на данных наук.
Ассоциация Европейских исследовательских библиотек рекомендует использовать FAIR-принципы.[10]
В документе 2017 года, подготовленном сторонниками FAIR-данных, сообщалось о росте осведомленности о FAIR-концепции среди различных исследователей и институтов, но также отмечалось, что принцимы размываются, многие имеют своё особое видение.[11]
В руководствах по внедрению FAIR-методов обработки данных говорится, что стоимость плана управления данными в соответствии с FAIR-практиками должна составлять 5% от общего бюджета исследований.[12]
В 2019 году Глобальный альянс данных коренных народов (Global Indigenous Data Alliance — GIDA) опубликовал дополнение в виде CARE-принципов.[13] Принципы CARE («заботы») расширяют принципы FAIR, добавляя к ним Collective benefit (общую выгоду), Authority to control (полномочия по контролю), Responsibility (ответственность), Ethics (этику), чтобы обеспечить учёт исторического контекста и различий в возможностях.
Отмечается, что отсутствие информации о практическом применении руководящих принципов, привело к их непоследовательному толкованию.[14]
В январе 2020 года представители девяти групп университетов по всему миру подготовили Сорбоннскую декларацию о правах на исследовательские данные[15], которая включила обязательство предоставлять FAIR-данные и призвала правительства оказать поддержку для её реализации.[16]
См. также
- Управление данными
- Культура ремиксов
- Открытый доступ
- Открытые данные — наборы данных и базы данных, имеющие явную открытую лицензию
- Открытая наука
Примечания
- Wilkinson, Mark D. (15 March 2016). “The FAIR Guiding Principles for scientific data management and stewardship”. Scientific Data [англ.]. 3: 160018. Bibcode:2016NatSD...360018W. DOI:10.1038/sdata.2016.18. PMID 26978244.
- FAIR Principles (англ.) ?. GO FAIR. Дата обращения: 16 февраля 2020. Material was copied from this source, which is available under a Creative Commons Attribution 4.0 International License.
- Sandra Collins; Françoise Genova; Natalie Harrower; Simon Hodson; Sarah Jones; Leif Laaksonen; Daniel Mietchen; Rūta Petrauskaité; Peter Wittenburg (7 June 2018), «Turning FAIR data into reality: interim report from the European Commission Expert Group on FAIR data», Zenodo, doi:10.5281/ZENODO.1285272
- G20 leaders. G20 Leaders' Communique Hangzhou Summit (англ.). europa.eu. European Commission (5 September 2016).
- European Commission embraces the FAIR principles – Dutch Techcentre for Life Sciences . Dutch Techcentre for Life Sciences (20 April 2016).
- Australian FAIR Access Working Group . www.fair-access.net.au. Дата обращения: 3 апреля 2020.
- Ministerie van Onderwijs. Progress towards the European Open Science Cloud – GO FAIR – News item – Government.nl (нид.). www.government.nl (1 декабря 2017). Дата обращения: 15 февраля 2020.
- FAIR Data Maturity Model WG (англ.). RDA (23 сентября 2018). Дата обращения: 16 февраля 2020.
- Decadal Programme – CODATA . www.codata.org. Дата обращения: 16 февраля 2020.
- Association of European Research Libraries. Open Consultation on FAIR Data Action Plan – LIBER . LIBER (13 July 2018).
- Mons, Barend (7 March 2017). “Cloudy, increasingly FAIR; revisiting the FAIR Data guiding principles for the European Open Science Cloud”. Information Services & Use. 37 (1): 49—56. DOI:10.3233/ISU-170824.
- Science Europe. Funding research data management and related infrastructures (May 2016).
- CARE Principles of Indigenous Data Governance (англ.) ?. Global Indigenous Data Alliance. Дата обращения: 30 сентября 2019.
- Jacobsen, Annika (January 2020). “FAIR Principles: Interpretations and Implementation Considerations”. Data Intelligence. 2 (1—2): 10—29. DOI:10.1162/dint_r_00024.
- Sorbonne Declaration on Research Data Rights, Jan 27 2020
- Open data ‘tougher’ than open access and needs ‘mindset change’, Times Higher Education, January 31 2020
Ссылки
- FAIR Data and Semantic Publishing, заявление из лаборатории первого автора оригинальной статьи
- Guide to FAIR Data Голландского Техцентра наук о жизни
- Веб-сайт инициативы GO FAIR
- FAIR Principles с подробным описанием каждого из руководящих принципов инициативы GO FAIR
- FAIR-сказка, объясняющая принципы FAIR