Метаданные

Метаданные (от др.-греч. μετά «за, после, рядом, в середине»[1][2][3] и данные) — информация о другой информации, или данные, относящиеся к дополнительной информации о содержимом или объекте. Метаданные раскрывают сведения о признаках и свойствах, характеризующих какие-либо сущности, позволяющие автоматически искать и управлять ими в больших информационных потоках.

Метаданные используются в информационных системах

Базы данных

Такая информация часто используется в базах данных:

  1. Метаданные — это субканальная информация об используемых данных[4].
  2. Структурированные данные, представляющие собой характеристики описываемых сущностей для целей их идентификации, поиска, оценки, управления ими[5].
  3. Набор допустимых структурированных описаний, которые доступны в явном виде и предназначение которых может помочь найти объект[6]. Термин используется в контексте поиска объектов, сущностей, ресурсов.
  4. Данные из более общей формальной системы, заданную с описывающей свойства системы данных.
  5. Информация о содержащейся на веб-странице свойств информации (создателе и т. п.). Пример: Имя автора правки в тексте. Этот термин в широком смысле слова используется для любой информации о данных: именах таблиц, колонок в таблице в реляционных базах данных, номер версии в файле программы (то есть как информативная часть в бинарном файле) и т. п.

Иерархии метаданных

Структурированные в виде иерархии метаданные более правильно называть онтологией или схемой метаданных (например, XML-схема).

Различие между данными и метаданными

Обычно невозможно провести однозначное разделение на данные и метаданные в документе, поскольку:

  • Что-то может являться как данными, так и метаданными. Так, заголовок статьи можно одновременно отнести как к метаданным (как элемент метаданных — заголовок), так и к собственно данным (поскольку заголовок является частью самого текста).
  • Данные и метаданные могут меняться ролями. На стихотворение, рассматриваемое как данные, может быть написана музыка, в этом случае всё стихотворение может быть «прикреплено» к музыкальному файлу и в этом случае рассматриваться как метаданные. Таким образом, отнесение к одной или другой категории зависит от точки зрения (или пространства имён, системы отсчёта).
  • Возможно создание мета-мета-…-метаданных (см. аксиома выбора). Поскольку, в соответствии с обычным определением, метаданные являются данными, то можно создать метаданные на метаданные, метаданные для вывода на специальные устройства, либо чтения их описания с использованием программного обеспечения, преобразующего текст в речь.

Другие описательные метаданные могут использоваться автоматизированными рабочими потоками. Например, если некоторая «умная» программа «знает» содержимое и структуру данных, то данные могут быть автоматически преобразованы и переданы другой «умной» программе как входные данные. В результате, пользователи будут освобождены от необходимости выполнения множества рутинных операций, если данные предоставлены для работы такими «немногословными» программами.

Метаданные становятся важны в World Wide Web по причине необходимости обеспечения поиска полезной информации среди огромного количества доступной. Метаданные, созданные вручную, имеют большую ценность, поскольку это гарантирует осмысленность. Если веб-страница на какую-то определённую тему содержит слово или фразу, то все другие веб-страницы на эту тему могут содержать такое же слово или фразу. Метаданные также обладают разнообразием, поэтому если с какой-то темой связаны два значения, то каждое из них может быть использовано. Например, статья про Живой Журнал может быть обозначена с помощью нескольких значений: «Живой Журнал», «ЖЖ», «LiveJournal».

Метаданные используются для хранения информации о записях audio CD. Аналогично MP3 файлы хранят метаданные в формате ID3.

Редактировать метаданные графических файлов можно в специальных программах для работы с метаданными.

Классификация метаданных

Метаданные можно классифицировать по

  • Содержанию. Метаданные могут либо описывать сам ресурс (например, название и размер файла), либо содержимое ресурса (например, «в этом видеофайле показано как парень играет в футбол»).
  • По отношению к ресурсу в целом. Метаданные могут относиться к ресурсу в целом или к его частям. Например, «Title» (название фильма) относится к фильму в целом, а «Scene description» (описание эпизода фильма) отдельное для каждого эпизода фильма.
  • По возможности логического вывода. Метаданные можно подразделить на три слоя: нижний слой — это «сырые» данные сами по себе; средний слой — метаданные, описывающие указанные «сырые» данные; и верхний слой — метаданные, которые позволяют делать логический вывод, используя второй слой.

Тремя наиболее используемыми классами метаданных являются[7]:

  • Внутренние метаданные, описывающие структуру или составные части вещи, то, чем вещь является. Например, формат и размер файла.
  • Административные метаданные, требующиеся для процессов обработки информации, назначение вещи. Например, информация об авторе, редакторе, дата публикации и т. п.
  • Описательные метаданные, которые описывают природу вещи, её признаки. Например, набор связанных с информацией категорий, ссылки на другие вещи, связанные с данной.

Формат метаданных

Метаданными на практике обычно называют данные, представленные в соответствии с одним из форматов метаданных.

Формат метаданных — представляет собой стандарт, предназначенный для формального описания некоторой категории ресурсов (объектов, сущностей и т. п.). Такой стандарт обычно включает в себя набор полей (атрибутов, свойств, элементов метаданных), позволяющих характеризовать рассматриваемый объект. Например, формат MARC позволяет описывать книги (и не только книги), содержит поля для описания названия, автора, тематики и огромного множества других характеристик (формат MARC позволяет описать сотни характеристик).

Форматы можно классифицировать, во-первых, по охвату и подробности типов описываемых ресурсов. Во-вторых, по ширине и подробности области описания ресурсов и мощности структуры элементов метаданных. Кроме этого, можно классифицировать по предметным областям, или целям разработки и использования формата метаданных.

Форматы метаданных часто разрабатываются международными организациями или консорциумами, включающими в себя заинтересованные в появлении стандарта государственные организации и частные компании. Разработанный формат часто закрепляется как стандарт в одной или нескольких организациях, занимающихся разработкой и принятием стандартов (например W3C, ISO, ANSI и т. п.).

Классификация форматов метаданных по описываемой предметной области:

  • DCMI является одним из наиболее распространённых в интернет форматов метаданных для описания ресурсов любого типа (как электронных документов, так и реальных физических объектов). Другие форматы метаданных, предназначенные для описания архивов и электронных ресурсов GILS, EAD.
  • для описания персон и организаций vCard и FOAF
  • для описания библиографических ресурсов предназначены форматы семейства MARC (MARC 21, используемый в США и Великобритании, и UNIMARC, используемый в Европе и Азии); UNIMARC в свою очередь подразделяется на национальные расширения этого формата (так, в России используется RUSMARC); в силу большой сложности форматов семейства MARC для решения задач интеграции данных был разработан формат MODS.
  • для описания музейных и исторических ценностей используется формат CDWA
  • для описания издательской продукции используются PRISM и ONIX
  • для кристаллографической информации CIF
  • для работы с изображениями со спутников VICAR
  • для описания новостей NewsXML

и т. д.

Нормативные документы

  • Метаданные в информационных системах
    • ГОСТ Р ИСО 15836-2011 Информация и документация. Набор элементов метаданных Dublin Core
    • ГОСТ Р ИСО/МЭК 11179-1-2010 Информационная технология (ИТ). Регистры метаданных (РМД). Часть 1. Основные положения
    • ГОСТ Р ИСО/МЭК 11179-2-2012 Информационная технология (ИТ). Регистры метаданных (РМД). Часть 2. Классификация
    • ГОСТ Р ИСО/МЭК 11179-3-2012 Информационная технология (ИТ). Регистры метаданных (РМД). Часть 3. Метамодель регистра и основные атрибуты
    • ГОСТ Р ИСО/МЭК 11179-4-2012 Информационная технология (ИТ). Регистры метаданных (РМД). Часть 4. Формулировка определений данных
    • ГОСТ Р ИСО/МЭК 11179-5-2012 Информационная технология (ИТ). Регистры метаданных (РМД). Часть 5. Принципы наименования и идентификация
  • Метаданные в управлении документами
    • ГОСТ Р ИСО 23081-1-2008 СИБИД. Процессы управления документами. Метаданные для документов. Часть 1. Принципы[8]
  • Метаданные в картографировании
    • ГОСТ Р 52573-2006 Географическая информация. Метаданные[9]
    • ГОСТ Р 51353-99 Геоинформационное картографирование. Метаданные электронных карт. Состав и содержание
    • ГОСТ Р 57668-2017 (ИСО 19115-1:2014) Пространственные данные. Метаданные. Часть 1. Основные положения
    • ГОСТ Р 57656-2017 (ИСО 19115-2:2009) Пространственные данные. Метаданные. Часть 2. Расширения для изображений и матричных данных
  • Метаданные в образовании
    • ГОСТ Р 55750-2013 Информационно-коммуникационные технологии в образовании. Метаданные электронных образовательных ресурсов. Общие положения
    • ГОСТ 33247-2015 (ISO/IEC 19788-1:2011) Информационные технологии (ИТ). Обучение, образование и подготовка. Метаданные для образовательных ресурсов. Часть 1. Структура
    • ГОСТ ISO/IEC 19788-2-2015 Информационные технологии (ИТ). Обучение, образование и подготовка. Метаданные для образовательных ресурсов. Часть 2. Элементы Дублинского ядра
    • ГОСТ ISO/IEC 19788-3-2015 Информационные технологии (ИТ). Обучение, образование и подготовка. Метаданные для образовательных ресурсов. Часть 3. Основной профиль применения
    • ГОСТ ISO/IEC 19788-5-2015 Информационные технологии (ИТ). Обучение, образование и подготовка. Метаданные для образовательных ресурсов. Часть 5. Образовательные элементы
  • Метаданные в медицине
    • ГОСТ Р ИСО 13119-2016 Информатизация здоровья. Источники клинических знаний. Метаданные
    • ГОСТ Р 58505-2019/ISO/TS 20428:2017 Информатизация здоровья. Элементы данных и их метаданные для описания структурированной информации о клиническом геномном секвенировании в электронных медицинских картах
  • Метаданные в телевидении
    • ГОСТ Р 56476-2015 Телевидение вещательное цифровое. Система TV-Anytime. Схемы метаданных. Основные параметры
    • ГОСТ Р 56952-2016 Телевидение вещательное цифровое. Система TV-Anytime. Передача метаданных по двунаправленной сети. Основные параметры
    • ГОСТ Р 57873-2017 Телевидение вещательное цифровое. Система TV-Anytime. Протоколы передачи метаданных по двунаправленной сети. Основные параметры
    • ГОСТ Р 54719-2011 Архивирование телерадиопрограмм. Описание аудиовизуальных материалов. Структура метаданных

См. также

Примечания

  1. meta- (англ.) ?. Etymonline.
  2. meta (англ.) ?. Dictionary.com.
  3. meta- (англ.) // Wiktionary.
  4. Воройский Ф. С. Информатика. Новый систематизированный словарь-справочник (Вводный курс по информатике и вычислительной технике в терминах). — 2-е изд., перераб. и доп.. М.: Издательство Либерия, 2001. — С. 536. — ISBN 5-85129-134-6.
  5. Task Force on Metadata. Summary Report. // American Library Association. — 1999. Т. June.
  6. D. C. A. Bultermann. Is It Time For a Moratorium on Metadata? // IEEE MultiMedia. — 2004. Т. Oct-Dec.
  7. Wodtke, C. and Govella, A. Information Architecture: Blueprints for the Web. — Pearson Education, 2009. — 312 p. — ISBN 9780132104258.
  8. ГОСТ Р ИСО 23081-1-2008 СИБИД. Процессы управления документами. Метаданные для документов. Часть 1. Принципы (Переиздание).
  9. ГОСТ Р 52573-2006 Географическая информация. Метаданные.

Ссылки

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.