Семантическая публикация
Семантическая публикация (англ. Semantic publishing) или публикация в семантическом вебе (англ. semantic web publishing) — размещение информации в Интернете в формате документов, сопровождаемых семантической разметкой. Семантическая публикация даёт возможность поисковым машинам более точно интерпретировать структуру и смысл опубликованной информации, что делает поиск информации в Интернете и интеграции данных более эффективным[1].
Хотя семантическая публикация не является чем-то специфичным для Интернета, развитие семантических сетей способствовало росту числа семантических публикаций. В семантической сети информация публикуется вместе с метаданными, которые её описывают, обеспечивая тем самым «семантический» контекст[2][3][4].
Семантическая публикация потенциально способна изменить формат публикации документов в Интернете, но конкретная реализация этих форматов зависит от разработки соответствующих прикладных программ. Веб-сайты могут изначально создаваться с контентом, представленным одновременно в формате HTML и семантическом формате[5]. RSS1.0, например, использует семантический формат RDF, но становится менее популярным по сравнению с RSS2.0 и Atom[6].
По оценкам экспертов, семантические публикации могут произвести революцию в издании научной литературы и периодики. Тим Бернерс-Ли в 2001 году предсказал, что семантическая сеть «изменит саму природу получения и распространения научных знаний таким образом, что мы сейчас едва ли сможем вообразить»[7]. Коллеги Бернерс-Ли полагают, что семантический веб «может привести к революции всего жизненного цикла существования научного знания»[8]. Например, исследователи смогут самостоятельно публиковать свои экспериментальные данные в Интернете в «семантическом» формате, а семантические поисковые системы сделают эти данные доступными в мировом масштабе. Рабочая группа W3C по медицинским и биологическим наукам изучает эту идею[9].
Два подхода к реализации семантических публикаций
1. Публикация информации как объектов данных с использованием семантических веб-языков, таких как RDF и OWL. Онтология обычно разрабатывается применительно к конкретной предметной области[6]. SWEO Linking Open Data Projec[10] содержит список источников данных[11], а также список инструментов семантических публикаций[12].
2. Вставка в документы формальных метаданных с использованием новых языков разметки, таких как RDF и микроформаты.
Примеры онтологий и словарей для семантических публикаций
Примеры инструментов и сервисов для семантических публикаций
- Ambra Project — свободное программное обеспечения для публикации журналов, находящихся в открытом доступе с помощью RDF. Используется Общественной научной библиотекой;
- Semantic MediaWiki — расширение для вики-движка MediaWiki, позволяющее пользователям добавлять семантические аннотации к вики-страницам, используя дополнительные элементы вики-разметки, превращая MediaWiki в семантическую вики;
- D2R Server — инструмент для размещения в семантическом вебе реляционных баз данных, таких как Linked data и SPARQL — точек доступа;
- Utopia Documents — инструмент для обработки документов проекта по биоинформатике UTOPIA[13].
См. также
Примечания
- Batchelor, C.R., and Corbett, P.T. (2007) Semantic enrichment of journal articles using chemical named entity recognition. Proceedings of the ACL 2007 Demo and Poster Sessions, pages 45-48, Prague, June 2007.
- The Semantic Web Revisited (May–June 2006), С. 96–101.
- Stefan Gradmann: From Catalogs to Graphs: Changing Terms for a Changing Profession
- Hull Duncan, Pettifer Steve R., Kell Douglas B. Defrosting the Digital Library: Bibliographic Tools for the Next Generation Web // PLoS Computational Biology. — 2008. — 31 октября (т. 4, № 10). — С. e1000204. — ISSN 1553-7358. — doi:10.1371/journal.pcbi.1000204.
- Examples are mindswap, UMBC ebiquity, and web2express.org open lab Архивировано 6 января 2007 года.
- Web2express.org applies RDF to various data feeds. Anyone can use their service free online service (ufeed) Архивировано 11 октября 2007 года. to create and provide RDF data resources and datafeeds for products, news, events, jobs and studies.
- Berners-Lee & Hendler, 2001.
- Shadbolt, Berners-Lee & Hall, 2006.
- self-publishing of experiment A demo Архивировано 4 января 2007 года. is available.
- W3C SWEO Linking Open Data Project (недоступная ссылка)
- list of data sources
- Semantic Publishing Tools
- Attwood T. K., Kell D. B., McDermott P., Marsh J., Pettifer S. R., Thorne D. Utopia documents: linking scholarly literature with research data. (англ.) // Bioinformatics. — 2010. — Vol. 26, no. 18. — P. 568—574. — doi:10.1093/bioinformatics/btq383. — PMID 20823323.
Литература
- Tutorial on How to publish Linked Data on the Web
- Resources for semantic publishing
- SePublica 2011, the first international workshop on semantic publishing
- T.Berners-Lee, J.Hendler. Publishing on the semantic web. — 2001. — Т. 410, вып. 6832. — С. 1023—1024. — doi:10.1038/35074206. — PMID 11323639.
- Nigel Shadbolt, Tim Berners-Lee, Wendy Hall. The Semantic Web Revisited. — 2006. — Т. 21, вып. 3. — С. 96—101.