Тезаурус
Теза́урус (от греч. θησαυρός «сокровище»), в общем смысле — специальная терминология. Более строго и предметно — словарь, собрание сведений, корпус или свод, полномерно охватывающие понятия, определения и термины специальной области знаний или сферы деятельности, что должно способствовать правильной лексической, корпоративной коммуникации (пониманию в общении и взаимодействии лиц, связанных одной дисциплиной или профессией); в современной лингвистике — особая разновидность словарей, в которых указаны семантические отношения (синонимы, антонимы, паронимы, гипонимы, гиперонимы и т. п.) между лексическими единицами. Тезаурусы являются одним из действенных инструментов для описания отдельных предметных областей.
История
Одним из первых тезаурусов называют «Словарь синонимов» Филона Библского. Более точное соответствие термину имеет Амара-коша, написанный на санскрите в стихотворной форме в VI веке. Первый современный английский тезаурус был создан Питером Марком Роже (англ.) в 1805 году. Он был опубликован в 1852 году и с тех пор используется без переизданий[1].
В 1970-е годы тезаурусы стали активно использоваться для информационно-поисковых задач. В таких тезаурусах слова сопоставляются с дескрипторами, через которые устанавливаются семантические связи[2].
Описание
В отличие от толкового словаря, тезаурус позволяет выявить смысл не только с помощью определения, но и посредством соотнесения слова с другими понятиями и их группами, благодаря чему может использоваться для наполнения баз знаний систем искусственного интеллекта.
В прошлом термином тезаурус обозначались по преимуществу словари, с максимальной полнотой представлявшие лексику языка с примерами её употребления в текстах.
В настоящее время понятие также включает словари, появившиеся в связи с распространением информационных технологий, сети Интернет и машинного перевода при поиске слов в системах ЭВМ:
- тезаурусы одноязычные информационно-поисковые;
- тезаурусы многоязычные информационно-поисковые[3].
Также термин тезаурус употребляется в теории информации для обозначения совокупности всех сведений, которыми обладает субъект.
В психологии тезаурус индивидуума характеризуют восприятие и понимание информации. Теория коммуникации также рассматривает общий тезаурус сложной системы, благодаря которому взаимодействуют её элементы[2].
Примеры
- Амара-коша (Словарь Амары) — первый и наиболее важный санскритский тезаурус (III—IV век)
- Тезаурус Роже (XIX век, около 15000 синсетов).
- Викисловарь: многоязычный свободно пополняемый словарь и тезаурус (с 2004 года по настоящее время, проект фонда Викимедиа, в Русском Викисловаре (дата — август 2013) содержится около 390 тыс. понятий[4], 212 тыс. отношений всего[5], из них 150 тыс. отношений для русского языка[6]).
- РуТез — тезаурус русского языка (был создан Центром информационных исследований как инструмент для автоматического индексирования; разрабатывается с 1997 года по настоящее время, 45 тыс. понятий, 107 тыс. слов и выражений, 177 тыс. отношений)[7].
- Встроенный тезаурус в Microsoft Word[8].
- «Писательский тезаурус» советского писателя С. Н. Есина[9].
См. также
Примечания
- A History of Roget's Thesaurus: Origins, Development, and Design (англ.). Дата обращения: 2 июня 2015.
- Тезаурус — статья из Большой советской энциклопедии
- ГОСТ Р 7.0.47-2008 СИБИД . http://docs.cntd.ru/. Дата обращения: 4 октября 2019.
- wikt:Участник:AKA MBG/Статистика:Размеры базы данных, созданной парсером Викисловаря, строка «meaning» в таблице.
- wikt:Участник:AKA MBG/Статистика:Размеры базы данных, созданной парсером Викисловаря, строка «relation» в таблице.
- wikt:Участник:AKA MBG/Статистика:Семантические отношения#Number of relations per language, столбец «total» в таблице.
- Онтологии для автоматической обработки текстов: описание понятий и лексических значений
- Поиск синонимов с помощью тезауруса - Word . support.office.com. Дата обращения: 18 января 2017.
- Есин С. Н. Писательский тезаурус
Литература
- Тезаурус // Большая российская энциклопедия. Том 31. — М., 2016. — С. 752.
- Русский тезаурус (словарь О. С. Баранова) — 2012 г.
- В. В. Морковкин. [rifmovnik.ru Идеографические словари]. — 1970.
- Захаров Н. В. Шекспиризм русской классической литературы: тезаурусный анализ. — М.: Издательство Московского гуманитарного университета, 2008. — ISBN 978-5-98079-486-6.
- Луков Вал. А., Луков Вл. А. Тезаурусы: Субъектная организация гуманитарного знания. — М.: Изд-во Нац. ин-та бизнеса, 2008. — 784 с. — 1000 экз. — ISBN 978-5-8309-0272-4.
- Луков Вал. А., Луков Вл. А. Тезаурусы II : Тезаурусный подход к пониманию человека и его мира. — М.: Изд-во Нац. ин-та бизнеса, 2013. — 640 с. — 700 экз. — ISBN 978-5-8309-0391-2.
- Захаров Н. В., Луков А. В. Школа тезаурусного анализа // Знание. Понимание. Умение. — 2006. — № 1. — С. 231—233.
- Гетман, Иван Михайлович. Тезаурус как инструмент современного языкознания: Автореф. дис. ... докт. филол. наук. — Киев: Ин-т языковедения, 1991. — С. 34.
- Нгуен М. Х., Аджиев А. С. Описание и использование тезаурусов в информационных системах, подходы и реализация // Электронные библиотеки. — 2004. — Т. 7, № 1. — С. 16—45. — ISSN 1562-5419. Архивировано 19 апреля 2016 года.
- Лукашевич Н. В. Тезаурусы в задачах информационного поиска. — М.: Изд-тво Московского ун-та, 2011. — С. 512. — ISBN 978-5-211-05926-0.
- ГОСТ 7.25-2001. Тезаурус информационно-поисковый одноязычный. Правила разработки, структура, состав и форма представления (Система стандартов по информации, библиотечному и издательскому делу)
- ГОСТ 7.24-2007. Тезаурус информационно-поисковый многоязычный. Состав, структура и основные требования к построению: межгосударственный стандарт (Система стандартов по информации, библиотечному и издательскому делу) / Межгосударственный совет по стандартизации, метрологии и сертификации — М. : Стандартинформ, 2007
Ссылки
- Луков Вал. А., Луков Вл. А. Тезаурусный подход в гуманитарных науках
- Луков Вал. А., Луков Вл. А. Тезаурусный подход: исходные положения
- Тезаурусный анализ мировой культуры на сайте Московского гуманитарного университета
- Эпштейн М. Таня, Пушкин и деньги. Жизнь как нарратив и тезаурус.