Мера включения

Меры включения — несимметричные меры сходства отражающие степень близости одного объекта относительно другого. Использовать меры включения по отдельности не имеет смысла. Меры включения также известны как асимметричные меры, направленные меры конвергенции. Меры включения отражают отношения «целого-части». Также существует понятие мер невключения, которые определяются как дополнение мер включения до 1. Обычно меры включения представляют в виде матрицы включения

Следует особо отметить, что меры включения более информативны в общем и особенно для разновеликих по числу признаков объектов, чем меры сходства, так как последние, по сути, представляют собой усреднённые показатели и, следовательно, теряют часть информации об объектах, а несимметричные меры включения адекватно оценивают более распространённые в природе нетранзитивные отношения. Например, один список может включаться на 100 % в другой список, а другой список в свою очередь включаться только на 10 %. При этом коэффициент сходства не сможет адекватно отразить эти отношения, так как, например, 10 общих видов значительны для одного списка в 10 видов, но не столь значимы для большого списка в (к примеру) 100 видов. Мера сходства Сёренсена в данном случае будет равна около 20 %.[1][2]
В общем виде несимметричные меры сходства можно представить так: ; . А конкретную меру включения можно рассчитать из общей формулы континуума мер сходства Сёмкина.

Меры включения для конечных множеств

Подобные меры, под названием коэффициентов «полноты» и «точности» нашли широкое применение в информационно-поисковых системах[3][4]. Под названием «коэффициентов неспецифичности» одной флоры относительно другой использовались во флористике Б. А. Юрцевым[5][6]. После работ Б. И. Семкина и Т. А. Комаровой[7][8] меры включения стали широко использоваться в синэкологии и биогеографии[9].
Наиболее часто используются меры:

Меры включения для дескриптивных множеств

Для случая дескриптивных множеств (дескриптивная интерпретация), в экологии это выборки по обилию, меры введены Б. И. Семкиным и Т. А. Комаровой. Например:

Меры включения для вероятностей

Если сравнивается встречаемость видов (вероятностная интерпретация), то есть учитываются вероятности встреч объектов, то аналогом вышеприведённым мерам будут несимметричные меры (меры включения событий) Дайса (association index), предложенные Л. Р. Дайсом в 1945 году[10]:

Меры Дайса, как и все меры включения событий, являются вероятностными мерами и по сути являются условными вероятностями.

Меры включения для информационной интерпретации

Для информационной аналитической интерпретации используются относительные меры односторонней зависимости.[11][12]

См. также

Литература

  1. Сёмкин Б. И. О связи между средними значениями двух мер включения и мерами сходства (недоступная ссылка) // Бюлл. БСИ ДВО РАН  : науч. журн. / Ботан. сад-институт ДВО РАН. — Владивосток, 2009. Вып. 3. С. 91-101.
  2. Сёмкин Б. И., Орешко А. П., Горшков М. В. Об использовании биоинформационных технологий в сравнительной флористике. II. Меры включения дескриптивных множеств и их использование (недоступная ссылка) // Бюлл. БСИ ДВО РАН  : науч. журн. / БСИ ДВО РАН. — Владивосток, 2009. Вып. 4. С. 58-70.
  3. Clevardon C.W. The testing of index Language Devices // Aslib Proceedings. 1963. V. 15. № 4. P. 106—130.
  4. Сэлтон Г. А. Автоматическая обработка, хранение и поиск информации. — М.: Сов. радио, 1973. — 560 с.
  5. Юрцев Б. А. Флора Сунтар-Хаята. — Л.: Наука, 1968. — 235 с.
  6. Сёмкин Б. И. Количественные показатели для оценки односторонних флористических связей, предложенных Б. А. Юрцевым // Бот. ж. 2007. Т. 92. № 4. С. 114—127.
  7. Сёмкин Б. И., Комарова Т. А. Анализ фитоценотических описаний с использованием мер включения (на примере растительных сообществ долины реки Амгуэмы на Чукотке) // Бот. ж. 1977. Т. 62. № 1. С. 54-63.
  8. Сёмкин Б. И., Комарова Т. А. Использование мер включения при изучении вторичных сукцессий (на примере послепожарных сообществ Сихотэ-Алиня) // Бот. ж. 1985. Т. 70. № 1. С. 89-97.
  9. Андреев В. Л. Классификационные построения в экологии и систематике. — М.: Наука, 1980. — 142 с.
  10. Dice L.R. Measures of the amount of ecological association between species // Ecology. 1945. V. 26. № 3. P. 297—302.
  11. Nakahama H., Nishioka S. Statistical dependency between intervals in neuronal impulse sequences // J. Theoret. Biol. 1966. V. 12. № 1. P. 140—146.
  12. Nakahama H., Nishioka S., Otsuka T., Aikawa S. Statistical dependency between interspike intervals of spontaneous activity in thalamic lemniscal neurons // J. Neurophysiol. 1966. V. 29. № 5. P. 921—934.
This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.