Сжатое префиксное дерево

Базисное дерево (также компактное префиксное дерево, основное дерево, дерево остатков[1]) — это структура данных, представляющая собой оптимизированную по памяти реализацию префиксного дерева. В базисном дереве узел , являющийся единственным потомком узла , сливается с узлом .

Базисное дерево
Тип дерево
Год изобретения 1968
Автор Дональд Р. Моррисон
Сложность в О-символике
В худшем случае
Поиск
Вставка
Удаление
 Медиафайлы на Викискладе
Пример базисного дерева для русского языка

Временная сложность операций поиска, добавления и удаления элемента из базисного дерева оценивается как , где  — длина обрабатываемого элемента. Время работы не зависит от количества элементов в дереве.

В отличие от обычных префиксных деревьев, узел базисного дерева может быть помечен как одним элементом (символом, битом и т. д.), так и последовательностью элементов. Это делает базисное дерево более эффективным для небольших наборов строк (особенно если сами строки достаточно длинные), и также для наборов, имеющих небольшое количество длинных префиксов.

Применение

  • Базисное дерево используется, в частности, для синтаксического анализа естественных языков[2].
  • Базисное дерево является одной из структур данных ядра Linux[3].

Примечания

  1. Структура Radix Tree для сжатия данных https://habrahabr.ru/post/141145/
  2. Pymorphy 2 https://m.habrahabr.ru/post/176575/
  3. Robert Love. Linux Kernel Development. Third Edition. 2010 https://docs.google.com/file/d/0B1iyZaHiAMfFZE9aXzNBOXR0OGM/edit?pli=1 Архивная копия от 15 декабря 2015 на Wayback Machine

Ссылки

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.