Гипотеза об экспоненциальном времени
Гипотеза об экспоненциальном времени — это недоказанное допущение о вычислительной сложности, которое сформулировали Импальяццо и Патури[1]. Гипотеза утверждает, что 3-SAT (или любая из связанных NP-полных задач) не может быть решена за субэкспоненциальное время в худшем случае[2]. Из верности гипотезы об экспоненциальном времени, если она верна, следовало бы, что P ≠ NP, но гипотеза является более сильным утверждением. Из утверждения гипотезы можно показать, что многие вычислительные задачи эквиваленты по сложности в том смысле, что если одна из них имеет алгоритм экспоненциального времени, то все они имеют алгоритмы такой же сложности.
Определение
Задача k-SAT является задачей проверки, можно ли логическое выражение в конъюнктивной нормальной форме, имеющее более k переменных на (конъюнктивное) выражение, сделать верным путём присвоения значения булевских значений переменным выражения. Для любого целого определим вещественное число как инфимумом вещественных чисел , для которых существует алгоритм решения задачи k-SAT за время , где n — число переменных в данной задаче k-SAT. Тогда , поскольку задача 2-SAT может быть решена за полиномиальное время. Гипотеза об экспоненциальном времени — это предположение, что для любого . Ясно, что , так что гипотеза эквивалентна предположению, что , положительность оставшихся чисел следует автоматически из предположения.
Некоторые источники определяют гипотезу об экспоненциальном времени в виде несколько более слабого утверждения, что 3-SAT не может быть решена за время . Если существует алгоритм решения задачи 3-SAT за время , то ясно, что будет равно нулю. Однако это согласуется с текущим знанием, что может существовать последовательность 3-SAT алгоритмов, каждый из которых работает за время для чисел , стремящихся к нулю, но описание этих алгоритмов быстро растёт, так что один алгоритм не в состоянии автоматически выбрать и выполнить наиболее подходящий алгоритм[3].
Поскольку числа образуют монотонную последовательность, которая сверху ограничена единицей, они должны сходиться к пределу . Сильная гипотеза об экспоненциальном времени (SETH) — это предположение, что предельное значение s∞ последовательности чисел sk равно единице[4].
Другой вариант гипотезы — неоднородная гипотеза об экспоненциальном времени, усиливающая вторую часть ETH, которая постулирует, что не существует семейства алгоритмов (по одному на каждую длину входа в духе подсказки), которое может решить задачу 3-SAT за время 2o(n).
Следствие для выполнимости
Не может быть равным для любого конечного k — как показали Импальяццо, Патури и Зейн[5], существует константа , такая что . Поэтому, если гипотеза об экспоненциальном времени верна, должно быть бесконечно много значений k для которых skотличается от .
Важное средство в этой области — лемма о разрежении Импальяццо, Патури и Зейна[5], которая показывает, что для любого любая k-CNF формула может быть заменена более простыми k-CNF формулами, в которых каждая переменная появляется лишь постоянное число раз, а потому число предложений линейно. Лемма о разрежении доказана путём последовательного нахождения больших множеств выражений, имеющих непустое общее пересечение в заданной формуле, и заменой формулы двумя более простыми формулами, в одной из которых каждое такое выражение заменяется их общим пересечением, а в другой пересечении удаляется из каждого выражения. При применении леммы разрежения и использовании новых переменных для расщепления выражений можно получить множество из 3-CNF формул, каждое с линейным числом переменных, так что исходная k-CNF формула является выполнимой тогда и только тогда, когда по меньшей мере одна из этих 3-CNF формул выполнима. Таким образом, если 3-SAT могла бы быть решена за субэкспоненциальное время, можно использовать это приведение для решения задачи k-SAT за субэкспоненциальное время. Эквивалентно, если для любого k > 3, то и гипотеза об экспоненциальном времени верна[2][5].
Предельное значение последовательности чисел sk не превосходит sCNF, где sCNF — инфимум чисел , таких что выполнимость формул в конъюнктивной нормальной форме без ограничения длины выражения может быть решена за время . Таким образом, если сильная гипотеза об экспоненциальном времени верна, то не существует алгоритма для общей задачи CNF выполнимости, который существенно быстрее, чем проверка всех возможных высказываний на истинность. Однако если сильная гипотеза об экспоненциальном времени не верна, для sCNF остаётся возможность равенства единице[6].
Следствия для задач поиска
Из гипотезы об экспоненциальном времени вытекает, что многие другие задачи в классе сложности SNP не имеют алгоритмов, время работы которых меньше чем cn для некоторой константы c. В эти задачи входят k-раскрашиваемость графа, нахождение гамильтоновых циклов, наибольших клик, наибольших независимых множеств и вершинных покрытий на графах с n вершинами. Обратно, если любая из этих задач имеет субэкспоненциальный алгоритм, то можно будет показать, что гипотеза об экспоненциальном времени неверна[2][5].
Если клики или независимые множества логарифмического размера можно было бы найти за полиномиальное время, гипотеза об экспоненциальном времени была бы неверна. Таким образом, даже если нахождение клик или независимых множеств такого малого размера вряд ли являются NP-полными задачами, из гипотезы об экспоненциальном времени вытекает, что эти задачи не полиномиальны[2][7]. Более обще из гипотезы об экспоненциальном времени следует, что невозможно найти клики или независимые множества размером k за время [8]. Из гипотезы об экспоненциальном времени также вытекает, что невозможно решить задачу k-SUM (даны n вещественных чисел, нужно найти k из них, дающих сумме нуль) за время . Из сильной гипотезы об экспоненциальном времени следует, что невозможно найти доминирующие множества, состоящие из k вершин быстрее, чем за время [6].
Из гипотезы об экспоненциальном времени следует также, что взвешенная задача нахождения разрезающего циклы набора дуг на турнирах (FAST) не имеет параметрического алгоритма со временем работы , она даже не имеет параметрического алгоритма со временем работы [9].
Сильная гипотеза об экспоненциальном времени приводит к точным границам параметризованной сложности некоторых задач на графах с ограниченной древесной шириной. В частности, если сильная гипотеза об экспоненциальном времени верна, то граница оптимального времени поиска независимых множеств на графах с древесной шириной w равна , оптимальное время для задачи о доминирующем множестве равно , оптимальное время для максимального разреза графа равно , а оптимальное время для k-раскраски равно [10]. Эквивалентно, любое улучшение этих времён работы приводит к неверности сильной гипотезы об экспоненциальном времени[11]. Из гипотезы об экспоненциальном времени также следует, что любой фиксированно-параметрически разрешимый алгоритм для покрытия рёбер графа кликами должен иметь двойную экспоненциальную зависимость от параметра[12].
Следствия в теории сложности коммуникации
В задаче трёхсторонней дизъюнктности множеств в коммуникационной сложности задаются три подмножества целых чисел из некоторого интервала [1,m] и даны три общающихся участника, каждый из которых знает два из трёх подмножеств. Целью участников является передать как можно меньше битов информации друг другу по общему коммуникационному каналу, но чтобы один из участников смог определить, является ли пересечение трёх множеств пустым или не пустым. Тривиальным m-битовым протоколом была бы посылка одного из участников битового вектора, описывающего пересечение двух известных ему множеств, после чего каждый из оставшихся двоих участников может определить пустоту пересечения. Однако, если существует протокол, решающий задачу за o(m) пересылок и вычислений, он может быть преобразован в алгоритм решения k-SAT за время O(1,74n) для любой фиксированной константы k, что нарушает сильную гипотезу об экспоненциальном времени. Поэтому из сильной гипотезы об экспоненциальном времени следует, что либо тривиальный протокол для задачи о трёхсторонней дизъюнктивности множеств является оптимальным, либо любой лучший протокол требует экпоненциального числа вычислений[6].
Следствия в теории структурной сложности
Если гипотеза об экспоненциальном времени верна, то 3-SAT не должна иметь алгоритма полиномиального времени, а потому из этого следовало бы, что P ≠ NP. Более сильно, в этом случае задача 3-SAT не имела бы даже алгоритма квази-полиномиального времени, так что NP не могло бы быть подмножеством класса QP. Однако, если гипотеза об экспоненциальном времени не верна, из этого не следовало бы равенство классов P и NP. Существуют NP-полные задачи, для которых лучшее известное время решения имеет вид для , и если бы лучшее возможное время работы для 3-SAT имело такой вид, то P был бы не равен NP (поскольку 3-SAT является NP-полной задачей, а это время не полиномиально), но гипотеза об экспоненциальном времени была бы не верна.
В теории параметрической сложности, поскольку из гипотезы об экспоненциальном времени вытекает, что не существует фиксированно-параметрически разрешимого алгоритма для нахождения наибольшей клики, из её также следует, что W[1] ≠ FPT[8]. Является важной открытой проблемой в этой области, может ли обратить это следствие — следует ли из гипотеза об экспоненциальном времени? Существует иерархия классов параметрической сложности, называемая M-иерархией, которая перемежается с W-иерархией в том смысле, что для всех i, . Например, задача поиска вершинного покрытия размера в графе с n вершинами является полной для M[1]. Гипотеза об экспоненциальном времени эквивалентна утверждению, что , а вопрос о равенстве для i > 1 также остаётся открытым[3].
Можно также показать вывод в другом направлении, из неверности варианта сильной гипотезы об экспоненциальном времени к разделению классов сложности. Как показал Уильямс[13], если существует алгоритм A, который решает задачу о выполнимости булевской схемы время для некоторой суперполиномиально растущей функции , то NEXPTIME не является подмножеством P/poly. Уильямс показал, что если алгоритм A существует и семейство схем, моделирующее NEXPTIME в P/poly также существует, то алгоритм A можно было бы скомбинировать со схемой для моделирования задач NEXPTIME недетминированно за меньшее время, что противоречит теореме о иерархии времени. Таким образом, существование алгоритма A доказывает невозможность существования семейства схем и разделение этих двух классов сложности.
Примечания
- Impagliazzo, Paturi, 1999.
- Woeginger, 2003.
- Flum, Grohe, 2006.
- Dantsin, Wolpert, 2010.
- Impagliazzo, Paturi, Zane, 2001.
- Pătraşcu, Williams, 2010.
- Feige, Kilian, 1997.
- Chen, Huang, Kanj, Xia, 2006.
- Karpinski, Warren, 2010.
- Cygan, Fomin, Kowalik, Lokshtanov и др., 2015.
- Lokshtanov, Marx, Saurabh, 2011.
- Cygan, Pilipczuk, Pilipczuk, 2013.
- Williams, 2010.
Литература
- Jianer Chen, Xiuzhen Huang, Iyad A. Kanj, Ge Xia. Strong computational lower bounds via parameterized complexity // Journal of Computer and System Sciences. — 2006. — Т. 72, вып. 8. — С. 1346—1367. — doi:10.1016/j.jcss.2006.04.007.
- Marek Cygan, Fedor V. Fomin, Lukasz Kowalik, Daniel Lokshtanov, Daniel Marx, Marcin Pilipczuk, Michal Pilipczuk, Saket Saurabh. Parameterized Algorithms. — Springer, 2015. — С. 555. — ISBN 978-3-319-21274-6.
- Marek Cygan, Marcin Pilipczuk, Michał Pilipczuk. Known algorithms for EDGE CLIQUE COVER are probably optimal // Proc. 24th ACM-SIAM Symposium on Discrete Algorithms (SODA 2013). — 2013. Архивировано 16 апреля 2013 года.
- Evgeny Dantsin, Alexander Wolpert. Theory and Applications of Satisfiability Testing–SAT 2010. — Springer-Verlag, 2010. — Т. 6175. — С. 313—325. — doi:10.1007/978-3-642-14186-7_27.
- Uriel Feige, Joe Kilian. On limited versus polynomial nondeterminism (англ.) // Theoretical Computer Science. — 1997. — Vol. 1. — P. 1—20.
- Jörg Flum, Martin Grohe. 16. Subexponential Fixed-Parameter Tractability // Parameterized Complexity Theory. — Springer-Verlag, 2006. — С. 417—451. — (EATCS Texts in Theoretical Computer Science). — ISBN 978-3-540-29952-3.
- Russell Impagliazzo, Ramamohan Paturi. The Complexity of k-SAT // Proc. 14th IEEE Conf. on Computational Complexity. — 1999. — С. 237—240. — doi:10.1109/CCC.1999.766282.
- Russell Impagliazzo, Ramamohan Paturi, Francis Zane. Which problems have strongly exponential complexity? // Journal of Computer and System Sciences. — 2001. — Т. 63, вып. 4. — С. 512—530. — doi:10.1006/jcss.2001.1774.
- Marek Karpinski, Schudy Warren. Faster Algorithms for Feedback Arc Set Tournament, Kemeny Rank Aggregation and Betweenness Tournament // Proc. ISAAC 2010, Part I. — 2010. — С. 3—14. — doi:10.1007/978-3-642-17517-6_3.
- Daniel Lokshtanov, Dániel Marx, Saket Saurabh. Known algorithms on graphs of bounded treewidth are probably optimal // Proc. 22nd ACM/SIAM Symposium on Discrete Algorithms (SODA 2011). — 2011. — С. 777—789. Архивная копия от 18 октября 2012 на Wayback Machine
- Mihai Pătraşcu, Ryan Williams. On the possibility of faster SAT algorithms // Proc. 21st ACM/SIAM Symposium on Discrete Algorithms (SODA 2010). — 2010. — С. 1065—1075.
- Ryan Williams. Improving exhaustive search implies superpolynomial lower bounds // Proc. 42nd ACM Symposium on Theory of Computing (STOC 2010). — New York, NY, USA: ACM, 2010. — С. 231—240. — doi:10.1145/1806689.1806723.
- Gerhard J. Woeginger. Exact algorithms for NP-hard problems: A survey // Combinatorial Optimization — Eureka, You Shrink!. — Springer-Verlag, 2003. — Т. 2570. — С. 185—207. — doi:10.1007/3-540-36478-1_17.