PostgreSQL
PostgreSQL (произносится «Пост-Грэс-Кью-Эл»[6]) — свободная объектно-реляционная система управления базами данных (СУБД).
PostgreSQL | |
---|---|
Тип | реляционная СУБД |
Автор | Майкл Стоунбрейкер[1] |
Разработчик | сообщество PostgreSQL |
Написана на | Си[2][3] |
Операционная система | FreeBSD[4], OpenBSD[4], Linux[4], macOS[4], Solaris[4], Microsoft Windows[4] и UNIX-подобные операционные системы |
Первый выпуск | 1996 |
Последняя версия |
|
Лицензия | PostgreSQL License (free and open-source) |
Сайт | postgresql.org (англ.) |
Медиафайлы на Викискладе |
Существует в реализациях для множества UNIX-подобных платформ, включая AIX, различные BSD-системы, HP-UX, IRIX, Linux, macOS, Solaris/OpenSolaris, Tru64, QNX, а также для Microsoft Windows.
Поддержка стандартов, возможности, особенности
PostgreSQL базируется на языке SQL и поддерживает многие из возможностей стандарта SQL:2011[7][8].
В PostgreSQL версии 12 есть следующие ограничения[9]:
Максимальный размер базы данных | Нет ограничений |
Максимальный размер таблицы | 32 Тбайт |
Максимальный размер поля | 1 Гбайт |
Максимум записей в таблице | Ограничено размерами таблицы |
Максимум полей в записи | 250—1600, в зависимости от типов полей |
Максимум индексов в таблице | Нет ограничений |
Сильными сторонами PostgreSQL считаются:
- высокопроизводительные и надёжные механизмы транзакций и репликации;
- расширяемая система встроенных языков программирования: в стандартной поставке поддерживаются PL/pgSQL, PL/Perl, PL/Python и PL/Tcl; дополнительно можно использовать PL/Java, PL/PHP, PL/Py, PL/R, PL/Ruby, PL/Scheme, PL/sh и PL/V8, а также имеется поддержка загрузки модулей расширения на языке C[10];
- наследование;
- возможность индексирования геометрических (в частности, географических) объектов и наличие базирующегося на ней расширения PostGIS;
- встроенная поддержка слабоструктурированных данных в формате JSON с возможностью их индексации;
- расширяемость (возможность создавать новые типы данных, типы индексов, языки программирования, модули расширения, подключать любые внешние источники данных).
История
PostgreSQL создана на основе некоммерческой СУБД Postgres, разработанной как open-source проект в Калифорнийском университете в Беркли. К разработке Postgres, начавшейся в 1986 году, имел непосредственное отношение Майкл Стоунбрейкер, руководитель более раннего проекта Ingres, на тот момент уже приобретённого компанией Computer Associates. Название расшифровывалось как «Post Ingres», и при создании Postgres были применены многие ранние наработки.
Стоунбрейкер и его студенты разрабатывали новую СУБД в течение восьми лет с 1986 по 1994 годы. За этот период в синтаксис были введены процедуры, правила, пользовательские типы и другие компоненты. В 1995 году разработка снова разделилась: Стоунбрейкер использовал полученный опыт в создании коммерческой СУБД Illustra, продвигаемой его собственной одноимённой компанией (приобретённой впоследствии компанией Informix), а его студенты разработали новую версию Postgres — Postgres95, в которой язык запросов POSTQUEL — наследие Ingres — был заменен на SQL.
Разработка Postgres95 была выведена за пределы университета и передана команде энтузиастов. Новая СУБД получила имя, под которым она известна и развивается в текущий момент — PostgreSQL.
Основные возможности
Функции
Функции являются блоками кода, исполняемыми на сервере, а не на клиенте БД. Хотя они могут писаться на чистом SQL, реализация дополнительной логики, например, условных переходов и циклов, выходит за рамки SQL и требует использования некоторых языковых расширений. Функции могут писаться с использованием одного из следующих языков:
- Встроенный процедурный язык PL/pgSQL, во многом аналогичный языку PL/SQL, используемому в СУБД Oracle;
- Скриптовые языки — PL/Lua, PL/LOLCODE, PL/Perl, PL/PHP, PL/Python, PL/Ruby, PL/sh, PL/Tcl, PL/Scheme, PL/v8 (Javascript);
- Классические языки — C, C++, Java (через модуль PL/Java);
- Статистический язык R (через модуль PL/R).
PostgreSQL допускает использование функций, возвращающих набор записей, который далее можно использовать так же, как и результат выполнения обычного запроса.
Функции могут выполняться как с правами их создателя, так и с правами текущего пользователя.
Иногда функции отождествляются с хранимыми процедурами, однако между этими понятиями есть различие. С девятой версии возможно написание автономных блоков, которые позволяют выполнять код на процедурных языках без написания функций, непосредственно в клиенте.
Триггеры
Триггеры определяются как функции, инициируемые DML-операциями. Например, операция INSERT может запускать триггер, проверяющий добавленную запись на соответствия определённым условиям. При написании функций для триггеров могут использоваться различные языки программирования (см. выше).
Триггеры ассоциируются с таблицами. Множественные триггеры выполняются в алфавитном порядке.
Правила и представления
Механизм правил (англ. rules) представляет собой механизм создания пользовательских обработчиков не только DML-операций, но и операции выборки. Основное отличие от механизма триггеров заключается в том, что правила срабатывают на этапе разбора запроса, до выбора оптимального плана выполнения и самого процесса выполнения. Правила позволяют переопределять поведение системы при выполнении SQL-операции к таблице. Хорошим примером является реализация механизма представлений (англ. views): при создании представления создается правило, которое определяет, что вместо выполнения операции выборки к представлению система должна выполнять операцию выборки к базовой таблице/таблицам с учётом условий выборки, лежащих в основе определения представления. Для создания представлений, поддерживающих операции обновления, правила для операций вставки, изменения и удаления строк должны быть определены пользователем.
Индексы
В PostgreSQL имеется поддержка индексов следующих типов: B-дерево, хеш, GiST, GIN, BRIN, Bloom. При необходимости можно создавать новые типы индексов. Индексы в PostgreSQL обладают следующими свойствами:
- возможен просмотр индекса не только в прямом, но и в обратном порядке — создание отдельного индекса для работы конструкции
ORDER BY ... DESC
не нужно; - возможно создание индекса над несколькими столбцами таблицы, в том числе над столбцами различных типов данных;
- индексы могут быть функциональными, то есть строиться не на базе набора значений некоего столбца/столбцов, а на базе набора значений функции от набора значений;
- индексы могут быть частичными, то есть строиться только по части таблицы (по некоторой её проекции); в некоторых случаях это помогает создавать намного более компактные индексы или достигать улучшения производительности за счёт использования разных типов индексов для разных (например, с точки зрения частоты обновления) частей таблицы;
- планировщик запросов может использовать несколько индексов одновременно для выполнения сложных запросов.
Многоверсионность (MVCC)
PostgreSQL поддерживает одновременную модификацию БД несколькими пользователями с помощью механизма Multiversion Concurrency Control (MVCC). Благодаря этому соблюдаются требования ACID и практически отпадает нужда в блокировках чтения.
Типы данных
PostgreSQL поддерживает большой набор встроенных типов данных:
- Численные типы
- Целые
- С фиксированной точкой
- С плавающей точкой
- Денежный тип (отличается специальным форматом вывода, а в остальном аналогичен числам с фиксированной точкой с двумя знаками после запятой)
- Символьные типы произвольной длины
- Двоичные типы (включая BLOB)
- Типы «дата/время» (полностью поддерживающие различные форматы, точность, форматы вывода, включая последние изменения в часовых поясах)
- Булев тип
- Перечисление
- Геометрические примитивы
- Интервалы (RANGE)
- Сетевые типы
- UUID-идентификатор
- XML-данные
- Массивы
- JSON
- Идентификаторы объектов БД
- Псевдотипы
Более того, пользователь может самостоятельно создавать новые требуемые ему типы и программировать для них механизмы индексирования с помощью GiST.
Пользовательские объекты
PostgreSQL может быть расширен пользователем для собственных нужд практически в любом аспекте. Есть возможность добавлять собственные:
- Преобразования типов
- Типы данных
- Домены (пользовательские типы с изначально наложенными ограничениями)
- Функции (включая агрегатные)
- Индексы
- Операторы (включая переопределение уже существующих)
- Процедурные языки
Наследование и партицирование
Таблицы могут наследовать характеристики и наборы полей от других таблиц (родительских). При этом данные, добавленные в порождённую таблицу, автоматически будут участвовать (если это не указано отдельно) в запросах к родительской таблице.
В PostgreSQL 10 был добавлен механизм партицирования таблиц. Партицирование предназначено для разделения одной таблицы на несколько, так называемые партиции. Партицирование схоже с наследованием, но имеет более дружелюбный к пользователю синтаксис и более строгие ограничения, что позволяет выполнять дополнительные оптимизации при планировании запросов.
Прочие возможности
- Соблюдение принципов ACID
- Соответствие стандартам ANSI, SQL-92, SQL-99, SQL:2003, SQL:2011
- Поддержка запросов с
OUTER JOIN
,UNION
,UNION ALL
,EXCEPT
,INTERSECT
и подзапросов - Последовательности
- Контроль целостности
- Репликация
- Общие табличные выражения и рекурсивные запросы
- Аналитические функции
- Поддержка Юникода (UTF-8)
- Поддержка регулярных выражений в стиле Perl
- Встроенная поддержка SSL, SELinux и Kerberos
- Протокол разделяемых блокировок
- Подгружаемые расширения, поддерживающие SHA1, MD5, XML
- Расширения для написания сложных выборок, отчётов и т. д. (API открыт)
- Средства для генерации совместимого с другими системами SQL-кода и импорта из других систем
- Автономные блоки на доступных языках, а не только SQL
Качество исходного кода
Согласно результатам автоматизированного исследования различного ПО на предмет ошибок, проведённом в 2005 году, в исходном коде PostgreSQL было найдено 20 проблемных мест на 775 000 строк исходного кода (в среднем, одна ошибка на 39 000 строк кода)[11]. Для сравнения: MySQL — 97 проблем, одна ошибка на 8 000 строк кода; FreeBSD (целиком) — 306 проблем, одна ошибка на 2 500 строк кода; Linux (только ядро) — 950 проблем, одна ошибка на 800 строк кода.
Производные продукты
Лицензия PostgreSQL позволяет на его основе создавать различные, в том числе коммерческие, форки. Их известно несколько десятков[12].
На базе PostgreSQL компанией EnterpriseDB были разработаны другие варианты этой СУБД, являющиеся платными для коммерческого использования — Postgres Plus (состоит целиком только из продуктов с открытыми исходными кодами; плата требуется только при необходимости приобретения коммерческой поддержки продукта) и Postgres Plus Advanced Server (расширение PostgreSQL специальными возможностями для обеспечения совместимости с Oracle Database)[13]. В комплекте поставки данных продуктов содержится набор ПО для разработчиков и администраторов баз данных:
- Postgres Studio — аналог phpPgAdmin;
- Postgres Plus Debugger — отладчик для кода на PL/pgSQL, интегрированный с предыдущим пакетом;
- Migration Studio — инструмент для автоматического преобразования баз данных из MySQL/Oracle в PostgreSQL
Существуют и другие коммерческие продукты, созданные на базе PostgreSQL и дополняющие её различными функциями:
Postgres Pro
- Postgres Pro компании Postgres Professional[16] — разрабатываемый в России дистрибутив, содержащий усовершенствования, которые, как правило, впоследствии, поступают в апстрим основного проекта. Postgres Pro является одним из наиболее популярных решений среди российских СУБД в сфере российского импортозамещения[17]. Эта версия PostgreSQL сертифицирована ФСТЭК[18] и, рядом крупных российских организаций, во время импортозамещения рассматривается как предпочтительная замена Oracle[19][20].
Компания-разработчик была основана в 2015 году российскими 3 ведущими разработчиками (Major Contributor) СУБД PostgreSQL - Олегом Бартуновым, Фёдором Сигаевым, Александром Коротковым, разработчиком Иваном Панченко и сооснователем компании Энвижн Груп Антоном Сушкевичем, который стал инвестором проекта[21].
Примечания
- https://www.postgresql.org/docs/current/history.html
- https://github.com/postgres/postgres
- The postgres Open Source Project on Open Hub: Languages Page — 2006.
- https://www.postgresql.org/download/
- PostgreSQL 14.2, 13.6, 12.10, 11.15, and 10.20 Released! — 2022.
- Согласно FAQ Архивная копия от 15 октября 2011 на Wayback Machine, а также в соответствии с аудиозаписью Архивная копия от 17 сентября 2009 на Wayback Machine эталонного произношения, встречается произношение «Постгре-Эс-Кью-Эл», которое не вполне согласуется с историей наименования (нет отдельного слова «Postgre», а частица «-gres» встречается в названиях многих реляционных СУБД).
- «Appendix D. SQL Conformance» Архивная копия от 23 марта 2014 на Wayback Machine. PostgreSQL 9 Documentation Архивная копия от 8 июля 2014 на Wayback Machine. PostgreSQL Global Development Group. 2009 [1996]. Retrieved 2013-04-01.
- «SQL Conformance» Архивная копия от 21 июля 2014 на Wayback Machine. postgresql.org. 2013-04-04. Retrieved 2013-08-28.
- PostgreSQL Limits . www.postgresql.org. Дата обращения: 15 августа 2016. Архивировано 12 ноября 2019 года.
- PostgreSQL: Documentation: 11: Procedural Languages . www.postgresql.org. Дата обращения: 2 марта 2019. Архивировано 3 марта 2019 года.
- PostgreSQL Achieves Coverity Quality Certification (англ.) (недоступная ссылка). PostgreSQL Global Development Group (24 июля 2005). — Новость о результатах сертификации качества. Дата обращения: 8 сентября 2009. Архивировано 24 августа 2011 года.
- PostgreSQL derived databases . PostgreSQL Wiki. Дата обращения: 30 июля 2018. Архивировано 30 июля 2018 года.
- Подход к миграции баз данных с Oracle на EnterpriseDB (недоступная ссылка). Бюро Соломатина (13 декабря 2010). — Подход к миграции баз данных с Oracle на EnterpriseDB. Дата обращения: 13 декабря 2010. Архивировано 24 августа 2011 года. (недоступная ссылка с 07-03-2017 [1821 день])
- 2ndQPostgres . Дата обращения: 8 ноября 2019. Архивировано 8 ноября 2019 года.
- Fujitsu Enterprise Postgres . Дата обращения: 8 ноября 2019. Архивировано 8 ноября 2019 года.
- Postgres Pro . Дата обращения: 8 ноября 2019. Архивировано 6 сентября 2019 года.
- Константин Скурат (15.11.2021). “СУБДсидия в рост”. ComNews. Проверьте дату в
|date=
(справка на английском) - Александр Маляревский (27 июля 2021 г.). “Виртуализация: тренды внутри тренда на российском рынке”. CRN. Проверьте дату в
|date=
(справка на английском) - Денис Воейков (10 декабря 2020). “«Росатом» массово меняет СУБД Oracle и Microsoft на российскую Postgres Pro”. CNews.
- Денис Воейков (04 января 2021). “«Гознак» переходит на российскую СУБД Postgres Pro”. CNews. Проверьте дату в
|date=
(справка на английском) - Владислав Мещеряков (28 января 2015). “Основатель «Энвижн» инвестировал в российскую команду разработчиков PostgreSQL”. CNews.
Ссылки
- Евгений Балдин. PostgreSQL. Серия из шести статей, опубликованных в журнале Linux Format (2006—2007)
- Иван Панченко. PostgreSQL: вчера, сегодня, завтра . Открытые системы. СУБД, № 03, 2015. Дата обращения: 16 марта 2016.
- Александр Алексеев. Серия статей о PostgreSQL. Примеры использования физической и логической репликации, полнотекстового и пространственного поиска, автоматического восстановления после сбоев, написания расширений.