Грид
Грид-вычисления (англ. grid — решётка, сеть) — это форма распределённых вычислений, в которой «виртуальный суперкомпьютер» представлен в виде кластеров, соединённых с помощью сети, слабосвязанных гетерогенных компьютеров, работающих вместе для выполнения огромного количества заданий (операций, работ). Эта технология применяется для решения научных, математических задач, требующих значительных вычислительных ресурсов. Грид-вычисления используются также в коммерческой инфраструктуре для решения таких трудоёмких задач, как экономическое прогнозирование, сейсмоанализ, разработка и изучение свойств новых лекарств.
Грид с точки зрения сетевой организации представляет собой согласованную, открытую и стандартизованную среду, которая обеспечивает гибкое, безопасное, скоординированное разделение вычислительных ресурсов и ресурсов хранения[1] информации, которые являются частью этой среды, в рамках одной виртуальной организации.[2]
Концепция грид
Грид является географически распределённой инфраструктурой, объединяющей множество ресурсов разных типов (процессоры, долговременная и оперативная память, хранилища и базы данных, сети), доступ к которым пользователь может получить из любой точки, независимо от места их расположения.[3]
Идея грид-компьютинга возникла вместе с распространением персональных компьютеров, развитием интернета и технологий пакетной передачи данных на основе оптического волокна (SONET, SDH и ATM), а также технологий локальных сетей (Gigabit Ethernet). Полоса пропускания коммуникационных средств стала достаточной, чтобы при необходимости привлечь ресурсы другого компьютера. Учитывая, что множество подключенных к глобальной сети компьютеров большую часть рабочего времени простаивает и располагает большими ресурсами, чем необходимо для решения их повседневных задач, возникает возможность применить их неиспользуемые ресурсы в другом месте.
Сравнение грид-систем и обычных суперкомпьютеров
Распределённые, или грид-вычисления в целом являются разновидностью параллельных вычислений, которые основываются на обычных компьютерах (со стандартными процессорами, устройствами хранения данных, блоками питания и т. д.), подключенных к сети (локальной или глобальной) при помощи обычных протоколов, например, Ethernet, в то время как обычный суперкомпьютер содержит множество процессоров, подключенных к локальной высокоскоростной шине.
Основным преимуществом распределённых вычислений является то, что отдельная ячейка вычислительной системы может быть приобретена как обычный неспециализированный компьютер. Таким образом можно получить практически те же вычислительные мощности, что и на обычных суперкомпьютерах, но с гораздо меньшей стоимостью.
Типы грид-систем
В настоящее время выделяют три основных типа грид-систем:
- Добровольные гриды — гриды на основе использования добровольно предоставляемого свободного ресурса персональных компьютеров;
- Научные гриды — хорошо распараллеливаемые приложения программируются специальным образом (например, с использованием Globus Toolkit);
- Гриды на основе выделения вычислительных ресурсов по требованию (коммерческий грид, англ. enterprise grid) — обычные коммерческие приложения работают на виртуальном компьютере, который, в свою очередь, состоит из нескольких физических компьютеров, объединённых с помощью грид-технологий.
История
Термин «грид-вычисления» появился в начале 1990-х годов как метафора, демонстрирующая возможность простого доступа к вычислительным ресурсам как и к электрической сети (англ. power grid) в сборнике под редакцией Иэна Фостера и Карла Кессельмана «The Grid: Blueprint for a new computing infrastructure».
Использование свободного времени процессоров и добровольного компьютинга стало популярным в конце 1990-х годов после запуска проектов добровольных вычислений GIMPS в 1996 году, distributed.net в 1997 году и SETI@home в 1999 году. Эти первые проекты добровольного компьютинга использовали мощности подсоединённых к сети компьютеров обычных пользователей для решения исследовательских задач, требующих больших вычислительных мощностей.
Идеи грид-системы (включая идеи из областей распределённых вычислений, объектно-ориентированного программирования, использования компьютерных кластеров, веб-сервисов и др.) были собраны и объединены Иэном Фостером, Карлом Кессельманом и Стивом Тукке (Steve Tuecke), которых часто называют отцами грид-технологии.[1] Они начали создание набора инструментов для грид-компьютинга Globus Toolkit, который включает в себя не только инструменты менеджмента вычислений, но и инструменты управления ресурсами хранения данных, обеспечения безопасности доступа к данным и к самому гриду, мониторинга использования и передвижения данных, а также инструментарий для разработки дополнительных грид-сервисов. В настоящее время этот набор инструментария является де факто стандартом для построения инфраструктуры на базе технологии грид, хотя на рынке существует множество других инструментариев для грид-систем как в масштабе предприятия, так и в глобальном.
Грид-технология применяется для моделирования и обработки данных в экспериментах на Большом адронном коллайдере (грид используется и в других задачах с интенсивными вычислениями). На платформе BOINC в настоящее время ведутся активные вычисления более 60 проектов. Например, проект Fusion (юг Франции, разработка метода получения электричества с помощью термоядерного синтеза на экспериментальном реакторе ITER) также использует грид (EDGeS@Home). Под названием CLOUD начат проект коммерциализации грид-технологий, в рамках которого небольшие компании, институты, нуждающиеся в вычислительных ресурсах, но не могущие себе позволить по тем или иным причинам иметь свой суперкомпьютерный центр, могут покупать вычислительное время грида.[4]
Структура грид-системы ЦЕРНа
Грид-система ЦЕРНа, предназначенная для обработки данных, получаемых с Большого адронного коллайдера, имеет иерархическую структуру.[4]
Самая верхняя точка иерархии, нулевой уровень — CERN (получение информации с детекторов, сбор «сырых» научных данных, которые будут храниться до конца работы эксперимента). За первый год работы планируется собрать до 15 петабайт (тысяч терабайт) данных первой копии.
Первый уровень, Tier1 — хранение второй копии этих данных в других уголках мира (12 центров: в России, Италии, Испании, Франции, Скандинавии, Великобритании, США, на Тайване, а один центр первого уровня — CMS Tier1 — в ЦЕРНе). 26 марта 2015 года новый центр открылся в Лаборатории информационных технологий в Дубне (ОИЯИ)[5]. Центры обладают значительными ресурсами для хранения данных.
Tier2 — следующие в иерархии, многочисленные центры второго уровня. Наличие крупных ресурсов для хранения данных не обязательно; обладают хорошими вычислительными ресурсами. Российские центры: в Дубне (ОИЯИ), три центра в Москве (НИИЯФ МГУ, ФИАН, ИТЭФ), Троицке (ИЯИ), Протвино (ИФВЭ), Санкт-Петербурге (СПбГУ)[6] и Гатчине (ПИЯФ). Кроме того, в единую сеть с этими центрами связаны и центры других стран - участниц ОИЯИ — в Харькове, Минске, Ереване, Софии, Баку и Тбилиси.
Более 85 % всех вычислительных задач Большого адронного коллайдера по состоянию на 2010 год выполнялось вне ЦЕРНа, из них более 50 % — на центрах второго уровня.[4]
См. также
Примечания
- Amy M. Braverman.Father of the Grid . Архивировано 18 февраля 2012 года.
- GRIDCLUB.ru: Интернет-портал по грид-технологиям
- Концепция грид
- Интернет-коллайдер
- В Дубне открыт первый в России центр уровня Tier-1 (недоступная ссылка) (26 марта 2015). Дата обращения: 27 марта 2015. Архивировано 2 апреля 2015 года.
- РАСПРЕДЕЛЕННЫЕ ВЫЧИСЛЕНИЯ И ГРИД-ТЕХНОЛОГИИ В НАУКЕ И ОБРАЗОВАНИИ. Тезисы докладов третьей международной конференции. Дубна, 30 июня – 4 июля 2008 г. (недоступная ссылка). Дата обращения: 3 октября 2012. Архивировано 22 июля 2011 года.
Литература
- http://www.ict.nsc.ru/jspui/bitstream/ICT/538/1/Grid.2004-11-29.pdf
- http://omega.sp.susu.ru/books/grid/%D0%A4%D0%BE%D1%81%D1%82%D0%B5%D1%80%D0%9A%D0%A2%2001.pdf
- https://www.osp.ru/os/2003/01/182393
- http://egee.pnpi.nw.ru/doc/pp-832.pdf
- https://www.osp.ru/os/2013/08/13037859
- Davies, Antony Computational Intermediation and the Evolution of Computation as a Commodity (англ.) // Applied Economics : journal. — 2004. — June. Архивировано 28 февраля 2008 года.
- Foster, Ian; Kesselman, Carl The Grid: Blueprint for a New Computing Infrastructure (англ.). — Morgan Kaufmann Publishers, 1998. — ISBN 978-1-55860-475-9.
- Plaszczak, Pawel; Wellner, Richard, Jr. Grid Computing "The Savvy Manager's Guide" (англ.). — Morgan Kaufmann Publishers, 2005. — ISBN 9780127425030.
- Berman, Fran; Hey, Anthony, Fox, Geoffrey C. Grid Computing: Making The Global Infrastructure a Reality (англ.). — Wiley, 2003. — ISBN 978-0-470-85319-1.
- Li, Maozhen; Baker, Mark A. The Grid: Core Technologies (англ.). — Wiley, 2005. — ISBN 978-0-470-09419-8.
- Catlett, Charlie; Smarr, Larry Metacomputing (англ.) // Communications of the ACM : journal. — 1992. — June (vol. 35, no. 6). — doi:10.1145/129888.129890..
- Buyya, Rajkumar Grid Computing: Making the Global Cyberinfrastructure for eScience a Reality (англ.) // CSI Communications : journal. — Mumbai, India: Computer Society of India (CSI), 2005. — July (vol. 29, no. 1). Архивировано 28 февраля 2006 года.
- Stockinger, Heinz; et al. Defining the Grid: A Snapshot on the Current View (англ.) // The Journal of Supercomputing. — 2007. — March.
- Черняк, Леонид. Распределённые вычисления, GRID-технологии или кластеры? // Открытые Системы : журнал. — 2004. — Апрель (т. 4, № 4).
- Ривкин, Марк. Платформа для коммерческих GRID // Открытые Системы. — 2003. — Декабрь (т. 12, № 12).
Ссылки
- Smith, Roger Grid Computing: A Brief Technology Analysis . CTO Network Library (2005).
- Berstis, Viktors Fundamentals of Grid Computing (недоступная ссылка). IBM. Дата обращения: 15 февраля 2008. Архивировано 21 октября 2016 года.
- Ferreira, Luis; et.al. Grid Computing Products and Services . IBM. Архивировано 18 февраля 2012 года.
- Ferreira, Luis; et.al. Introduction to Grid Computing with Globus . IBM. Архивировано 18 февраля 2012 года.
- Jacob, Bart; et.al. Enabling Applications for Grid Computing . IBM. Архивировано 18 февраля 2012 года.
- Ferreira, Luis; et.al. Grid Services Programming and Application Enablement (недоступная ссылка). IBM. Дата обращения: 15 февраля 2008. Архивировано 12 февраля 2016 года.
- Jacob, Bart; et.al. Introduction to Grid Computing . IBM. Архивировано 18 февраля 2012 года.
- Ferreira, Luis; et.al. Grid Computing in Research and Education . IBM. Архивировано 18 февраля 2012 года.
- Ferreira, Luis; et.al. Globus Toolkit 3.0 Quick Start (недоступная ссылка). IBM. Дата обращения: 15 февраля 2008. Архивировано 11 марта 2016 года.
- Surridge, Mike; et.al. Experiences with GRIA – Industrial applications on a Web Services Grid . IEEE. Архивировано 18 февраля 2012 года.
- Global Grids and Software Toolkits: A Study of Four Grid Middleware Technologies
- AZGRID | Грид сегмент Института Физики НАН Азербайджана
- JRES| Java Remote Execution Service