Вычислительная мощность компьютера
Вычислительная мощность компьютера (производительность компьютера) — это количественная характеристика скорости выполнения определённых операций на компьютере. Чаще всего вычислительная мощность измеряется во флопсах (количество операций с плавающей запятой в секунду), а также производными от неё.
На данный момент принято причислять к суперкомпьютерам системы с вычислительной мощностью более 10 терафлопсов (10*1012 или десять триллионов флопсов; для сравнения - среднестатистический современный настольный компьютер имеет производительность порядка 0,1 терафлопса). Одна из наиболее мощных на тесте HPL компьютерных систем — китайский Sunway TaihuLight — имеет производительность, превышающую несколько десятков петафлопсов[1].
Неоднозначность определения
Существует несколько сложностей при определении вычислительной мощности суперкомпьютера. Во-первых, следует иметь в виду, что производительность системы может сильно зависеть от типа выполняемой задачи. В частности, отрицательно сказывается на вычислительной мощности необходимость частого обмена данных между составляющими компьютерной системы, а также частое обращение к памяти. В связи с этим выделяют пиковую вычислительную мощность — гипотетически максимально возможное количество операций над числами с плавающей запятой в секунду, которое способен произвести данный суперкомпьютер.
Важную роль играет также разрядность значений, обрабатываемых программой (обычно имеется в виду формат чисел с плавающей запятой). Так, например, у графических процессоров NVIDIA Tesla первых двух поколений максимальная производительность в режиме одинарной точности (32 бит) составляет порядка 1 терафлопса, однако при проведении вычислений с двойной точностью (64 бит) она в 10 раз ниже (так, в микросхемах серии GF200 в 10 раз меньше блоков с поддержкой вычислений с двойной точностью[2]).
Измерение производительности
Оценка реальной вычислительной мощности производится путём прохождения специальных тестов (бенчмарков) — набора программ, специально предназначенных для проведения вычислений и измерения времени их выполнения. Обычно оценивается скорость решения системой большой системы линейных алгебраических уравнений, что обусловливается, в первую очередь, хорошей масштабируемостью этой задачи.
Наиболее популярным тестом производительности является Linpack benchmark. В частности, HPL (высокопараллельная реализация Linpack с применением MPI)[3] используется при составлении списка TOP500 суперкомпьютеров в мире[4].
Другими популярными программами для проведения тестирования являются NAMD[5] (решение задач молекулярной динамики), HPCC (HPC Challenge Benchmark), NAS Parallel Benchmarks[3].
Наиболее мощные суперкомпьютеры
По состоянию на июнь 2011 года наиболее мощными суперкомпьютерами являются[1]:
- JUGENE — располагается в Германии в Исследовательском центре Юлиха. Разработан в рамках проекта Blue Gene компанией IBM.
- Kraken XT5 — располагается в США в университете Теннесси. Создан компанией Cray Inc.
- Roadrunner — располагается в США в Лос-Аламосской национальной лаборатории. Первый суперкомпьютер, пиковая производительность которого превысила уровень 1 петафлопса[6]. Создан компанией IBM. Особенностью является использование гибридной архитектуры, в которой основная вычислительная мощность обеспечивается процессорами Cell.
- Jaguar — располагается в США в национальной лаборатории Оук-Ридж, основан на серверных процессорах AMD Opteron. Создан компанией Cray Inc.
- Тяньхэ-1А — первый китайский суперкомпьютер петафлопсного класса[7]. Создан Национальным университетом оборонных технологией Китая. Особенностью архитектуры является наличие графических карт ATI Radeon HD 4870, сравнительно недавно предложенных для использования в сверхпроизводительных решениях.
- K computer — располагается в Японии в Институте физико-химических исследований. Разработан компанией Fujitsu.
Примечания
- Топ 500 лист суперкомпьютеров, ноябрь 2016 (англ.)
- http://www.ixbt.com/video3/cuda-1.shtml "для поддержки FP64 вычислений в NVIDIA решили сделать выделенные вычислительные блоки. И в GT200 их в десять раз меньше, чем блоков FP32 (по одному блоку двойной точности на каждый мультипроцессор)."
- Обзор некоторых пакетов измерения производительности кластерных систем
- TOP500. The Linpack Benchmark (англ.)
- NAMD Performance (англ.)
- Пришла пора замахнуться на экзафлоп?
- В мире обозначился новый мощнейший суперкомпьютер (недоступная ссылка). Дата обращения: 1 декабря 2009. Архивировано 4 декабря 2010 года.