ShenWei
ShenWei (кит. 申威) — семейство микропроцессоров, разработанных китайской компанией Jiāngnán Computing Lab (кит. 江南计算技术研究所) из Уси.
Гибридный микропроцессор ShenWei SW26010
Летом 2016 года была опубликована информация о процессорах ShenWei SW26010, на базе которых был создан наиболее производительный суперкомпьютер в мире (по рейтингу TOP500), Sunway TaihuLight. Каждый процессор содержит 4 управляющих RISC-ядра и 256 вычислительных RISC-ядер общего назначения в 4 группах по 64 ядра[1].
Микропроцессор ShenWei SW1600
ShenWei SW1600 — третье поколение процессоров компании Jiāngnán Computing Research Lab. Работая на тактовой частоте 1,1 ГГц, он достигает производительности на операциях с плавающей запятой в 140,8 Гфлопс. Содержит 16 ядер архитектуры RISC. Создан в рамках совместного проекта Jiāngnán Computing Research Lab и «High Performance Server & Storage Technologies» (кит. 高效能服务器和存储技术). Изготовлен по технологии 65 нм. Производится в Шанхае, предположительно, компанией SMIC, S2 fab.
Характеристики ядра SW1600:
- суперскалярный процессор с исполнением до 4 инструкций за такт;
- исполнительные устройства: два целочисленных, два для обработки чисел с плавающей запятой;
- целочисленный конвейер имеет 7 стадий, а конвейер чисел с плавающей запятой — 10 стадий;
- виртуальная адресация 43-битная, физическая адресация 40-битная;
- Поддерживается виртуальное адресное пространство размером до 8 ТБ, физическое — 1 ТБ;
- кеш L1: 8 КБ для инструкций, 8 КБ для данных;
- кеш L2: 96 КБ, универсальный;
- 128-битная системная шина.[2]
История процессоров ShenWei
Серия процессоров ShenWei разрабатывалась в основном для военных применений в КНР. Есть мнение, что оригинальная архитектура основывалась на некоторых идеях процессоров DEC Alpha.[3] По другой версии, использовались некоторые идеи архитектуры SPARC.
ShenWei SW-1
- первое поколение ShenWei, 2006 год;
- кристалл содержит одно ядро;
- тактовая частота — 900 МГц;
- техпроцесс — 130 нм, SMIC.
ShenWei SW-2
- второе поколение ShenWei, 2008 год;
- кристалл содержит два ядра;
- тактовая частота — 1,4 ГГц;
- техпроцесс — 130 нм, SMIC;
- тепловыделение — до 70-100 Вт.
ShenWei SW-3
- третье поколение ShenWei, 2010 год;
- 64-битная архитектура;
- 16-ядерный чип[4];
- тактовая частота — 975—1200 МГц;
- техпроцесс — 65 нм;
- общая[уточнить] производительность чипа при вычислениях с плавающей запятой — 140,8 GFLOPS на частоте 1,1 ГГц;
- производительность одного ядра — 8 операций над числами с плавающей запятой за 1 такт[5];
- контроллер оперативной памяти:
- максимальный объем — 16 ГБ;
- пиковая пропускная способность — 68 ГБ/с;
- четыре канала;
- 128-битный DDR3.
Sunway SW26010
см. SW26010
- Четвёртое поколение, 2016;
- 64-битная архитектура;
- тактовая частота — 1,45 ГГц;
- 260-ядерный чип, состоящий из 4 кластеров, в каждом из которых размещаются по 64 «вычислительно-процессинговых элемента» (Compute-Processing Elements, CPE), расположенных в виде матрицы 8 на 8 элементов, и одного управляющего процессингового элемента» (Management Processing Element, MPE), который обеспечивает наблюдательные функции, соединённые между собой посредством сети-на-кристалле (англ.)
Суперкомпьютер Sunway BlueLight MPP
Sunway BlueLight MPP | |
---|---|
Активность | с сентября 2011 года |
Операторы | Технологический департамент Программы 863 |
Местонахождение | Национальный суперкомпьютерный центр, Цзинань, кит. 国家超算济南中心 |
Архитектура | 8575 процессоров SW1600 (975 МГц) |
Мощность | ~1 МВт |
Пространство | 2 ПБ |
Оперативная память | 150 ТБ |
Производительность | 1,07 петафлопс (сентябрь 2011 года) |
Рэнкинг |
TOP500: 14 (ноябрь 2011)[6] TOP100 Китая: 2 (2011)[7] Green500 39 (2011)[8] |
Веб-сайт | swcpu.cn |
Массово-параллельный суперкомпьютер Sunway BlueLight (кит. 神威蓝光) полностью разработан в КНР и использует микропроцессоры SW1600 (SW-3). Является первым китайским суперкомпьютером с производительностью петафлопсного диапазона, изготовленным на базе разработанных в Китае микропроцессоров.[9][10] Занимает 14 место в рейтинге TOP500 суперкомпьютеров в мире (ноябрь 2011)[6] , 2 место в рейтинге Top100 суперкомпьютеров КНР 2011 года[7][11] и 39 место в рейтинге Green500 (11/2011).[8] Комплекс введен в строй в сентябре 2011 года и установлен в Национальном суперкомпьютерном центре в Цзинане. Разработан в National Parallel Computer Engineering Technology Research Center (кит. 国家并行计算机工程技术研究中心) и эксплуатируется Технологическим департаментом Программы 863.
Состоит конструктивно из 9 стоек, 8704 процессоров ShenWei SW1600 (975 МГц[7]), сгруппированных в 34 суперузла (Super Nodes). Каждый суперузел состоит из 256 вычислительных узлов. В стойке — 4 суперузла. В каждом RackUnit установлено 4 процессорные платы, по 2 процессора на каждой.[12][13]
Общий объём оперативной памяти 150 ТБ, внешней памяти 2 ПБ. Пиковая производительность при использовании 8575 процессоров на частоте 975 МГц составила 1,07016 Пфлопс, производительность на тесте LINPACK - 795,9 Тфлопс (эффективность 74,37 %).[7] Энергопотребление 1074 кВт (1 МВт). Использует исключительно водяное охлаждение.[14]
Сетевая подсистема построена на базе InfiniBand QDR, топология Fat tree. Используются оптические кабели и коммутаторы на 256 и 324 порта. Пропускная способность каждого соединения 80 Гбит/с, суммарная — 8,7 Тбит/с; латентность порядка 2 мкс.
Суперкомпьютер Sunway TaihuLight
SW26010 применяются в суперкомпьютере Sunway TaihuLight, который на ноябрь 2016 года занимал 1 место по производительности в рейтинге TOP500. В Sunway TaihuLight используется 40 960 процессоров SW26010, производительность в тесте LINPACK достигает 93,01 PFLOPS.
Примечания
- Jack Dongarra. Report on the Sunway TaihuLight. Tech Report UT-EECS-16-742 (англ.). — University of Tennessee, June 24, 2016.
- Hung-Sheng Tsao. SW1600 и Alpha 21164 (недоступная ссылка). LaoTsao's Weblog (29 октября 2011). Дата обращения: 29 октября 2011. Архивировано 2 сентября 2012 года.
- hswz. Jiangnan Computing Lab's Civilian CPU Debut - SW-1 (недоступная ссылка). bbs.lemote.com (4 мая 2009). Дата обращения: 31 октября 2011. Архивировано 31 марта 2012 года.
- http://www.prace-project.eu/IMG/pdf/d8.4_1ip.pdf Архивная копия от 27 сентября 2016 на Wayback Machine page 42
- Andreas Stiller, About TLAs and IPOs Архивировано 19 августа 2012 года. // TOP500 whispers, 2012-02-15: "Currently, 8 flops/clock/core – Sandy Bridge, Power7, SPARC, VIII8fx, Bluegene/Q, ShenWei "
- http://top500.org/list/2011/11/100 TOP500 List — November 2011 (1-100)
- 洪钊峰. 2011 China HPC Top100 Ranking (недоступная ссылка). it168 (27 октября 2011). Дата обращения: 30 октября 2011. Архивировано 25 октября 2012 года.
- http://www.green500.org/lists/2011/11/top/list.php?from=1&to=100 Архивная копия от 23 ноября 2011 на Wayback Machine The Green500 List — November 2011
- JOHN MARKOFF, The New York Times. «China Has Homemade Supercomputer Gain.» October 28, 2011. Retrieved November 7, 2011.
- Cade Metz, WIRED. «China Builds World-Class Supercomputer Sans Intel, AMD.» October 31, 2011. Retrieved November 7, 2011.
- アーカイブされたコピー (недоступная ссылка). Дата обращения: 18 ноября 2011. Архивировано 11 сентября 2012 года. 2011年中国高性能计算机性能TOP100排行榜
- SUNWAY BlueLight MPP 神威蓝光
- HPCwire: China’s Indigenous Supercomputing Strategy Bears First Fruit
- xiongxuehui. 国产CPU再掀热潮 揭秘神威蓝光来龙去脉 (недоступная ссылка). pconline (29 октября 2011). Дата обращения: 29 октября 2011. Архивировано 14 мая 2012 года.
Ссылки
- Сделано в Китае: новый суперкомпьютер Поднебесной использует собственные чипы // 3DNews, 31.10.2011 (рус.)
- Слайд из презентации с описанием микропроцессора SW1600 (кит.)