SW26010

SW26010 — 260-ядерный процессор, спроектированный китайским Национальным центром по проектированию высокопроизводительных интегральных микросхем в Шанхае[1]. В процессоре реализована 64-битная RISC-микроархитектура ShenWei, разработанная в Китае. SW26010 состоит из 4 групп (называемых кластерами) по 64 «вычислительно-процессорных элемента» (compute-processing elements, CPE), расположенных в виде матрицы 8×8 элементов. CPE исполняют SIMD-инструкции и могут выполнять за один цикл 8 операций над числами с плавающей запятой одинарной точности. Каждый кластер сопровождается более традиционным ядром общего назначения, называемым «управляющим процессорным элементом» (management processing element, MPE), и обеспечивающим функции мониторинга и управления[1]. Каждый кластер имеет свой собственный контроллер памяти DDR3 SDRAM и банк памяти (англ. memory bank) со своим собственным адресным пространством[2][3]. Процессор работает с тактовой частотой 1,45 ГГц[4].

Каждый CPE обладает внутренней сверхоперативной памятью (англ. scratchpad memory) размером 64 Кб для данных и 16 Кб для инструкций, и соединены посредством сети-на-кристалле (англ. network on a chip), вместо традиционной иерархии кеш-памяти (англ. cache hierarchy)[5][6]. MPE имеет более традиционную схему с 32 Кб кеш-памяти 1-го уровня для данных и инструкций и 256 Кб кеш-памяти 2-го уровня[1]. Сеть-на-кристалле соединена с единым внутрисистемным интерфейсом, который соединяет микросхему с внешним миром.

SW26010 применяются в суперкомпьютере Sunway TaihuLight, который с ноября 2016 по июнь 2018 года занимал 1-е место по производительности в рейтинге TOP500[7][8]. В Sunway TaihuLight используется 40 960 процессоров SW26010, производительность в тесте LINPACK достигает 93,01 PFLOPS.

Примечания

  1. Dongarra, Jack Report on the Sunway TaihuLight System. www.netlib.org (20 июня 2016). Дата обращения: 20 июня 2016.
  2. Fu, H H; Liao, JF; Yang, J Z. The Sunway TaihuLight Supercomputer: System and Applications (англ.) // Chinese Academy of Sciences : journal. — 2016. doi:10.1007/s11432-016-5588-7.
  3. Trader, Tiffany China Debuts 93-Petaflops ‘Sunway’ with Homegrown Processors. HPC Wire (19 июня 2016). — «Each core of the CPE has a single floating point pipeline that can perform 8 flops per cycle per core (64-bit floating point arithmetic) and the MPE has a dual pipeline each of which can perform 8 flops per cycle per pipeline (64-bit floating point arithmetic)». Дата обращения: 21 июня 2016.
  4. Hemsoth, Nicole A Look Inside China's Chart-Topping New Supercomputer. The Next Platform (20 июня 2016). Дата обращения: 20 июня 2016.
  5. Lendino, Jamie Meet the new world’s fastest supercomputer: China’s TaihuLight. Extremetech (20 июня 2016). — «"The TOP500 report said that the chip also lacks any traditional L1-L2-L3 cache, and instead has 12KB of instruction cache and 64KB “local scratchpad” that works sort of like an L1 cache."». Дата обращения: 21 июня 2016.
  6. https://www.researchgate.net/profile/Yi_Chao_Wang/publication/311614249_Porting_and_Optimizing_GTC-P_on_TaihuLight_Supercomputer_with_Sunway_OpenACC/links/5850e4c708ae8f373819491e.pdf
  7. Top 500 The List: November 2016. TOP 500 (14 ноября 2016). Дата обращения: 26 ноября 2016.
  8. США вернули себе первенство в Top500. iXBT.com. Дата обращения: 5 февраля 2020.
This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.