首页 > 业界 > 相比龙芯,申威的“芯”路历程为什么平坦很多?
2015
10-04

相比龙芯,申威的“芯”路历程为什么平坦很多?

相比龙芯,申威的“芯”路历程为什么平坦很多? - 同创卓越 - 1

相对于从诞生之初就处于舆论风口浪尖的龙芯,国内另一款走全自主道路的芯片——申威,相比之下就低调得多。

无论是传统纸媒还是网络媒体,申威的曝光率比起龙芯、海思、展讯等国产芯片都要低得多,而且相比于嘲讽天赋技能被点满的龙芯,申威极少成为网媒和充满虐气的网民的攻击对象。申威的军方背景更是给它带一缕神秘的色彩。下面,让我们一起走进申威,解密申威的“芯”路历程。

1、申威的诞生

上世纪 60-70 年代末,中国在高性能计算机领域也曾有过自己的辉煌——哈军工曾经制造出具有分时操作系统和汇编语言、FORTRAN 语言及标准程序库的 441B 系列计算机。北京大学、北京有线电厂等单位联合研制 150 计算机。清华大学、北京无线电三厂研制生产了 130、131、132、135、140、152、153 系列计算机近千台。国防科大成功研制出 151 计算机,华东计算技术研究所成功研制 1001 中型集成电路计算机和 HDS-9 计算机,其中 HDS-9 计算机每秒运算达 500 万次,更为难能可贵的是,这些计算机的软件和硬件是中国人自己编译和制造的。

但在 80 年代因迷信“造不如买、买不如租”、“市场换技术”等理论,放弃了自主芯片的研发转而大量外购国外芯片。从 80 年代的银河 1 超算开始,到 90 年代的银河2、银河3,曙光系列超级计算机都没有中国“芯”,在技术上始终受制于人。即使是在几年前的天河 2 号上,也只有 4096 片飞腾 1500 作为计算节点前端处理器,而飞腾 1500 是在 SUN 的 UltraSPARC T2 基础上做的改进版本。

为解决在超算和国防、信息安全无“芯”可用的困境。总参谋部第五十六研究所(无锡江南计算技术研究所)于 2003 年开始着手设计中国人自己的高性能芯片。申威从此踏上了征途。

相比龙芯,申威的“芯”路历程为什么平坦很多? - 同创卓越 - 2

(超云申威服务器)

  2、申威的娘家

申威由总参谋部第五十六研究所(无锡江南计算技术研究所)设计,上海高性能集成电路设计中心是 56 所的马甲。

该研究所创建于 1951 年 6 月,坐落于无锡。主要研究方向有计算机系统结构、并行/分布处理与智能计算机系统、计算机软件、人工智能与智能控制、计算机与通信、计算机信息处理与应用。八十年代以来,在计算机、通信及机电一体化等领域共荣获国家、军队科学技术成果奖 300 多项,其中国家科学技术进步特等奖 3 项,军队科学技术进步一等奖 35 项。1987、2000 年,中央军委两次为 56 所荣记集体一等功。1993 年中央军委授予 56 所“勇攀科技高峰先进研究所”荣誉称号。

相比龙芯,申威的“芯”路历程为什么平坦很多? - 同创卓越 - 3

(瘦客户端)

  3、申威的指令集和技术渊源

申威属于 Alpha 阵营,指令集也是基于 Alpha 进行扩展。

申威的技术来源是于 DEC 的 Alpha 21164。DEC 的技术实力很强,Alpha 性能更是惊艳,AMD 就曾经购买了 Alpha 21264 的技术资料,挖走了部分 DEC 的技术人员后,开发出自己的 K7 微结构。

DEC 是技术实力比人强,但商业模式不如人而失败的典型例子,Alpha 也被几经转手,先被康柏收购,后被惠普雪藏。目前 Alpha 已经被束之高阁,指令集和微结构都已经不再更新,技术专利大多已过期或快过期了。申威是目前 Alpha 阵营中仅存的硕果,拥有自主扩展指令和发展路线的自主权。

至于购买国外指令集,并以此为基础扩展指令,发展出自己的指令集是否是自主可控等问题,请参见本人撰写的另一篇文章《15 年了,龙芯拿什么与国外芯片巨头对抗》

相比龙芯,申威的“芯”路历程为什么平坦很多? - 同创卓越 - 4

(防火墙)

  4、自主可控体系构建

申威和龙芯作为国内硕果仅存的两个走自主可控路线的 IC 设计单位,和龙芯一样在积极构建自己的软硬件体系以保障从软件和硬件两个方面实现安全可控。

申威开发了自己的神威睿智编译器,研发了基于 Linux 的神威睿思操作系统。加上超算领域不像 PC 领域那样存在软件生态的掣肘,申威构建自主技术体系的道路可谓一片坦途——于 2012 年 9 月投入使用的神威蓝光超算使用了 8704 片申威 1600,搭载神威睿思操作系统,实现了软件和硬件全部国产化。

 5、申威历程

56 所(江南所)以 Alpha 指令集为基础,扩展出自己的指令集,并在 2006 年设计出具有自主微结构的申威1,申威 1 是一款 130nm 制程工艺的单核心 CPU,主频 900MHz,集成 5700 万晶体管。2008 年完成的申威2,是一款 130nm 制程工艺的双核 CPU,主频 1.4GHz。

如果说申威 1 和申威 2 更像是 56 所磨砺技艺的作品,是对 Alpha21164 技术的消化吸收,那么 2010 年研发的申威 1600 则是 56 将国外技术融会贯通后,推陈出新的产品。申威 1600 是一款 65nm 制程工艺的 16 核 CPU,主频 1.1G,双精浮点 140G。申威 1600 被用于神威蓝光超算。

也许是因 Alpha 当年强悍的性能,本人对源自 Alpha 的申威抱有很高的期望。但根据国家高性能集成电路设计中心公布的论文显示,申威 1600 的 SPEC2000 测试分数只能说是差强人意,唯有性能功耗比和 LINPACK 测试聊以自慰。

平心而论,虽然申威 1600 处理器的单核性能有限,但 16 核的可扩展性很好,实现了比较理想的多核性能加速比。

申威 1600 性能参数如下图所示:

相比龙芯,申威的“芯”路历程为什么平坦很多? - 同创卓越 - 5

2012 年,56 所研制出申威 1610 和申威 410,申威 1610 为 40nm 制程的 16 核 CPU,集成 10 亿晶体管,主频 1.6G,最大功耗 50W,双精浮点运算 200G。申威 410 为 40nm 制程的 4 核 CPU,集成 2.7 亿晶体管,主频 1.6G。前者用于服务器,后者用于 PC,支持中标麒麟操作系统。这两款产品同样遭遇了龙芯在 PC 市场遇到的软件生态贫乏和产业联盟弱小导致产品缺乏市场竞争力的困境,加上申威 410 单核性能太弱,搭载申威 410 的安全可信 PC 基本不具备在民用 PC 市场的竞争力。

2014 年底,申威 5 成功流片。根据一篇由坐落于无锡的数字工程与先进技术国家重点实验室和坐落于北京的国家并行计算机工程技术研究中心联合发布的论文,申威 5 很有可能是一款集成了 4 个管理核心和 256 个运算核心的高性能众核 CPU,双精浮点运算超过 1T,核内 linpack 效率 93%,并有很高的性能功耗比。

相比龙芯,申威的“芯”路历程为什么平坦很多? - 同创卓越 - 6

    (申威 5 结构图)

   6、神威蓝光超算

相比龙芯,申威的“芯”路历程为什么平坦很多? - 同创卓越 - 7

神威蓝光超算总投资 6 亿元,于 2012 年 9 月投入使用。神威蓝光超级计算机使用了 8704 片申威 1600,搭载神威睿思操作系统,实现了软件和硬件全部国产化。神威蓝光超算峰值计算性能 1PFlops(一千万亿次每秒),持续性能为 0.796PFlops,性能功耗比超过 741MFlops/W(百万次浮点运算/秒·瓦),LINPACK 效率为 74%。

神威蓝光超算有以下特点:

一是全部使用申威 1600 芯片,搭载神威睿思操作系统,实现软件和硬件全部国产化;

二是稳定性较好,测试 Linpack 全过程 9 个多小时无故障;

三是液冷系统高效可靠,冷却剂在冷板内部的封闭水循环带走主板热量,环保且无噪音;

四是高密度封装,一个机仓可装入 1024 个 CPU;

五是整机功耗低,性能功耗比高。神威蓝光超算性能功耗比超过 741MFlops/W,整机功耗 1W;天河 1 号超算性能功耗比 431.7 MFlops/ W,整机功耗 4W。

六是整机效率高。神威蓝光超算 LINPACK 在不同规模下的效率:单处理器核 80.28%,单 CPU 75.20%,单机舱 75.07%,整机 74.37%。神威蓝光超算整机效率与曾经是美国最快的计算机美洲虎超级计算机效率相当。

相比龙芯,申威的“芯”路历程为什么平坦很多? - 同创卓越 - 8
据统计,“国家超级计算济南中心”有注册用户超过 100 个,移植优化 60 多道重点应用课题,其中能够达到上万核并行规模的应用课题达 16 个,有应用成果的课题超过 15 个,系统利用率已超过 60%。目前主要面向气象气候、海洋环境、生物医药、信息安全、航 空航天、材料物理、金融分析、工业设计、石油物探等应用领域。

新一代神威超算

无锡市人民政府于 2013 年就成立了以市长为组长,副市长为副组长的国家超级计算无锡中心建设领导小组,积极筹备新一代神威超算建设。2015 年 4 月,官方成立了无锡恒鼎超级计算中心有限公司作为国家超级计算(无锡)中心的建设和运营主体,56 所成立了项目指挥组及总师组负责解决超算建设过程中的技术问题。

目前,新一代神威超算主机系统软件正在调试中,整机系统设计计划于 2015 年年底公布。新超算总投资 18 亿元,计划在 2017-2018 年建成,运算能力将达到 100PFlops,计算性能有望冲击世界第一。

神威 MPP 机

神威 MPP 机是国家并行计算机工程技术研究中心研制的面向千万亿级以上规模的高性能计算机,能通过虚拟化技术、网格计算技术和云存储技术在服务层虚拟出多种计算和存储服务形态。

神威 MPP 机硬件系统由高速运算系统、互连网络系统、海量存储系统、维护监控系统、电源系统、冷却系统和结构组装设计等部分组成。软件系统主要包括“神威睿思”操作系统、“神威睿智”编译器、基础库等。 相比龙芯,申威的“芯”路历程为什么平坦很多? - 同创卓越 - 9

系统投入使用以来,已经成功移植了包括气候气象、海洋科学、新药研制、生物信息、航空航天、工业设计、金融分析等重点应用领域的近二十道万核以上并行规模的实际应用课题,取得若干重大应用成果。

6 神威 Cluster 是在汇集神威 MPP 机的技术优点基础上,专门为科学和工程计算领域设计开发的高性能计算平台。在气候气象、海洋环境、数值风洞、碰撞仿真、蛋白质折叠、基因研究、新药研发、分子动力学模拟、量子化学计算、材料科学、芯片设计、动漫设计、工业设计等方面用途广泛。

神威 Cluster 系统的通用结构如下图:

相比龙芯,申威的“芯”路历程为什么平坦很多? - 同创卓越 - 10

7、安全可信 PC

神威安全可信 PC 是搭载申威 410,针对有较高安全需求的党政军单位,元器件实现 100% 国产化。内嵌的国产外围套片,集成了符合国家标准的可信密码模块,实现系统内嵌式可信引导和软件系统的可信度量,保证系统的安全可信。

因申威 410 单核性能太弱,软件生态极度贫乏,仅限于满足特殊部门使用。如果说龙芯还是在从安全市场往民用市场方向发展的话,申威从头到尾压根就没考虑过民用市场,完全是自己关起门来自己玩。

实事求是的说,搭载申威 410 的安全可信 PC 不仅价格贵,整机性能弱,而且软件生态贫乏,基本不具备在民用 PC 市场的竞争力。

在申威 5 走众核路线后,从 2012 年至今,申威没有新的桌面芯片产品,很有可能已经放弃桌面芯片开发。

安全架构如图所示: 

相比龙芯,申威的“芯”路历程为什么平坦很多? - 同创卓越 - 11

8、神威云

神威云是国家并行计算机工程技术研究中心研发的云产品,能够提供丰富的云产品套件、开放的 API 接口、全面的资源管理平台和运维监视平台,具有强大的虚拟资源池管理能力。神威云平台采用商用服务器、高速网络、高性能存储设备,结合神威云平台系列软件搭建。具有功能强大、性能稳定、安全可靠、简单好用的特点。

相比龙芯,申威的“芯”路历程为什么平坦很多? - 同创卓越 - 12

 9、小结

虽然申威和龙芯一样是走独立自主路线,但申威的道路要比龙芯平坦得多:

首先,国家对龙芯的投入非常有限,而且龙芯自 2010 年市场化运营后完全自主经营,自负盈亏。申威是军方项目,不仅不用面对 IC 设计公司最头痛的技术人才流失问题,还能在人力物力财力可以得到军方充足保障。

其次,申威专注于超算领域,不存在龙芯在 PC 市场遇到的软件生态贫乏和产业联盟弱小导致产品缺乏市场竞争力的困境。申威有自己的指令集、微结构、CPU、编译器、操作系统就足以在超算领域立足。而龙芯则被软件生态贫乏和产业联盟弱小掣肘。但申威专注于超算领域也带来一个缺憾,就是在和人民群众最息息相关的民用 PC 市场,我们可能永远看不到申威的产品了。

最后,申威是军方项目,而神威超算更是国家级工程,申威的软件和硬件产品完全可以在体制内完成内部循环。而龙芯的很多产品必须到商业市场上去拼杀。

申威自 2003 年诞生以来,基于 Alpha 自主扩展了指令集,共设计了申威1、申威2、申威 1600、申威 1610、申威 5 五款芯片,自主研发了神威睿智编译器和神威睿思操作系统,推出了搭载申威芯片的 PC、服务器、高性能计算机、超算、防火墙、机架式存储服务器、大规模集群存储系统、瘦客户端、QDR HCA 卡、神威云等产品,为国家信息安全和超算建设竭尽所能,圆满完成了国家交付的任务。

来自: 雷锋网
最后编辑:
作者:同创卓越
这个作者貌似有点懒,什么都没有留下。

留下一个回复

你的email不会被公开。