中科曙光产品篇——超级计算机-中科曙光研发投入

2023-04-11 22:24:43

 

欢迎关注微信公众号:佐沐熙

篇前预警:本系列文章仅为个人兴趣之作,绝非炒股建议。如因本文有投资损失,后果自负!

另外,文章写的比较长。没空看的人可以直接翻到最下面看总结哦。总结里有每个部分的简介,可以挑感兴趣的地方直接跳到相应部分,重点有加粗。

高性能计算机&通用服务器

在财务分析篇我们看到,中科曙光有80%的营收都来自高性能计算机和通用服务器。二者有何界限呢?或者说,为什么中科曙光要在2015年将二者业务进行合并?

软妹兎通过查看百度百科和中科曙光的投资者纪要,得出他们二者大概的区别就是,高性能计算机是一台机器里有很多处理器,或者同时有很多台计算机作为一个计算系统的计算环境,和服务器不同的是,高性能计算机的所有计算资源往往都被倾注到一个任务或者有限几个任务中,从而实现一般电脑无法完成的海量资料处理,每秒运行速度可达万亿次以上。而通用服务器则是单个机器,接受网络上其他客户机的服务请求并提供相应服务。可以说高性能计算机是一个机器集群,包含了通用服务器在里面。而中科曙光将二者业务进行合并的理由是,近年来的趋势是客户往往直接采购集群,也就是高性能计算机和高端服务器总是一起采购,于是曙光干脆将通用服务器合并到了高性能计算机里。

中国高性能计算机金字塔——性能进化史

下面,软妹兎将介绍四款对于中国超算具有里程碑意义的超级计算机,它们带领着中国来到世界的超算舞台上和美国同台竞技,展现出无与伦比的风采。而美国为了压制中国超算,夺回霸主地位,在2015年曾禁止英特尔出售“至强芯片Xeon”给中国。然而中国却凭借自主研发的CPU继续蝉联超算霸主。打脸来得如此迅速而有力,大家是不是还有点小激动呢?反正软妹兎在搜集资料时是非常的激动的(妈妈问兎兎为什么跪着码字?)然而在去年,也就是2018年,美国终究夺回了超算冠军。两国在超算领域角逐的下一个目标是E级超算,而中国也已经有了相关的技术成果。那么,现在让我们开始逐一介绍这些闪烁着华人智慧光芒的超级计算机产品吧。曙光5000A

2008年推出,应用于上海超级计算中心——曙光魔方。当时世界排名第10名(前9名是美国的HPC),使中国成为继美国之后第二个能研制并应用超过百万亿次HPC(HPC是高性能计算机的简称)的国家。曙光6000A2010年,曙光6000A问世,应用于国家超级计算深圳中心——曙光星云、中科院超级计算中心——元。曙光星云当时在2010年第35届全球超级计算机500强排名中名列第二,并在接下来的两年里始终位列前十,成为国内首台、世界上第三台实测性能超千万亿次的超级计算机。曙光星云(Nebulae)是曙光公司与中科院计算所、国家超级计算深圳中心联合承担的十一五“863计划”的重大专项任务,是曙光6000的阶段性成果。相比于天河和神威是军用的计算型HPC,星云偏民用,除了高性能以外,还有高效易用的编程环境和方便的用户操作应用。天河2号

由国防科技大学研发,使用英特尔的至强CPU芯片Xeon,连续成为2013、2014、2015年世界最快的超级计算机(同样使用Xeon芯片的美国超级计算机运算能力仅为天河2号的五分之一左右,运算效率为天河2号的60.7%)。然而2015年4月9日,美国商务部 以危害国家安全为由禁止英特尔向天河出售Xeon处理器,从而打断了天河二号继续升级的步伐。而天河相关的四家单位——国家超算长沙中心、广州中心、天津中心、国防科大,也被列入出口管制名单。美国给出的解释是,天河2号“据信被用于核爆炸模拟”。天河2号选择了国产Matrix-2000加速卡代替Xeon升级了天河2号超算,并夺得了2018年超算第四名。(还是被影响到了,夺冠的重任交给了江南计算所)神威.太湖之光

在天河2号2015年蝉联冠军,而被美国禁售英特尔CPU后,由江南计算所研发,采用国产CPU芯片“申威”的超级计算机“神威.太湖之光”夺得2016年世界超级计算机冠军,而且2017年继续蝉联冠军,不仅速度比第二名“天河二号”快出近两倍,其效率也提高3倍。2018年神威位居世界第三。小结

用通俗易懂的语言总结一下上面几段话,那就是,美国看中国的超级计算机天河总是拿世界冠军,眼红了,于是就撕破脸皮禁止英特尔向天河提供芯片,而这个芯片是超级计算机的“心脏”,势必会影响到中国超级计算机继续夺冠。美国满心以为这次该我们拿第一了吧?然而让他们惊掉下巴的是,大天朝转眼又拿出了国产CPU,继续拿了两年的冠军。美国憋着劲追赶,总算在2018年拿回了冠军。而国产CPU的性能优化还在路上。为了更确切的了解到以上几款HPC的牛逼程度,我们介绍一下它们的主流性能指标参数。主流衡量指标为Linpack测试中的flops(每秒浮点运算次数),表示简单海量计算能力。

啥?你不知道上面那些数字什么意思?那人脑你知道吧?人脑的计算能力约等于100million MIPS(数据来自2009年《科学美国人》Moravec发表的文章),也就是3万亿次浮点运算每秒,也就是0.00003亿亿次/秒。所以,曙光6000A大概等于423.67个人脑,神威大概等于41.67万个人脑。敲黑板,上面单指计算速度。不包括存储能力哦。存储能力?你自己想想你复习考试背书的痛苦程度(还记得马冬梅吗?),再想想一大群计算机的存储量级别吧
另外我们注意到,曙光5000A和曙光6000A和神威、天河已经不是一个数量级别的性能了。中科曙光在通用类超级计算机这块是老牌王者,它对于中国超算曾经做出过很大的贡献,但天河和神威后来者居上(然而这两家有关的公司没上市,中科曙光依旧是上市公司里超算的龙头)。综合前文,我们知道,如今世界上最先进的超级计算机算力大约在数十亿亿次/秒的级别,而超算的下一个皇冠则是百亿亿次/秒,也就是——E级超算!!目前,E级超算已成为当前各国竞相角逐的战略制高点,美国、欧洲、日本等国家都提出了自己的E级超算研发计划。而中国E级超算的原型系统,由中科曙光、国防科大、江南计算所同时着手研发,这一次,中科曙光依旧扮演着举足轻重的角色——它研发了全球首个面向E级超算的Torus硅元交换机!在制冷和网络互联技术上有了革新性成果。啥是交换机?以下比喻来自知乎。你住在一幢小区楼里,最开始楼上楼下有什么事儿喊一嗓子就知道了,但人一多就会噪音扰民,你听到的大部分内容都与你无关,这很困扰。于是大家约定,有什么事儿都通过书信,传达室大爷负责投递。如果要跟小区外的人通信,传达室大爷会再将其转交给邮递员蜀黍。这样一来每个人分工明确,职责清楚:大爷负责小区内的通信,蜀黍负责小区外的通信。没有大爷行不行?当然可以,但邮递员蜀黍的负担大大增加,本来他只要一到小区门口把成捆的信件丢给传达室大爷就走人了,现在要挨家挨户敲门。(当然小区人不多的话,可以去他大爷的) 。总结一下,喊一嗓子=集线器;传达室大爷=交换机;邮递员蜀黍=路由器。 如果要跟外部通信,必须要用路由器;如果是家庭网络,相当于小区住户不多,路由器完全可以兼任交换机的角色; 如果是网吧,就必须要由交换机来分摊内部通信压力了。中科曙光的硅元交换机采用了torus拓扑结构使得超算的可扩展性更强。啥是torus?哦,软妹兎也不太懂,大概就是一个曲面形的网络结构吧

。下面让我不懂装懂地给大家讲解下硅元torus结构牛逼在哪里(讲错了欢迎大佬指出)

传统的超算采用的是胖树拓扑网络架构,每增加一个节点,通讯网络连接的单位就会越来越多,成本呈指数级增长。同时,由于复杂度高,扩展到一定规模以后通信效率也会降低。更像是纵向扩展。torus拓扑结构每增加一个节点,成本是直线型增长,扩展成本大大降低。更像是横向扩展。但在降低成本的同时,要怎么同时达到胖树拓扑架构的网络延迟和带宽性能,依旧需要进一步研究。硅元指的是Torus高维网络中的一个单元,一个硅元内部是3D-Torus拓扑结构,多个硅元可以组成更高维的Torus结构。目前最新的硅立方超算采用的是6D-Torus架构。中科曙光面向E级超算研发的革新性制冷技术牛逼在哪里呢?

我们知道,计算机高速运行的时候会发热,为了让它不被烧坏,就必须要散热,而散热也会消耗能源(比如开空调散热),散热技术越低级,能源浪费得就越多。一般超级计算机都是用水冷技术散热,而这次中科曙光全球首创了浸没式液冷相变冷却技术,具体对比如下。

PUE=数据中心总设备能耗/IT设备能耗,越接近1表明一个数据中心的绿色化程度越高,表示数据中心能耗主要花在IT设备上,散热能耗较低。

超算的应用场景

由上面的一连串性能进化史,我们看到中美在超算上的角逐。那么,超算对于一个国家来说,意义真的如此重大吗?它主要应用于哪些场景呢?主要用于气象环境空气质量预报预警一体机、高分辨率专业气象数值预报服务一体机——一体机数据来源包含了国际已经建立的遍布全世界的观测站污染源排放的历史数据,也包含了实时采集的污染点对整个数据清单的修正,之后结合气象条件进行相关的计算,最后模拟不同政府措施下可能对污染结果的有利或者无利的影响,这样可以让预报更加精准,采取的措施更有针对性。还能用来预警突发性事件(爆炸、泄露)。十三五规划对于环保投入每年将达2万亿,主要用于大气治理,降低PM2.5值,提高空气质量。“地球数值模拟装置”原型系统便采用了中科曙光的硅立方超算,由中科院大气物理所、计算所、中科曙光共同研发,应对全球变化、防灾减灾、环境治理等。中科曙光还和中科院大气所联合投资成立“中科三清”,主要产品为雾霾治理场景的E级超算。处理卫星数据

子公司航天星图主要从事空天大数据的E级计算,用于处理卫星数据。一颗大卫星每天产生上百T的数据。能源行业

石油勘探——预测分布和储量

智能电网——优化电力配置和供电可靠性其他应用场景比如工业设计、医疗、生物、家居设计等

工业设计方面,天河2号6天内完成过去两年的商飞全机气动参数优化设计的工作量,而广汽集团车身侧面碰撞模拟的精度达到85%以上,广船4万吨排水量散货船数值水槽的设计周期得到缩短,研发成本得以降低;在生物医药健康产业,企业进行2000人基因组30X深度测序,天河2号8小时内完成原来8个月的工作量;在家居设计领域,可以快速产出3D图,减少设计师手工绘制的负荷。

总结

总结一下今天的内容,首先超级计算机是由多个处理器或者多台计算机组成的一个计算集群,它将高密度的计算资源集中起来完成一个或者有限几个计算任务,从而实现海量资料处理。然后,软妹兎给大家介绍了我国超算和美国你追我赶的竞争史,并指出超算的下一个发力点是E级超算。中科曙光参与了国家的E级超算原型系统的研发,并在制冷和互联架构上有了革新性的成果。最后,软妹兎介绍了超算的应用场景,目前国内主要应用于气象监测和大气治理(其实天朝也很努力地在治霾呢)、能源勘探和资源配置、工业家居设计和生物医疗等等。


以上就是关于《中科曙光产品篇——超级计算机-中科曙光研发投入》的全部内容,本文网址:https://www.7ca.cn/baike/16050.shtml,如对您有帮助可以分享给好友,谢谢。
标签:
声明

排行榜