智能和超算出现“历史性汇合”,超级计算机快速进入智能化时代

冼嘉琪2019-07-05 16:24

(图片来源:全景视觉)

经济观察网 记者 冼嘉琪 超级计算机正在快速进入智能化时代。据研究机构Hyperion Research预测,到2022年,全球超级计算机市场有望较2017年的规模翻番,达到95亿美元。国家超算深圳中心主任冯圣中在6月27日的2019国际智能计算机大会上表示,目前新一代智能超级计算机成为计算机产业国际竞争的标杆,它是实现科技创新的大国重器,是促进科技创新的重要信息基础设施。

超算应用

据近日召开的2019国际智能计算机大会现场资料,通俗来说,超级计算是用了很多个芯片,让它们同时执行任务,科学术语叫做“并行计算”,这是高性能计算的基本思路。超级计算机主要是用来解决其他计算机解决不了的挑战性问题,采用几万个甚至百万个以上的处理器并行协同解决一个大问题。

气象领域便是使用超算的大户,2018年,中国气象局安装了派-曙光超级计算机,峰值计算性能是8Pflops(每秒钟8千万亿次浮点计算),计算能力已跃居气象领域世界第3位。高性能计算可以应用于密码研究、核爆模拟、武器硏制、气象气候、石油勘探、海洋环境、航空航天、宇宙模拟、材料科学、工业设计、地震模拟等众多领域,对国防、国民经济建设和民生福祉都有不可替代的重大作用,发展高性能计算就是要让这巨大的作用发挥出来。

据2019国际智能计算机大会现场资料,随着超级计算技术的普及和成本大幅降低,其应用领域也从具有国家战略意义的核武器研制、信息安全和高冷的科学计算领域向更广泛的国民经济主战场快速扩张,其中新兴应用领域包括人工智能、深度学习、生物医药、基因工程、动漫渲染、过程控制、数据挖掘、金融分析、公共服务等。

“以云计算为例,是超级计算的一种互联网化的输送方式,成本更低,价格更便宣,亚马逊云和阿里云等公有云计算公司将对传统超算中心造成比较大的冲击和竞争,尤其在中低端计算领域;其次,超算的集群技术助力普及大数据;人工智能再次走进大众视野,是源于深度学习与来源于超级计算的GPU结合。区块链技术的POW共识机制的核心就是提交算力的证明,挖矿速度和能力是体现;边缘计算则是云计算的良好补充。”国家超算济南中心主任张云泉在2019国际智能计算机大会上介绍道,这些近期的黑科技都是围绕计算力为核心展开创新。 

引起全球热议的黑洞照片便是超算的成果之一。据了解,今年4月,200多名科研人员从四大洲8个观测点“捕获了”黑洞的视觉证据。此项研究历时10余年,加州理工学院采用Blue Waters超级计算及进行近900个黑洞合并的模拟,花费了2万小时的计算时间。

智能超算

事实上,由于深度神经网络和大数据的兴起,面向应用的超级计算已经成为发展人工智能的强大计算平台,中国工程院院士、中科院计算所首席科学家、曙光信息产业股份有限公司董事长李国杰在2019国际智能计算机大会上演讲表示,在没有找到变革性的智能平台之前,超级计算是研究和应用人工智能必不可少的基础设施。据他介绍,2015年我国高性能计算在数据分析与机器学习领域应用只有27%,2016年达到48%,2017年提升到56%,这个比例今后还将继续扩大。李国杰表示,机器学习不仅是人工智能领域研究的重点,也成为整个计算机科学研究的热点。

“人们对超级计算的直观理解是“算得快”的计算机,而智能计算机的本意是“算得巧”,本来是两股道上的车。但深度学习等智能应用需要算得特别快的计算机,智能与超算近几年出现历史性的汇合。”李国杰表示。

智能计算机有许多种类,包括云端(数据中心)智能计算机、智能工作站、人机交互的智能终端和智能物端设备等, 所谓智能超算主要是指云端的智能计算,或者是面向智能应用的超级计算机。李国杰认为,未来人工智能需要的不仅仅是计算能力,还需要更复杂的硬件结构,“可能发明新的智能计算机,但至少最近20年内智能超算是要高度重视的研究方向。”

“人工智能和智能计算机是中科院计算所数十年来努力的方向。1990年,国家科委批准成立国家智能计算机研究开发中心(依托计算所)。智能中心不但开展了曙光系列并行计算机的研制,而且从事人工智能的基础研究与应用研究,为今天智能超算的发展打下了基础。智能中心与 Motolora联合建立的D实验室培养了一大批与智能信息处理有关的研发人才。设在计算所的智能信息处理科学院重点实验室在计算机视觉知识处理等方面做出重要贡献。”李国杰说。

目前已基本实现自主国产

2018年美国表示预计在2021年建造出一台可实现每秒百亿亿次浮点运算的超级计算机“极光(Aurora)”,让全球的超算竞争进入了Exascale计算(百万兆级的计算,也可称E级超算)时代。中国的E级超级计算机系统将基于已构建的三种原型系统:曙光、天河和神威。

在全球超级计算机评估组织TOP500.org于2019年6月发布的第53届排行中(该排行每半年更新一次),中国超算的数量达到了219台,占全球的44%,排名世界第一。6月21日,美国商务部工业与安全局正式宣布将中国超算明星“曙光”和“神威”及其相关的5家中企机构列入“实体清单”。对于此次动作,众多专家学者在2019国际智能计算机大会上对中国的超算发展并没有表现出过多的担忧。

这样的底气基于中国超算目前已经基本实现自主国产。

超算由大量的计算节点组成,每个计算节点由一些CPU组成,计算节点由高速互联网络连接起来,另外,还有大规模存储系统、系统软件、应用软件和冷却系统等方面。前期,除了高端CPU外,其他部分中国都可以自行设计。而现在,中国的超算也已经可以实现CPU国产化。也就是说,中国的超算行业已经实现了从完全进口美国产品,到购买美国的CPU自己制造超算,再到使用自己的CPU和加速器制造超算的跨越。

“天河E级和神威E级均已配备‘中国芯’,‘中科曙光’也已具备自主设计迭代能力。”张云泉向经济观察网记者介绍,神威•太湖之光就安装了40960个中国自主研发的申威26010众核处理器,该众核处理器采用64位自主申威指令系统,用的全都是自主芯片。因此,“实体清单”对中国的超算发展并没有决定性影响。

据了解,神威E级超算原型机实现了完全自主可控——处理器、网络交换芯片、消息处理芯片等核心器件全部实现国产化。运算系统全部采用具有完全自主知识产权的申威众核处理器;高速互连网络系统全部采用完全自主知识产权的申威网络芯片构建;存储和管理系统采用申威多核处理器构建,实现了对该领域产品的国产化替代。

此外,张云泉指出,基于神威平台构建的人工智能算法平台架构, 实现了世界最大规模的LSTM训练(80亿模型参数); ImageNet数据集模型训练可在1小时内完成,实际应用包括医疗影像识别、遥感图像分类、语音识别、机器翻译、对弈系统等。

2018年5月的第二届世界智能大会上,国家超算天津中心展示了“天河三号”原型机,这款超级计算机的性能达到了百亿亿次,全部采用自主技术,处理器是自主的飞腾芯片,通信是自主的天河高速互联通信,操作系统是自主的麒麟操作系统。

张云泉在演讲中表示,E级超算原型机目前已部署的应用领域有天气气候、海洋环境、材料科学、航空航天、核模拟、船舶工程、电磁环境、生物医药、动漫渲染、谱方法、符号计算、人工智能。

“实际上,美国对我国超算的压制,并不是现在才开始的。”张云泉对经济观察网记者表示,在天河二号连续几次夺冠后,2015年4月9日,美国商务部就拒绝了英特尔公司向中国的国家超级计算广州中心出售至强芯片用于天河二号系统升级的申请。

版权声明:以上内容为《经济观察报》社原创作品,版权归《经济观察报》社所有。未经《经济观察报》社授权,严禁转载或镜像,否则将依法追究相关行为主体的法律责任。版权合作请致电:【010-60910566-1260】。