北电数智:激活国产算力

任晓宁 陈奇杰2024-05-25 10:34

经济观察报 记者 任晓宁 陈奇杰 北京朝阳区酒仙桥中路18号北广科技园内,有一片被绿幕围起来的施工地,占地1.7万平方米,地上建筑规模为3.5万平方米。今年底,这里将建成一座能给人工智能(AI)企业提供公共算力的智算中心。

智算中心在当下并不新鲜,自从2022年AI聊天机器人ChatGPT爆火后,全国各地抢建智算中心。研究人员一度对此感到担忧,害怕一窝蜂建设会造成烂尾现象。

北京这座智算中心的特殊之处在于,它不是单纯地建设算力仓库,堆叠硬件机器,而是在软件、硬件和场域层面都做了布局。同时,负责智算中心规划设计与建设运营的北京电子数智科技有限责任公司(下称“北电数智”),在北京市经信局的牵引下,还专心研究混元适配技术,以异构算力为基础,把性能各异、规格不同的国产芯片统一纳管,给用户提供算力。这项工作的目的,是推动当前市场占有率较低的国产芯片被使用起来。

北京这座智算中心全名北京数字经济算力中心(Artificial Inteligence Data Ceter, 下 称“AIDC”),是北京市级人工智能算力中心项目,落成达产后能够提供2000P(1P约等于每秒1000万亿次计算速度)算力供给。

作为北京电子控股有限责任公司(下称“北京电控”)的旗下公司,北电数智还有专门团队负责设计一站式的AI应用开发服务解决方案,该方案可以让没有开发能力的中小公司简单、快速地使用AI服务。

北电数智董事长荆磊给经济观察报打了个比方,他们其实就是在打造一座AI工厂,从芯片、模型、数据到应用,输出全栈的AI服务能力。

目前,来自摩尔线程、寒武纪等芯片公司的首批产品已在北电数智完成初期部署,后续所有国产主流芯片公司的产品也将陆续进入评测适配。荆磊说,做国产芯片混元适配具有极高战略意义,但没有终极商业价值,“它为了解决眼前的现实问题”。如果把它当作一个商业模式,这个商业模式非常窄。但是为了促进国产算力发展,必须有人去做这件事。

必须做的事

在一个家具都是二手的破旧房间内,荆磊、北电数智总经理阚冬以及几位核心人员开始筹备早期团队。与此同时,他们与AI行业内最知名的机构、顶级的科研人员碰撞讨论,由此开启创业之路。“虽然环境很破旧,但我们没有感觉到丝毫寒碜,因为我们知道自己在干什么事。”荆磊说,北电数智非常有可能成为AI时代的链主企业,以提供算力为源头,与国产芯片公司、数据库公司、大模型公司、AI应用公司合作,真正解决国内在AI时代面临的发展困境。

在那间办公室内,北电数智制定了早期策略。今年3月,北电数智AIDC在酒仙桥正式破土动工。此前,创始团队用了6个月的时间确定设计方案与运营方向。他们认为,在AI行业一日千里、瞬息万变的大变局下,虽然边想边干、边调整边优化是基本打法,但认知是第一生产力,在设计环节需要追求极致,研究清楚后再做事。

北电数智的运营方向有三个,包括算力层、模型层与数据层,即以AI工厂的理念要求做规模化智算中心,用生态的办法做落地的AI解决方案,面向未来做能支撑高质量数据运营的可信数据空间。

三个方向直接指向当前国内AI行业面临的三个困境:算力供给不足、应用场景落地难、高质量数据开发度低。

在算力层,北电数智的标杆项目AIDC和先进计算迭代验证平台在今年4月的中关村论坛上首次亮相,这证明了它的智算中心规划设计与运营能力以及多元异构算力调度能力。在模型层,北电数智利用算力及数据优势,广泛嫁接适配底座大模型。同时,它通过自研及联合多方伙伴共研行业大模型,链接生态伙伴700多家,覆盖AI药物研发、人形机器人、无人驾驶等领域,通过AI行业解决方案的合作共创,推动政务、医疗和制造等AI应用场景落地。在数据层,北电数智目前正在探索可信数据空间,以多种技术手段打造让数据安全共享、可信流通的基础设施。荆磊称:“我们的肉还没完全长出来,但是骨架已经出来了。”

荆磊认为,从成立之初到现在的整体发展来看,北电数智期中考试考得不错。到年底AIDC落成之时,北电数智将迎来期末考试。如果期末考试通过,后面就将奠定一个非常好的基础。

去年9月至今,北电数智的团队从几个人发展到几十人,目前还在继续扩大。它的新办公区能容纳300人,现在很多座位还是空的,但会议室却总是爆满状态。未来它将迎来更多新员工。“AI一日,人间一年。”荆磊这样形容进入AI行业9个月的感受。他会感觉到兴奋,因为这是一个完全没有过的体验,也会感受到压力,因为AI的变化太快,此刻认知的东西很有可能在一周之后就被颠覆。但荆磊并不焦虑,因为他认可这件事的终局价值。“当你把一件事想得特别清楚,知道你具体的方向在哪儿的时候,就不会那么焦虑了。”

用技术解困

AI是当前大国博弈的核心主战场,其中的关键是芯片。与国际先进企业的全能芯片相比,国产算力芯片更像单项选手,只在专项场景应用方面具备不错的性能表现。

因此,北电数智通过纳管国产芯片,形成混元算力集群,通过包括硬件层编译优化、中间层分布式优化及模型层优化在内的三重优化,对相对落后的芯片进行性能调优,让国产芯片变得可用。

北电数智的技术逻辑是,把专项可用的国产芯片放进同一个“包裹”,并通过软件加速、算子库补齐、网络和通信等方面的工作,实现国产芯片的性能加速和调优,由此凑成一个接近全能的选手,对外提供智能算力。目前,北电数智能把国产芯片的性能从30分—80分调整到70分—90分,即调整到有用户愿意买单的程度。

这套异构算力技术难度很大,并不是一项成熟的技术。等到国产芯片性能提升到足够程度时,这套技术或许就已派不上用场。因此,很多企业不愿意做这件事。

荆磊也提到,这件事本身具有极高战略意义,但没有终极商业价值,“它为了解决眼前的现实问题”。如果把它当作一个商业模式,这个商业模式非常窄。

但他认为,这是一件必须做的事,对芯片来说,有机会被使用最重要。北电数智当下所做的事情,就是先让国产芯片被用起来,同时从场景使用出发,检验国产芯片的性能和查找不足,反馈给研发企业,带动算力技术迭代升级,推动国产芯片从可用到好用。

北电数智做这件事,离不开母公司北京电控的支持,这与产业报国及技术情怀有关。作为“一五”时期国家重点投资、集中建设的全国重要电子工业基地,北京朝阳酒仙桥地区曾创下多个“第一”,为我国电子工业、国民经济发展及国防建设事业作出巨大贡献,被称为“新中国电子工业摇篮”。北京电控所属部分重点企业,曾在酒仙桥这片土地上研制出了新中国的第一只真空管、第一块集成电路、第一部程控交换机、第一台电子计算机。

进入21世纪,北京电控又培育出显示领域领军企业京东方、集成电路装备企业北方华创,以及一批具有行业影响力的产业企业。随着AI时代全面开启,北电数智应运而生。

北电数智目前已经集聚了一批芯片、网络、算法、数据等领域的高水平核心技术人员,也聘请了世界顶级的AI专家担任首席科学家。

荆磊有一种很强的紧迫感。随着“百模大战”在今年退潮,AI行业对算力的需求没有之前那么紧缺了。但AI发展速度太快,一旦又有了突破,诞生超级应用,或将推动AI真正在千行百业落地,AI算力将会更紧缺。

他想做很多事,但目前最重要的,还是先把北电数智AIDC建设完成。荆磊很确信,未来AI算力一定仍是短缺的,如果能把国产芯片都用起来,把供应链建设完备,将会缓解这个产业难题。

碗里、锅里和田里

既然要面向市场,北电数智当然不会只做“不挣钱的生意”。

为此,北电数智结合自身的模型和数据能力,建立了解决方案团队,为客户提供从底层算力、模型开发调优、AI工程化等全栈AI能力。荆磊表示,AI产业需要通过这个环节完成整个产业链跟社会的价值交换,才能理顺产业链与价值链的关系,实现产业落地和健康发展。国内发展AI产业的优势是可以做的场景多,且容易集中力量。解决方案做起来非常难,北电数智要用生态的方法来做。

在他看来,这一轮AI时代的创业者大多比较年轻,在管理、商业经营和项目获取方面的能力还有待提高,但这些创业者就像一块块“璞玉”,本身的技术能力并不弱,和北电数智进行生态合作可以发挥各自优势。此外,由于北电数智在产业链上的前瞻布局与综合优势,有不少大模型企业也向北电数智表达了合作的意愿。

截至目前,北电数智已有AI产业生态伙伴700多家,其中芯片合作伙伴12家,服务器合作伙伴3家,数据中心(IDC)合作伙伴2家,AI大模型及工程化合作伙伴33家,政务及公共服务合作伙伴86家,先进制造合作伙伴108家,大交通合作伙伴112家,大健康合作伙伴140家,教育合作伙伴103家,影视传媒合作伙伴99家。

除了算力、算法,AI三要素还包括数据。随着数据这一新型生产要素越发受到关注,北电数智在构建AI工厂的基础上,还把建设AI的可信数据空间这一数据基础设施的业务也加入到了计划中。

荆磊说,不管是在产业发展、国家安全还是在地方政府良性运转方面,数据的价值都非常高,再怎么强调都不为过。从AI产业发展的角度来讲,数据就是这个产业的中轴和终局。

难点在于,一些公共数据、核心产业链企业的数据和互联网企业的数据都难以公开,数据流动和使用过程中也涉及数据安全隐私、区块链、数据溯源等问题。

北电数智有天然的使命担当与产业组织优势,它也在数据方面做了完备的人才和项目布局。按照荆磊的比喻,AI工厂、AI场景和AI可信三块业务分别是北电数智碗里、锅里和田里的业务,由此可见他对未来业务规模的预期。

荆磊认为,北电数智作为AI领域创新型国企,接下来面临的最大考验就是节奏。“今年我们要确保AI工厂按照设计方案顺利落成,并对外提供能力。另外,已经确定的涉及模型、场景、数据的重点项目和人才队伍建设激励等重点工作都要落地,在年内完成战略布局,实现战术突破。”

|对话|

经济观察报:你投身AI已有9个月,身在其中是一种什么样的感受?

荆磊:这是一种之前完全没有的体验。现在有一个说法叫“AI一天,人间一年”,我的感受也的确是这样。你当前认知的东西,很有可能因为一个礼拜以后别人出了一个新的东西,就彻底改变了。

不过我不会感到焦虑,因为我们看到了终局。当你把一件事想得特别清楚,知道你具体的点落在哪儿的时候,就不会那么焦虑了。我们当前在发展方向、工作重点上都比较清晰,面临的挑战主要是节奏控制,这也是业内每一个人都在焦虑的问题。这件事的难点在于,当你把资源投下去之后,需求爆发的时点能不能匹配上?进退之间、腾挪之间要做很多工作,这对我来讲是一个很大的压力。有压力但并不焦虑,因为我知道我在做什么,这一点很重要。

有一句话叫“终局乐观、中局谨慎”,大体是这样。

经济观察报:根据你的实践感受,现在中国与美国之间AI的差距有多大?

荆磊:我们和领先国家的差距还是比较大的,但我们也有自己的独特发展优势。

算力方面,国内是“百花齐放、一强多弱”。与世界领先企业相比,从单芯片性能、集群能力表现等方面看,国内企业都有很长的一段路要走。

模型方面,可以用参数量做一个不太严谨的简单类比。已经发布的GPT-4(美国AI研究公司OpenAI旗下的大模型)是1.8万亿的参数量,国内的大模型差一个数量级。

数据层面,从可公开的高质量数据集角度来讲,我们也将近差一个数量级。

但技术水平再高,最终也要产业化落地,不能落地就成了空中楼阁。在这个方面,我们国家有自己的独特优势。首先是丰富的场景,中国有全世界最完整的工业体系,有全世界最大的互联网生态体系,这是一个了不得的优势。第二是集中力量办大事的机制,通过政府政策引导和链主企业组织,国内可以很好地协调各方面创新资源,加快实施核心技术攻关和重点基础设施建设,加快落地进程。

经济观察报:现在AI行业算力是否依然短缺?如果北电数智的智算中心建成使用,是否能彻底解决国内算力短缺的难题?

荆磊:这是一个很复杂的问题,算力的需求主要来自大模型的训练和推理,目前的需求主要在训练层面。去年很热闹的“百模大战”热潮开始降温,算力的供需紧张情况也有所缓解。

但算力需求有长期存在的趋势,还要看后面的变化。当AI应用场景爆发后,推理需求会爆发,因此未来算力需求一定是短缺的。你可以想象,未来每个人都需要AI服务,大量的数据都需要算力去计算,那是一个海量的需求。我们所做的事,就是在未来各行各业缺乏算力的时候,能尽力填补上算力空白,这件事的核心就是要把国产算力用起来。同时,我们也在加快构建供应链能力。

当然,这里面还有另一个深层的产业问题,是先进制程问题。AI芯片主要是5纳米、7纳米的制程,当这个问题解决时,你担心的国内算力短缺问题才能彻底地解决。相信这个问题在全社会的共同关心和支持下,应该不需要太长的时间,就会有一个比较好的缓解。

版权声明:以上内容为《经济观察报》社原创作品,版权归《经济观察报》社所有。未经《经济观察报》社授权,严禁转载或镜像,否则将依法追究相关行为主体的法律责任。版权合作请致电:【010-60910566-1260】。
TMT新闻部资深记者
关注并报道TMT(科技、传媒、通信)领域重大事件,擅长行业分析、深度报道。
联系邮箱:renxiaoning@eeo.com.cn
微信号:tangtangxiaomo