经济观察报 关注
2025-07-26 13:11
经济观察报 记者 钱玉娟
在2025世界人工智能大会(下称“WAIC 2025”)开幕前夜,7月25日,中国人工智能科技企业上海阶跃星辰智能科技有限公司(下称“阶跃星辰”)发布了首个全尺寸、原生多模态推理模型Step 3,这一基座大模型将于7月31日面向全球企业和开发者开源。
阶跃星辰创始人、CEO姜大昕接受包括经济观察报在内的媒体采访时称,当下坚持做基础大模型的公司越来越少,困难在于投入巨大。特别是当大模型产业过渡至2.0时代后,不少公司会放弃模型训练,去追求商业化。而他认为,模型的能力会决定应用的上限,应用也会给模型提供具体的场景、数据,因此,阶跃星辰更坚持超级模型加超级应用的路径。
姜大昕认为,最适合实际应用的大模型需要满足强智能、低成本、可开源和多模态四个特征,缺一不可。唯有模型全面发展,才能让模型真正用起来。这也是阶跃星辰研发Step 3基础模型的出发点:为追求性能与成本极致均衡的企业和开发者设计。
姜大昕介绍,Step 3是在模型架构创新、算法工程协同设计上的一次大胆尝试与Scale Up(纵向扩展、提升)。该基座大模型采用MoE架构,总参数量321B(3210亿),激活参数量38B(380亿),却可以在较高的推理解码效率下实现关键的成本优化过程。
Step 3拥有视觉感知和复杂推理能力,既能准确完成跨领域的复杂知识理解、数学与视觉信息的交叉分析,还能解决日常生活中的各类视觉分析问题。
阶跃星辰联合创始人兼副总裁朱亦博对Step 3的表现进行技术解释,在不牺牲激活参数量、不降低注意力容量的条件下,实测Step 3在英伟达H800芯片上进行分布式推理时,相较于行业顶尖水平的模型DeepSeek-R1的吞吐量提升了超70%,而在国产芯片上的推理效率最高能达DeepSeek-R1的300%。
阶跃星辰与近10家芯片及基础设施厂商组建一个模芯生态创新联盟,旨在通过联合打通芯片、模型和平台全链路的底层技术,提升大模型适配性和算力效率。
记者在现场看到,华为昇腾、沐曦、壁仞科技、燧原科技、天数智芯、无问芯穹、寒武纪、摩尔线程、硅基流动等厂商已成为上述联盟的首批成员。其中,华为昇腾芯片首先实现Step 3的搭载和运行;沐曦、天数智芯和燧原科技等也初步实现运行Step 3。
燧原科技创始人、董事长兼CEO赵立东一直认为国产AI芯片厂商面前有两座大山,一是高端芯片制造,二是生态。模型和芯片合作正是在解决生态的问题。
赵立东将阶跃星辰的Step 3视为一款专门为国产芯片卡开发的大模型,在他看来,芯片软件开发人员与应用或模型开发人员深度合作,开发出的国产芯片产品的性能优化和性价比等,不单是要对标英伟达的芯片,更关键的是要实现低成本、高性能,用国产算力支撑国产大模型的长远发展目标。
除了与产业上下游多厂商成立联盟共建生态,阶跃星辰还宣布与上海国有资本投资有限公司战略合作,在获得上海国投生态体系的一轮新融资后,阶跃星辰计划向全年10亿元人民币的收入目标冲刺。
阶跃星辰联合创始人、副总裁李璟负责商业化,他在接受包括经济观察报在内的媒体采访时明确,上述收入指确认的合同收入,该目标建立在阶跃星辰2025年上半年已实现数亿元合同收入且毛利水平较高的基础上。
李璟未给出营收业务各项及比例的具体数据,但他表示,在目前布局的手机、汽车、IoT设备等关键应用场景中,阶跃星辰已经与国内超一半的手机厂商合作打造Agent(智能体),也有吉利这样的头部车厂在共建智能座舱等,还在金融、零售等多个垂直领域与相关头部企业探索面向C端的场景化应用。