蚂蚁集团联合中国人民大学发布首个原生MoE扩散语言模型

经观智讯2025-09-12 11:25

经济观察网 据大象新闻消息，9月11日，在2025外滩大会上，蚂蚁集团与中国人民大学联合发布业界首个原生MoE架构的扩散语言模型(dLLM)“LLaDA-MoE”。实验数据显示，LLaDA-MoE模型性能效果在代码、数学、Agent等任务上领先于LLaDA1.0/1.5和Dream-7B等扩散语言模型，接近或超越了自回归模型Qwen2.5-3B-Instruct，仅激活1.4B参数即可实现等效3B稠密模型的性能。

热新闻

小红书被查并非无征兆明星“热搜”撑不住
今日看点｜中国8月CPI、PPI数据将公布
“牛市”氛围下的两张“面孔”
疫苗降到蜜雪冰城价企业集体亏损
谁是“日光基”的幕后推手？
罗永浩斥西贝预制菜乱象：高价“伪现做”何
中国与欧洲三大央行续签本币互换协议助力
苹果“牙膏挤爆了” 倒逼运营商“加码”eS
从“恒泰”到“金融街” 一家券商的战略转
阿里重磅发布：高德扫街榜切入线下到店领域

视频推荐

特朗普称俄无人机飞入波兰“可能是失误”

苹果“挤牙膏” 倒逼运营商“加码”eSIM服务

全国中小学食堂“互联网+明厨亮灶”覆盖率达98.5%

电子刊物

点击进入

用户名登录/手机号登录 还没有账号？免费注册

蚂蚁集团联合中国人民大学发布首个原生MoE扩散语言模型

热新闻

视频推荐

电子刊物

用户名登录/手机号登录

还没有账号？免费注册