讯飞超脑加速推进AI落在实处 合肥持续激发创新动力

资讯2022-11-25 17:00

AI帮助筛查抑郁症,筛查效果能达到91.2%。这是AI技术应用的一个面。如今AI技术落地正在加快,具备丰富行业知识的虚拟人出现了,还有会运动、能握手的机器狗。在第五届声博会暨2022科大讯飞全球1024开发者节上,可以窥见AI发展新方向、新动力。

上述这些AI应用都是基于“讯飞超脑2030计划”推进实现的。2022年初,科大讯飞宣布启动“讯飞超脑2030计划”,目的是让人工智能“懂知识、善学习、能进化”,让AI机器人走进每个家庭。在1024开发者节现场,科大讯飞董事长刘庆峰再次强调这个目标。

刘庆峰认为,数字经济是全球经济复苏的关键动力,人工智能是数字经济的核心引擎。2021年全球47个国家数字经济增长达15.6%,讯飞开放平台AI调用量增加36%。科大讯飞2022年AI开发者大赛中,32333支开发者团队创新方向也多种多样,其中热门方向包括了工业互联网、虚拟现实等,元宇宙大潮兴起,Z世代正成为AI开发者的主角。

AI开发创新之外,越来越多给人们生活带来便利的AI技术应用,与人们的生活更是息息相关。

让AI有用,用到实处

“人机互动”是AI技术发展中最热门的一项能力,目前这个能力正在进一步提升。在商场、医院、地铁这样的复杂场景下,语音识别受到多点噪声的影响。此前语音交互在这些复杂场景中是一个难题。

科大讯飞用“唇形+语音”的多模态语音增强技术,唤醒智能语音交互新模式。结合视频信息输入,新技术可以利用人脸、唇形、语音等多模态信息的互补,将主说话人的干净人声从嘈杂背景环境中分离出来,能够显著提升开放场景的识别效果。

“机器想更自然地与人类进行交互,需要通过听觉、视觉、语义以及各种传感器的组合去获取更多的有用信息,AI感知方式必然要从单模态发展到多模态,逐步拟人化。”科大讯飞AI研究院副院长高建清表示。

在更加专业的领域,更有AI发挥的空间。科大讯飞基于多模态交互以及医疗认知技术,研发了一套抑郁症定量筛查系统。系统通过模拟心理医生的问诊思路进行交互设计,用户通过与机器聊天的方式即可初步实现病情的定量评估,筛查效果达到91.2%。“超过业界最好的水平。”高建清表示。目前,这一系统已经在北京安定医院等医疗机构进行了试点应用。

“AI+认知”的方向上,科大讯飞同样推出了“老年认知障碍筛查系统”。该系统基于画钟测试、看图说话和五词记忆人物等功能,通过定向麦克风和电磁手写板采集受试者的语音、书写等数据,集合多模态深度学习模型及多层级评价体系,针对老年认知状态进行智能化多维度评估。让筛查更加便捷高效,适用于大规模筛查,缓解专业评估人员不足等问题。

这些都是科大讯飞基于“讯飞超脑2030计划”推动的AI技术落地应用。2022年初,科大讯飞发布了“讯飞超脑2030计划”,面对未来社会事业、工业发展和人类发展的刚性需求,提前做好技术准备。

“计划的核心,是以价值创造为根本,通过AI技术持续的核心源头技术创新和系统性创新,让机器远不止具备‘你问我答’的基础智能,还拥有更强的交互、运动能力,以解决未来社会重大刚需命题。”高建清表示。

AI怎么越来越正确

“支撑‘讯飞超脑2030计划’的发展,有两个关键算法亟待突破,无监督学习和知识推理。”高建清说,前者要实现实用化、场景化的预训练技术,后者要构建基于知识检索、决策以及融合的推理系统。

科大讯飞设计了基于无监督学习的预训练框架,并创新使用了少量有监督数据进行优化,大幅提升训练效率。在新的预训练框架下,训练时长可下降八成。

“预训练模型支持语音识别、声纹识别、情感识别、多模态语音识别等多个任务,参数量远远少于业界公开的模型,但效果却达到了业界最优。”高建清表示。

科大讯飞在语音合成技术领域也有了最新突破,推出多风格多情感合成系统SMART-TTS。该系统可以提供11种情感表达方式。同时,每种情感有20档强弱度不同的调节能力。让语音合成从简单的信息播报“变身”为具备喜怒哀乐情感的语音助手。

虚拟人也将变得更加个性化和可定制化。在声音和虚拟形象生成技术方面,科大讯飞实现了语义可控的声音、形象生成,语义驱动的情感、动作表达。比如,输入“一头长发”,系统智能生成温柔大方的女性形象,声音端庄又不失甜美;输入“英俊潇洒”,生成有一些商务范的男生形象,声音略带磁性。目前,讯飞开放平台将开放500个虚拟合成的声音。

作为“讯飞超脑2030计划”的阶段性成果,多款专业虚拟人面世。科大讯飞推出了分别用于客服、助理、招聘、财务、法务等行业工作的专业虚拟人,通过深入学习行业知识,科大讯飞定制研发了多行业交互大脑,使得这些虚拟人都具有丰富的专业知识。目前已为金融、电信、媒体等多行业提供专业虚拟人解决方案。

在交互系统的认知关键技术上,今年以来,依托科大讯飞建设的认知智能国家重点实验室相关团队在认知智能技术突破方面夺得3项国际冠军。在常识推理挑战赛CommonsenseQA 2.0中刷新机器常识推理水平世界纪录,在科学常识推理挑战赛OpenBookQA中以准确率94.2%的绝对优势夺冠,在常识推理挑战赛QASC中以多模型准确率93.48%、单模型准确率92.07%夺冠,后两项比赛更是超越人类平均水平。

围绕认知智能技术,讯飞实现了于语义图网络的开放场景语义理解。目前,讯飞定义了1517个意图、近2000个事件。

软硬技术同步,科大讯飞的四足机器狗今年亮相1024开发者节。这款机器狗不仅能走路、跑步,还能攀爬、上台阶、穿越复杂地形,同时具有握手、作揖等能力,运动能力超强,是“讯飞超脑2030计划”在运动智能方面的阶段性成果。

高建清表示,实现“讯飞超脑2030计划”,要突破人工智能共性基础算法,攻克多模态感知、多维表达、认知智能、运动智能等核心技术,也要研究软硬一体的机器人关键技术。此外,要探索虚拟人交互、机器人等方面的示范应用。

创新之城的一块拼图

科大讯飞对AI用在实处的追求,与合肥这座城市对创新的追求一脉相承。科大讯飞、京东方、长鑫存储等多个领域的龙头企业成长离不开合肥这座城市。合肥正在激发创新能力,“中国声谷”、“先进制造业新高地”、“IC之都”,一个个目标正在推进实现中。

11月18日,第五届世界声博会现场,中国电子信息产业发展研究院(又称“赛迪研究院”)发布了2022中国人工智能创新发展指数。数据显示,北京、广东和上海处于人工智能领域的领跑地位,安徽则紧随其后,排在全国第6位。值得一提的是,安徽人工智能90%的科研成果、基础设施建设、示范应用场景和人才队伍都集中在合肥。

“合肥已经成为人工智能领域、科技创新与产业发展最活跃的城市之一。”中国电子信息产业发展研究院院长张立说,在人工智能产业发展政策举措上,合肥不断完善支持龙头企业与高校、科研院所,以及上下游产业资源整合,在打造颠覆性技术创新、关键共性技术应用等方面效果明显。

在第五届世界声博会上,合肥市委书记虞爱华致辞提及,人工智能是年轻人聚集的产业,科创合肥正努力成为年轻人爱来的城市。成长中的合肥,需要不断补短板、强弱项,努力建设成为更加“宜居、韧性、智慧”城市。为此,要继续坚持创新创新再创新,勇当科技和产业创新“两个开路先锋”,不断提高城市吸引力,努力成为更多“年轻人”喜欢的城市,更多“年轻产业”兴旺的城市。

创新企业不断涌现合肥背后,还有舍得投。根据国家统计局、科技部、财政部在今年8月联合发布的《2021年全国科技经费投入统计公报》显示,2021年,安徽的R&D经费投入超过1000亿元,在全国排名第11位,投入强度达到2.34%。省会合肥R&D经费投入强度达3.52%,跃居全国省会城市第3位。

2022世界制造业大会,合肥列入大会成果签约项目70个、投资额668亿元。比亚迪、大众、蔚来、江淮、国轩等众多车企都选择扎根合肥。

工业互联网领域,基于讯飞开放平台2.0,安徽省经信厅和科大讯飞联合打造了羚羊工业互联网平台。2021年9月上线后,一年时间,羚羊工业互联网平台已汇聚22.6万用户入驻,服务企业44.5万次,创造了29.4亿元交易额。

世界制造业大会、世界集成电路大会、元宇宙生态大会、全国双创周、全国网信大会等,今年越来越多的行业链接大会在合肥举办。合肥这座城市的产业推动力一直在扩大。

版权声明:以上内容为《经济观察报》社原创作品,版权归《经济观察报》社所有。未经《经济观察报》社授权,严禁转载或镜像,否则将依法追究相关行为主体的法律责任。版权合作请致电:【010-60910566-1260】。