一个月内取得多项技术进展,详解阿里AI背后的故事

陈秋2019-07-11 09:26

(图片来源:全景视觉)

经济观察网 记者 陈秋 技术价值的最终体现,无非是从它能否带来经济社会生活的改变,能否带来商业化场景大规模落地。而在人工智能领域,技术应用的商业化也是衡量其价值的唯一标准。

在过去的两年时间里,阿里在人工智能的赛道上,逐步开启商业化进程,组建的达摩院,加速人工智能技术、商业的布局。目前,阿里AI机器智能团队拥有10位IEEE Fellow、20多位知名大学教授数量,达摩院超过一半的科学家拥有名校博士学历,布局也囊括了语音智能、语言技术、机器视觉、决策智能、无人驾驶等人工智能领域。

在大众生活领域,阿里拥有多个国民级应用,这让阿里的AI进入一个“更多的用户-更多的场景-更强的AI-更多的用户”的循环,这个循环将不断自我强化。

而在过去的一个月内,阿里AI在很多技术方面应用方面取得了突破,连续斩获5个世界第一,心血管提取准确率超人类医生、具备自主判案能力、识别超100万种实体等等。7月9日,阿里两位达摩院机器智能人员与包括经济观察网在内的媒体,探讨及沟通了阿里AI目前所处的阶段等相关问题。

创新与产品研发并重

已经加入阿里五年的王骏,现在担任机器智能实验室的首席架构师,在谈到达摩院研发布局时说,从长期的根本研究量子计算到短期的应用研究包括产品化都有研究。

他更注重的是,与人工智能相关的整个达摩院机器智能实验室团队在过去所做的工作、成果,以及人才储备。

机器智能实验室本质是以人工智能技术为核心,希望机器具有人的思维处理能力。而人的感官细胞分为视觉、语音、语言三个重要的通道,相应的具有视觉智能、语音智能、语言和知识。

王骏表示,希望通过这四个技术方向研究,让我们现在日常见到的机器去处理一些复杂的数据,能帮我们达到一定程度的智能。

“我们做了一个很好的平衡,创新与产品研发是并重的。同时,我们有对内和对外共享途径。” 王骏说,阿里对AI技术有非常多的需求,我们的技术是一个自上而下的研究体系,每一个研究小组都有灵活度去做自己需要的方向。我们的价值体现在创新技术产品上面,整个研发活动独立的,通过自上而下决定,做的特别好的增加一个混合机制,保证我们整个部门价值逐渐得到体现,研发逐渐布局到中长期、到长期的发展兼顾。

而目前头部公司都成立了自己的人工智能研究院,而如何打破部门之间的隔阂,让研发团队和产品的团队之间足够信任,继而做好落地尤为重要。

与其他部门,王骏透露,达摩院有技术、工程、资金和产品,是非常统一整合到一起的,这样避免了很多技术低效率问题。而对于阿里集团来说,最核心的人工智能技术汇集在达摩院,定位就是支持阿里经济体,对AI追求的最大核心是技术研发,达摩院不做硬件,这就解决了内部的问题。

“不管做的成功与不成功,阿里的经济体非常复杂,包括电商、物流、娱乐等,达摩院是核心技术团队,比较有机会在这些业务支持中,先把技术提炼出来,大规模的分类问题。” 王骏说。

AI赋能行业

王骏举例在图像语言方面取得了实施性的进展,但让计算机到有一天能识别每个物体这不是一个简单的事,需要长期投入,我们也会长期在这个方向去研发;在语言技术方面会更难,经常大量的问答是基于一些现有的背后的知识库进行回答,在实际中很多涉及到的是有没有这个答对的数据,知识总结的能力。

在过去大概一年多的时间,阿里AI涉及到交通、医疗、金融、零售等20多个行业落地。 “如果技术相对和场景更容易形成标准化的时候,就容易形成规模化的效应。”机器智能实验室的首席架构师王骏对经济观察网记者表示,在教育和医疗方面还在尝试阶段,还没有到商业化的阶段,特别是在医疗行业门槛非常高,这不是一个通用的问题,各种疾病的背景知识需要积累的比较多。

在传统的图像、语音识别等AI 应用领域,阿里慢慢成为了各类应用使用者的基础设施提供者。而不同于传统的端到端的部署模式,阿里AI以阿里云为输出载体,更容易被合作伙伴和开发者集成。据悉,目前阿里语音AI、图像AI、 NLP、决策AI每日调用量百亿次,服务全球近15亿人;阿里小蜜2018年全年对话轮次达14亿次,服务近5亿人。

而达摩院智能实验室的负责人鄢志杰最想让外界了解到的是,在阿里云智能下面在达摩院里面有一个团队,多年来一直坚持做核心算法的研究。这是一个技术密集型的团队,各种各样的语音的源头算法,全部资源的一整套的技术。在这些技术之上,会有大家看到的云智能输出的产品,无论是公共云、专有云、语音识别、语音合成、生物音频分析、云交互的等产品。

鄢志杰称,除了核心算法的研究之外,还要把这些技术进行产品化,再到阿里云整个商业的机器里面把这些技术变成产品,最后给到我们阿里云生态的客户,而从客户那边得到诉求,又可以直接转化到我们的研究那边去,做基础性的突破。

“我们试图形成一个从技术到商品的闭环可以互相影响,最重要的是把最先进的技术融合,阿里内部所有的部门业务,能够拿到我们最先进的语音技术,把这些最好的东西第一时间放到云上,供他们合作伙伴可以获得。”他说。

而未来的AI的供给模式发生变化,这不是单一能力的集成,而是整体上云能力的一个一站式的解决方案。鄢志杰强调,未来语音AI的供给模式也不仅是一个单一的产品,而是把客户的智能系统从运营商模式变到互联网模式,通过阿里云上获得例如语音识别技术、语音合成技术等,可以做一站式云上的能力的组合。

版权声明:以上内容为《经济观察报》社原创作品,版权归《经济观察报》社所有。未经《经济观察报》社授权,严禁转载或镜像,否则将依法追究相关行为主体的法律责任。版权合作请致电:【010-60910566-1260】。
TMT新闻部记者
长期关注TMT领域、创投领域的人和事,擅长追踪企业、人物专访及深度报道,致力于探究公司、事件背后的利益。
联系邮箱:chenqiu@eeo.com.cn