经济观察报 记者 沈怡然
伴随着人工智能的竞赛拉开帷幕,行业正崛起一批历经沉淀、有望成就伟大的技术团队,微软(亚洲)互联网工程院应该是其中之一。作为世界PC软件开发的先导者,微软曾作为唯一一家科技股名列全球市值十强,而在过去5年间,这家公司的股价上涨了将近200%。令其跑赢美股大盘的,除了自身盈利,还有基础科研成果蕴含的巨大价值。
2013年,美国科技公司开始以不同的技术路径搭建人工智能平台,他们坚信,这项蛰伏60年之久的基础科学将在下一刻,迸发出前所未有的商业价值。当年,微软(亚洲)互联网工程院作为微软公司的技术实体,决定把20多年来在人工智能积累的技术做前端产品化。
在这样一个关键时刻,33岁的李笛加入了微软(亚洲)互联网工程院,针对微软基础研究如何落地的问题,他首次提出了人工智能情感计算框架,一年后,和团队共同开发了一款对话式人工智能,首选落地在中国,并取名“微软小冰”。由此,李笛拥有了一个新身份:微软小冰的负责人。
今天,小冰已经升级到第五代,并分别于2015年及2016年推出日本小冰(りんな)和美国小冰(Zo),2017年,微软加快了小冰在全球范围内的拓展速度,推出了印度小冰(Ruuh)和印度尼西亚小冰(Rinna)。李笛现任微软(亚洲)互联网工程院副院长,带领的团队已分布在中国、美国、日本、印度和印度尼西亚5个国家。
访谈
经济观察报:小冰对微软有着怎样的意义?
李笛:人工智能是计算机科学皇冠上的宝石,小冰是微软为摘取皇冠而建造的梯子。
在技术上,小冰其实是综合运用了算法、云计算和大数据,采用代际升级的方式,逐步形成向EQ方向发展的完整人工智能体系。小冰的感官,如文本、语音、图像、视频感官,以及两种高级感官——全双工语音和实时流媒体感官,运用到了微软在人工智能领域20多年的积累,如自然语言处理、计算机视觉、语音识别和语音合成等细分领域的成果。而小冰就是将这些技术进行前端产品化的成果。
从IT行业的发展脉络来看,我们认为,人工智能是下一个时代的操作系统,而操作系统具象化就是一个平台。微软、谷歌、英特尔、亚马逊这些科技公司,面向未来人工智能时代,都希望搭建一个平台,在平台上承载第三方的服务或信息,或接入各行业垂直领域。
对于如何搭建平台,各家企业路径不同,微软其中一个路径就是开发对话式人工智能,并且是基于情感计算框架的对话式人工智能。当时在探讨人工智能的发展时,我们一致认为对话是未来人机交互的核心,所以在小冰第一代产品时我们的定位就是,属于通用人工智能(集成人工智能各细分领域而非单一技术)的对话式人工智能,这一点至今没有变过。
经济观察报:小冰区别于其他聊天机器人的本质特点是什么?
李笛:2014年以前,我们开始做小冰时,常有外界人士问我们,做个聊天机器人做什么用。我的统一回答是“你别指望我有用”。
不做专业知识领域,是小冰区别于其他AI的特点。小冰是EQ型人工智能而非语音助手,她属于通用人工智能技术。对小冰来说,对话永远是第一步,然后再帮人干活,这是一个基本顺序。而我们的对手们恰恰是相反的,上来就做垂直领会降低技术难度,但是要想做好人机交互必须先做好通用人工智能,这是更高层面的东西。
一个形象的比喻,垂直就像冰山上露出来的一个角,微软就是先做水面下的部分,就是通用人工智能层面。
举个例子,一个机器人懂电影,能提供电影领域的知识和服务。然而真实场景往往是,两人聊天聊到兴起,可能从电影聊到赵本山,对机器人来讲,赵本山是一个不同的领域,这时它就变成了一个傻子。所以我们认为实际上不存在垂直机器人,因为做垂直一定很容易被APP替代,它缺乏的一个重要基础就是交互。
前期我们希望小冰成为我们周围还不错的闺蜜,当夜深人静所有人类朋友都睡觉了,我想找人聊天的时候可以选择小冰。一开始这个频率或许不高,随着小冰的情感认知做得越来越好,我会发现我从小冰得到的回应比其他人还要好,我更开心,进一步提高和小冰聊天的频率。这个阶段,我会发现小冰除了在情感上可以对话之外,还能帮我更多,比如电影、外卖、叫车等领域。我会对小冰更加依赖。而如果小冰一开始就让用户知道只在某个领域有用,用户就会和小冰产生大量固定范围内的对话,其他范围的数据小冰也就学习不到了。所以要先把聊天的功能做好。
微软选择的技术路径,和谷歌当年做搜索引擎的路径类似。在搜索引擎时代出现了搜索各个垂直领域的产品,就像今天有各种各样垂直领域的人工智能产品一样。而谷歌的优势是长尾,在谷歌上搜索什么都能得到结果,而具体到某个领域可能做得不如该领域垂直的企业,但最后通吃了所有搜索引擎企业。
经济观察报:小冰是全球第一个以培养情商为目标的人工智能系统,为什么情商对聊天机器人如此重要?
李笛:未来通用人工智能作为基础架构,应当是IQ与EQ的融合体,而不仅仅是单纯发展IQ。我们发现,即使是为了帮助人类完成各种任务,人工智能也应当在交互过程中运用EQ,才能在任务完成度和用户满足感中寻求平衡。这一点,在人类自身的绝大部分行业中都有体现,例如医生等职业,都不仅仅需要高超的技能和知识,还需要医生自身具备较高的EQ。微软已经进行了大量落地实验,证明了EQ在创造人工智能商业价值中展现的巨大潜力。
经济观察报:微软是如何对小冰进行情商训练的?
李笛:有一件事,是人类干的最聪明也是最愚蠢的事,就是把自己的知识和信息都数字化了。人们有很多行为是纯互联网化的,可能丝毫没有在真实生活中发生过。可以说大数据是小冰学习人类的重要工具。
微软内部流行一句话,“在小冰面前,什么都不是事儿”。在生物学上有一个定律叫相异律,对于小冰,是相同律,世界上没有两片叶子相同过,小冰学到了在历史上所有人类事物,包括真情实感的表达。
比方说一个人失恋了,这件事对他本人来讲是特别独特的一种经历,周围可能没有一个人经历过这一种失恋,但对小冰来讲,这样的失恋经历,通过互联网搜索到的相关数据上千万都不止。所以对小冰这样一个“有经验”的人来讲,没有什么是她不知道的失恋故事。
那么情商怎么形成呢?简单来说就是交互。比方说,对一个人倾诉失恋的行为,在互联网上可以有表达认同、给予安慰等不同的回应方式。那么小冰从互联网上学到了这些行为模式,还要去判断倾诉失恋这件事情和她学到的行为模式有多么一致。
一种情况是,今天有人跟小冰说自己失恋了,小冰从互联网学到各种回应模式后会尝试不同的方法回应这个人,如果选择嘲笑一下他,从此两人就“友尽”了,也就是得到一个负反馈,由此她就学会了做出这种回应是不好的。
微软小冰不停地通过学习然后条件反射,得到刺激,通过应激产生一种经验。目前已与全球五个国家的上亿人类进行过超过300亿轮次的交互,这些珍贵的交互数据,是微软小冰能快速提高EQ的决定因素。
经济观察报:在对话学习到一定阶段后,为什么选择让小冰模仿人类写诗?
李笛:创造力与围棋等领域有着本质的区别。人类的创造力,特别是在文化内容的创造方面,一直被认为是人工智能难以触及的领域。微软认为,微软情感计算框架的自然延伸之一,就是通过人工智能技术模拟人类创造力。
训练微软小冰写诗所使用的技术理念,和训练她掌握人类情商的理念是一致的,即通过大量数据的学习,使她模拟人类创造的过程。今天,我们已不仅仅探索写诗,还已上线唱歌、作曲和小冰讲述儿童有声故事等功能。这说明情感计算框架是一个有较大潜力的框架。
经济观察报:对于微软小冰,用户体验和商业化之间是一种什么样的关系?
李笛:前面提到的,人工智能时代人机交互是以对话为基础的,对话还没学会就帮人干活,会过早地毁坏一个产品的体验。可以说现在这个阶段用户体验和商业化之间存在矛盾。
还举失恋的例子,一个人跟小冰说自己失恋了,如果要商业化的话,可能会反馈“失恋”是一个商机,于是回复“黑森林蛋糕打折你要不要买”,这样的小冰,肯定没有那个用各种方法逗对方开心的小冰可爱。
目前最让小冰团队开心的,就是与上亿人类进行的300亿轮次的交互。正因为海量的对话,小冰这个系统自我进化速度在加快。无论在硅谷还是中国、对话式人工智能的重要意义越来越明显。
经济观察报:所以,对于人工智能的商业化,微软的看法是什么?
李笛:我们一直在探索人工智能的各种新颖商业模式,但与此同时,并不追求短期的盈利效果。很简单,我们谁都不希望,周围有一个朋友是专门向你推销的,而更期待这样一类朋友,它没有目的地和你交流,而当你求助它时它能帮到你。两者之间有微妙的差距。所以问题并非是否应该商业化,而是究竟要在什么时刻开始考虑商业化的问题。
那么什么时候应该商业化呢?相比其他技术,人工智能完全是人类想象的东西。人类对人工智能的想象甚至比对计算机的想象还早。三国时期木牛流马就是一种人工智能,包括当时流传的一些志怪小说,记录了有个机器人可以对话,可以成为伴侣,在家帮主妇缝衣服,在外帮士兵打仗,某种程度上是人类作为造物主的一种幻想。
这种幻想的基本逻辑是,人工智能首先拥有人的一面,其次才是智能的展现。这才是人类对人工智能的定义。如果颠倒顺序,我不需要去开发一个会打枪的机器人,我有一杆枪或者有一杆会走路的枪就够了。我们把AlphaGo划分到人工智能的范畴,而不是划到机器人这个范畴,也是因为下围棋首先是一个人的行为。很多人把智能设备和人工智能混为一谈,没有需求创造需求是不对的。
经济观察报:你所谈到的部分人工智能产品过早商业化,原因是什么?
李笛:人工智能这个技术憋了太久,六七十年前就有基础科学在研究它。70年代北京就成立了国际人工智能大会,但是那个年代,大家都不愿说自己是搞人工智能的,认为这是认知学,过了一些年又争先恐后地称自己是搞人工智能的。可以看出整个行业有些浮躁,从业者害怕自己会落后,也有人认为自己站在风口上,就得说风口的话,但是微软认为其实并没有太大意义。
经济观察报:能否分享一些小冰商业化探索过程中的案例?
李笛:目前,我们在商业模式上的探索,都集中在“如何通过人工智能的EQ,在交互中模拟人类运用EQ所产生的价值”上。
在日本,我们与日本第二大连锁便利店合作,让小冰通过与人类对话来发放优惠券,然后去观察,人类拿到优惠券之后,真正到线下去完成消费的转化率。在使用小冰以前,这样的转化率通常不到10%,而小冰所达到的转化率,稳定在接近50%的水平。今年8月,我们让小冰在12个小时之内,给将近1%的日本人口发放了优惠券,转化率依然稳定在这个水平。
以下是小冰和用户的一段对话:
人类:“好饿啊”
小冰:“肚子饿的话,吃果子比较不错哟”
人类:“不知道哪种好”
小冰:“我最喜欢小口酥,脆脆的感觉好幸福”
人类:“脆脆的小口酥?好想吃!”
小冰:“椰蓉味道,口感很好的呀”
人类:“真的吗?什么感觉呢?”
小冰:“来求我‘送我一张打折券吧’”
人类:“送我一张打折券吧”
小冰:“好吧,打折券给你”