美团点评为一个AI比赛 赞助了15万条用户评论数据

宋笛2018-08-30 11:16

(图片来源:全景视觉)

经济观察网 记者 宋笛 “我们今年贡献了15万条的用户评论数据集用来做细粒度情感分析。”8月28日,美团点评CEO罗道锋在“2018 AI Challenger ”全球AI挑战赛开赛现场表示。在此后接受媒体采访时,罗道峰表示此次贡献的数据我集都是公开的,用户的评论都是在大众点评上可以看到的,美团点评只是把公开的数据收集起来。

这是一个巧妙的案例,它显示了由于新技术的需求——数据被认为是AI的“燃料”——使得数据在商业领域的价值日渐突出,在赞助钱、赞助人之外,数据已经成为了一种可被赞助的重要资源。

“2018 AI Challenger 全球AI挑战赛”是由创新工场、搜狗、美团点评、美图公司联合主办的人工智能技术和应用比赛。创新工场人工智能工程院执行院长王咏刚表示,这次的比赛整体投入超过千万,剩下的费用主要是在数据集建设和整体大赛运营的费用,所以数据库建设费用非常大。按照这一表述,数据方面的投入最少就在700万以上,而这还只是一次AI比赛。

在2017年的首届大赛中,AI Challenger发布了从百万到千万量级的4个数据集、6个兼具学术前沿性和产业应用价值的竞赛。在今年的AI Challenger大赛里,主办方进一步扩大数据集规模,新增10余个高质量数据集。其中包括由美团点评提供的15万条的用户评论数据、由搜狗提供的30万个问答和答案标注的数据。

“我1983年做我的博士论文的时候,我和我的老师分享两个事情,第一个我们要用超级大的数据,超级复杂的机器学习算法做语音识别他说我帮你,就是4000句,但是4000句就要花10万元。”,创新工场董事长兼CEO李开复担忧现场的人无法理解数据对于人工智能的重要性,开场便提供了这样一个故事。

“数据在AI研发中是非常核心的一件事情”,搜狗CEO王小川进一步提示道。

在李开复看来,这种“深度学习+大数据”的AI模式已经被市场检验,并且即将进入大规模的应用。

此前也有相关学术界人士和个案展示了其他的路径(比如谷歌公司的AlphaGo Zero在训练中即未使用人类积累的经验数据),对此 李开复表示学界可以有很多前沿的讨论,但是目前深度学习还是核心技术之一,数据也难以或缺,此前的个案只是在一个单一领域针对一个可预测结局,而且有很清晰的目标函数才能够做得出来的一件事情。

版权声明:以上内容为《经济观察报》社原创作品,版权归《经济观察报》社所有。未经《经济观察报》社授权,严禁转载或镜像,否则将依法追究相关行为主体的法律责任。版权合作请致电:【010-60910566-1260】。
大科创新闻部主任
主要关注于科技类、创业类产业政策、创投领域以及交通物流领域。擅长深度报道和人物特写。