首页

泛化智能CEO王汉洋:AI创业 从C到B

高阳2017-08-08 09:47

(图片来源:全景视觉)

经济观察报 王汉洋/口述 2013年,正值高中毕业,我去往加拿大滑铁卢大学攻读数学专业,主修计算机。学校的培养方向是想把我们培养成为计算机科学家,而我对科研并不感兴趣。大二刚读完,我选择休学回国创业。

休学回国 切入图形搜索

在滑铁卢的两年大学生涯内,国内总有朋友不断让我帮忙代购。我最直观的感受是,“这个东西为什么你自己不能买?”后来了解,原因很简单,国内的价格太高。尽管国外也有跨境购物网站,但对于不懂英文的消费者来说并不现实。此外,一些网站国内也无法正常登陆。更大的问题是,大家在国外网站上很难凭借有限的关键词精准搜索到自己想买的商品。

我突发奇想,为什么不能做一个搜索引擎,专门帮助中国人找海外的商品?于是我按照自己的设想做了一款垂直搜索引擎,类似更好用的Shopstyle。其实国内也有类似产品,而当时我并不知道。实际上,我做的这款搜索引擎与其他也有一定区别,我们是通过纯图像识别来打标签。

在过去,我要找一款鞋,很多网站为了省事,多个款式可能在网站上是一样的名字,这意味着消费者很难快速搜索到一个精准的结果。我可能只知道它是一双皮鞋。但这个时候,我们的搜索引擎会主动问用户,你是想要牛津鞋,还是德比鞋?

用户直接搜索名字是不靠谱的,在不知道名字的前提下,他会以特征为关键词,比如:蓝色皮鞋、黑色太阳镜。但这种关键词很难与脑子里定位的商品产生匹配,因为网站上所有的商品介绍信息都相对有限。于是,我们就开始思考,哪些因素是固定不变的?答案是——图片。如果能让计算机直接理解图片里的东西,就意味着我们可以为商品打上更为精准的标签。

当时我们设想,希望研究出一套系统,直接通过图像识别给商品打标签,从而给C端消费者提供一款搜索引擎。它能帮助中国消费者买到自己想买的时尚商品。

我们自己建立了数据库,通过爬虫抓取,积累了200多万个SKU。很快,我们做到了4000多个分类,每个分类下面还有很多标签。对标签的定义很关键,我们分为两步走,第一步是学习图像,第二步是学习语言描述。在这个过程中,我们聘请了专门的时尚编辑来辅助分类。

合伙人都是发小

2015年,我回国后正式创业,很快组建了一个20多人的团队。我不想做成一个电商平台,不想赚差价,因为很快我们积累了大量数据,每天更新近20万个SKU。我们知道用户在搜什么。我的设想是,服务于C端,积累数据,让数据发挥其价值,进而在B端寻找变现模式。

我们三个合伙人算是发小,从小到大都是好朋友。其中一位合伙人经历比较坎坷,成绩优秀,A Level考了4门A+,准备高中毕业就出国上大学。按理说,申请条件挺好,但他一直没收到录取信。最后才发现,自己早已被很多所名校录取,其中还包括剑桥大学,但邮箱系统把这些信件都自动归类为垃圾邮件。当发现时,为时已晚,已经过了确认时间。最后,他去了英国伯明翰大学攻读信息安全,后来转学机器学习。

我的另一位合伙人和我从小学开始就是同学。我们一起就读于东北师大附中,他的成绩一直是学校前十。他从小到大都很喜欢化学,大学也想学化学。但高考前体检他才发现自己存在色弱的缺陷,这种情况在中国的大学里学不了化学,但当时申请出国已经来不及。他最后去了吉林大学的车辆工程专业,他想转计算机,但学校不允许,折中之下,他修了计算机的双学位。

我们的编辑有的来自时尚集团,有的曾自己运营时尚公号,我挨个去说服加入,在一定程度上,他们也发挥着产品经理的作用。

我本身学编程出身,与大多数程序员有共同语言。我们当时的技术负责人在网络上开设了公开课教程,教授的就是我们需要的Ruby技术语言,我直接找到了他,向他发出邀请。

变现受挫 积极转型

搜索引擎的项目做了半年多时间,我们发现了几个问题。第一,我们每周用户都在涨,但用户涨得越多,赔得越多,因为服务器有成本,用户量越大,我们的成本越高。服务器每个月的成本有8-10万。加上研发和人员费用,当时几个月已经烧了200多万人民币。

第二,我们没有变现机会。我们想把用户行为数据卖给时尚公司,但他们缺乏使用这些数据的动力。当时国外已经有WGSN公司专注于信息梳理和预测未来时尚趋势,但国内的公司对这类服务缺乏认知。通过趋势预测,降低库存,我们能帮国内的时尚公司省下不少钱,但国内很多公司老板不这么认为。国内公司的老板认为省钱是他们的本事,和我们没关系。

我们接不到业务,无法变现,不得不思考转型。2016年1月,有一天我们几个合伙人一起吃饭时讨论说,“我们做的技术解决方案,很多公司都能用,为什么只给时尚公司?”这个想法,成为了我们转型的基础。

之前我们见了100多位投资人,但最后一分钱也没拿到。但大家都不甘心,不想就这么散了,于是我们就开始流窜作案。没有办公室,那就去咖啡馆里办公。当时觉得,创业成不成,与融不融资没有关系,创业是我们自己的事,能拿融资只是锦上添花。投资人不投我们,我们也要自己走出来。生死看淡,不服就干是我们的信条。

2016年,我们把之前的想法完全放弃,并重新思考了团队的优势和利弊。我们擅长的是人工智能、深度学习、机器学习、计算机视觉,我们为什么不在这些领域尝试突围?机器学习这个概念已经存在很久。深度学习的概念同样也很早就有了,然而,当时的CPU符合不了计算要求。在我大学期间,第一次接触到深度学习的时候,无比震惊。这种感觉,就像是1853年美国海军准将马修·佩里第一次让封闭的幕府民众见识了黑色的军舰。于我而言,深度学习就是那艘黑船,它叩开了我心中的门。

我们熟知的一些产品,比如:网易云音乐的推荐,日常的垃圾邮件判别,这些都在使用机器学习。只要你接触互联网,接触手机,你的行为就会与机器学习有关。

但在AlphaGo进入公众视野之前,很少有人知道机器学习的概念。突然之间,AlphaGo引爆了机器学习和人工智能的相关话题。

当时,我们发现,所有做AI(人工智能)的公司多是广义的AI范畴,他们自己都不是自己的用户,主要是用技术解决方案去服务于机构、企业和组织。然而,问题在于,你自己都不是用户,你怎么知道痛点在哪里?有的公司把技术解决方案卖给医院,但实际上产业和学术脱节严重。

正好我们在思考转型,当时就觉得,必须以用户需求为导向,不能闭门造车。近20人的团队,当时只剩下几个人。可是我们有技术,也有人手,何不找一些业务先做做?沿着这个想法,我们四处找企业谈。当时的思路是,产业界存在很多问题,大部分公司,都是拿着解决方案找问题,而不是找到问题之后研究解决方案。

拿到融资与客户

AI存在了很长时间,但至今没有一个爆款产品出现。AI技术本身也不成熟,并没有想象中那么神奇。它仅仅是一项技术,并不是什么轰动性的东西。到底AI用来干什么?如果不是Alpha-Go,可能大多数人都没有概念,可是Al-phaGo其实离我们的生活太遥远。

客户不知道我们做什么,我们不知道他们要什么,似乎整个行业都存在这样的问题。我们不假定产品形态,因为我们也不知道最终的AI产品形态是什么,但行业只要存在问题,就可以去尝试解决。针对不同的行业需求,我们展开了调研,直接下到了产业内部。

我们接触了几家无人机公司,发现无人机公司并不是我们实际上的客户。能够为我们的技术解决方案付费的人,是无人机的使用者。我们做了更深入的用户调研。我们想要弄清楚,无人机拍摄视频的实际场景是什么样子?我们全公司的人带着无人机,找到了实际场景,自己去飞,自己去看,模仿了用户的实际操作步骤。

不同的无人机,不同的操作者,进而导致了不同的牌照水平,会造成很多模糊照片。模糊的照片和问题照片是否需要甄别?拍摄的不同对象,是否需要归类?能不能自动生成报告?我们发现,这些问题都是行业痛点。如果我们能解决这些问题,客户就会愿意付费。我们针对现实存在的问题设计了AI技术解决方案,最终,南方电网成为了我们的客户。

在图片识别的应用上,我们也能与公安的需求结合。抓逃犯是全球警察机构的刚需。但我们调研发现,真正要提供有效的解决方案,并不是用人工智能去识别那么简单,还需要在摄像环节去优化改造。如果不能在初始环节切入,就很难实现理想效果。目前我们看到的现实情况是,企业选择人工智能,目的并不是要取代人,而是因为人手不够。一项工作,实际需要300个人去做,可是企业的现实是只有30个人。在这样的背景下,人工智能解决方案可以帮助企业缓解人力不足的难题。到现在我们已经帮机场电网无人机医院等多个行业制作了不同的解决方案。

2016年7月,我们成功完成了融资。经发现创投的万总介绍,我们认识了梅花天使创始合伙人吴世春,与他第一次见面就敲定了融资。最近,我们又完成了新一轮融资。我们公司起名为泛化智能,意在地提供高效灵活的人工智能解决方案。(经济观察报记者高阳采访整理)

推荐理由

泛化智能是为具体场景提供提升效率和降低成本的智能引擎,切入点准确,团队务实,技术国内一流。

——吴世春 梅花天使创投创始合伙人

泛化智能简介

泛化智能是一家专注于机器学习与计算机视觉的人工智能公司,总部位于北京。致力于为客户提供可快速部署、通用的人工智能产品与解决方案。

经济观察报 公司部记者
伦敦政治经济学院·国际史硕士、伦敦大学国王学院·战争系硕士。2016年2月加入经济观察报·公司新闻部。主要关注早期投资、创业领域。擅长人物专栏、调查和公司报道。负责专栏:花蕾之约、VC投资笔记、PE家笔记。