《爆发》:大数据预测未来思维(13)
导语:姜齐平:我把这本书形容为大数据哲学,互联网是个机会特别多,却让人看不清楚的地方,我们看到一个成功的例子,却没看到后面的99具尸体,100个人往上冲,我们要当留下的那个。这是大数据之道,互联网之道。

 

 王煜全:我觉得悖论是你想象出来的悖论,不是一个真实的,因为首先我们现在所说的预测基于个人行为数据历史数据的预测,未来行为的预测并不是去预测这个人某年某月某日会在某地做某事,不是这种预测,是你今天收发了邮件明天可能还会发邮件,是这种预测,不是预测你某年某月会遇到某个贵人,你们两个人会怎么着,这是真是变成了算命了,这个不是算命,一种行为推理,你可能会发生这样一件事,所以你说的你知道那个未来会发生什么悖论就是根本不存在,因为你知道你明天肯定会发邮件你就不活到明天了吗?这是两回事。

Keso:我觉得这本书就是偏重一个技术的感觉去看它,可能你会到七八十年代刚有机器人技术出来的时候,所有人都在怀疑是不是以后机器人要去操纵人类要统治世界,但是实际到今天大家可能也不会考虑太多这些问题,机器更多是给人体够一个便利,我现在对于大数据的挖掘预测今后可能也是同样的道理,他们可能会在你的生活里面提供更多的你买机票、买东西给你提供一些推荐和预测的是一个便利的服务,他不太会走到一个真正的操纵的感觉上。

罗振宇:其实刚才Keso讲的是书里面有一段讲这个问题,他说比如说给我打电话,你再预测说我下一秒钟打电话的可能性甭管是0.1%还是99%,其实对我都没有意义,但是对谁有意义?对上一个层级的人有意义,比如说附近机站的工程师对他就有意义了,能够预测出我们这一群人在下一秒钟打电话的可能性有多少,他那个机站的带宽设到多少对他就有意义,所以这个Keso讲的不是从层次上看矛盾对象,一旦层次拉开。

问:我对刚才说的话题有一个可能不太一样的意见,我觉得巴拉巴西这个书是从数据去看未来这是一个方法,但是数据是历史,有一个行为巴拉巴西这点没有办法去想到的,那就是我们在座可能每个人都有的能力,创作,我去构想一个新的东西,这个不是历史,这个是未来,因为我随时可以改变它,我可以去设计我要讲的一个东西可能是什么样子,这个书对于我来说,那我有了这样一个历史的数据意味着什么,意味着说我有了对现在更好的一个把握和理解,在我去构建这些新的事件的时候我可以做出更好的选择,所以说我可以去预测未来,实际上不是预测未来而是更好地帮助我们去选择,我觉得是7%实际上我理解的是创造力,因为你说现在人类历史上很有价值的东西,艺术作品他们有一个特点是他们不可重复,你没有办法预测一个达芬奇的蒙娜丽莎的诞生,但是它一旦诞生你去重复也没有意义,但是一旦诞生会打开一个新的世界,给我们带来一个新的视角,这个就是7%所存在的意义。我们在了解到我们现在的93%的基础之上,我们去做7%的这样一个开拓,我对于这个书所讲的预测未来的理解。

罗振宇:好,谢谢。

问:93%这个可能是基于数据就是统计方面已经逻辑推导了,那7%不可预测,我先把刚才说的腾讯的圈子,他一出来我就很恐怖,他将我整个社会关系都给完整地挖了出来,很快做了一个问题他并没有意识到我跟人关系的深浅,这个就是确值这个概念,他不知道我最喜欢的姑娘是谁,他没有反应出来,我跟哪个哥们最铁他也没有反应出来,就是说当然他们都在圈子里面,93%预测这个方面他是相当于是物理方面的,统计加逻辑,对于确值这个方面因为我们都知道毛毛细雨和滂沱大雨是两个概念,虽然都是雨,对于这一块布我不知道如何要我们去进行策略,以及关于确值这块我可以预测以及7%具体包含哪些东西呢?这是我想知道的两个问题。

罗振宇:你能再表述一下你的问题吗?

问:数据可以预测,因为基于统计以及逻辑推导,但是确值,我跟你关系的深浅这个浓度这个概念他没有给我推导出来。

罗振宇:你的问题是什么?

问:我的问题就是能不能给我推导出来以及是否还有其他的推导出来的?

罗振宇:到什么程度才能推导他来他喜欢哪个姑娘?

女:我觉得是这样的,从巴拉巴西那本书以及我现有部门的大数据这本书我们来看的话,其实大数据的专家们他们对于大数据他们的基本特征,他觉得在大数据时代有两个特征是比较明显的,第一他讲的是概率性,因为这是海量数据,另外他觉得精确性已经是对他而言并不是非常非常在意的东西了,而是概率性,第二就是数据之间的相关性,这个相关性是说以前的时候我们这些数据都是因果的关系,现在是说不同的数据我们看似是没有什么样的,我们不再去挖最终的因果了,而是看是不是有相关的关联,而相关的关联可能会对数据产生一个你觉得这个事情之前是完全没有任何关联的,但是忽然你觉得这些之间似乎是有某一种意义存在的,比如说就像是我总觉得像亚马逊他背后的数据的统计的平台,可能他就是根据用户的一些习惯他把你一些不同的情况给关联在一起了,所以我觉得大数据时代的两个特征,一个是概率性,一个是相关性,这个是基本的特征,刚才您说的精确性他能做到,他是随着世界上这种技术的发展,对于这种计算机也好,对于新的技术的演进也好精确性是能够解决的,通过你的样本的情况以及你一个更大量数据和你的操作平台的控制,你的精确性是可以解决的,但是从商业发展而言来看,以及大数据的基本的特征来说,它的精确性反而不是过分强调的。我不知道是不是可以回答你的问题。

 

男:我理解你的问题是按照逻辑和量化分析之外还能做什么,我的答案是我认为有巴拉巴西和大数据已经有明显的进展,这个进展不是哲学问题。第一个在量化分析里面实际上你提了几个问题都提升到质,质可不可以分析,我明确地提出可以分析,现在这个大数据在技术上有极端的特点,他从结构化数据到非结构化数据,非结构化数据意味着什么,跟质有关的几位数据开始进行分析领域了,这个里面是图像,包括语言,包括声音这几项都是包含了非逻辑性的因素,它可以由此进入到质的分析,比如说我们进行语言分析的时候,从语型到语义要语用就是你言外之意这些分析,实际上是通过语言分析不是通过统计分析,这一点大数据可以大大地推进一步,第二我认为就是在一时层面之下还有一些过去难以分析的潜意识层面的东西,比如情感的东西等等,你说到深度以后他涉及的是以往在业余分析的水平里头佛洛依德曾经做过这样的一种分析,大数据现在可以得出明显的结论,他可以在专业水平上做大,比如说你做的梦,你似乎觉得梦是不可以决定的,其实梦是可以决定的,当你问你的小孩他梦见的是大灰狼还是老巫婆?这个东西他脑子里想的是什么呢?他梦见的是老巫婆的话是你的爱人对他太严厉了,如果梦见大灰狼是你对他他严厉了,小孩他只受到了压力他并不做语言分析,但是和他的生活世界觉得最可怕男的动物就是大灰狼,女的动物就是老巫婆,这一点他也可以分析出来,这点只是时间早晚的问题不存在不可克服的障碍,但是有一点从这两个问题都是属于受力状态,自由意志都不是你这个问题,刚才那位说的创造性已经逃离了问题的区域了。

 

张昕:我理解你还是想扩展93%,你刚才问题是想知道人际关系浓度的问题,我想反问一个问题,假如说能够预测出你喜欢的人话的话你会喜欢这样的产品吗?

男:我会立刻抛弃它。

张昕:我不是QQ圈子的产品经理我是做别的产品经理,其实像你跟某个人的浓度,你跟谁经常聊天,聊天的频次这些都是能捕获的,另外包括你聊天时间,你用了QQ的聊天,你又用了QQ的输入法,你跟他发的时候是用什么样的语气词去写这个句子的,你包括说你在敲这个字的时候敲了一会儿又退回去,又在改,这些行为都可以给你捕获的。

 

已有0人参与

网友评论(所发表点评仅代表网友个人观点,不代表经济观察网观点)

用户名: 快速登录

经济观察网相关产品