《爆发》:大数据预测未来思维(7)
导语:姜齐平:我把这本书形容为大数据哲学,互联网是个机会特别多,却让人看不清楚的地方,我们看到一个成功的例子,却没看到后面的99具尸体,100个人往上冲,我们要当留下的那个。这是大数据之道,互联网之道。

 

我们人类之所以有今天在地球上能够自由繁衍成为地球的主宰者,不是因为我们是强者,不是因为我们身强力壮,是因为我们的合作性是世界最强的,所以这个合作形就必然带来一些我们人类相互之间的一个行为规则。海特认为说人类行为规则有五条,第一条有爱恨,互相之间爱恨情愁的关系,第二条是公平性,我要待在这个社会里要有公平性,第三条是我对一个群体要也认同感,第四条是我对权威会崇拜,我们都知道如果做过了就麻烦了。我崇拜权威是因为他做过权威的事,但是很多时候他做过事我崇拜以后他做的事不权威了,或者做错了我还崇拜就麻烦了,连德国被号称多么理性的国家也对某个叫希特勒的权威崇拜的一塌糊涂。

第五个叫做纯洁性,我昨天还和一个朋友讨论,海特讲的事情也不全对,我们现在都希望所有读书是批判性接受,因为海特有一个视频他讲了20分钟讲这个理论。他问台下的人,因为稍微解释一下,他认为社会现在进化了,社会这五条大家不是普遍都遵守了,是进化到两极。一极是所谓的保守的人这五条同等重视,另外一极是更加文明的人,只尊重前两条,只强调爱恨和公平,但是对后三条强调的不够,基本不强调,参与者基本上都是美国的主流。这是我们讲社会层面对大数据的理解,稍微说一点我们现在说的事是实践层面,我原来特别痛恨资本主义的一切,现在也成了一个资本主义的小走狗,用资本的力量推动社交的发展,我们做了一个孵化器,孵化了将近20家做社交网络各种应用的企业弄得我最近狼狈不堪,因为每个企业都有自己的应用,每个企业都很棒,都希望成为未来的谷歌。

稍微做点小的介绍,除了一些世俗的赚钱的业务以外,稍微有点纯洁的就是跟陈教授合作那部分,做点基础研究。我们认为由于有了大数据,尤其有了社会关系,社会关系使得我们的数据一下深入了一个层次,所以我为什么说是社会化计算。其实理论上讲谷歌那个年代就已经用到了社会关系,他是把网页按照社会关系给连接起来了。他计算哪个网页对我们的搜索关键词最匹配,哪个网页在这个领域最重要,用的是社会关系这种做法来的。所有的其他也含有这个关键词的网页和这个网页的连接是最多的,相当于我问北京谁最出名?这个关键词就是北京,谁,每个人身份都有一个北京,北京人,他都指向某个人,比如都认识Keso,那他就是北京最出名的。这是用社会性办法来算的,但是很不幸是计算网页之间的关系,这下很麻烦了,因为我用网页对应人是对不上的,所以百度最亏的就是没有社会网络,他没有办法把所有积累的知识和人做对应。

一旦有人这个对应物了,这个社会关系你在上面叠加信息。我们开玩笑说蒸汽机已经发明出来了,只不过推动社会进步的工业化还刚刚在开始,我们在做的是工业化的工作。这种工业化必须要和学术结合,因为蒸汽机刚发明有很多学术成分要解决,所以我们在做一系列很有趣的实验,希望去揭示如何用算法能够给大家提供更真实的服务。

时间关系就稍微解释一点点比如说举例来讲过去我们知道有这么一个规律,如果这个人的社会地位比较高,他能够拥有的社会资源就会比较多一些,他为什么出名?为什么有社会地位?它是有道理的,因为他能占便宜,比如罗老师社会地位高,理论上讲社会地位高有什么特点?他更容易娶到年轻漂亮的老婆,确实是这样的。但是这个很好玩我们也知道更出名的例子,比如杨振宁,如果是一个80来岁的看工厂门的退休老员工他娶不到一个20多岁的年轻硕士,因为他是杨振宁,所以他能娶到。

国外研究社会地位越高他就能和越年轻漂亮的女性结婚,因为拥有社会资源能力更强,但是这个事总来没有证明过,我们和陈老师我们在合作希望在社交网络里利用数据去证明这件事,当然也可能推翻我们正在拷数据。为什么呢?第一社会地位可计算了,通过分析你在社交网络当中的位置我们可以分析出一个人的社会地位的,这个是很了不起的。

以前我不知道,现在我知道了,而且我们现在做一个事清华另外一个教授唐杰,也是社交网络在中国顶尖的高手。他帮我们把社交网络里,因为现在新浪的社交网络差不多有三四亿用户,他把每一个用户的社会地位做了一个高低,你在这三亿多人里是排在哪个位置给你一个数,这个很厉害。另外一个是社会资源,也有数,我不知道这个人他老婆到底多少岁数,这个没有体现,但是我可以用另外一个数据取代她,所以实际上做社会学研究的核心是你学会用各种各样数据近似性得到你想要的结论。

我们的数据就是这个人假设他拥有更好的资源他就能拥有和更多的年轻漂亮女孩互动的机会,我们测他的双向异性好友的平均年龄和他的年龄差,假设这个人40岁,我们把两组人挑出来都是40岁的人我们全挑出来分成两组,一种是社会地位高很多,一种是低很多,把每个人的双向好友里边的女性实出来,因为实际上新浪用户里边70%是标明自己的年龄和性别的,这点特别好,我们现在用户数据特别充分,有些没有标明就去掉,因为海量数据不看,挑出来之后可以证明双向好友里边的异性的平均年龄和这个人40岁到底差多少。

我们想看他的社会等级不同的时候他的年龄差是变得更大还是更小,如果说社会等级不同年龄差没变那说明我们的社会非常公平,如果社会等级不同年龄差很大说明什么问题,我们的社会可能有资本主义因素存在,但是好玩的地方就在于说。举一个例子,我们这样好玩的例子有一大堆,大家如果有兴趣做研发和创业的可以来找我们,我们最希望疯狂的人跟我们一起改变世界。

最好玩的在于这是一个崭新的世界,这是一个崭新的理解世界的途径,因为以前我们根本不可能从这个角度去理解人类,大数据时代最幸福的就是社会化网络计算的时代,最幸福的以前这个世界是对个体行为的理解达到空前的深度。从弗洛伊德开始,对过去的几年包括后来有了功能性投资共振对人的理解达到一个空前的深度。未来的一百年20世纪大家认为是人性解放,21世纪是群体解放,对人群体的行为了解可以达到一个空前的深度,这种时候就意味着一个新的工业革命的开始。

稍微说的更加疯狂一点,我们一直有一个概念我忘了国外谁说的,那本书里讲到一个理念,人类的进化一直是什么呢?不光是人所有的动物整个生物地球的进化,进化的原则是物竞天择适者生存,大家发现没有,这个进化从来就搞不懂为什么是单向,越来越复杂,进化你没有看到越来越简单的理论,但是进化的理论达尔文并没有得到一个结论进化必然越来越复杂,是最近这几年才搞出来的。

什么意思?因为进化从来都是弱者更合作去战胜了同等水平的强者,所以弱者一抱团,而且抱团的如此紧密以至于形成了一个新个体,弱者这一个群体结合成以后变成个体,变成超有机体战胜了强者。最弱的分子是散着的,他们合起来变成了细胞,一个细胞就可以战胜掉强大的分子,弱势的细胞个体合起来变成了多细胞动物他们能够战胜掉最强大的单细胞动物,而那个最强大的单细胞动物到今天在地球上都存在着叫草履虫,而我们是一代一代复杂化了以后更多层级从单细胞到多细胞逐渐演化。

我们是一层一层的进化从过去的包括说哺乳动物是有感情的,我们现在是理性的每一层的进化都带来超有机体的诞生和涌现出来的新的智力水平,或者是新的管理控制系统,这个才造成人类的进化,很有可能我们若干年之后回来看说现在这个年代2012年很多人认为是世界毁灭,很可能是新生,人类会诞生出崭新的超有机体可能就是革命,从现在开始,如果我们能够有幸成为其中的探索者,我觉得是一个无比荣幸的事情,因为按照历史局限性来说,这是我们能够参与的最激动人心的事情了。谢谢。

 

已有0人参与

网友评论(所发表点评仅代表网友个人观点,不代表经济观察网观点)

用户名: 快速登录

经济观察网相关产品