《爆发》:大数据预测未来思维(6)
导语:姜齐平:我把这本书形容为大数据哲学,互联网是个机会特别多,却让人看不清楚的地方,我们看到一个成功的例子,却没看到后面的99具尸体,100个人往上冲,我们要当留下的那个。这是大数据之道,互联网之道。

 

移动的数据是宝藏,当时我们跟联通一起聊,他说我们上了一套BI系统我能从用户行为里面分析出谁是黑社会、谁是三陪,我说你这事吓不了我,我是研究用户行为的,这些人在通话行为上一定和别人有明显差异你才能把他筛出来,要不然是不可能的。从我猜我那些年每天都熬夜,熬得很深,基本上我的行为规律是中午才起床下午去办公室,晚上熬到三四点钟回家,但是晚上太饿了回家之前去东直门的簋街吃点东西,然后再回家。我就发现有这一个规律:三四点钟我去吃东西的时候一帮男男女女都是属于一看就是男的像黑社会女的像三陪的也去吃饭,后来我搞明白他们的规律了,很容易理解。现在也不是保密的事,这帮人上班就是这样,白天也睡觉,他比我起的还晚,下午才起,晚上去夜总会上班,十点多上班,跟人陪人三陪,陪人唱歌、喝酒、陪到三四点钟他才下班,那这些人下班以后也要下班,所以我说你看这样人的行为规律就注定他的通话规律也会很特别。他上午从来不打电话,因为睡觉呢;他下午傍晚的时候尤其是会打一阵电话,约着吃个晚饭,然后再去上班,十点以前都会有电话。但是这帮人很敬业,几点开始接客以后就不打电话了,然后到三点姐妹们约着去吃饭又打电话。你把这样的人拎出来他下午才打电话,晚上密集打一段,十点到三点是空白,三点以后又打,你把这样人拎出来你猜他不是三陪还是什么,估计就是我了。所以说理论上讲你理解了用户行为才能真正知道这个数据怎么去用,要不然这个数据量越大对你来说越是晕的,这块对我们来说是很挑战的事情。

你对用户行为的理解程度是如何,而且有很多时候你不理解用户行为这个数据量对你没有意义,我们原来跟移动做了很多年的合作,我发现大量的金矿在他那被当成石头就扔掉了,因为他没有用户行为的东西。我们原来讲过如果我能收集每个用户的异地开关机的情况,我就能分析到所有人的航空飞行的差旅行为,这样的话我再给他提供服务的话,这个携程就不好干了,因为我对用户行为太了解了。比如姜老师每年飞100趟其中80趟是北京和上海之间,基本都是周五下午飞上海,周一早上回来,我再给姜老师订票,那他肯定愿意合作。这个是我们真正需要挖掘,掘金能力有时候想起来比数据本身还要重要,你光有数据没有挖掘能力没有意义。

当然另外一方面我们现在发现,特别有意义的就是这个掘金能力由于有了社会关系之后变得更有价值了,以前我只是孤立的分析每个人的个体行为,我根据每个人以前的行为的历史记录做分析的时候,这个数据分析会越来越收缩,会越来越窄,因为我要把他的一些偶然性行为去掉,只有重复性行为才能做预测,偶然性的行为预测的准度一定太低了,我对他的分析只能越来越收缩,这样就越来越小了。

但是实际上有了社会化行为以后我可以参照他的朋友的行为,这种时候意义就颠倒过来了,我有了他的朋友的行为,去预测他的行为,这个数据量会越来越发散,我对他的了解越来越多,现在国外研究非常少,有一类行为其实不是用人的固化行为能够预测出来的,因为是流行性行为。我们人是社会性动物,我们受周围环境影响非常大我们每个人的行为不是简单自己以前行为历史的延续,不是过去的行为历史加上流行行为的叠加,而这个研究流行行为和过去行为叠加的方面的研究国外也是非常少,坦白讲巴拉巴西是起了个头后面可做的事特别多,叠加是什么意思?比如我喜欢听音乐,煜全喜欢听校园民谣,当然了是准的,你再给我推荐校园民谣也行。但是其实你可能分析我以前从来不听中国风,但是最近流行这个,听起来好像也不错我可能听两下。但是这个没有持续,可能流行过了就不再听了,包括我们都知道球迷分成两种一种是铁杆的,不管有没有球赛他都参加。

另外一种是平时根本就不看球到世界杯期间为了到酒吧喝酒跟人议论就看球去了,这种叠加的意义往往在于你朋友的行为,如果你朋友行为分析自己。董寰老师也讲到,有一本我们期盼已久的书,作者特别牛,是哈佛的两个教授,这两个教授我认为《爆发》的作者,巴拉巴西和丹特曼斯,这两个人发现了小世界和无尺度网络是上一代的领军人物,坦白讲他们现在的研究有点属于他们是不自己做研究了,是带着别人做研究了。他的博士或者是博士的博士为他们效劳了,他是领袖人物了,他的突破已经做完了,我认为未来的影响最深的结论是这两个人,实际上是这两个理论造成的。第一个是三度的影响,刚才董寰老师讲过肥胖都传染,因为你的好友对你影响如此之前,这个其实也是可以理解的,我们每个人都是环境的动物。

现在心理学认为环境对人的影响超过你自己的自由意志,而我们生活在社会当中我们的环境是谁呢?就是我们的朋友,我的强关系就是我的强烈的环境,它是什么情况我是什么情况,他里边讲的不光是肥胖,连抑郁症都是受朋友影响的,所以哪天你抑郁了,先别召集去治,看看是不是你朋友治的。当然如果你朋友没有抑郁的你也别去医院,你看看是不是你朋友的朋友抑郁了。如果你的二度好友,你一度好友背后的那个你从来不知道他存在的那个人,他对你的影响基本上也能够达到25%。所以如果你交友不慎,你某个朋友背后藏了四个人,这四个人同时抑郁了,你也基本上快抑郁了,所以这个理论对于我们来说影响特别大,因为我们是反过来用这个理论的。

 

三度关系意味着什么,我如果对一个人本身不了解,我想知道他是谁的时候我根本不用去分析他,我可以去分析他的好友。而且我分析他的好友,因为好友关系是很难造假的。我听他好友对他的结论比问他还精准,我问他一定会美化自己。我每个人都会高估自己,一定会美化自己,但是我问他的朋友根本不问他,曾经有个名人说自己是加州理工毕业的。最后证明是西太平洋的,你问他不承认,我是加州理工的,但是你问他的朋友基本上都是西太平洋的没有加州理工的所以你猜他是哪的。

用朋友去看他会比从自己看自己是准确得多,因为他的数据可以伪造,他朋友的数据是没有办法伪造的,你是西太平洋毕业的你想把你的朋友都换成加州理工毕业的这个难度相当大,这个是第二个特别有意义的东西,在社会层面里面我们能够利用到社会化数据来做深入的分析,一个是对未来对现在的理论更重要的三度影响理论,还有一个特别巧也是湛庐在出的东西。

《正义之心》,“正义之心”的理论在未来看起来也会意义巨大,而且会颠覆掉现在美国很多的业务模式,美国做的业务在社交领域里面美国的实践跟我们的进展是差不多的,我认为美国很多实践有它美国这个社会的局限性,历史局限性是普遍存在的,每个人也跑不了,稍微说一点,海特的《正义之心》的作者,我们所有人都是亿万年在社会当中进化来的,我们亿万年以前的祖先和其他动物的差别就是我们的聚群能力更强,我们几十万年以前就是达到了150人的聚群水平,这是世界最大的,我们的合作形。

 

已有0人参与

网友评论(所发表点评仅代表网友个人观点,不代表经济观察网观点)

用户名: 快速登录

经济观察网相关产品