涂子沛说“大数据”时代(2)
导语:“一个真正的信息社会,首先是一个公民社会”,这是全书的一个出发点,这个出发点就是说,“信息社会最大的特点就是,信息的自由流动。”如果没有人的平等,没有人的自由,信息能够自由流动吗?如果没有人的平等,我们这个社会彼此另外压抑另外一个人,我们的创造力怎么迸发出来?

 

我们再回到刚刚的例子,为什么呢?他们后来经过检测,发现西藏和新疆的男性总是给太太和爱人许下诺言,有一天我要带你去看海,可是一下子去不了,怎么办呢?先买一个笔记本表示一下心意,这是解释的一种,但这是不是一个知识?最多的解释,数据挖掘能发现一些新的知识,而我们知道的,数据挖掘不仅仅是挖掘数据,还会挖掘图像,挖掘文本,挖掘视频。现在的数据挖掘是非常强大的,我们周围有很多的摄像头,你在这个镜头出现过,挖掘一下你有没有在那个镜头出现过,如果它都监控过,就可以挖掘到今天同一个人在哪里哪里出现过,这就牵涉到我们公民生活一个很重要的方面--隐私,在这个时代还有没有隐私。

另外还有一个很有名的事,有一个百货店,有一个父亲生气来质问这个销售经理,“你为什么给我未成年的女儿寄这个东西”,经理一看是一个怀孕妇女的用品,过几天父亲发现他的女儿居然怀孕了,那么他现在对这些企业而言,已经是一个很基本的数据挖据。现在对企业最大的挑战是什么?挑战是我要让你不知道我知道你怀孕了,要是知道,我作为一个顾客,我要知道你知道我怀孕了,我会觉得被冒犯了,下次我恐怕不会来你这里买东西,这就是平衡。但是商家他不想冒犯你,他用很巧妙的形式来隐瞒自己的意图,他把这个广告放在其他的广告里面,好像装作自己不经意,数据挖掘已经到达一个很普遍而且大家都在用的东西。   

到2004年的时候又出现了一个新的现象,就是facebook。我们回到创新这个话题,facebook是不是创新?那肯定是创新。前一段时间我看国内有很多制度来鼓励创新,我当时也跟几个朋友讨论了,说可不可行呢?马克?扎克伯格为什么要建facebook?他建facebook的理由很简单,就是想多认识一些漂亮的女孩子,后来他就是想帮助别人多认识一些漂亮的女孩子。facebook开始就是一个大学交流平台,就这么简单,后来他就去见硅谷的投资商,人家给了他1000万,觉得这个东西有前途。创新不是一个制度化的东西可以鼓励出来的,它是真正源于一种在自由的情况下的一种内在的能量的爆发。

facebook给人类社会大数据的现象是一个“一锤定音”。为什么这么说呢?我们说以前是信息系统在收集数据,这时候是每个人都在贡献数据,你也发微博,他也发微博,而且你发了一条微博可能有视频,有图像。原来的信息系统收集恐怕就是数据,记录一个商业过程,这时候全世界的人开始贡献数据,而且这种数据有一个不同的名字叫“非结构保持性”,跟以前的数据不一样。大家想想什么叫非结构化?就是格式大小不一定一致。你发了一条微博大小肯定跟他发的不一致,你可能有三张图片,他可能没图片,你可能140个字,他可能只有20个字,这种数据的挖掘也很难,这时候人类的数据一下子就开始爆炸了,大数据已经成为一个不可挽回的现象,为什么呢?因为80%的数据都是这种数据,原来信息系统收集的数据变成20%,变成少数了,这就是不折不扣的进入大数据时代。

我们看到中国社会因为微博也发生了很多深刻的变化,很多事情都是由微博出发的,带表局长的事,高铁的事等等。我记得高铁的事的时候,我正在美国,我一直跟踪在微博上看,就是大家对这个事情的评论,事情不断地推进。比如盲人的事件的时候我也在里头,而且这些事件,你们能很快地从微博当中跟踪到最新的消息。你看微博被另外一个交流协同的影响比地震波还快,首先在微博可以看到那个地方地震了,几秒钟之后感到地震波,有振动。所以我们可以多说两句,因为这个东西太重要了,微博把这个平台,把互联网的交流沟通的功能推向了一个登峰造极的地步。我个人认为我们很难再超越在现有的互联网架构上很难有再超越微博新的发明和应用产生,要超越的话只有把现有的互联网架构重新推倒了再来。这就是Web3.0或者是Web2.0。

王总和姜总他们两个人都很博学,我今天下午和他们交流的时候已经学到了很多东西。王总是投资公司的老总,他刚才跟我说,他投资的项目100%全是基于微博的力量。我们再回到“大数据”上,2010年的时候“大数据”就成了一个很普遍的现象,2012年的时候“大数据”成了一个美国的国家战略。奥巴马把这个提得很高,他认为是跟互联网的超级计算一样重要。美国联邦政府投互联网的时候投了5亿,现在他们宣布给了2亿多。也是“大数据”很常见的一个解释,我就不多说了。   

我们最后来分析一下,这种种的现象最后导致了数据的增加,特别是社交媒体,使数据量大到物联网上,最后这个“大数据”的现象意味着什么呢?它代表的是什么呢?我个人认为,是一个新的时代来临,什么时代呢?信息时代和知识时代,正在向智能时代迈进。最简单的解释就是,我们从数据当中能有能力去发现更多的智慧,这是以前发现不了的,我们说我们在信息时代最大的标志是什么?信息无所不在,你想找一个你不知道的信息,你一百度几秒钟就可以找到了答案。信息时代就像这个三角形,在上面是知识时代,信息要成为知识,什么是知识?知识是有规律的信息,经过系统化的信息才成为知识,我们说现在正在一个知识的时代。我们举几个例子,这几年教育领域近一两年在发生很深刻的变化,大家都是在大学教育,现在是在线教育。斯坦福大学的英文课现在已经有10万人在上,10万人同步在听,有一个教授在上课,斯坦福大学的学生没有100人,还有99900人都在全世界同步在听。大家现在要问,这个技术是不是以前就成熟了?以前的技术跟现在的不一样,他们除了上课之外还做作业,全世界10万个人跟这100个人做的作业是一样的,同一个平台,在一个智能学习平台。

智能学习平台后面也是“大数据”,它能记录你所有的学习行为,然后分析你的学习行为,给后来的学习者提供建议。你进入它所有的鼠标,你在每一个PPT上面的停留,你什么地方做错了,它是大量的数据之后是不是能积累到很多很多的知识,你一上来如果告诉它我是个大一的学生,他就知道大一的学生学习行为应该是什么样子;她是一个女生,而且学的是物理学,它这里面有智能的系统会不断的引导你。这是以前没有的,大家可以想象这会发生什么变化呢?就是说每一门课都会有一个视频出来,这个视频是世界上最好的老师讲的,你学这门课恐怕大家都会有兴趣世界上最好的老师,哈佛的老师,斯坦福的老师讲课的时候是怎么讲的,更绝的事是什么,还有好多学者在进行编辑,他们把他们认为最好的视频汇编到一起,不同学习者不停地打分,不停地呈现,大家可以想象最后出现什么结果?就是每一门课都会有一个最好的视频,大家都要看这个视频,而且是免费的,所以说知识在变为无所不在。

这跟我们的公民生活也都是相关的,等会儿我们再具体的阐释,这个跟公民生活到底怎么相关?所以说未来的老师也面临一个革命,他上课的时候就会想,我们是不是大家都先看看哈佛的老师怎么讲,他会成为一个课堂的组织者,而不是像以前一样的是一个知识的传授者。

我们说从知识时代进入智能时代还有很多的标志,比如说IBM能获胜,2011年时候战胜人类回答问题的冠军,我们记得,90年代的时候有一部计算机很有名叫“深蓝”,它下象棋战胜了人类的冠军。这个沃森是怎么回事,美国有一个节目叫“危险边缘”,主持人就是对参加比赛的人问问题,什么问题都问?天文、地理、语文、数学、明星、八卦、做菜、家务等等什么都问,终于有一个冠军出来了,回答战胜了所有的人,他的知识面是最广的,结果沃森把他战胜了。就是直接有人向他发问,然后沃森就回答,把人类冠军战胜了,这背后也是一个大数据,就是智能。它在快速的处理大量的信息时,一听到有人问,最后就回答。大家都知道谷歌,谷歌的无人驾驶汽车已经快上市了,现已经在路面上跑了,它也是一个大数据,很快就能决定什么情况应该刹车,什么情况应该转弯,什么时候应该减速,还有很多继续学习等等,因为只有半个小时,我就不展开了。

已有0人参与

网友评论(所发表点评仅代表网友个人观点,不代表经济观察网观点)

用户名: 快速登录

经济观察网相关产品