涂子沛:数据之巅通向智能社会

为什么说是“巅”,先来破一下题。我觉得“巅”有三个维度,第一,登上数据之巅看数据文明是怎么兴起的。第二个,这个时代使用数据巅峰的形式是什么?我的结论是让机器学习来使用数据,实现智能化。大数据的兴起标志着社会向智能化的社会迈进和转型。第三个巅的意思,大数据需要站在巅峰之上、需要顶层设计。

我们从这三个维度来看今天的演讲,今天的演讲会从四个定律来认识大数据、展望大数据的未来。刚才提到了大数据的另外一个维度“赌球”,我们看看德国队现在是怎么训练的。德国队已经把传感器装到了每一个队员的身上,装到了足球上面。一场比赛下来6,000万条记录,一个球员控球时间的长短、传了多少个球、奔跑的加速度是多少、奔跑的长度是多少,这些全部都可以计算。我们可以看到一个精细化的管理,数据给我们带来了精细化的管理。从这个案例来讲是数据是收集来的,把传感器放到足球和队员的身上而收集来的。

第一个定律是“数据是人为的现象”,一切的数据都是人为收集的。数据有三个来源,一个是测量,第二是记录,第三是计算。正是因为所有的数据都是收集来的,我们说要建设好大数据一定需要顶层设计,这个设计首先要从收集开始。到底什么是数据呢?我们到底收集了什么呢?在前信息时代数据意味着对客观世界的测量,它是有一个有根据的数字。进入了信息时代之后,数据的内涵其实发生了深刻的变化,为什么?就因为计算机产生了。计算机产生之后有一个新的名词叫数据,音频、视频都统称为数据,视频的内涵扩大了。不仅内涵扩大了,容量也发生了变化。

现在Twitter上一天产生的数据量相当于以前一百多年产生的数据量,这部分微博、微信数据称之为非结构化的数据,因为这部分数据的爆炸引起了大数据时代的到来。

第二个定律,我们有大数据的定律,什么是大数据?我的定义是传统的小数据+现代的大记录。现在的大记录就是指音频、视频,它的来源是源于记录事件,传统数据是来源于测量事件。

接下来看数据有什么用?传统的小数据和现在的大记录到底在怎么样影响我们的生活?我们说数据对生活当中的作用由来已久,不是现在的事情,可以在历史中追溯到很早。我们以美国为例,美国《宪法》当中有很多数据的因子,美国在立国的时候就强调用数据来管理。最典型的例子美国在立国、立宪的时候怎么去分配国家的权利,最后争论的结果国家的权利要按人口多少来分配。他们就说每十年要进行一次人口普查,这是二百多年以前挨村各户普查,按照这个地区人口的多少去分配议员。

人口普查有什么作用呢?在未来发生重大的作用。立国之后的南美战争,南美战争是后来的一个概况,为什么会打南美战争?当时南美双方拼命的辩论,北方说我们的制度好,要自由。北方的图书馆、农产品、工业品、教会、学校都比南方多,所以制度更加优越。南方说不是这样的,南方说你们总体人多的,但是我们效率更高,整个社会总是要有脏活、累活有人干。你们标榜着自由,但是有更多的问题,残疾人也高。最后战争怎么打起来的呢?还是因为人口的差异,人口普查是最后南方的敌人,所有的事件都要到国会去辩论,这时候越来越多的移民选择了去北方,没有去南方,所以北方的议席越来越多,所以之后就产生了打架。

我们再看打仗,这个就说到了将军谢尔曼,谢尔曼当时带着6万大军去攻打亚特兰大,打完了之后就说,我要切断后勤,不要补给。带着6万人不要任何粮草打到东海岸去,这个战役叫“向大海进军”。

大家可以想像兵马未动、粮草先行,现在粮食都不要那怎么打?他根据人口普查的数据哪个地方有多少头牛、多少匹马、家禽,他把部队分了五路大军。在地图上算这个东西走到这里,这个部队走到这里粮食能不能够支持到。后来证明了什么?后来证明这些数据非常有用,6.2万人一个多月没有任何补给达到了目标。谢尔曼被认为美国历史上具备现代意义的将军,为什么?因为他会使用数据。这个是谢尔曼的回忆录,“这场战争濒临结束之后种种事件证明,没有数据我赢不了”。这也是他写给美国人口普查局局长的信。

我们再说人口普查,人口普查不仅在政治、经济、社会中有重要作用,而且驱动了全人类社会迈向了新世界。为什么?因为美国人多啊,一次普查数据完了之后要七年、八年最后数据才能整理出来,就推动了技术创新,就产生了什么?产生了打孔机,产生了第一个数据之父霍尔瑞斯,也是后来的IBM。第一台商用计算机,第一个客户就是人口普查局,因为第一个项目也是人口普查。

回头看当时美国的人口普查是政治决定,但是这个政治决定却推动了美国社会最后登上了信息技术的巅峰,改变了整个人类社会的进程。我们刚刚讲的在政治生活、军事生活、经济生活当中的应用。再看看文化生活,文化生活有一个很著名的案例。

第三个定律,人类的政治、经济和技术生活是靠对数据的规定、解释、处理和探索展开的。我们再来看文化生活,大家知道《纸牌屋》,大数据的电影。要说大数据驱动了电影第一部是《乱世佳人》,这就说到美国第一个具有现代意识的数据大师盖勒普。这个电影出来之后盖勒普做了两年的调查,好莱坞的制片人完全按照这个数据来打造电影,这部电影到底拍多长,上集、下集、彩色、黑白,以及用谁做电影,全部用数据调查。当时的制片方一塌糊涂,全部按照盖勒普做的调查。盖勒普做了什么调查?用谁做女主角,最后是拍成彩色的,拍成四个小时的。最精彩的是盖勒普预测这部电影最终的票房是5650万。我们看第三点是5650万,当时美国有1亿多人,这部电影一共上了四轮,每一轮盖勒普都会告诉他这部电影在哪个城市里多少人看,群体是屌丝还是精英,票价、广告策略做什么调整,全部按照数据去做。最后的票房是5997万。

通过《乱世佳人》这个电影,好莱坞对盖勒普五体投地,盖勒普华丽转身成为了观众调查研究所,把数据驱动的方法带到了电影行业。

我们再来看看,看了历史再来看今天的现在。今天的大数据给我们生活带来了什么样的影响?我们注重看一个东西,设备越来越小,传感器无处不在。传感器在干什么?传感器在收集数据。一句话是万物皆联、无处不计算。再举几个例子,这几个例子在我的书里面都有,具有各种各样的传感器不停的在收集数据,比如埋在土里面根据土壤的湿度、结合空气的温度,能够确定花坛或草地什么时候开始浇水或者浇多少水。大数据最终导致的是大计算,我们在迈向计算型的智能社会。

还有最经典的例子,那就是Google的无人驾驶汽车,也是大数据驱动的。首先要收集数据,首先是街景式的去收集数据,然后有无人驾驶汽车到路面。

然后说这个时代我们在干什么?我们在沿着这样的路径在前进,从数据到信息到知识再到智能。所谓的智能是通过像机器获取大量的数据,让机器自动的计算、自动为人类服务完成一些任务实现智能化。

我们来看最后一条定律,我们未来的世界或者说现在的世界是什么样子?数据驱动的世界,软件在定义世界,软件定义世界还可以再分一下,谁在写软件?程序员在写软件。程序员在用代码和数据重新定义这个世界的流程,不要看不起IT男,我们在重新定义这个世界,我们通过软件重新定义所有的流程,数据是我们迈向智能社会新的土壤。

我的下一本书《大停滞》,就在分析智能社会,我们即将迈进智能社会,这个智能社会有许许多多的挑战我跟一个美国经济学家合作,他在写美国的挑战,我在写中国的挑战。

最后做一个结论,这个时代用数据说话远远不够,我们要改变思维方式。我们现在要从数据当中寻找知识、启迪、规律,用数据去预测未来,用数据去管理社会,但是这还不够。我们还要用数据创新,像Google的无人驾驶汽车一样,因为我们正在迈向一个智能型的社会,所有的创新都离不开数据。

【Datacn.Net-大数据应用从业者与爱好者组织,聚焦大数据业务价值实现。】

You may also like...