读吴军著的《人类文明的基石》提炼总结
1.数据是知识的基础。
数据可以包括很广的范围,比如我们平时收发的邮件,工厂设计图纸,医院影像资料等等。这些数据其实承载了一定的信息,但不是每种信息都是对人们有利的,对人们有利的信息,被人们所用才更有意义。
而数据中隐藏的信息和知识是客观存在的,只有专业人士才能将它们挖掘出来。对数据和信息进行处理后,人们就能获得知识了。比如,通过测量星球的位置和对应的时间,获得数据,根据这些数据得到星球的运动轨迹,这是信息,根据信息总结归纳出开普勒三定律,这是知识。所以,数据是知识的基础。
数据是人类文明的基石。比如,在遭遇洪水时,对洪水到来退去的时间,洪水的大小等的预测,都反映了人们文明的积累。然而,过去的很多年,人们根本不会利用数据,究其原因有两种:1.数据的积累语言大量地时间,那个时候时间比较短,还不足以积累很多数据。2.数据不是单独存在就能反映问题,它必须依赖相关数据,才可以,共同反映问题。
逐渐的统计数据的工作发展起来了,数据统计需要大量的样本,而同时样本又要具有代表性,在这个基础上,人们开始建立数学模型。模型的建立至关重要,模型选对了,后面修修补补就容易多了。在数据样本够多,又具有代表性的情况下,人们发现通过几个简单模型的叠加也可以代替一种复杂的模型了,这就是数据驱动法。而今,计算机对数据的存储,帮助我们利用数学驱动法。未来,计算机将引领这个数据时代。











网友评论