美文网首页
恰似艺术的统计学

恰似艺术的统计学

作者: 花影婆娑 | 来源:发表于2023-03-27 15:37 被阅读0次

数学历来被认为是确定性的科学,这就意味着,从同样的条件出发就应当得到同样的结论。如果得到结论不一样,就会认为其中至少有一个结论是错误的。但在日常生活中,人们却会遇到大量的不确定性事件,也就是说,事先无法确定这样的事件是否一定会发生、会发生到什么程度。比如,明天下雨的事件、期末考试得到90分以上的事件、彩票中奖的事件,等等,人们称这样的事件为随机事件。事实上,古代的人们就知道有些事件是随机的,只是不知道应当如何理解和处理这些随机事件。

在今天,我们已经很清楚地知道,虽然事先无法确定某一个随机事件是否一定发生,但是却可以依据一些先验信息来预测事件发生可能性的大小。

从纯粹数学的角度思考,概率是被定义出来的。

最初的概率定义是拉普拉斯在1814年出版的一本小册子《概率的哲学导论》中给出的:将同一类的所有事件都化简为一定数目的等可能情况。即化简到这样的程度,我们可以等同地对待所有不确定的存在,并且确定欲求其概率那个事件的有利情况的数目,此数目与所有可能情况之比就是欲求概率的测度。简而言之,概率是一个分数,其分子是有利情况的数目,分母是所有可能情况的数目。

几乎所有教科书,概率的定义都采用了拉普拉斯上文中的最后一句话:概率是一个分数,分子是有利情况的数目,分母是所有可能情况的数目。人们称这样定义的概率为古典概率。

必须注意到拉普拉斯的定义是有条件的:一个条件是所有可能发生事件的数目是有限的,随机变量可能取值的个数是有限的;另一个条件是随机事件发生可能性的大小是相等的,随机变量取每一个值的概率都是相等的。

在1933年出版的德文著作《概率论基础》中,柯尔莫哥洛夫创立了概率论公理体系,这本著作已经成为这个研究领域的经典。

对于绝大多数的随机事件,需要建立起这样一个信念:概率是随机事件的一个固有属性,但这个属性是未知的,只能对这个属性进行估计。

那么,我们应当如何估计未知的概率呢?

只有一个办法:调查研究,通过数据进行估计。

仍然考虑摸球的问题,调查的方法就是有放回地摸球,记录摸到各种颜色球的次数,称这样的记录为数据。其中,“有放回”的操作是为了保证每次调查的条件都是一样的,称这样取得数据的操作过程为随机抽样。凭借直观,可以想象随机抽样之后,通过数据分析至少可以进行下面的估计:1.估计出袋子中的白球比红球多;2.估计白球与红球的比例;3.如果知道球的总数,还可以分别估计白球和红球的数量。

一般而言,估计是一种推断的方法。通过数据对随机事件进行推断被称为“统计推断”或者“推断数据分析”。估计概率与定义概率是完全不一样的:定义概率需要对背景了如指掌,并且要给出相应的假设;估计概率只依靠数据,参照数据产生的背景建立随机模型,给出估计方法。

必须认真分析事件的本质,抽象出合理的数学表达,这就是建构模型的过程。常见的有伯努利模型、最大似然估计、误差模型。

虽然统计学要用数学语言进行表达,但与传统的确定性数学是合而不同,分析这个区别,不仅有利于了解统计学,也有利王深刻地理解数学。

大概有三个不同。

第一,立论基础不同。通过数量与数量关系的抽象,可以看到,数学是建立在概念和符号的基础上的,一个好的概念的形成(比如实数的定义)、一个好的符号表达(比如函数的连续),对数学的发展至关重要。而统计学是建立在数据的基础上的,是通过数据进行推断的。

第二,推理方法不同。数学的证明是基于公理和假设的,证明的过程依赖的是演绎推理,得到的结论是必然的。统计学强调的是数据产生的背景,根据背景寻找合适的抽象方法和推断方法,推理的过程依赖的是归纳推理,得到的结论是或然的。在后面几讲,还会专门讨论这两种形式的推理。

第三,判断原则丕同。因为传统数学研究的是确定性问题,因此对结果的判断原则只能是“对”或“错”。而统计学是通过数据推断数据产生的背景,允许人们根据自己的理解提出不同的推断方法,因此统计学对结果的判断原则只能是“好”或“坏”。在这个意义上,统计学不仅是一门科学,也是一门艺术,因为艺术作品允许“仁者见仁,智者见智”。

正如《大美百科全书》对统计学的定义:作为一个研究领域,统计学是关于收集和分析数据的科学和艺术,其目的是为了对一些不确定的事物进行较准确的推断。

在现代生活中,统计学变得越来越重要,主要原因是数据分析变得越来越重要。因为计算机科学和信息科学的迅猛发展,人们把数据等同于信息,对许多事情都进行数据化处理,包括言语、信号、图形、声音,把凡是能够承载信息的东西都形成数据,而统计学恰恰是数据分析的科学和艺术。

洁白

相关文章

  • 描述统计学之R语言实战1:表格法

    统计学是搜集、分析、表述和解释数据的科学与艺术,掌握统计学相关知识可以帮助我们更好的发现数据背后隐藏的价值,R语言...

  • 统计学

    统计学是收集和分析数据的科学和艺术。 统计学是应用数学的一个分支,主要通过利用概率论建立数学模型,收集所观察系统的...

  • 第一课 Background&基础语法(一)

    5.8 “数据科学家=统计学家+程序员+讲故事的人+艺术家。“DataScientist=statistician...

  • 统计学下的艺术分析

    《纳博科夫最喜欢的词》| 陈章鱼解读 《纳博科夫最喜欢的词》| 陈章鱼解读 建议WiFi环境下播放 关于作者 本·...

  • 《商务与经济统计》读书笔记(一)

    数据与统计资料 关键术语 统计学(statistics):搜集、分析、表述和解释数据的艺术和科学。 数据(data...

  • 【科学研究】20180205 解读:《信号与噪声》

    作者介绍 纳特•西尔弗(Nate Silver)《信号与噪声:大数据时代预测的科学与艺术》作者,统计学家、作家和《...

  • 书单

    《说服的艺术》,《关键20小时快速学会任何技能》 数学 《统计学习方法》作者:李航王萱认为,这本书由浅入深,涉及的...

  • 外国统计学优秀著作译丛 统计学

    01外国统计学优秀著作译丛 统计学.pdf: 在线阅读: 01外国统计学优秀著作译丛 统计学.pdf:

  • 恰似

    夜晚来临之时,听见窗外下起了小雨,伴着她到来时特有的魅力,思绪飘然,一时恍惚之间看到了你。 你说你...

  • 恰似

    恰似 浮光 在云水木隙 在明眸 化就化掉一整颗心子 去林中 去陌生的水湄 看帆布鞋沉默寡言 看一万种风用了一万种...

网友评论

      本文标题:恰似艺术的统计学

      本文链接:https://www.haomeiwen.com/subject/cvjzrdtx.html