美文网首页
简单统计学-读书笔记

简单统计学-读书笔记

作者: 橘猫吃不胖 | 来源:发表于2020-07-09 16:52 被阅读0次

本书的目的是帮助我们院里错误,通过本书,我们将学到一些简单的指导准则,用于识别其他人或者你自己说出的不靠谱的观点。

模式、模式、模式

章鱼保罗的故事,一只章鱼(章鱼是最聪明的无脊椎动物)成功预测了7场2010年世界杯比赛的获胜者。

章鱼真的可以预测未来吗?

事实并非如此,作者从多个角度来解释的这其中的“黑幕”,比如只公布预测成功的消息,而失败的并没有被报道出来;

我们通常倾向于寻找模式并且相信我们所观察到的模式是有意义的。

不再神奇的超级畅销书

当数据涉及人们的选择时,就会出现“自选择偏差”,在这种情况下,对于做出不同选择的人进行比较的做法是靠不住的。
在我们通过观察人们的行为而收集的“观测性数据”中,自选择偏差非常普遍。人们可以选择自己的行为,因此他们的选择也反映了自身的特点。要想避免这种自选择性偏差,可以进行对照实验,即将人们随机分配到不同的小组里,然后告诉他们应该怎样做。

根据这个例子,如果把警察都解雇掉,难道投票率会提升??
这也是一个谬误,首先这个人群就是筛选出来的,这个样本无法代表整体,这个例子中涉及2个问题,一个是否投票,一个是否犯罪,也许是不投票的人更容易犯罪。


自选择性的观测数据,也类似与有偏差的样本,也就是样本数据是经过筛选的,而不是随机的。

幸存者偏差
回溯性研究往往存在幸存者偏差,当我们选择现在的样本并回顾过去时,我们只能看到幸存者。老年人的历史医疗记录中排除了没有活到老的个体,公司财务历史记录中排除了已经破产的公司。

观测性研究,同样存在幸存者偏差。

作者提到了一个观点,就是一本畅销书《从优秀到卓越》,这本书我是听过的,但是这本书同样存在一个致命的问题:幸存者偏差,这是一项存在幸存者偏差的回溯性研究。

我们会自然地根据我们看到的现象得出结论。我们还应该考虑我们没有看到的事情。为了避免幸存者偏差,我们应当从过去开始,并向未来展望。

被误传的谋杀之都

安慰剂效应
只有通过对照实验得出的结论,才具有参考意义,单凭一组实验数据,很容易被“安慰剂效应”影响,得出错误结论

当基数很小时,一个统计以外可能会产生巨大的影响。

当任何两样事物随时间增长时,它们之间可能没有任何因果关系,但他们仍然具有统计相关性。

新的经济学上帝

图像可以帮助我们解释数据,作出判断,发现倾向、模式、趋势和关系;
一张图片的价值可能胜过千言万语;
但图像可能有意无意地扭曲或破坏数据。

关于图形的一些迷惑性


不仔细看的话,的确可以得出这个结论,但是仔细分析下这个图表,会发现,他的横坐标时间轴,前几个值都是10年未单位,而最近的只有4年,用四年和十年对比??

坐标轴的起始点,每一个单位代表的意义,都存在被恶意修改的可能

  • 调整坐标轴的起始点,通常是纵坐标不从零开始,这就放大了数据的波动性
  • 隐藏纵坐标的数字,更容易迷惑读者
  • 时间轴的单位,比如同一个单位,有的代表1年,有的代表10年,就是影响数据的观察
  • 隐藏某些时间段,来放大影响
  • 使用双轴,叠加上述其他的操作,来增强对比
  • 切换横纵坐标,这个手法,很厉害

将时间轴,放在纵轴上,结论就发生了逆转
图像可以揭示某种模式,比如收入随时间的变化以及收入与支出的相互关系。图像也会扭曲数据,误导读者。

几个有意思的悖论:
三门问题

二孩问题

辛普森悖论

当聚合数据被分解时,其中的模式发生逆转的现象

要想注意到可能的辛普森悖论,关键是考虑是否存在被忽略的混杂因素

这是一个悖论,不是一个错误,只是说,我们在看数据的时候,需要注意到其中的混杂因素

相关文章

网友评论

      本文标题:简单统计学-读书笔记

      本文链接:https://www.haomeiwen.com/subject/fdgccktx.html