中位数还是能正确的描述出这批数据的整体收入水平,不会像平均值那样因为异常的数值产生变化。
image.png
四分位数:
image.png
整个数据集按从小到大排序,最小的数值位于最左边,叫做下界。最右边的数值位于最右边,叫做上界。中位数把数集分成两个50%,下四分位就是把前50%分成两个25%,上四分位就是把后50%,分成两个25%。
直接肉眼看四分位数的5个数值是看不出什么东西的,为了方便人类大脑直观形象的理解四分位数,用于表示四分位数的箱线图被发明了。
image.png
上界是22,但中位数离下四分位数较近,表明大部分数据集中盒子的下端,即大部分数据的值集中在下四分位数和中位数之间。
中位数是资料的集中性描述,还是以这张图为例:
image.png
image.png
大部分人(4人)的收入水平在12万左右,人数集中在12万左右,只有马云(1人)收入10亿,也就是说看中位数(Q2)相当与看大多数人的水平,也就是看集中性,而结合了上下界就可以看出大部分人的水平是偏高还是偏低,Q1其实是一半人的中位数,根据Q1就可以看出这一半人的集中水平是多少,是偏低还是偏高,Q3和Q1同理,看的是另一半人的集中水平。所以通过箱线图就可以看出数据的整体分布。
参考文章:
https://zhuanlan.zhihu.com/p/235345817
https://www.zhihu.com/question/54858749/answer/202280013













网友评论