统计基础入门10分钟
1、数据的种类
定义
数据分类包括数值型数据和类别型数据;
可以这样进行区分:能够通过测量获取到值的都是数值型数据,不能则是类别型数据
直观理解
《你好,李焕英》中那场排球赛的参赛队伍{铁娘子队,打铁娘子队};两个队伍名称本身不可测量即为类别型数据
那场排球比赛打铁娘子队得分{6};排球比赛得分可测量即为数值型数据;如果打铁娘子队参加三场比赛得分可表示为{6,10,15}
2、一组数据的整体指标
2.1、数值型数据指标
对于一组数值型数据一般需要我们了解的就是数据的变化范围、平均水平、稳定性
变化的范围即最小值~最大值;平均水平则是平均值;
稳定性以标准差进行描述,公式为:(其中n为本组数据的数量)。
直观理解
以某位短跑选手的百米冲刺的成绩例,来描述下标准差
| 选手冲刺成绩 | |
|---|---|
| 11秒 | |
| 14秒 | |
| 13秒 | |
| 11秒 | |
| 9秒 | |
| 8秒 | |
| 11秒 | |
| 均值 | 11秒 |
将如上数据转换为折线图(如下图)后,可知该选手每次冲刺成绩都围绕着均值线上下波动;而标准差就是用来衡量这种波动的数值。
现在就结合上图解释下标准差公式
- 如何计算标准差
-
便于记忆和理解的方式
由于标准差日常使用较少,为防忘记这里将公式改写成如下方式
2.2、类别型数据指标
相较于数值型数据,类别型数据衡量更加简单,其是以各类型的出现频数作为参考。 如:一周的天气情况:{晴,晴,晴,雨,阴,阴,阴}
| 天气 | 次数 |
|---|---|
| 晴 | 3 |
| 雨 | 1 |
| 阴 | 3 |












网友评论