美文网首页
大数据之统计学基础(一) -- 描述统计

大数据之统计学基础(一) -- 描述统计

作者: k_wzzc | 来源:发表于2019-07-21 17:35 被阅读0次

描述统计

1.描述数据水平的统计量

  1. 平均数(平均数反映了一组数的平均水平,平均数会受到极端值的影响),在计算时一般使用算术平均数:

算术平均数 \ \ \bar{x} = {\displaystyle\sum_{i=1}^nx_i \over n}

  1. 分位数:四分位数、中位数(中位数反映一组数据的中等水平,只与数据的位置有关,不受极端值影响)、百分位数

中位数: M_e=\begin{cases} x_{(n+1) \over 2}, & n为奇数 \\ {1 \over 2}(x_{n \over 2}+x_{{n \over 2}+1}), & n为偶数 \end{cases} `

四分位数 \ \ \ \ \ \ \ \ Q_{25\%} = {n+1 \over 4} ;\ \ \ Q_{75\%}={3(n+1) \over 4}

  1. 众数(一组数据中出现频次最多的数)

2.描述数据差异的统计量

  1. 极差:一组数据的最大值与最小值之差(受极端值影响)。

R = Max(x) - Min(x)

  1. 四分位差(反映中间50%数据的离散程度,不受极端值影响)。

IQR = Q_{75\% }-Q_{25\%}

  1. 方差和标准差:标准差反映数据离散程度的绝对值,其数值受原始数据大小的影响;另外,标准差与原始数据的计量单位相同,因此,在比较不同样本数据的离散程度时,使用变异系数是更好的选择。

样本方差 \ \ s^2 = {\displaystyle\sum_{i=1}^n (x_i- \bar{x})^2 \over n-1} \\

  1. 变异系数(CV):变异系数又称离散系数,变异系数消除了计算数值和计量单位的影响,因此可以反映一组数据的相对离散程度(变异系数是相对值),主要用于比较不同样本数据的离散程度。

离散系数 \ \ CV = {s \over \bar{x}}

  1. 标准分数:标准化值,度量每个数值在该组数据中的相对位置

标准分数 \ \ z_i = {x_i -\bar{x} \over s}

3.描述数据分布形状的统计量

  1. 偏度系数:偏度系数用于描述数据分布的对称性,偏度系数越接近0,则数据的分布月对称,偏度系数为正,则数据分布为右偏,为负,则数据分布为左偏

  2. 峰度系数:描述数据分布峰值的高低。

相关文章

  • 125、描述统计学基础

    学习数据分析最重要的基础之一是描述统计学,我推荐《深入浅出统计学》这本书,那什么是描述统计学呢? 描述统计学就是将...

  • Matplotlib和Seaborn之描述统计学、离群值和坐标轴

    描述统计学、离群值和坐标轴范围 在创建图形和探索数据时,确保注意基本描述统计学传达的信息之外的信息。注意数据的各个...

  • 描述统计性分析

    统计学是人工智能的基础知识,也是投资领域的核心技能。 描述统计学即对大量信息进行归纳。数据越多,事实越模糊,所以需...

  • 统计与统计数据

    统计学的两个分支:描述统计和推断统计。 什么是描述统计呢?研究数据收集、整理和描述的统计学方法,包括如何取得所需数...

  • 初识统计学

    一、什么是描述统计学 官方定义:描述统计学(descriptive statistics)是研究如何取得反映客观现...

  • 第一篇 理解统计学中的基本概念

    统计学(stastics)是收集、分析和解释数据的科学。 描述统计(descriptive statistics)...

  • 大数据之统计学基础(一) -- 描述统计

    描述统计 1.描述数据水平的统计量 平均数(平均数反映了一组数的平均水平,平均数会受到极端值的影响),在计算时一般...

  • 统计第一课

    描述统计学(descriptive statistics)是研究如何取得反映客观现象的数据(data tabula...

  • 统计学基础1- 描述性统计

    一. 统计学概述 统计学可以分为: 描述统计学使用特定的数字或图表来体现数据的集中程度和离散程度。例: 每次考试的...

  • 统计学基础知识一

    统计学可以分为:描述性统计学与推断统计学 描述统计学:使用特定的数字或图表来表现数据的集中程度和离散程度。例如:考...

网友评论

      本文标题:大数据之统计学基础(一) -- 描述统计

      本文链接:https://www.haomeiwen.com/subject/iiaylctx.html