美文网首页
《数据挖掘导论》知识点整理

《数据挖掘导论》知识点整理

作者: wshxj123 | 来源:发表于2016-11-24 15:43 被阅读228次

数据挖掘上课没怎么好好听,反而现在想自己多学一点了。最近发现Kaggle竞赛很有意思,但是自己基础太差了,所以定计划,每天看书30页左右,把自己感觉之前不知道的东西记录在这里。

第3章 探索数据

  • 众数(mode):具有最高频率的值。
  • 百分位数(percentile):第p个百分位数xp是一个x值,使得x的p%的观测值小于xp
  • 截断均值(trimmed mean):丢弃高端和低端(p/2)%的数据,再计算均值。
  • 极差(range):
    ![](http://latex.codecogs.com/gif.latex? range(x)=max(x)-min(x))
  • 方差(variance):
    ![](http://latex.codecogs.com/gif.latex? variance(x)=s_x2=\frac{1}{m-1}\sum_{i=1}{m}(x_i-\bar{x})^2)
  • 协方差矩阵(covariance matrix):两个属性的协方差是两个属性一起变化并依赖于变量大小的度量。
    ![](http://latex.codecogs.com/gif.latex? s_{ij} = covariance(x_i, x_j) = \frac{1}{m-1}\sum_{k-1}^{m}(x_{ki}-\overline{x_i})(x_{kj}-\overline{x_j}))
  • 相关矩阵(correlation matrix):
    ![](http://latex.codecogs.com/gif.latex? r_{ij} = correlation(x_i, x_j) = \frac{covariance(x_i,x_j)}{s_is_j})

相关文章

  • 《数据挖掘导论》知识点整理

    数据挖掘上课没怎么好好听,反而现在想自己多学一点了。最近发现Kaggle竞赛很有意思,但是自己基础太差了,所以定计...

  • 数据挖掘导论 - 1

    layout: posttitle: 数据挖掘基本概念 --《数据挖掘导论》categories: Coursed...

  • 《数据挖掘导论》学习

    数据挖掘导论读书笔记

  • 数据挖掘导论

    一、为什么要挖掘数据 1.数据丰富但信息贫乏 2.电脑便宜且强大 3.大量数据超出人的理解范围 4.数据收集与储存...

  • 数据挖掘导论

    什么是数据挖掘 数据挖掘(Data mining),它是数据库知识发现(英语:Knowledge-Discover...

  • 数据挖掘导论

    一、数据挖掘的定义 指通过从大量数据中通过算法搜索隐藏与其中信息的过程。其中机器学习是支撑数据挖掘的主要手段。 二...

  • 第二章 数据(1) --《数据挖掘导论》

    layout: posttitle: 第二章 数据(1) --《数据挖掘导论》categories: Course...

  • 数据挖掘学习笔记(一)

    导论 数据挖掘 数据库中知识发现 Knowledge Discovery in Database (KKD) 是将...

  • 浅谈数据挖掘(概论)

    浅谈数据挖掘(概论) 前言:学习资料的来源均出自,《图解机器学习》-杉山将,中国工信出版集团。《数据挖掘导论》-戴...

  • 【学习】数据挖掘导论

    链接: https://pan.baidu.com/s/1pIbKslArK8zlQ3f4UOyJZA 提取码: ...

网友评论

      本文标题:《数据挖掘导论》知识点整理

      本文链接:https://www.haomeiwen.com/subject/nvbbpttx.html