前言 在处理数据的时候,经常会遇到两个名词Scale和Normalization,这两个名词经常会被混杂着使用,让...[作者空间]
一、概念 1、关联规则 关联规则是数据挖掘中的典型问题之一,又被称为购物篮分析,这是因为传统的关联规则案例大多发生...[作者空间]
核函数是能够将低维不可分的数据映射到高维空间进行线性可分时能够降低数据处理难度的重要手段。核函数的本质就是一种将一...[作者空间]
基于划分的方法是用对象之间的距离进行聚类,这样的方法只能发现球状的簇,而在发现任意形状的簇上遇到了困难,因此有人提...[作者空间]
层次聚类方法是古老而且常用的聚类方法。层次聚类方法的基本思想是:通过某种相似性测度计算节点之间的相似性,并按相似度...[作者空间]
基于划分的方法(Partition-based Methods):其原理简单来说就是,想象你有一堆散点需要聚类,想...[作者空间]
一、降维的概念 降维就是指采用某种映射方法,将原高维空间中的数据点映射到低维度的空间中. 1、降维的必要性 多重共...[作者空间]
一、概念 1、什么是稀疏矩阵 在矩阵中,若数值为0的元素数目远远多于非0元素的数目,并且非0元素分布没有规律时,则...[作者空间]
降维往往作为预处理步骤,其中独立成分分析、因子分析和主成分分析比较流行,主成分分析(PCA)最为广泛。 PCA借助...[作者空间]
泊松分布 泊松分布是统计与概率中重要的离散分布之一,泊松分布表示在一定的时间或空间内出现的事件个数,比如某一服务设...[作者空间]
文章作者:Tyan博客:noahsnail.com | CSDN | 简书 1. 引言 贝叶斯估计、最大似然估计(...[作者空间]