美文网首页
特征选择前言

特征选择前言

作者: echolvan | 来源:发表于2019-12-24 15:50 被阅读0次

我们假设数据中没有冗余数据,并且包含了所有的重要信息。

首先第一个问题,如果我们没有业务知识,不知道特征的关键性,怎么选择?

这样在领域知识之内没有先验假设我们只能遍历所有可能的子集了。但是这只是理论可行,特征多,会遇到组合爆炸的,太多子集了,根本就算不出来。

产生一个候选的子集评价它的好坏基于评价结果产生下一个候选子集

  • 获取下一个候选特征子集
  • 评价候选特征子集的好坏
搜索方式

1. 前向搜索

image.png
2. 后向搜索
从全特征集一个个的剔除特征,和前向是反的。
3. 双向搜索
前后搜索结合进行
but!!这些都是策略都是贪婪的,因为它们仅仅考虑的是本轮的选定集最优。比如杂物i第三轮时a5优于a6那么选定集和{a2,a4,a5}然而可能第四轮的最优集和{a2,a4,a5,a7}不如{a2,a4,a6,a9},但是很遗憾,上述方法都无法做到,除非使用穷举法
评价候选子集

信息熵。

SUMARRY

上述的搜索方式:将前向搜索与信息熵相结合,这和决策树算法非常相似。而事实上决策树是可以用来特征选择的。

常见特征选择的方法:

  • filter过滤法
  • wrapper包装法
  • embedded嵌入法
    详细看另外一篇文章。
    --- 来自读西瓜书的理解 ---

相关文章

  • 特征选择前言

    我们假设数据中没有冗余数据,并且包含了所有的重要信息。 首先第一个问题,如果我们没有业务知识,不知道特征的关键性,...

  • 粒子群优化算法(PSO)之基于离散化的特征选择(FS)(一)

    前言:在机器学习中,离散化(Discretization)和特征选择(Feature Selection,FS)是...

  • 什么是超平面?

    前言:最近在学习特征选择算法,看到了一篇论文,里面提出了基于局部超平面的动态Relief特征选择算法。恰逢刚创博客...

  • 特征选择与特征子集(一)

    前言:本系列博客将介绍特征选择一系列相关的内容。 本节我们先简介特征工程中的三个组成部分。 特征工程 特征工程一般...

  • 什么是粗糙集(一)

    前言:最近一直在学Relief算法,属于特征选择的方面。而我想起了之前一直做的粗糙集,基于粗糙集的特征选择称为属性...

  • 决策树

    例子1 打网球 抓重点:每个特征的影响力 例子2 选择属性 例子3 特征选择特征选择2特征选择3随机森林选择特征...

  • 决策树: 特征选择之寻找最优划分

    前言决策树算法的三个步骤:特征选择、决策树生成、决策树剪枝。其中特征选择要解决的核心问题就是:每个节点在哪个维度上...

  • 3. 机器学习之特征选择

    1. 特征选择( Feature Selection ) 1.1 特征选择的定义 特征选择( Feature ...

  • 浅读机器学习有感(二)

    六、机器学习中的特征选择: 6.1什么是特征选择? 特征选择就是单纯地从提取到的所有特征中选择部分特征作为训...

  • 特征选择与特征学习算法研究--笔记1

    特征选择与特征学习算法研究 2.1特征选择 特征选择过程特征选择是对数据进行预处理的机器学习算法,通过从数据中筛选...

网友评论

      本文标题:特征选择前言

      本文链接:https://www.haomeiwen.com/subject/xixfoctx.html