美文网首页
特征工程——特征抽取

特征工程——特征抽取

作者: 宅家学算法 | 来源:发表于2020-05-12 16:40 被阅读0次

  数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限。因此,特征工程在机器学习过程中占据极其重要的一部分,在这一过程中,需要最大限度地从原始数据中提取能够更好地代表预测模型潜在问题的特征以供算法使用,较好的特征工程能够极大的提高对未知数据的模型准确性
  特征抽取作为特征工程的一部分,主要是对原始数据进行映射转换为模型能够接受的新的特征。本文是一遍归集文章,主要整理几种比较常见的特征抽取方法。

1.字典特征抽取

  把字典中一些类别数据,分别进行转换成特征。因为原始数据中有的数据是文本的或者字符串的形式存在,这时候计算机并不能识别此类型的数据,因此需要对数据进行特征抽取。对于本来就是数值型的数据(如温度等)直接保留,而对于有类别的数据则要先转化为字典数据,sklearn采用one-hot编码的方式处理。

2.主成分分析PCA

  信号表示,特征抽取后的特征要能够精确地表示样本信息,使得信息丢失很小。

3.线性评判分析LDA

信号分类,特征抽取后的特征,要使得分类后的准确率很高,不能比原来特征进行分类的准确率低。

相关文章

  • 特征工程——特征抽取

      数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限。因此,特征工程在机器学习过程中占据极其重要的一部...

  • Python全栈工程师!要会哪些技术?全栈技术详解!最少五天掌握

    本章从商业数据分析和挖掘的角度详细地介绍了特征工程及其使用的响应方法:数据预处理、特征构造、特征抽取以及特征选择。...

  • 15.Spark学习(Python版本):特征处理相关的算法(T

    特征处理相关的算法,大体分为以下三类: 特征抽取:从原始数据中抽取特征特征转换:特征的维度、特征的转化、特征的修改...

  • sklearn学习 — 特征抽取

    特征抽取 sklearn库提供了特征抽取模块 sklearn.feature_extraction 对数据进行特征...

  • 特征工程

    机器学习之特征工程 特征工程的作用 从数据中抽取出对预测结果有用的信息 从数据中构建出对结果有用的信息 更好的特征...

  • 降维与特征选择

    第七章 降维与特征选择 [TOC] 1. 特征抽取和特征选择的区别 特征抽取:在已有的特征上,采用特征变换的方法,...

  • 3.1.1.1特征抽取

    3.1.1特征抽取 特征抽取,就是逐条将原始数据转化为特征向量的形式,这个过程同时涉及对数据特征的量化表示;而特征...

  • scikit-learn特征工程

    字典数据特征抽取 sklearn的DictVectorizer可以对字典做特征抽取,并以onehot形式编码。 有...

  • 特征选择, 经典三刀

    ​特征选择(Feature Selection,FS)和特征抽取(Feature Extraction, FE)是...

  • 特征抽取器

    文本的特点: 文本是一个序列 文本长度不固定 文本的位置是个重要的信息 文本的任务: 序列标注 分类任务 句子关系...

网友评论

      本文标题:特征工程——特征抽取

      本文链接:https://www.haomeiwen.com/subject/pglructx.html