美文网首页
特征工程学习

特征工程学习

作者: 13351 | 来源:发表于2019-03-26 18:36 被阅读0次

原博客作者:http://www.cnblogs.com/jasonfreak/p/5448385.html

使用sklearn做单机特征工程

导入鸢尾花数据库,包含四个变量(sepal length、sepal width、petal length、petal width)学习目的是对鸢尾花进行分类,可以看到这里已经设定好了是4个特征,遇到具体问题的时候怎么设定更好的特征决定了结果的上限

from sklearn.datasets import load_iris

#导入IRIS数据集
iris = load_iris()

#特征矩阵
iris.data

#目标向量
iris.target

数据预处理

提取的特征可能存在的问题:
刚刚提取出来的特征,可能有冗余、量纲不同

可能定性特征、处理方法:

  1. 一个定性特征可以赋值1,2,3,4但是这对调参来说很不友好
  2. 更好的方法是,把这一个定性特征的各种值态认为是多个特征,当这一个定性特征取第i种值态时,就光给这个值态赋值 1 ,其他的赋值为0,实际上是把定性特征用哑变量编码了,对于线性模型,这种哑变量赋值可以达到非线性的效果。

可能数据缺失

缺失值需要补充

信息利用率低

刚才的哑变量编码的方式可以使得线性模型变得非线性,定量特征多项式话也可以达到非线性的效果。

sklearn 的preprocessing库来做数据处理,可以覆盖以上问题的解决方案

无量纲化

常见的是标准化和区间缩放法,标准化前提是特征服从正态分布(正态检验),标准化之后特征转化成了标准正态分布,

标准化

image.png

相关文章

  • sklearn库-特征工程

    sklearn作为python机器学习的一个常用库,可以用来做特征工程,算法的调用,模型的评估 特征工程 特征工程...

  • 深度学习中的特征工程-特征筛选

    在深度学习中是否需要特征工程中,阐述了在工业界的深度学习应用中,对特征工程的必要性。 在:高频特征打压 中通过特征...

  • 特征预处理

    前言 特征工程在机器学习中占有相当重要的地位,,那么特征工程是什么呢? 特征工程是利用数据领域的相关知识来创建能够...

  • 【特征工程】特征选择与特征学习

    特征选择与特征学习 在机器学习的具体实践任务中,选择一组具有代表性的特征用于构建模型是非常重要的问题。特征选择通常...

  • 特征工程

    做多模态融合需要特征工程知识,所以来学特征工程,最近还要学深度学习算法,统计学方法,好多东西要学!特征工程入门的介...

  • [Deep Learning] 特征工程

    特征工程(Feature Engineering)是从原始数据中创造新的特征以提升算法学习效果的过程。特征工程与特...

  • 特征工程

    Feature Enginnering 应用机器学习的本质是特征工程。通过特征工程,我们能持续地提升效果,而模型算...

  • 机器学习特征工程--特征选择

    前言 特征工程是数据分析中最耗时间和精力的一部分工作,它不像算法和模型那样是确定的步骤,更多是工程上的经验和权衡。...

  • 【机器学习】特征工程:特征选择

      特征选择应该算是机器学习中最重要的环节之一了,虽然在许多机器学习相关的书里很难找到关于特征选择的详细内容。对于...

  • 【机器学习】特征工程:特征组合

      为了提高复杂关系的拟合能力,在特征工程中经常会把一阶离散特征两两组合,构成高阶组合特征,即不同类型或者不同维度...

网友评论

      本文标题:特征工程学习

      本文链接:https://www.haomeiwen.com/subject/dmowvqtx.html