美文网首页
面试 - 特征工程

面试 - 特征工程

作者: Kevin不会创作 | 来源:发表于2025-07-29 17:47 被阅读0次
  1. 数据归一化

    通过梯度下降法求解的模型通常需要归一化:线性回归、逻辑回归、支持向量机、神经网络。数据归一化可以加速搜索最优解。
    决策树模型并不适用归一化,因为归一化并不会改变样本在某一特征上的信息增益。
    零均值归一化:
    z=\frac{x-\mu}{\sigma}

  2. 类别型特征

    序号编码:通常用于处理类别间具有大小关系的特征。
    独热编码:通常用于处理类别间不具有大小关系的特征。

  3. 过拟合的处理方法

    基于模型的方法:

    • 简化模型,如将非线性模型简化为线性模型,减少神经网络层数与节点数。
    • 添加正则项(L1/L2正则项)
    • 集成学习(Bagging/Boosting)
    • 添加Dropout超参数

    基于数据的方法

    • 一定程度内的随机旋转、平移、缩放、裁剪、填充、左右翻转。
    • 对图像中的像素添加噪声扰动,比如椒盐噪声、高斯白噪声等。
    • 改变图像的亮度、清晰度、对比度、锐度等。
    • 对图片进行特征提取,然后在图像 的特征空间内进行变换,利用一些通用的数据扩充或上采样技术,例如SMOTE算法。
    • 生成式对抗网络(GAN)
    • 迁移学习,借用一个在大规模数据集上预训练好的通用模型,并在针对目标任务的小数据集上进行微调(fine-tune)。
  4. L1和L2正则项的区别

    L1正则(Lasso Regression)会使特征矩阵变得稀疏,自动进行特征选择,也就是将这些特征对应的权重置为0。适用于特征之间有关联的情况。

    L2正则(Ridge Regression)让所有特征的系数都缩小,但是不会减为0,它会使优化求解稳定快速。适用于特征之间没有关联的情况。

相关文章

  • 2018-04-03-机器学习相关

    No.1 特征工程 (1)使用sklearn做单机特征工程 - jasonfreak - 博客园 (2)特征工程实...

  • 机器学习之特征工程

    目录大纲 特征工程是什么? 特征工程的重要性 特征工程子问题:1.特征处理2.Feature Selection(...

  • 使用sklearn做单机特征工程

    使用sklearn做单机特征工程 | 转载 使用sklearn做单机特征工程 目录1 特征工程是什么?2 数据预处...

  • 特征工程

    http://www.cnblogs.com/jasonfreak/p/5448385.html

  • 特征工程

    特征工程  我们做比赛的初衷是想在比赛中锻炼用深度学习模型解决实际问题的能力。所以我们做特征工程时更多的考虑了深度...

  • 特征工程

    目录 1 特征工程是什么?2 数据预处理2.1 无量纲化2.1.1 标准化2.1.2 区间缩放法2.1.3 标准化...

  • 特征工程

    数据和特征的质量决定了机器学习的上限,而模型和算法只是不断逼近这个上限而已 数据清洗 数据样本抽样 异常值(空值处...

  • 特征工程

  • 特征工程

    首先,给一张特征工程的思维导图: 【如果要浏览图片,建议将其下载到本地,使用图片浏览软件查看】 关于特征工程(Fe...

  • 特征工程

    Feature Enginnering 应用机器学习的本质是特征工程。通过特征工程,我们能持续地提升效果,而模型算...

网友评论

      本文标题:面试 - 特征工程

      本文链接:https://www.haomeiwen.com/subject/stttgrtx.html