归一化,使所有特征值归一道01之间,统一量纲,可以加快计算,同时提高精度。(之字形逼近与直接逼近);数据的归一化不是万能的,在实际使用中,通过梯度下降法求解的模型通常是需要归一化 的,包括线性回归、逻辑回归、支持向量机、神经网络等。但是对于决策树则不适用,一个节点是否分裂,与其值的绝对大小没有关系。
标准化:神经网络每一层的输入都不同的分布,只能采用较小的学习率去学习,做了BN等标准化后,可以增加学习的容易性。
离散化。逻辑斯特回归等将连续性数据转化为离散性数据。有利于模型快速迭代、加大拟合。模型使用离散特征还是连续特征实际上是“海量离散特征+简单模型”与“少量连续特征+复杂模型”等权衡。













网友评论