一、kmeans简介 k-means:无监督学习算法,用于将给定训练样本D划分成k个类,用Ck表示。 算法原理: ...[作者空间]
bagging和boosting都属于组合学习算法,都是将简单的分类或者回归算法组合在一起来提高模型的分类或者回归...[作者空间]
一、什么是过拟合 过拟合的表现:模型训练时候的误差很小,但在测试的时候误差很大。 过拟合本质原因: 模型相对于训练...[作者空间]
一、正则化基础 正则化等价于结构风险最小化,就是在经验风险后面加上了表示模型复杂度的正则化项或惩罚项。 正则化的作...[作者空间]
1、为什么要进行交叉验证? 目的:为了得到可靠稳定的模型 交叉验证是一种模型选择方法,其将样本的一部分用于训练,另...[作者空间]
以前一直以为GBDT算法十分的什么,而且十分难懂,但是最近看了李航老师的《统计学习方法》一书的第八章,从AdaBo...[作者空间]
这是一个非常好,也非常值得思考的问题。换一个方式来问这个问题:为什么基于 tree-ensemble 的机器学习方...[作者空间]
最近在弄毕设中需要用到GBDT,关于调参这块一窍不通,然后找到了一篇很好的介绍它调参的文章,这里拿来共享一下。 h...[作者空间]
1.gbdt以CART作为基分类器,xgb还支持线性分类器,这个时候xgb相当于带L1和L2正则项的LR或线性回归...[作者空间]
时间都是虚妄。1.实际回答中要举例子时,不要说比如,而要说:以当时我做为例,xxxx2.讲述一个事例时先讲结论,做...[作者空间]
今天是9.25r。不,是9.26r了。继续整理之前简历上的盲点,总是希望去做到更好。至少无论何时都不会紧张,坦然面...[作者空间]
9.25r早上面网易数据挖掘工程师岗位,第一次面数据挖掘的岗位,只想着能够去多准备一些,体验面这个岗位的感觉,虽然...[作者空间]
综述 GBDT(Gradient Boosting Decision Tree) 又叫 MART(Multiple...[作者空间]
电子商务是互联网应用中发展期最早且模式最为成熟的商业模式,其用户和业务所带来的数据规模不断扩大,如何从大数据获取更...[作者空间]