美文网首页推荐系统遇到深度学习
美团机器学习实践第一章-问题建模总结

美团机器学习实践第一章-问题建模总结

作者: 文哥的学习日记 | 来源:发表于2019-01-16 14:32 被阅读631次

思维导图如下:

机器学习解决问题的通用流程

问题建模-特种工程-模型选择-模型融合。

问题建模应包含三方面的内容:评估指标、样本选择、交叉验证。

评估指标

评估指标很多,我们应该选择一个跟业务指标波动一致的评估指标,这样通过观察评估指标就能判断模型效果,可以大大提高模型迭代效率。

通常,线下使用的是机器学习评估指标,线上使用的是业务指标。为此,在一个新的问题的开始阶段,都会进行多轮模型迭代,来探索与线上业务指标一致的线下指标,尽可能使线下指标的变化趋势跟线上指标一致。

评估指标根据任务类型分类,可分为分类指标、回归指标、聚类指标和排序指标等。

分类指标

精确率、召回率

F1值

准确率与错误率

ROC曲线与AUC

对数损失logloss

回归指标

平均绝对误差MAE

平均绝对百分误差MAPE

均方根误差RMSE

均方根对数误差RMSLE

RMSLE对预测值偏小的样本惩罚比对预测值偏大的样本惩罚更大。

排序指标

平均准确率均值MAP

书中这里的公式是有问题的,我认为分母应该是正确样本的数量。

归一化贴现累计收益NDCG

样本选择

样本选择是数据预处理中一个非常重要的环节,主要从海量数据中识别和选择相关性高的数据作为模型输入。最理想的样本选择结果是,选择了最少量的训练集S,而模型的效果不会变差。样本选择的好处主要有:减小模型的运算时间、去除相关性低的数据、去除噪声数据。

样本选择有很多方法:数据去噪、采样、原型选择、训练集选择。

交叉验证

在离线环节,需要对模型进行评估,根据评估指标选出最佳模型。交叉验证是很好的方法。

交叉验证的主要方法有留出法、K折交叉验证和自助法Bootstrapping。

相关文章

  • 《美团机器学习实践》—— 思维导图

    分享一份对于书籍《美团机器学习实践》的思维导图总结。 第一章 问题建模 第二章 特征工程 第三章 常用模型 第四章...

  • 美团机器学习实践第一章-问题建模总结

    思维导图如下: 机器学习解决问题的通用流程 问题建模-特种工程-模型选择-模型融合。 问题建模应包含三方面的内容:...

  • 美团机器学习实践

    之前为了做房源标签,单独读过这本书的第五章,受益匪浅。 最近随手翻了下,发现其他章节的内容也干货十足,堪称机器学习...

  • 《美团机器学习实践》笔记

    https://book.douban.com/subject/30243136/ Performance Met...

  • 机器学习通用流程

    机器学习解决问题的通用流程主要分为4大部分: 问题建模: 解决一个机器学习问题都是从问题建模开始。首先需要收集问题...

  • 机器学习-问题建模

    机器学习的流程包括:问题建模、特征工程、模型选择、模型融合。其中问题建模的环节主要包括以下几个模块: 评估指标分类...

  • 2019-05-23

    该课系统地讲授机器学习面临的各种问题背景、建模、学习方法实现、性能评价 本课讲授内容包括如下几个部分第一章、 ...

  • python实践时间序列分析建模理论及代码实现

    python实践——时间序列分析建模理论及代码实现 python进阶教程 机器学习 深度学习关注 进入正文 声明:...

  • 分布式加速深度学习

    《美团“猜你喜欢”深度学习排序模型实践》 《Angel是腾讯开源的基于参数服务器理念开发的分布式机器学习平台,支持...

  • 《美团机器学习实践》—— 思维导图

    文章发布于公号【数智物语】 (ID:decision_engine),关注公号不错过每一篇干货。 转自 | Pyt...

网友评论

    本文标题:美团机器学习实践第一章-问题建模总结

    本文链接:https://www.haomeiwen.com/subject/brlmdqtx.html