美文网首页
16.算法选择

16.算法选择

作者: 袁一帆 | 来源:发表于2016-03-14 14:46 被阅读189次
Scikit 官方图

简单看一下(点击看大图
四大类解决方案

  1. 分类
  2. 回归
  3. 聚类
  4. 降维

预测结果是一个类别,且现在有已标记数据的情况

  1. 对于大量数据 (10w+),在线学习
    1.1 利用SGD(stochastic gradient descent )随机梯度下降方法
    1.2 SDG,效果不好改用 kernel approximation 核逼近的方法
  2. 对于非海量数据
    2.1 线性SVC(多分类是一对一模式)
    2.2 若不管用,则

2.2.1 文本数据用朴素贝叶斯
2.2.2 非文本数据用KNN,
2.2.3 效果不好则尝试基于SVC和投票分类器的集成学习

预测结果是一个类别,没有标记好数据的情况

  1. 对于知道类别数量的情况
    1.1 利用KMeans
    1.2 效果不好,则利用Spectral Clustering(谱聚类)或者高斯混合模型聚类
  2. 对于不知道类别数量的情况
    2.1 数据量小的情况时用MiniBatch Kmeans,或者VBGMM

预测结果是一个连续的数值

  1. 小数据量
    1.1 一小部分特征重要的情况用:Lasso()或者ElasticNet()
    1.2 利用RidgeRegression或者SVR(linear)
    1.3效果不好用集成式回归和SVR(rbf)
  2. 大数据量
    2.1 随机梯度下降(SGD Regressor)

预测结果也不是一个数值

  1. 随机主成分分析(randomized PCA)
  2. 效果不好则观察数据集大小
    2.1 大数据集用核逼近
    2.2 小数据集利用Isomap(Isometric Feature Mapping)和谱嵌入(spectral embedding)
    2.3 效果不好则用,LLE

相关文章

  • 16.算法选择

    简单看一下(点击看大图)四大类解决方案 分类 回归 聚类 降维 预测结果是一个类别,且现在有已标记数据的情况 对于...

  • 16.哈希算法

    1.定义 将任意长度的二进制值串映射为固定长度的二进制值串,这个映射的规则就是哈希算法,而通过原始数据映射之后得到...

  • 算法-选择排序

    算 法:选择排序算法时间复杂度: 选择排序算法概述 选择排序伪代码 选择排序实现 选择排序算法概述 排序算法有许...

  • 16.排序算法(7)

    1.归并排序介绍 2. 代码实现

  • 算法4:插入排序和选择排序算法的比较

    排序算法列表电梯: 选择排序算法:详见 《算法4》2.1 - 选择排序算法(Selection Sort), Py...

  • 改变命运的概率

    学习老喻《人生算法》"16.宿命:用概率思维提高你的胜算" 先上笔记脑图: 假设你今后的人生,还有10次改变人生的...

  • 快速选择算法(Quick Selection)

      因为快速选择算法是基于快速排序算法改进而来,并且两个算法的作者都是Tony Hoare。所以在讲解快速选择算法...

  • 第二章:排序基础

    选择排序算法(selectionSort) 算法思想: 算法图示: 使用模板(泛型)编写算法:随机生成算法测试用例...

  • 推荐系统总结4(流行算法变种)

    16. 冷启动问题(Cold-Start)+探索利用问题(EE) Bandit 问题定义:在众多备选方案选择中,选...

  • 算法的时间和空间复杂度

    什么叫做算法: 选择怎样的算法 选择算法主要从【时间】和【空间】两个角度去考量 时间维度:是指执行当前算法所消耗的...

网友评论

      本文标题:16.算法选择

      本文链接:https://www.haomeiwen.com/subject/dywxlttx.html