美文网首页
机器学习之算法概览

机器学习之算法概览

作者: 有志者说 | 来源:发表于2017-11-29 00:38 被阅读48次

本文是斯坦福机器学习课程笔记第2篇:机器学习算法概览,主要是NG课程1-3,1-4两小节和李宏毅ML课程第1课内容的总结整理。本节不探讨算法的实现细节,只做总体的概览。
机器学习的算法有很多,请看下面一张图,这张图来自台湾李宏毅教授机器学习课程PPT,很好的概括了机器学习的常见算法,可以作为一个学习路线图。


ML-LearningMap

1.监督学习(Supervised Learning)

首先要理解监督的到底是指什么?个人理解就是训练数据有标签,比如面积,价格,房间数等,预测也有目标性,即成交价格,这就是所谓的“监督”。

1.1 回归(Regression)

NG课程里面举了一个预测房价的例子,还是比较容易理解的。如下图所示:


supervised-learning

上图表示根据某一地区房屋历史交易数据,可以在图上标出面积和房价的点,根据这些历史数据,可以拟合出一条面积和价格之间的直线,或者曲线,进而预测房屋价格。
根据已有房屋历史交易数据(即所谓的“正确答案”)来来预测房屋交易价格(即更多“正确答案”),是典型的监督学习,而且是线性回归算法。这里要理解回归(Regression)是什么含义?简单来说,回归就意味着预测结果是连续的(Continuous)。

1.2 分类(Classification)

如果预测结果是不连续的呢?这就属于分类问题,比如NG在课程中提到的癌症预测案例,如下图所示:


classification

根据一个人身上肿块大小,预测肿瘤是良性的还是恶性的,即有没有得癌症?因为结果要么是得了癌症,要么是没得癌症,只有两个结果,即结果是不连续的,离散的。本实例只有两个结果,即良性和恶性,算是一个Binary Classification,当然有Multi-Class Classification,比如新闻分类,可以有很多种。
上述两个案例中,都是只有一个特征,实际问题中特征肯定不止一个,比如房间预测案例中房间数目,癌症预测案例病人年龄,都是有价值的特征。有一些算法可以处理多个甚至无限多特征,比如支持向量机(SVM),里面有 一个巧妙的数学技巧,能让计算机处理无限多个特征。
另外,监督学习中还有决策树,深度学习等,也属于分类算法,后面的课程笔记中再详细说明。

2.无监督学习(Unsupervised Learning)

无监督学习肯定是相对监督学习而言,无监督学习不管是训练数据还是学习目标都不明确,没有任何标签(Unlabeled data),没有“正确答案”,只有一个数据集,算法自己从数据中学习出有价值的东西出来。最常见的应该是聚类算法,聚类算法应用很广泛,比如谷歌新闻分类,DNA微观数据集,大型计算机集群,推荐系统,天文数据分析等。
NG在课程中举了一个鸡尾酒宴问题(Cocktail Party Problem)的案例,即在一个嘈杂的环境中,如何根据两个麦克风输入的声音,提取出某一个人或者某个东西发出的声音,是一个无监督学习的例子。
除了无监督学习,图中还提到的几个算法,下面逐一简单说明之:

  • Semi-supervised Learning,半监督学习是监督学习与无监督学习相结合的一种方法,同时使用未标记和有标记数据,来进行模式识别工作,能够提升学习效率;
  • Transfer Learning,顾名思义就是就是把已学训练好的模型和参数,迁移到新的模型来帮助新模型训练数据集。
  • Reinforcement Learning 增强学习(或强化学习)是近年来机器学习和智能控制领域的主要方法之一。相比其他学习方法,增强学习更接近生物学习的本质,因此有望获得更高的智能,这一点在棋类游戏中已经得到体现,想必大火的阿尔法狗让你记忆犹新!
    阿尔法狗

3.另一种分类

在网上看到过一篇机器学习的入门文章(计算机的潜意思《让我们从机器学习谈起》),总结的也比较好,如下:

  • 回归算法 入门算法,包括线性回归和逻辑回归。首先是线性回归,比如房价求解问题,寻找一条直线匹配所有数据,常用最小二乘法求解,但效率不高。数值计算用来提升计算的准确性和效率问题,例如梯度下降及牛顿法。其次是逻辑回归,与线性回归类似,但本质不同,线性回归处理的是数值问题,预测结果也为数值,逻辑回归属于分类算法,预测结果是离散分类。

  • 神经网络,人工神经网络(ANN),基于大脑机理研究,在语音和视觉识别上效果好,BP算法诞生后发展进入新阶段。分解与整合是主要机理,但训练过程仍然困难,90年代后SVM算法取代了神经网络的地位。

  • SVM(支持向量机)支持向量机算法诞生于统计学界,是一种数学成分很浓的算法,是逻辑回归算法的强化,通过给与逻辑回归算法更严格的优化条件,通过高斯“核”获得比逻辑回归更好的分类界限,所谓“核”事实上就是一种特殊的函数,最典型的特征是可以将低纬空间映射到高纬空间。

  • 聚类算法 没有标签,无监督算法的典型代表。计算种群中的距离,根据距离远近将数据划分为多个族群。

  • 降维算法 无监督学习算法的一种,将数据从高纬降到低维,主要作用是压缩数据与提升机器学其他算法的效率。。

  • 推荐算法 电商网站用的最多,根据用户特征推荐可能感兴趣的东西。一个是基于物品内容的推荐,一个基于相似用户的推荐。

  • 其他 高斯判别,朴素贝叶斯,决策树等
    最后,奉上一张来自http://scikit-learn.org的神图,如下:

    机器学习算法分类.jpg

    -- THE END --

AI_Notes,欢迎关注

相关文章

  • 机器学习之算法概览

    本文是斯坦福机器学习课程笔记第2篇:机器学习算法概览,主要是NG课程1-3,1-4两小节和李宏毅ML课程第1课内容...

  • K-Means算法

    参考链接:1. python机器学习实战之K均值聚类2. 机器学习实战之K-Means算法3.《机器学习实战》(十...

  • 机器学习常见算法汇总

    1.机器学习&数据挖掘笔记_16(常见面试之机器学习算法思想简单梳理)

  • 2019-10-29

    Day2 简单线性回归模型 机器学习入门--简单线性回归机器学习算法之线性回归算法 导入库matplotlib 绘...

  • 机器学习概览

    Machine Learning,经过几十年的发展,特别是近年来工业界的大规模应用和媒体界的推波助澜,得到越来越多...

  • 学习SceneKit之几何体概览

    学习SceneKit之几何体概览 学习SceneKit之几何体概览

  • 《Scikit-Learn与TensorFlow机器学习实用指南

    第1章 机器学习概览 来源:ApacheCN《Sklearn 与 TensorFlow 机器学习实用指南》翻译项目...

  • Scikit-Learn & TensorFlow机器学习实用指

    机器学习实用指南(一):机器学习概览 作者:LeonG本文参考自:《Hands-On Machine Learni...

  • 人工智能 机器学习 深度学习

    一、人工智能包括机器学习,而机器学习包括深度学习。 人工智能就是算法组成的, 而机器学习就是包括很多算法,机器学习...

  • 机器学习和算法

    机器学习算法 github主页:机器学习和算法 最近以来一直在学习机器学习和算法,然后自己就在不断总结和写笔记,记...

网友评论

      本文标题:机器学习之算法概览

      本文链接:https://www.haomeiwen.com/subject/evuybxtx.html