美文网首页大数据,机器学习,人工智能机器学习与数据挖掘机器学习
机器学习(1):常见术语 | 模型 | 样本 | 特征 | 标签

机器学习(1):常见术语 | 模型 | 样本 | 特征 | 标签

作者: 广州小程 | 来源:发表于2019-05-21 16:44 被阅读1次

说到机器学习,或讨论这个事情时,什么训练、样本、模型或算法就会蹦出来,今时今日什么事情大家都知道一点点,很多代表就是这样来的。但是,对于真心想弄清楚一个事情的我们来说,应该要理解一些基本的术语,所以这里就说一些机器学习时遇到的基本术语,也不是全部,说全部还太早。至于为什么不说tf,因为tf是去到代码的级别了啊,这个他日再相逢。

(1)标签

对于机器学习,我们经常说,要训练机器,让它达到一个最佳的状态,然后用它来预测一些事情。所以,我们的目的,是预测一些信息。

预测的信息,叫作标签。不预测,通过人工建立的信息,也叫作标签。标签就是一个信息。

由于信息多种多样,所以标签也就多种多样。

标签可以表示一类物体,比如标签是“苹果”、“香蕉”,比如标签是“红色”、“橙色”。标签可以表示变化,比如标签是“明天的天气”、“下半年的房价”、“这个股票的趋势”。标签可以表示含义,比如标签是“01表示什么”、“这个动作是什么意思”。等等。

我们说某某人是什么性格,这个就是打标签,比如说某人很“风趣”、“稳重”,这些都是标签,根据这些标签就可以聚类,比如把“稳重”的人聚成一类。在数字时代,很多事物都可以打标签,标签也有意义。比如文章可以标签:“java”、“机器学习”等,比如视频可以标签:“温情”、“恐怖”等,音频可以标签:“民谣”、“慢节奏”、“男低音”等。

所以,标签几乎是你能想到的任何事物或事情。

(2)特征

标签是一个信息,至于是什么信息,跟特征有直接关系。

特征就是一系列的信息,用来表征事物,映射出标签。特征应该是具体可量化的信息,不包括主观感受。

说一个人“稳重”,是根据这个人的特征来评定的,比如TA再三确认问题、及时反馈进度、结束后回顾总结,等等,具备这些特征,我们就给TA打上“稳重”的标签。

(3)模型

模型,就是能训练与预测的程序。

模型的训练就是固化特征与标签的关系。

模型最终用于预测标签,也就是根据特征,判断出标签是什么。

从训练与预测的角度,模型的工作图是这样的:


模型工作图

从模型预测的信息来看,可以把模型分为回归模型跟分类模型。

回归模型,用于预测“未来”会发生的事情,比如“明天腾讯的股值是否会上涨”。

分类模型,用于预测事物是哪一类,比如“这个东西是苹果”。

(4)样本

样本是数据实例,是特征的封装。

样本可以带标签,或不带标签。

带标签的样本,可以用于模型的训练。

不带标签的样本,可用于模型的预测。

大量而特征良好的带标签样本,是机器学习的关键。

好了,就这么多了。简单来说,机器学习的概念可以从模型说起,模型就是具备预测能力的系统,可以预测末来(叫回归模型),可以分类事物(叫分类模型)。模型接受训练,而且一定要训练,不断训练不断进化,比如从一个正方形训练成一个圆,再训练成一个椭圆,而这个椭圆可能就是一个可用的预测状态,这个训练过程有可能是很漫长的。另一方面,要训练,就一定要用到样本,样本就是特征的集合,对于训练,这个样本必需要有标签。什么特征就有什么标签,就是这个关系,训练就是要强化模型对特征与标签的关系。所以,对于机器学习来说,有两个关键,一个是良好的模型,另一个就是大量良好的样本,而这两个关键,真要感谢无私共享的人。


follow your heart

相关文章

  • 机器学习(1):常见术语 | 模型 | 样本 | 特征 | 标签

    说到机器学习,或讨论这个事情时,什么训练、样本、模型或算法就会蹦出来,今时今日什么事情大家都知道一点点,很多代表就...

  • 机器学习

    机器学习 Chapter One 样本和模型 样本 标签 特征 模型 模型定义了特征与标签之间的关系。例如,垃圾邮...

  • 机器学习第一次尝试

    首先了解几个机器学习中常见的术语的意义一个机器学习模型的质量问题,从对训练集样本拟合程度的角度,可以分为欠拟合(U...

  • 神经网络与深度学习第二章阅读

    第二章机器学习概述 2.1 基本概念 基本概念:样本、特征(属性)、标签、模型、学习算法这里举了一个买芒果的例子。...

  • 入门

    了解机器学习 标签需要通过机器学习模型判断出的结果 特征机器学习模型进行判断的条件(可以是很多的变量) 模型机器学...

  • 2.1线性神经网络

    1. 线性回归模型 1.1 模型单样本:#为参数,为样本特征样本集:#X形状为[n,d],n个d个特征样本集合 损...

  • 吴恩达机器学习笔记(1)

    一.初识机器学习 1.监督学习 在监督学习中,训练数据既有特征又有标签,通过训练,让机器可以自己找到特征和标签之间...

  • 客户分群-聚类算法

    机器学习算法分类 有监督学习 有训练样本 分类模型 预测模型 无监督学习 无训练样本 关联模型 聚类模型 聚类算法...

  • 机器学习中常见函数

    1、激活函数 常用于神经网络,激活函数增加了神经网络模型的非线性特征 2、损失函数 机器学习过程中中,我们期望样本...

  • 基于sklearn的文本特征抽取

    理论 机器学习的样本一般都是特征向量,但是除了特征向量以外经常有非特征化的数据,最常见的就是文本 结构化数据 当某...

网友评论

    本文标题:机器学习(1):常见术语 | 模型 | 样本 | 特征 | 标签

    本文链接:https://www.haomeiwen.com/subject/lzijzqtx.html