美文网首页
读机器学习

读机器学习

作者: 未央不了 | 来源:发表于2019-11-06 11:47 被阅读0次

一. K-近邻法

将计算目标数据与所有样本数据的距离,获取距离最近的*K*个元素.认为目标数据与这*K*个元素属性一致.
电影名称 打斗镜头 接吻镜头 电影类型
a 3 104 爱情片
b 2 100 爱情片
c 102 3 动作片
d 98 8 动作片
e 10 87 爱情片

给出电影f,打斗镜头:5,接吻镜头97.计算最近3(K)个(自行脑补坐标轴),类型为爱情片

二. 决策树

你是否玩过二十个问题的游戏:参与游戏的一方在脑海里想某个事物,其他参与者向他提问题,只允许提20个问题,问题答案只能用对和错回答.问问题的人通过推断分解,逐步缩小猜测事物的范围,最终给出游戏的答案

如何构造问题?

熵? 信息的期望值.热力学中的表示分子状态混乱程度的物理量.信息熵,是一种对信息混乱程度的量化描述.

变量的不确定性越大,熵也就越大,把它搞清楚所需要的信息量也就越大。
信息熵是信息论中用于度量信息量的一个概念。一个系统越是有序,信息熵就越低
反之,一个系统越是混乱,信息熵就越高。所以,信息熵也可以说是系统有序化程度的一个度量。

信息 如果待分类的事物可能划分在多个分类之中.则符号l(xi) = -log2P(xi)
P(xi)为选择该分类的概率.
计算熵 计算所有类别所有可能值包含的信息期望值.H = - ∑ni=1P(xi)log2P(xi),其中n为分类目录.
个人简单的认为:自定义分类,然后计算这个分类的熵.添加更多分类,观察熵的变化.(感觉没这么简单,可能最终衡量出一套,因为这个划分影响决策树下一分支的划分).按获取最大信息增益方式化分出数据.去划分数据集.创建决策树.

相关文章

  • 读机器学习

    一. K-近邻法 给出电影f,打斗镜头:5,接吻镜头97.计算最近3(K)个(自行脑补坐标轴),类型为爱情片 二....

  • 读《机器学习实战》

    前段时间看完《机器学习极简入门》,找到点门路,然后阅读有本机器学习的书籍时还是很费解,只能变实践边阅读。前几天...

  • 初识CNN

    读研以来不断地说机器学习,但是机器学习究竟是什么还是不清楚,直到老师要自己讲机器学习算法,我又正好抽到卷积神经网络...

  • 《机器学习》读中感

    最近下班后抽空阅读周志华老师所著《机器学习》一书,收获颇丰。 这本大名鼎鼎的机器学习教材,因其封面和书中算法示例皆...

  • 读芯术 - [周末AI课堂 - 16讲]非参模型初步(代码篇)-

    学习资料来源 读芯术【周末AI课堂】非参模型初步(代码篇)| 机器学习你会遇到的“坑” [感谢读芯君,感谢作者:唐...

  • 读芯术 - [周末AI课堂 - 15讲]非参模型初步(理论篇)-

    学习资料来源 读芯术【周末AI课堂】非参模型初步(理论篇)| 机器学习你会遇到的“坑” [感谢读芯君,感谢作者:唐...

  • 机器学习概述与算法介绍(二)

    机器学习概述 机器学习基本概念 机器学习基本流程与工作环节 机器学习中的评估指标 机器学习算法一览 3. 机器学习...

  • 论文推荐

    1.论文推荐:QA,增强学习,知识图谱,机器阅读理解 | 本周值得读 #40

  • word2vec与深度学习

    ​我挺喜欢机器学习这个方向,但这方面的经历实在不多:读研时上过《机器学习》的课,一塌糊涂,后来毕设所谓的研究中用过...

  • 怎样读文献(翻译)

    原文链接:怎样读文献(翻译) 微信公众号:机器学习养成记 搜索添加微信公众号:chenchenwings 学习前...

网友评论

      本文标题:读机器学习

      本文链接:https://www.haomeiwen.com/subject/kacubctx.html