模拟人类思维的机器学习工具
机器学习
- 能够做预测,因为数据包含某种模式。
- 特征空间
- 过拟合
- 模型越复杂,风险越高
- KNN,定义距离算法,K太大太小都有问题。
- 高位空间,距离的概念很不确定,KNN不容易发挥作用。
- 贝叶斯出现
- 决策树,优先级计算
- 信息熵,把信息分类的程度
- 无结果数据集,降维(冗余的特征)
PCA,降维
- 无结果数据集,聚类
至此看完第21讲。
22.2
-
RNN,回路,信息循环,记忆基础。
RNN
前馈网络VS循环网络
22.3 语言模型N-gram
-
一个单词受前面N-1个单词的影响。
N-gram
22.4
- W不变
-
每一次传递都包含之前的所有结果,即保留历史状态了。
RNN两种表达方式
训练W是重点。
信息传播有衰减,本质上或许也合理。
- word2vec,能精细化语言编码,使得单词数量下降
22.7 RNN诗人
22.8 时间因素
- 长短记忆网络,长短记忆机,克服RNN信息衰减的问题。
看完第22讲










网友评论