美文网首页
动手学深度学习-Task02

动手学深度学习-Task02

作者: 乔咏田 | 来源:发表于2020-02-14 15:44 被阅读0次

任务名称

文本预处理;语言模型;循环神经网络基础

学习心得

1、鉴于自己从事NLP已有一段时间,因此该部分还是稍微轻松一些。

2、以前总是直接用开源的已经训练好的语言模型,大部分都是word2vec的预训练模型,以及后面新出现的比较强大的BERT等。没有自己动手去研究语言模型的来龙去脉,正好借此机会补习一下。

3、两种采样方式:

随机采样:在随机采样中,每个样本是原始序列上任意截取的一段序列,相邻的两个随机小批量在原始序列上的位置不一定相毗邻。

相邻采样:在相邻采样中,相邻的两个随机小批量在原始序列上的位置相毗邻。

4、语言模型困惑度(perplexity):用来评价语言模型的好坏。困惑度是对交叉熵损失函数做指数运算后得到的值。

最佳情况下,模型总是把标签类别的概率预测为1,此时困惑度为1;

最坏情况下,模型总是把标签类别的概率预测为0,此时困惑度为正无穷;

基线情况下,模型总是预测所有类别的概率都相同,此时困惑度为类别个数。

显然,任何一个有效模型的困惑度必须小于类别个数。

困惑度(perplexity)的基本思想是:给测试集的句子赋予较高概率值的语言模型较好,当语言模型训练完之后,测试集中的句子都是正常的句子,那么训练好的模型就是在测试集上的概率越高越好,公式如下:

由公式可知,语言模型越好,困惑度越小。

相关文章

  • 动手学深度学习-Task02

    任务名称 文本预处理;语言模型;循环神经网络基础 学习心得 1、鉴于自己从事NLP已有一段时间,因此该部分还是稍微...

  • 2022-02-15

    《动手学深度学习》环境搭建教程指南—windows10系统 本文在李沐博士的《动手学深度学习》 — 动手学深度学习...

  • mxnet:如何对多维NDArray按维度操作?

    参考: 动手学深度学习第3.6.3章节.

  • 动手学深度学习

    线性回归 一.主要内容包括: 1.线性回归的基本要素 2.线性回归模型从零开始的实现 3.线性回归模型使用pyto...

  • 线性回归的实现

    选自 李沐 《动手学深度学习》 第三章。 3.3 线性回归的简洁实现 随着深度学习框架的发展,开发深度学习应用变得...

  • 《动手学深度学习》PDF

    用户下载说明: 电子版仅供预览,下载后24小时内务必删除,支持正版,喜欢的请购买正版书籍 《动手学深度学习》PDF...

  • 《动手学深度学习》笔记

    画一个函数图像: 画一组features和labels的散点图 细节:在做loss的时候记得reshape,因为l...

  • 序言

    课程链接 动手学深度学习PyTorch版:https://www.boyuai.com/elites/course...

  • 动手学深度学习PyTorch版

    课程介绍 本课程面向希望更多的通过代码实践去学习深度学习原理的同学和在职人士。 《动手学深度学习》是2019年国内...

  • 学习Pytorch遇到的一些问题(一)

    基本介绍 这周开始学习深度学习的部分知识,参考的书是《动手学深度学习》(PyTorch版),在操作过程中遇到一些小...

网友评论

      本文标题:动手学深度学习-Task02

      本文链接:https://www.haomeiwen.com/subject/ggzdfhtx.html