美文网首页
语言模型

语言模型

作者: A李旭辉 | 来源:发表于2018-12-29 18:37 被阅读0次

什么是语言模型呢?

简单地说,语言模型就是用来计算一个句子的概率的模型,也就是判断一句话是否是人话的概率?

放一篇文章 语言模型及其实现 建议直接看原文,讲的非常清楚。

  • 概率表示

给每一个句子赋予一个概率,合法的句子得到概率比较大,而不合法的句子得到的概率比较小,这样只需要从所有可能的情况中选取概率最大的那种组合,我们就能够得到合法的句子了;
文章中讲了这个概率的公式以及如何去理解这个公式,还有这个公示的缺点引出下面的马尔科夫假设

语言模型公式
  • 马尔科夫假设

为了解决太过复杂而难以计算的问题,我们需要引入马尔科夫假设,马尔科夫假设中最重要的一点就是有限视野假设
由于基础公式计算起来过于复杂,所以通过马尔科夫假设来简化公式;
当应用在我们的语言模型中时,就是指每一个词语的概率只由其前面的n−1个词语所决定,这被称为n元语言模型 当n=2时,相应的语言模型就被称为是二元模型

二元模型
  • 概率估计

在拥有大语料的情况下,我们可以直接统计(wi−1,wi)这对词在语料中的出现次数,同时也能统计wi−1出现的次数,根据大数定理,相对频度就能近似概率;
其中#(xi−1,xi),#wi−1,#分别表示词对(wi−1,wi)在语料中出现的次数,wi−1在语料中出现的次数和语料库的大小;

求概率
  • 模型训练&零概率

概率值出现为0的这种情况我们称之为不平滑,相应的需要进行平滑操作;
其中,|V|表示词库的大小,之所以要在分母上同时加上一个λ|V|,是为了保证概率之和为1的条件;

加法平滑

总结

  1. N-gram就是文中所指的n元模型,它与语言模型是什么关系呢?个人认为是包含在语言模型中的;
  2. 学到了什么是语言模型,以及优化n-gram;这是NLP最基础的东西,是必须要了解的;
  3. 语言模型的用途就不做仔细的研究了;

相关文章

  • CMU Sphinx语音识别入门:构建语言模型

      CMUSphinx支持多种语言解码模型,包括:关键字列表模型、语法模型、统计语言模型和语言语音模型。不同的模型...

  • TensorFlow 实战Google深度学习框架(第2版)第九

    第九章:自然语言处理 * 9.1语言模型的背景知识 * 9.1.1语言模型简介 * 9.1.2语言模型的评...

  • 语言模型

    什么是语言模型 语言模型建模方法分为 统计语言模型 和 规则语言模型 两大类,前者完全依靠大文本的数据,用统计的方...

  • 语言模型

    模型:可以量化,可以打分。 语言模型 概率语言模型(统计语言模型) 用处示例:输入法、机器翻译、语音识别等。 N-...

  • 词向量原理

    了解词向量要从语言模型说起,语言模型其实就是计算任意一个句子的概率。 经典的语言模型是n-gram模型,该模型假设...

  • NLP复习(Lecture 9-15)

    Lecture 9 Language Model 语言模型分两类——概率语言模型和结构语言模型 1. N-Gra...

  • 数据库原理

    关系模型 关系模型 实体关系模型 对象关系模型 半结构化数据模型 XML(扩展标记语言) 数据语言 DML 数据操...

  • 零基础进行神经网络语言建模文章

    摘要:本文从最简单的语言模型开始介绍,以优化模型性能为目标,由浅到深的介绍了神经网络模型在语言模型中的应用。 语言...

  • 中文分析3:基于语言模型的无监督分词

    一、语言模型 1、什么是语言模型 语言模型就是计算条件概率的模型。 其中w1,w2,…,wn−1是句子中的前n−1...

  • 《数学之美》统计语言模型、分词

    语言模型 基于规则的模型 基于概率的模型 统计语言模型 问题:整个句子的概率:为了保证句子通顺,不出现歧义,计算整...

网友评论

      本文标题:语言模型

      本文链接:https://www.haomeiwen.com/subject/ellplqtx.html