美文网首页
台大数位语音处理第五课

台大数位语音处理第五课

作者: 马尔克ov | 来源:发表于2019-07-23 22:56 被阅读0次

与第四章纯数学相比,第五章针对语音场景的HMM

1. Triphone的来源

image.png

建模用最小,最细的phoneme

phone : a phoneme’s acoustic realization 一个phoneme有多种phone
context:上下文
coarticulation:相邻的phoneme会影响实际发音

image.png

不能每一个词都有训练样本(解决不了新词),用phoneme就可以拼出所有的新词。泛化性好。
最优选择:Triphone考虑上下文
有些triphone罕见没有样本,用参数共享解决

两种share方式

2. Information Theory基础

image.png

m比特数,常见取2的倍数

衡量信息量,四个属性
熵:平均信息量

分布不均匀->好猜->信息量小->混乱度小
分布平均->不好猜->信息量大->混乱度大

Data+knowledge driven:利用语言学专业知识,决策树分类,相似的归到一类。没有样本的也可以按照树走到某一类。


每个state一颗树

轻声,除了一二三四声以外:王爷,走吧

空声母韵母

为了尽量减少数量

远古时代 成绩对比

相关文章

网友评论

      本文标题:台大数位语音处理第五课

      本文链接:https://www.haomeiwen.com/subject/fliwlctx.html