python完成语音特征MFCCs提取

作者: 刘小白DOER | 来源:发表于2022-02-13 22:05 被阅读0次

    为了完成语音oneclass分类,笔者在一步步在做着工作往前推进,今天将语音wav文件提取特征,完成特征的提取。MFCC是音频信号特征中最重要的一个,基本上处理音频信号就会用到,笔者对于语音方面知识匮乏,只能先前期使用特征MFCC来完成特征表征。

    笔者使用了两个库来完成MFCC特征提取,每个库提取的特征值是不一样的。虽然mfcc特征时固定的,但每个wav文件的长度是不一样的,mfcc_feat帧数不一样,那么每个wav文件的特征矩阵是不一样的,笔者使用np.mean来取所有帧数的特征均值来代表这个wav文件。如果wav文件长度相差不大,那么这个基本没有问题,否则可能存在一些问题,请参考文末的分析。

1、python_speech_features库提取每一帧的mfcc并计算13个特征的平均值

2、librosa库提取每一帧的mfcc并计算20个特征的平均值

    主程序将目录下的语音文件循环读取并提取特征写入deque中,频繁的插入操作且不需要查询的的话,deque比列表更加适合。find_specific_files时重用以前的代码,知道==找到目录下匹配的文件,笔者以前用过几次了就不再阐述了。

    最后使用np.array将deque转为np数组,再通过np.savetxt写入到csv文件中,完成大量的wav文件的特征提取,为后面的特征过程和模型训练做好准备。

    接下来就是分析帧数的特征均值来代表这个wav文件是否合适了。

1、wav文件长度相差很大;

2、wav文件相差不大,但是可能存在部分的静音,这与采集方法有关系;

3、wav文件时长一致,但是MFCCs特征平均值在建模时不能高效的检测,那么就需要将wav文件分帧为相同帧数的实例,将这个帧数*特征的矩阵作为实例,而不仅仅是平均值。

    针对上面的情况,音频文件不容易建模分析,那么就需要数据清洗,一步步来吧。

相关文章

  • python完成语音特征MFCCs提取

    为了完成语音oneclass分类,笔者在一步步在做着工作往前推进,今天将语音wav文件提取特征,完成特征的提取...

  • Kaldi命令词识别(续)

    task4 : 特征提取(FMCC) 完成了语言模型的构建,下面开始生成声学模型部分,首先对语音文件进行特征提取,...

  • MFCC(Mel Frequency Cepstral Coef

    MFCCs是一个在语音识别和说话者识别领域被广泛运用的特征,由Davis和Mermelstein在1980年提出,...

  • 机器学习:循环神经网络

    传统的机器学习算法非常依赖人工提取特征,使得图像识别、语音识别、自然语音处理等问题存在特征提取的瓶颈,基于全连接神...

  • 情感语音识别

    语音信号特征:能量 基音频率 共振峰 处理阶段:数字化预处理端点检测提取语音特征、计算 能量分短时能量和短时平...

  • batch中特征的补0

    训练时 ,每个特征会按batch中最长的特征长度进行补0 , 输出结果: 经过特征提取后每条语音的特征长度是不同的...

  • 无标题文章

    python 机器学习 预测分析核心算法 特征提取和特征工程 确定哪些特征可用于预测也需要尝试。这个过程就是特征提...

  • 12.11

    翻译500字 (未完成) WGAN实验 (未完成) 新的数据集提取简单特征 (完成) 标注中高层特征 (未完成)...

  • MFCC、FBank、LPC总结

    一、MFCC 几乎照搬语音特征参数MFCC提取过程详解参考CSDN语音信号处理之(四)梅尔频率倒谱系数(MFCC)...

  • 机器学习与模式识别系列之特征提取

    特征选择与特征提取 模式识别的大致流程如下: 从图中我们可以知道,特征提取与选择是在分类器设计之前完成,它主要的工...

网友评论

    本文标题:python完成语音特征MFCCs提取

    本文链接:https://www.haomeiwen.com/subject/asjqlrtx.html