结合EMD和WMCEP的语音信号共振峰提取算法。计算机工程与应用 - 源码 - 源码 - 免费下载

结合EMD和WMCEP的语音信号共振峰提取算法。计算机工程与应用

文件大小： 1538k

源码售价： 10 个金币积分规则积分充值

资源说明：共振峰是语音信号处理领域一个至关重要的概念，它描述的是在人的发声过程中，气流通过声道时声道振动所产生的共振频率。这些频率一般表现为语音信号频谱中的峰值，通常具有较大的能量，是频谱中重要的组成部分，对信号的时域波形有决定性影响。在语音合成实验中，浊音信号的前三个共振峰的频率尤为重要，因为它们对于区分不同元音和反映说话人的个性特征具有关键作用。共振峰提取是说话人识别、语音合成、语音编码等多个语音处理领域中的关键技术。共振峰提取算法主要分为三类： 1. 基于频谱峰值提取法：该方法计算量相对较小，直接从语音信号的频谱中识别并提取共振峰。 2. 基于线性预测求根法：通过线性预测编码（LPC）分析来估算声道的传递函数，并求解该传递函数的根，进而得到共振峰的位置。 3. 基于语音分析合成法：这类方法通过语音的合成模型来分析共振峰，例如通过合成信号与原始信号的差异来估计共振峰。在本篇研究论文中，提出了一种新的共振峰提取算法，该算法结合了经验模态分解（EMD）和加权Mel倒谱（WMCEP）。EMD是一种自适应信号分析方法，它可以将复杂的信号分解为一系列称为固有模态函数（Intrinsic Mode Function，IMF）的简单振荡模态，每个IMF代表信号中的一个固有振动模式。加权Mel倒谱分析是基于人类听觉感知特性的频谱分析方法，能够提取出语音信号频谱中的主要成分。算法的主要步骤如下： 1. 对语音信号进行EMD分解，得到一系列IMF，这些IMF中的某些特定IMF包含了共振峰的信息。 2. 通过选择和重构这些含有共振峰信息的IMF来生成一个新的语音信号。 3. 对重构后的语音信号应用加权Mel倒谱分析，提取出包含频谱主要成分的加权Mel倒谱系数（WMCC）。 4. 使用离散余弦变换（DCT）为基础的平滑算法处理WMCC，得到平滑的谱包络。 5. 在谱包络中找到峰值点，这些峰值点即为候选共振峰。 6. 根据共振峰的连续性和频率范围约束来筛选共振峰的估计值。研究结果表明，相比于单独使用WMCEP提取共振峰的方法，该算法在不同信噪比的条件下均能更加准确地提取共振峰，并且在信噪比低于20dB的情况下仍然有效。关键词包括共振峰（Formant）、经验模态分解（EMD）、固有模态函数（IMF）、加权Mel倒谱系数（WMCEP）和离散余弦变换（DCT）。这些概念和算法的结合，为语音信号处理和分析提供了新的工具和视角，有助于提高语音相关应用的性能和准确性。

部分文件列表（点击文件名可查看文件内容）

					
									本源码包内暂不包含可直接显示的源代码文件，请下载源码包。