结合EMD和WMCEP的语音信号共振峰提取算法。 计算机工程与应用
文件大小: 1538k
源码售价: 10 个金币 积分规则     积分充值
资源说明:共振峰是语音信号处理领域一个至关重要的概念,它描述的是在人的发声过程中,气流通过声道时声道振动所产生的共振频率。这些频率一般表现为语音信号频谱中的峰值,通常具有较大的能量,是频谱中重要的组成部分,对信号的时域波形有决定性影响。在语音合成实验中,浊音信号的前三个共振峰的频率尤为重要,因为它们对于区分不同元音和反映说话人的个性特征具有关键作用。共振峰提取是说话人识别、语音合成、语音编码等多个语音处理领域中的关键技术。 共振峰提取算法主要分为三类: 1. 基于频谱峰值提取法:该方法计算量相对较小,直接从语音信号的频谱中识别并提取共振峰。 2. 基于线性预测求根法:通过线性预测编码(LPC)分析来估算声道的传递函数,并求解该传递函数的根,进而得到共振峰的位置。 3. 基于语音分析合成法:这类方法通过语音的合成模型来分析共振峰,例如通过合成信号与原始信号的差异来估计共振峰。 在本篇研究论文中,提出了一种新的共振峰提取算法,该算法结合了经验模态分解(EMD)和加权Mel倒谱(WMCEP)。EMD是一种自适应信号分析方法,它可以将复杂的信号分解为一系列称为固有模态函数(Intrinsic Mode Function,IMF)的简单振荡模态,每个IMF代表信号中的一个固有振动模式。加权Mel倒谱分析是基于人类听觉感知特性的频谱分析方法,能够提取出语音信号频谱中的主要成分。 算法的主要步骤如下: 1. 对语音信号进行EMD分解,得到一系列IMF,这些IMF中的某些特定IMF包含了共振峰的信息。 2. 通过选择和重构这些含有共振峰信息的IMF来生成一个新的语音信号。 3. 对重构后的语音信号应用加权Mel倒谱分析,提取出包含频谱主要成分的加权Mel倒谱系数(WMCC)。 4. 使用离散余弦变换(DCT)为基础的平滑算法处理WMCC,得到平滑的谱包络。 5. 在谱包络中找到峰值点,这些峰值点即为候选共振峰。 6. 根据共振峰的连续性和频率范围约束来筛选共振峰的估计值。 研究结果表明,相比于单独使用WMCEP提取共振峰的方法,该算法在不同信噪比的条件下均能更加准确地提取共振峰,并且在信噪比低于20dB的情况下仍然有效。 关键词包括共振峰(Formant)、经验模态分解(EMD)、固有模态函数(IMF)、加权Mel倒谱系数(WMCEP)和离散余弦变换(DCT)。这些概念和算法的结合,为语音信号处理和分析提供了新的工具和视角,有助于提高语音相关应用的性能和准确性。
本源码包内暂不包含可直接显示的源代码文件,请下载源码包。