文献综述
本课题的现状及发展趋势:
语音增强,其本质就是语音降噪,换句话说,日常生活中,麦克风采集的语音通常是带有不同噪声的“污染”语音,语音增强的主要目的就是从这些被“污染”的带噪语音中恢复出我们想要的干净语音[1]。语音增强涉及的应用领域十分广泛,语音增强作为数字信号处理的一个分支,已经有了50多年的历史。虽然语音增强技术看似只是一个简单的纯净语音恢复过程,但是其中涉及的知识和算法是广泛而又多样的[2][3]。
对于语音增强方法的分类,可以按照其运用方法的不同进行分类,于是便可以分成如下两大类:数字信号处理的语音增强方法和基于机器学习的语音增强方法。其中,数字信号处理的语音增强方法是主流方法,历史悠久,且拥有很深的技术奠基,是目前工程界进行语音降噪的主要思路。而在传统的数字信号处理的方法中,按照其通道数目的不同,又可以进一步划分为:单通道语音增强方法和麦克风阵列的语音增强方法[4]。在传统的单通道语音增强方法中,对数字信号处理的知识运用较多,时域和频域的方法都有,以频域处理为主,其中基于短时谱估计的语音增强方法是目前应用最为广泛的语音增强方法,具体的算法可以分为以下三大类:谱减法、维纳滤波法和基于统计模型的方法[5][6]。而在麦克风阵列的语音增强方法中,由于利用了更多的麦克风,考虑了信号的空间信息,因此在抑制特定方向的干扰、进行语音分离等方面,比单通道的语音增强更有优势[7]。基于机器学习的语音增强方法,不同于传统的数字信号处理方法,它借鉴机器学习的思路,通过有监督的训练实现语音增强[8]。
维纳滤波算法的本质就是从噪声中提取信号的过滤和预测的方法,并以估计的结果与信号的真值间误差的最小均方值作为最佳准则[9][10]。因此,维纳滤波器是统计意义上的最优滤波器,或者说是波形的最优线性估计器。此外,维纳滤波算法以其较小的运算复杂度和不错的降噪性能优势,在语音增强的工程领域一直发挥着很重要的作用[11]。
根据维纳滤波算法应用域的不同,可以分为:时域的维纳滤波和频域的维纳滤波。而根据是否利用未来的信息来估计当前的值,又可将其分成因果系统和非因果系统。对于因果的系统,只需要用到过去和当前的值来估计当前的期望值,而在非因果系统中,还需要用到未来的信息来估计当前的期望值[12][13]。维纳滤波的思想,除了被应用在语音增强领域,还在其他工程领域,比如图像增强、飞机盲着陆、地震数据处理、抗多址干扰盲检测等领域都有所应用。维纳滤波这种以最小均方误差的准则进行线性滤波的方法,在很多对干扰信号的进行处理的工程领域都表现出了十分不错的性能[14][15]。
本课题的价值:
以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。