全文总字数:4002字
文献综述
文 献 综 述一、 选题背景在现实生活中,音频常常会因为环境噪声、网络拥塞和设备限幅等影响,产生诸如脉冲干扰、片段丢失和削顶失真等情况的受损,降低音频的可听度。
如果音频应用于语音识别、说话人辨识等情况,还会导致相应识别率下降,所以需要对受损音频进行数字化修复,还原出受损部分,改善音频质量。
目前音频修复大致有两种:一种是传输中去噪,即在音频传输过程中,对接收端通过语音增强,将带限语音中丢失的高频部分还原出来,或者修复因丢包而丧失的音频片段,从而使得接收方听到的语言更加真实;另一种传输后增强,对广播电台录制的音频、图书馆保存的音像资料,会议录制的会议纪要等珍贵历史音频进行修复。
以上两种应用的最大区别在于处理时对噪声性质的掌握程度。
本文只讨论第二种情况,即在已经获得完整的音频的条件下,增强其中的语音信号。
为此,需要对音频信号进行时频域分析,对不同的噪声,针对性的选用修复方法。
比如对Click噪声用小波阈值去噪,对削顶失真采用循环神经网络等等。
二、 研究现状音频修复理论大致起源于上世纪60年代,随后不同的修复算法被不断的提出。
1975年自适应相消去噪法被提出;1978年维纳滤波法开始用于语音去噪;1980年Maulay 和 Malpass 研究出软判决法来对噪声进行去除;1984年Ephraim 与 Malah 研究出了基于 MMSE 的短时谱去噪法,短时谱去噪技术得到一定的发展和研究;1987年Paliwal 研究出了卡尔曼滤波来进行语音去噪研究,其是基于测量方差已知的条件下对带噪语音进行最优估计;1995 年Ephraim 研究出了信号子空间法来进行语音去噪,将纯净语音分解到一个空间,将噪声分解到另一空间;2004年,Hu Yi 和 Loizou 研究出了通过小波变换阈值函数的多窗口谱对语音信号进行去噪。
以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。