声音的基音周期特征参数提取及钢琴音阶的自动检测文献综述

 2022-11-26 13:08:38

一、研究背景及其意义

随着人们进入信息时代,人们的生活、学习、工作领域也越来越智能化。作为人和这些领域沟通的关键接口,语音信号处理技术自然引起里人们的足够重视。该技术就是让机器通过识别和理解把语音信号转变为相应的文本或命令的高级技术。通过该技术人们可以不通过键盘的输入过程而直接通过语音进行操作,并且语音技术的应用已经成为一个具有竞争性的新兴高技术产业。而音乐,作为语音信号中的一种,更是与人们的生活密不可分。音乐的音阶与基音频率有关,钢琴的每一个音阶都对应固定的基音频率,据此可对钢琴的乐声进行音阶的自动检测,在钢琴培训、键音校准、音乐检索和声音分离中具有较好的实用价值。其中基音顾名思义就是声音的基础。这里我们主要讨论人的发声,根据声带震动的方式的不同,将声音信号分为清音和浊音。其中浊音需要声带周期性震动,所以具有明显的周期性,这种声带振动的频率称为基音频率,相应的周期就成为基音周期。但清音没有明显的周期性[2]

通常,基音频率与个人的声带的结构有很大的关系,所以基因频率也能用于识别发音源。一般来说,男性说话者的基音频率较低,而女性说话者和小孩的基音频率相对较高,就是通常说的“男的声音高,女的声音低”。基音周期的估计称谓基音检测,基音检测的最终目的是为了找出和声带振动频率完全一致或尽可能相吻合的轨迹曲线。基因周期作为语音信号处理中描述激励源的重要参数之一,在语音合成、语音压缩编码、语音识别和说话人确认等领域都有着广泛而重要的问题,尤其对汉语更是如此[8]

二、国内外研究现状

自进行语音信号分析研究以来,基音检测一直是一个重点研究的课题。尽管目前基音检测的方法有很多种,然而这些方法都有其局限性。迄今为止仍然没有一种检测方法能够适用不同的说话人、不同的要求和环境、究其原因,可归纳为如下几个方面。ensp;
1.语音信号变化十分复杂,声门激励的波形并不是完全的周期脉冲串,在语音的头、尾部并不具有声带振动那样的周期性,对于有些清浊音的过度帧很难判定其应属于周期性或非周期性,从而也就无法估计出基音周期。ensp;
2.声道共振峰有时会严重影响激励信号的谐波结构,使得想要从语音信号中去除声道影响,直接取出仅和声带振动有关的声源信息并不容易。ensp;
3.在浊音语音段很难对每个基因周期的开始和结束位置进行精确的判断,一方面因为语音信号本身是准周期的。另一方面因为语音信号的波形受共振峰、噪音等因素的影响。ensp;
4.在实际应用中,语音信号常常混有噪声,而噪声的存在对于基音检测算法的性能产生强烈影响。ensp;
5.基音频率变化范围大,从低音男声的70Hz到儿童女性的450Hz,接近3个倍频程,给基因检测带来了一定的困难[7]。ensp;
尽管语音检测面临着很多困难,然而由于基因周期在语音信号处理领域的重要性,使得语音基因周期检测一直是不断研究改进的重要课题之一。数十年来,国内外众多学者对如何准确地从语音波形中提取出基因周期作出了不懈的努力,提出了多种有效的基音周期检测方法。我国基因检测方面的研究起步要比国外发达国家晚一点,但是进步很大,特别是对汉语的基音检测取得成果尤为突出。目前基音检测算法主要可分为两类:非基于事件检测方法和基于事件检测方法
这里的事件是指声门闭合。非基于事件的检测方法主要有:自相关函数法、平均幅度查函数法,倒谱法,以及在以上算法基础上的一些改进算法[17]。语音信号是一种典型的时变、非平稳信号,但是,由于语音的形成过程是发音器官的运动密切相关的,而这种物理运动比起声音振动速度来讲要缓慢得多,因此语音信号常常可假定为短时平稳的,即在短时间内,其频谱特性和某些物理特征参量可近似地看作是不变的,非基于事件的检测方法正是利用语音信号短时平稳性这一特点,先将语音信号分为长度一定的语音帧,然而对每一帧语音求基音周期。相比基于事件的基音周期检测方法来说,它的优点是算法简单,运算量小,然而从本质上说这些方法无法检测帧内基因周期的非平稳变化,检测精度不高。ensp;
基于事件的检测方法是通过定位声门闭合时刻来对基因周期进行估计,而不需要对语音信号进行短时平稳假设,主要有小波变换方法和Hilbert-Huang变换方法两种[16]。在时域和频域上这两种方法又具有良好的局部特性,能够跟踪基因周期的变化,并可以将微小的基因周期变化检测出来,因此检测精度较高,但是计算量较大。

三、结论及展望

如今,语音技术相关产品已经成为了我们生活的一部分,它的作用越来越被重视,人们对当前语音技术的提高也是越来越期待。而基因检测作为语音处理中的重要技术更是受到大家的关注。基音检测是语音处理中的一个非常重要的问题,但由于影响基音检测的因素众多,使得基音周期的准确估计非常困难。尽管基音周期检测有许多困难,但因为它的重要性,基音周期检测一直是一个研究的重要课题。为了从语音波形中准确地提取基音的工作,使全世界的科学家忙了几十年,从20世纪60年代以来出现了很多种基音周期检测方法,特别是在有噪环境下的语音信号的基音周期检测方面更是提出了许多有效的方法。进行基音检测方面早期研究工作的国家主要有美国等欧美国家,之后,我国在基音检测方面,尤其是对汉语的基音检测工作也取得了很大进展。ensp;ensp;
为了提高基音检测的准确性,降低计算复杂度,人们已经从基于事件的检测方法和非基于事件的检测方法出发ensp;开发了许多基音检测算法。虽然目前基音检测算法还有一些不足,但是我相信以后在基音周期方向上,人们会取得重大突破。

参考文献

[1] 韩纪庆,张磊,郑铁然.语音信号处理(第二版)[M].北京:清华大学出版社,2013

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。