当前位置:论文网 > 论文宝库 > 信息科技类 > 信息技术论文 > 正文

语音数字信号处理技术

来源:UC论文网2019-04-08 11:58

摘要:

  【摘要】数字信号处理技术是将模拟信息(如声音、视频和图片)转换为数字信息的技术。DSP通常指的是执行这些功能的芯片或处理器。它们可能也用于处理此信息然后将它作为模拟信息输出。本文利用这些方法结合起来,同时利用MATLAB工具对语音信号进行了分析,解决实际工程技术问题的能力。  【关键词】数字信号处理;音频信号;信号分析;滤波处理  中图分类号:TN911.72文献标志码:A文章编号:1673-...

  【摘要】数字信号处理技术是将模拟信息(如声音、视频和图片)转换为数字信息的技术。DSP通常指的是执行这些功能的芯片或处理器。它们可能也用于处理此信息然后将它作为模拟信息输出。本文利用这些方法结合起来,同时利用MATLAB工具对语音信号进行了分析,解决实际工程技术问题的能力。


  【关键词】数字信号处理;音频信号;信号分析;滤波处理


  中图分类号:TN911.72文献标志码:A文章编号:1673-8500(2013)12-0034-01


  处在一个高速发展,日新月异的社会中,科学技术无疑扮演着重要的角色。众所周知,语音信号的处理分析已变得非常流行,基于语音处理分析技术的产品也开始流入市场,充满人们的生活。


  一、语音信号分析


  对语音信号分析可以从时域分析和频谱分析两个方面来进行。语音的时域分析包括:短时能量、短时过零率、语音端点检测以及时域方法求基音等。语音的时域分析还包括语谱图、共振峰等。


  短时能量分析作为语音信号时域中最基本的方法,应用相当广泛,特别是在语音信号端点检测方面。由于在语音信号端点检测方面这两种方法通常是独立使用的,在端点检测的时候很容易漏掉的重要信息,短时能量是对语音信号强度的度量参数。


  对语音信号进行fourier变换后,我们可以得到对应信号的频谱进而画出其频谱图,于是我们就可以很方便地在频域上对语音信号进行分析,对语音信号进行反fourier变换后,我们又可以得到相应的语音信号,于是通过对频谱的改变,在进行反fourier变换,我们就能知道频域对时域的影响。


  二、语音信号的频谱分析


  当我们知道人的声音频谱范围大致在[300,3500]左右后,我们就能马上说明为何电话可以对语音信号采用8KHz的采样速率了。由乃奎斯特采样定理我们知道采样频率,即只需使采样频率大于7KHz即可,所以电话对语音信号的采样频率采用8KHz是完全合理的。


  首先播放读入的语音信号,得到如图一所示的波形图以及频谱图。然后调用FFT函数对语音信号进行变换。解决这个问题我们很快想到的是通过语音信号的频谱图来进行分析,通过观察频谱,我们可以很直观的找到语音信号频谱中的主要频率成分所在的带宽,然后通过其带宽可以清楚的解释为何电话可以对语音信号采用8KHz的采样速率。


  为了验证我们的假设,我们用到了快速傅里叶变换(fft)。直接做fft变换之后其横坐坐标只是比例值,并不是我们想像中的频率。当我们把高频率掉之后,再将语音信号做反傅里叶变换之后播放,发现语音信号基本上与以前一致,说明其确实是由于噪音的影响。由此我们可以认为语音信号的主要频谱成分所在的带宽范围为[300,3500]左右。


  .wav文件的采样速率为44.1KHz,仍然远远高于我们通常说的语音信号需要的频谱宽度,例如在电话对语音信号的采样中,我们仅仅使用8KHz的采样速率。对读入的音频数据进行不同速率的降采样,使用wavplay()命令播放降采样后的序列,验证是否会对信号的质量产生影响。


  在matlab中,我们很容易就可以对信号进行降采样,当我们把采样频率降为原采样频率1/2时,声音与原声音相比还相差不太大,当把采样频率降为原采样频率1/4时,声音变得模糊不清了,把采样频率降为原采样频率1/8时,声音已经严重变质了。


  关于降采样对语音信号的影响,从直观的感受上我们就能理解采样频率越低,音质肯定会变差,因为采样频率低,即我们采的点少,即对原信号保留的信息就少,那么信号还原回来音质肯定会变差。


  三、语音信号的滤波处理


  语音信号的滤波处理是数字信号处理领域目前发展最为迅速的信息科学研究领域的核心技术之一,通过语音传递信息是人类最重要、最有效、最常用和最方便的交换信息形式。当实际处理一个信号时,滤波器类型的选取主要取决于滤波时,要强调的侧重面及信号的特点。文中涉及的四种滤波器,前两种属于IIR(InfiniteImpulseResponse)数字滤波器,后两种属于FIR(FiniteImpulseResponse)。


  IIR滤波器最大优点是可取得非常好的通带与阻滞衰减,计算量较少(阶次低),如果强调最大限度去除噪声而没有别的限制,最佳选择是IIR滤波器,其缺点是不具有线性相位,由于转移函数中存在极点,所以IIR滤波器中还存在稳定性问题。那么最好选择为FIR滤波器,它也有缺点,即为了获得较好的通带和阻滞衰减,滤波器的阶次N往往较大(是同指标的IIR滤波器的5~10倍),所以计算量较大,不易实时实现。


  滤波器设计在数字信号处理中占有极其重要的地位,FIR数字滤波器和IIR滤波器是滤波器设计的重要组成部分。利用MATLAB信号处理工具箱可以快速有效地设计各种数字滤波器。课题基于MATLAB有噪音语音信号处理的设计与实现,综合运用数字信号处理的理论知识对加噪声语音信号进行时域、频域分析和滤波。通过理论推导得出相应结论,再利用MATLAB作为编程工具进行计算机实现。在设计实现的过程中,使用窗函数法来设计FIR数字滤波器,用巴特沃斯、切比雪夫和双线性变法设计IIR数字滤波器,并利用MATLAB作为辅助工具完成设计中的计算与图形的绘制。通过对对所设计滤波器的仿真和频率特性分析,可知利用MATLAB信号处理工具箱可以有效快捷地设计FIR和IIR数字滤波器,过程简单方便,结果的各项性能指标均达到指定要求。


  将语音信号看作一个向量,于是就把语音数字化了。通过比较加噪前后,语音的频谱和语音回放,能明显的感觉到加入噪声后回放的声音与原始的语音信号有很大的不同,前者随较尖锐的干扰啸叫声。从含噪语音信号的频谱图中可以看出含噪声的语音信号频谱,在整个频域范围内分是布均匀。其实,这正是干扰所造成的。通过滤波前后的对比,低通滤波后效果最好,高通滤波后的效果最差。由此可见,语音信号主要分布在低频段,而噪声主要分布在高频段。


  四、结语


  本次数字信号处理,以WINDOWS为平台,同时借用MATLAB软件实现了语音信号在时域和频域的分析。通过对MATLAB函数的调用实现了语音信号的读入,以及对它进行滤波。通过学习和认识到一个很现实的问题,搞科研遇到问题是必不可少的,如何正确对待学习工作中遇到的问题,要尽量想办法去解决。这样我们就得在遇到问题时静下心来去思考问题并去摸索解决问题的方法,这样才能在再未来科技日新月异的明天立于不败之地。


核心期刊推荐