第11章 多带激励声码器

上传人:熏** 文档编号:243151640 上传时间:2024-09-17 格式:PPT 页数:51 大小:1.74MB
收藏 版权申诉 举报 下载
第11章 多带激励声码器_第1页
第1页 / 共51页
第11章 多带激励声码器_第2页
第2页 / 共51页
第11章 多带激励声码器_第3页
第3页 / 共51页
资源描述:

《第11章 多带激励声码器》由会员分享,可在线阅读,更多相关《第11章 多带激励声码器(51页珍藏版)》请在装配图网上搜索。

1、单击此处编辑母版标题样式,,单击此处编辑母版文本样式,,第二级,,第三级,,第四级,,第五级,,*,*,国家“十一五”规划教材,,《,数字语音编码,》,讲议,,,同济大学电子与信息工程学院,,赵晓群,编著,,机械工业出版社,,2007,年,,第,11,章 多带激励声码器,11.2,多带激励语音模型,,11.1,概述,11.4,多带激励语音合成,11.3,多带激励语音分析,第,11,章 多带激励声码器,,11.1,,概述,,CELP,、,MPLPC,等:,全极点模型,、,LPC,,分析,,,合成,-,分析法,,,,,听觉加权,方均误差准则,,闭环,确定激励参数。,,◆,这类,混合编码,,在,4.

2、8~16,,kbit/s,,码率内获得巨大成功。,,◆,关键技术:,是保持了合成语音与原始语音波形的相似性。,,◆,再降数码率时,合成语音质量迅速下降。,,LPC,,声码器:,(清,/,浊音),二元激励模型,,,分析,-,合成法,,,,,LPC,,分析,,,清,/,浊音判别,,估计,基音周期,。,,◆,SNR,,较高时,,2.4,,kbit/s,,及以下码率,语音,可懂度,相当高。,,以上编码器,当噪声较大时,因无法准确提取参数,,,性能,严重恶化,;,,其它声码器,如,通道声码器,、,同态声码器,等也有同样弱点。,第,11,章,多带激励声码器,,11.1,,概述,同济大学电子与信息工程学院,

3、-,3,-,赵晓群,,教授,产生原因:,二元激励模型,过于简化,不符合实际语音的特性。,,◆,许多语音段,同时含,周期性,、,非周期性,分量,,,,过渡音段,、,有噪浊音段,更是如此。,,◆,当用,二元谱,来拟合时,合成语音,缺乏自然度,。,,1988,,年,MIT,,林肯实验室,提出,多带激励,(,MBE,),语音编码,,,,◆,突破,二元激励的局限性,对,多个频带,逐个进行,V/U,,判决,,,,故称为多带激励模型。,,◆,采用,合成,-,分析法,,在,2.4,,~ 4.8,,kbit/s,,码率,时性能优良。,,◆,改进方案被,国际海事卫星组织,采用(,INMARSAT-M,,Voice

4、,,,,Codec,),,码率,为,6.4,,kbit/s,。,,本章主要内容:,MBE,,原理,,,参数提取,方法,,合成语音,的方法。重点介绍,INMARSAT-M,,Voice,,Codec,,标准,的算法。,,第,11,章,多带激励声码器,,11.1,,概述,同济大学电子与信息工程学院,-,4,-,赵晓群,,教授,第,11,章 多带激励声码器,,11.2,多带激励语音模型,,窗选语音信号,为(窗长,20~40,ms,):,,◆,源,-,系统语音模型,理论,语音段是,线性系统,(声道),,对某种,激励信号,的响应。,,设系统的,单位脉冲响应,为,则的,Fourier,,变换,可表示为:,

5、,,式中,H,w,(,ω,),,,E,w,(,ω,),——,h,w,(,n,),,,e,w,(,n,),,的,Fourier,,变换,。,,◆,重建语音信号谱,,X,wr,(,ω,),,可表示为:,,式中,H,wr,(,ω,),——,,合成滤波器,的,系统函数,;,,,E,wr,(,ω,),——,,合成滤波器的,激励信号,的,Fourier,,变换,。,,两者皆从,原始语音信号,中分析,提取,。,第,11,章,多带激励声码器,,11.2,,多带激励语音模型,同济大学电子与信息工程学院,-,5,-,赵晓群,,教授,清音波形,H,wr,(,ω,),,用,全极点函数,来逼近,相应于,X,wr,(,ω

6、,),,的,谱包络,。,,MBE,,按,基音,各,谐波,,将语音分成若干个,子频带,,(如以,3,个相邻的谐波频带为一组进行分带),,,分别对各子带进行,V/U,,判决,,,激励信号,为各子带的,和,。,,◆,清音带:,用,白噪声谱,作为,激励信号谱,;,,◆,浊音带:,用,周期性,的,P,w,(,ω,),,作为,激励信号谱,。,,激励信号是,周期性信号,与,非周期性噪声,按不同频带混合而成。,,系统函数,,H,wr,(,ω,),,的作用是:,调整,各子带分量的相对,幅度,和,,相,位,,并将,E,w,(,ω,),,映射成,X,w,(,ω,),,。,,该模型较符合实际语音的特性,使,合成语音谱

7、,同,原语音谱,,在频谱精细结构上,拟合得更好,。,,若还利用谱的,相位,信息,则能够合成出高质量的语音。,第,11,章,多带激励声码器,,11.2,,多带激励语音模型,同济大学电子与信息工程学院,-,6,-,赵晓群,,教授,图,11.1,:,典型的,浊音,、,清音,和,混合语音,段的分析,-,合成情况。,,◆,MBE,,编码过程涉及三种参数的提取,,,①,,基音频率,;,,②,每个,子带,的谱包络的,幅度,和,相位,参数;,,③,每个,子带,的,V/U,,判决,。,,图,11.2,:,MBE,,语音,编,/,解码器,的简化原理图。,第,11,章,多带激励声码器,,11.2,,多带激励语音模型

8、,同济大学电子与信息工程学院,-,7,-,赵晓群,,教授,图,11.2,,MBE,声码器语音编,/,解码器原理图,清语音合成,浊语音合成,基音周期估计,谐波产生,频带划分,幅度估计,清,/,浊判决,相位计算,FFT,,传 输,,输出,Hamming,窗,同济大学电子与信息工程学院,-,8,-,赵晓群,,教授,(a),浊语音段,(b),清语音段,(c),混合语音段,,图,11.1,语音,MBE,的分析,-,合成波形(,10 kHz,采样,,256,点,Hamming,窗),,,,,,,,,,,,,,,,,浊音波形,清音波形,混合音波形,加窗语音谱,加窗语音谱,加窗语音谱,谱包络,谱包络

9、,谱包络,U/V,判决结果,U/V,判决结果,U/V,判决结果,周期谱,P,(e,j,ω,),周期谱,P,(e,j,ω,),周期谱,P,(e,j,ω,),白噪声谱,白噪声谱,白噪声谱,激励信号谱,激励信号谱,激励信号谱,合成语音谱,合成语音谱,合成语音谱,同济大学电子与信息工程学院,-,9,-,赵晓群,,教授,第,11,章 多带激励声码器,,11.3,多带激励语音分析,,MBE,模型参数的最优提取,计算量大,工程难以实时实现。,,常用,次优,算法,分两步完成参数的提取:,,①,确定,基音频率,和,每个分带,的,谱包络,参数,用,AbS,,法,提取,;,,②,对,每个分带,进行,V/U,判决,。

10、,,有两种参数提取方案:,,,①,使下列,加权积分,值(,加权方均谱误差,)为,最小,:,,,,②,应使下列,加权积分,值达到,最小,:,,,,式中,G,(,ω,),,——,频率加权函数,;,,,X,w,(,ω,),,,X,wr,(,ω,),,——,原始语音谱,和,合成语音谱,。,第,11,章,多带激励声码器,,11.3,,多带激励语音分析,,差别:,,方案,①,利用语音谱的,模值,;,,方案,②,利用,模值,和,相位,,性能优于,①,,,,但计算复杂,码率有所增加。,,INMARSAT-M,,Voice,,Codec,,采用方案,①,。,,本节主要内容:,,,11.3.1,频域分析,,,11

11、.3.2,时域分析,,,11.3.3,,INMARSAT-M,,改进,MBE,,模型分析算法,第,11,章,多带激励声码器,,11.3,,多带激励语音分析,,同济大学电子与信息工程学院,-,10,-,赵晓群,,教授,,11.3.1,频域分析,,,1.,,基音估计及各次谐波幅度的计算,,设,基音周期,为,T,0,(,基音角频率,,ω,0,=,2,π,/T,0,,)。,,依次,假设,,ω,0,为各种可能出现的值。,,◆,对于,可能,的,基音角频率,值,ω,0,,将,ω,=,-,π,~,π,,分为若干频带,,,,分界点,为:,a,m,=,(,m,-,0.5),ω,0,,,b,m,=,(,m,+,0.

12、5),ω,0,,,m,=0,,±,1,…,,±,(,M,+1),,◆,设,每个,分带,,[,a,m,,,b,m,],中,H,wr,(,ω,),,保持不变,,H,wr,(,ω,)=,,A,m,,,,,则有:,,式中,ε,——,总的,加权方均谱,误差;,,,,ε,m,——,,第,m,子带,加权方均谱,误差,,,,,或,第,11,章,多带激励声码器,,11.3,,多带激励语音分析,,同济大学电子与信息工程学院,-,11,-,赵晓群,,教授,仅考虑,,幅度谱,时,考虑,幅度、,,相位谱,时,令,或      ,,,由上两式可分别,解得,一组,最佳,和 :,,,,或,,◆,若,第,,m,,次谐波,

13、的能量显,周期性,,则其能量集中在该谐波附近,;,,,选,周期性,,P,w,(,ω,),的作为,激励信号,,E,wr,(,ω,),,,,,则,合成语音谱,X,wr,(,ω,),与,窗选语音谱,,X,w,(,ω,),,,在,第,,m,次谐波,带内将拟合得很好(,ε,m,最小)。,,◆,若,第,,m,,次谐波,的能量显,非周期性,,,,,则,,X,w,(,ω,),在该频带内没有特征性的形状。,,仍用,P,w,(,ω,),作为激励,,ε,m,值将较大。此时,,应选,噪声,为激励。,第,11,章,多带激励声码器,,11.3,,多带激励语音分析,,同济大学电子与信息工程学院,-,12,-,赵晓群,,教授

14、,仅考虑,,幅度谱,时,考虑,幅度、,,相位谱,时,分析,周期性,与,非周期性,信号激励时的,最佳解,。,,◆,浊音频带时,,选,P,w,(,ω,),为,激励信号,,由上页两式得:,,,,,,,,,◆,清音频带时,,激励采用,理想白噪声,(,幅度谱,,= 1,),则有:,第,11,章,多带激励声码器,,11.3,,多带激励语音分析,,同济大学电子与信息工程学院,-,13,-,赵晓群,,教授,仅考虑,幅度谱,时,,,最佳谱幅度,考虑,幅度、相位谱,时,,,最佳谱包络,。,相位信息无关紧要,,,在此,无需计算,,A,m,。,对于,假定,基音频率,,ω,0,,的每一个谐波,,计算,,︱,A,m,,︳

15、,或,A,m,,,,,,再求,出,各次谐波内,的最小误差 。,,则整个频带的总的最小误差:,,◆,每假设一个,基音频率,,ω,0,,计算出对应的,ε,0,。,,显然,正确的,基音周期,或其,倍数,上,,ε,0,取,极小值,。,,◆,搜索,,ε,0,的全局最小值对应的,T,0,=2,π,/,,ω,0,值可能是,,正确的,基音周期,的某个整数倍值。,,◆,因而,还需要对,T,0,/2,、,T,0,/3,、,…,处的,ε,0,进行,校核,,,,以判断,正确,的,基音周期,,从而确定,最佳基音周期,。,,◆,最后确定最佳基音周期时,还,需要考虑,前后帧,的情况。,,一

16、般相邻帧的,T,0,值变化不会太大。,第,11,章,多带激励声码器,,11.3,,多带激励语音分析,,同济大学电子与信息工程学院,-,14,-,赵晓群,,教授,,2.,,谐波频带内,V/U,,判决,,第,m,,子带的,归一化误差能量,为:,,,,◆,采用,激励信号,P,w,(,ω,),(,谱幅度,︱,A,m,,︳,或,谱包络,,A,m,、,周期,,T,0,,),,是第,m,谐波子带的谱拟合误差。,,◆,令,频率加权函数,,G,(,ω,)=1,,上式化简为:,,,,◆,子带判决:,,,,◆,可以将相邻的几个谐波频带,合并,成一个,子频带,,,,用上述同样的方法,提取,︱,A,m,,︳,或,A,m

17、,,并,进行,,V/U,,判决,。,第,11,章,多带激励声码器,,11.3,,多带激励语音分析,,同济大学电子与信息工程学院,-,15,-,赵晓群,,教授,,11.3.2,时域分析,,W,(,ω,),:,窗函数,,w,(,n,),,的,Fourier,,变换,,,,ω,0,:,归一化基音角频率,(,基音周期,,T,0,,,ω,0,= 2,π,/,T,0,),,◆,假设,在,-,π,~,π,,频率范围内共,2,M,个,谐波,,,,,P,w,(,ω,),为,激励,时,有,:,,,,,式中,,,,第,11,章,多带激励声码器,,11.3,,多带激励语音分析,,同济大学电子与信息工程学院,-,16,

18、-,赵晓群,,教授,◆,令频率,加权函数,,G,(,ω,)=1,,,由前面给出的式子,,,,得,,全带拟合误差,:,,,,式中,,,◆,由,上,式,可,求出,使,ε,取,极小值,的矢量,,a,,为,:,,再,代入,上,式,,,结合,上页,式,得,:,,,,,式中,,,◆,因此,对于某个,选定,的,,T,,值,时,,,计算,min,,ε,,等价,于,,max,,ψ,。,第,11,章,多带激励声码器,,11.3,,多带激励语音分析,,同济大学电子与信息工程学院,-,17,-,赵晓群,,教授,,注:,上标,T,,为转置,,,,H,,为共轭转置,为了,方便,,选择,窗函数,,w,(,n,),,,使其满

19、足,,◆,频域内正交条件,:,,,,,,,,,,,,,I,,是,单位矩阵,;,,◆,相当于,时域,内,满足条件,:,,◆,还要求,其,Fourier,,变换的,泄露,足够小,,,,,,,,,,,,,,,,,,,,,主瓣宽度,足够窄,,(,此宽度不应大于基音频率值,),,。,,满足,上述,条件且,,w,(,n,),为,偶函数,时,,,上页计算,ψ,,式可,改写,为:,,,◆,注意到,,ω,0,M=,π,,近似成立,且,,ω,0,T=,2,π,,则上式可,简化,为,:,,,式,中,,T,,——,假定的,基音周期,;,,,——,,w,2,(,n,),x,(,n,),的,自相关函数,,,第,11,章,

20、多带激励声码器,,11.3,,多带激励语音分析,,同济大学电子与信息工程学院,-,18,-,赵晓群,,教授,由,Parseval,,定理,,总拟合误差,写成,:,,,,,,为了去除由于,,T,,值增加造成,的,ε,下降,需要对,上,式,修正,,,,,以保证真正的,基音周期,对应的是全局最小值。,,◆,采用,无偏拟合误差公式,如下:,,,,,◆,采用此修正后,,归一化总误差能量,应写成下列形式:,,第,11,章,多带激励声码器,,11.3,,多带激励语音分析,,同济大学电子与信息工程学院,-,19,-,赵晓群,,教授,设,窗函数,,w,(,n,),长为,2,N,+1,,,以,原点对称,。,,,同

21、时,假设,在窗长范围内有,,L,,个,假设基音周期,,,即:,,,◆,则上页,式中,,,ξ,uB,的求和上下限应作相应的,改动,,,即得到,:,,,,,,,,,,为,粗搜索,时确定,初始基音周期,,T,I,,所用的拟合误差,时域,表达,。,,◆,为,提高,精度,,,T,,值也可取,非整数,,,如,,20.5,,,21,,,21.5…,。,,,,,,非整数点,上,的相关函数,可,插值计算,:,,,实验表明,,1,0,k,Hz,,采样,基音周期,的,精确,可达,0.04,,样点,。,,数,码率较低,时(,4.8,,kbit/s,以下,),,精确到,,1/4,,~,,1/8,,样,点,也就满足要求了

22、,这样运算量可以减少很多。,第,11,章,多带激励声码器,,11.3,,多带激励语音分析,,同济大学电子与信息工程学院,-,20,-,赵晓群,,教授,,11.3.3,,INMARSAT-M,,改进,MBE,,模型分析算法,,,图,11,.,3,:,INMARSAT-M,,改进,,MBE,,模型算法框图。,,◆,语音信号,:,,8,,k,Hz,,采样,,,线性,,PCM,,编码,,,,,,,语音样值的,最大,值,定标,范围,:,[2,14,-,1,,,2,15,-,1],,,,,,,,,,,最小值定标,范围,:,[,-,2,15,,,-,2,14,],,◆,需求出,改进,,MBE,,模型参数,:

23、,基音角频率,、,V/U,判决,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,子带,谱包络参数,(,仅考虑,幅度谱,),。,第,11,章,多带激励声码器,,11.3,,多带激励语音分析,,同济大学电子与信息工程学院,-,21,-,赵晓群,,教授,图,11.3,,MBE,,语音分析算法方框图,高通滤波器,低通滤波器,基音周期,,初始估计,清,/,浊判决,,基音周期,,精确估计,,频谱估计,语音信号,,1.,高通滤波,,◆,语音,经,数字,高通滤波器,,,滤,除信号中的,直流分量,。,,,高通滤波器,的,截止频率,约,,1,0,,Hz,,,传递函数,为,:,,,,

24、,2.,低通滤波,,◆,低通滤波器,输出的信号按下式计算,:,,,,,,,,低通滤波器,是,,21,,阶,,FIR,,数字滤波器,,其系数值列于,表,11,.1,。,第,11,章,多带激励声码器,,11.3,,多带激励语音分析,,同济大学电子与信息工程学院,-,22,-,赵晓群,,教授,表,11,.1,,FIR,,低通滤波器,系数,,,,,,j,h,L,(,j,),j,h,L,(,j,),j,h,L,(,j,),0,0.394201,±4,-,0.063723,±8,-,0.007430,±1,0.297354,±5,-,0.004565,±9,-0.013775,±2,0.093671,±6

25、,0.030659,±10,-,0.002174,±,3,-,0.051602,±7,0.016900,,,同济大学电子与信息工程学院,-,23,-,赵晓群,,教授,图,11.4,相邻语音帧与帧之间的关系,过去帧  当前帧  将来帧,,3.,,基音估计,,基音估计算法,:,应,保持,相邻语音帧,基音周期的某种,连续性,。,,基音跟踪算法,:,在确定当前帧的基音周期时要考虑,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,相邻的,过去帧,和,将来帧,的影响。,,图,11,.,4,:,当前帧,和,前后帧,之间的关系,。,,,◆,帧长,为,,20,,ms,(,160,,个,样点,),

26、。,,◆,基音估计,算法,分,:,初始估计,、,精细估计,两,步,进行,。,,初始估计,得到,初始基音周期,:,T,I,,,T,I,∈,,D,={21,21.5,…,114},,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,精度,:,,1/2,,采样周期,;,,再,由,精细估计,得出,归,最终,基音周期,,,精度,:,1/4,,采样周期,。,,两,步,法可,降低,计算复杂度,和,提高鲁棒性,。,,第,11,章,多带激励声码器,,11.3,,多带激励语音分析,,,-,40,,-,20,,0,,20,,40,,60 ms,,,,,T,-2,,,T

27、,-1,,,T,0,,,T,1,,T,2,,,基音周期:,,,,,,,,,,,,,误差函数:,,E,-2,(,T,),,E,-1,(,T,),,E,0,(,T,),,E,1,(,T,),,E,2,(,T,),,,算法,的,重要特点,:,初始估计,和,精细估计,使用不同长度的窗函数,。,,◆,初始估计窗,,w,I,(,n,),,长为,,281,,个,样点,;,,◆,精细估计窗,w,R,(,n,),长,为,221,,个,样点,;,,◆,皆,是,对称三角形窗,,,两窗,中,点,对齐,。,,相邻语音帧之间的,重叠量,是窗长的,函数,,,,,,,,重叠量,,=,窗长,,-,帧移动量,(,160,,个,样

28、点,),。,,◆,w,R,(,n,),时,,,重叠量,,61,,个,样点,;,w,R,(,n,),时,,,121,个,样点,。,,,(,1),,基音的,初始估计,(,步骤,见,图,11.5,,),,◆,对每一个,可能,的,基音周期,,T,∈,D,,,计算,误差函数值,,E,(,T,),。,,,,,,,,,然后通过,前向,与,后向基音,,,跟,综算法,,,比较,求出的值,,,,,,,,,,最终,选择,最佳的候选者,,,,,,,,,作为,T,I,。,第,11,章,多带激励声码器,,11.3,,多带激励语音分析,,同济大学电子与信息工程学院,-,24,-,赵晓群,,教授,图,11.5,初始基音周期估

29、计,后向,,基音跟踪,前向,,基音跟踪,比较基音,,估计值,计算,,误差函数,,①,,计算,误差函数,,◆,根据,归一化总误差能量,定义,,,误差函数,,E,(,T,),定义,为:,,,,,,,,,,式中,,w,I,(,n,),,——,归一化三角形窗,函数,,,满足,,,,,,,,,,,,,,,,,,,,,,,,,,,,,。,,◆,当,t,,为,整数,值,时,,自相关函数,,φ,(,t,),定义,为,:,,,,当,t,,为,非整数,值,时,,,用,线性内插,公式,计算,,φ,(,t,),。,,◆,基音,周,期的,初始估计,,T,I,,为:,,◆,采用基音跟踪算法,,,保证,基音周期,,T,I,

30、的,连续性,。,第,11,章,多带激励声码器,,11.3,,多带激励语音分析,,同济大学电子与信息工程学院,-,25,-,赵晓群,,教授,,②,,后向基音跟踪,,◆,E,-1,(,T,-1,),、,E,-2,(,T,-2,) ——,过去两帧对应的,误差函数值,;,,◆,,因,基音周期的,连续性,,当前帧的基音周期,,T,,应在,,T,-1,附近,,,,,,,,应,满足约束条件,:,,,◆,在,上式,范围内逐个,选取,,T,,,并,计算,相应的,,E,(,T,),,,,,,使,,E,(,T,),最小,的,,T,就是后,向,估计,,T,B,,,,,,,计算,后向累计误差,,CE,(,T,B,),:

31、,,,,CE,(,T,B,),是,后向基音估计,的,置信度测度,。,第,11,章,多带激励声码器,,11.3,,多带激励语音分析,,同济大学电子与信息工程学院,-,26,-,赵晓群,,教授,,③,前向基音跟踪,,◆,E,1,(,T,1,),、,E,2,(,T,2,) ——,将来,两帧对应的,误差函数值,;,,◆,将来两帧的基音周期,尚未确定,,,,,,,前向基音跟踪算法必须首先设法确定这些基音周期值,。,,◆,在集合,D,内选定一个,,T,0,,按下面的,约束条件,选取,T,1,、,T,2,:,,,,使,E,1,(,T,1,)+,E,2,(,T,2,),最小,的,T,1,、,T,2,表示为,,

32、,,,,,,,,,,,,,,,,并按下式,计算,前向累计误差函数,,CE,F,(,T,0,),,为:,,,◆,重复上述过程,,在规定的范围内逐个,选定,,T,0,,,,,计算,相应的,CE,F,(,T,0,),,,,使其,最小,的,,T,0,定义,为,,,,,,,。,第,11,章,多带激励声码器,,11.3,,多带激励语音分析,,同济大学电子与信息工程学院,-,27,-,赵晓群,,教授,为防止,倍基音周期,,,考虑,,,,,,取 的可能性,。,,◆,要,求,,,,,,,,,,,,,,,,,,,,,选择,一个与其,最接近,的值代替。

33、,,,,,,再,检查,是否,满足,下列,三个条件,之,一、,且为,最小值,的,,,,,,,,,,,,,,◆,若有,则,前向基音,估计,,,,,,,,,,,,,,,,;,否,则,,,,,,,,,,,,。,,,,,完成,前,、,后向基音跟踪,,并,求得,估计,值,后,,,,按下列,判决规则,确定,初始基音估计,,T,I,:,,,If,,CE,b,(,T,B,)<0.48,,,then,,T,I,,=,T,B,,,e,lse,,if,,CE,b,(,T,B,),≤,CE,F,(,T,F,),,then,,T,I,,=,T,B,,,e,lse,,T,I,,=,T,F,,,◆,最终的,基音估计的,精,度

34、,提高到,,1/4,,采样周期,。,,第,11,章,多带激励声码器,,11.3,,多带激励语音分析,,同济大学电子与信息工程学院,-,28,-,赵晓群,,教授,,(2,),,基音的,精细,估计,,图,11,.,6,:,基音精细估计,的方框图。,,◆,精细估计窗,,w,R,(,n,),:,长,,221,,个,样点,,,归一化,三角形窗,。,,◆,由,基音初始估计,,T,I,,产生,,10,,个,基音精细估计,的,候选值,:,,,◆,将其,转换,为相应的,基音频率,,ω,0,=,2,π,/T,0,。,,,,,然后在这,,10,,个点上,进行,细搜索,,,确定,基音周期的,精细估计,。,第,11,章

35、,多带激励声码器,,11.3,,多带激励语音分析,,同济大学电子与信息工程学院,-,29,-,赵晓群,,教授,图,11.6,基音的精细估计,计算,A,m,(,ω,0,),计算,X,wr,(,l,,,ω,0,),⊕,计算,ε,(,ω,0,),256,点,DFT,16384,点,DFT,产生,10,个,,ω,0,候选值,min,ε,(,ω,0,),①,计算,窗,选,语音,和,窗函数,的,离散,,Fourier,,变换,。,,◆,对,窗,选,语音信号,,,计算,,256,,点,,DFT,:,,,,,,对,窗函数,,,计算,16384,,点,,DFT,:,(扩大点数,可,保证精度,),,,②,对每一个

36、假设的,,ω,0,,,求,各谐波的,最佳谱包络值,,A,m,(,ω,0,),。,,◆,选定,,ω,0,,,则,在,,-,π,~,π,,之间有个,,[ 2,π,/,ω,0,],谐波,分量,,,,,,两个,相邻谐波,之间含有,,256,ω,0,/,2,π,,个,语音信号,的,,DFT,,点。,,◆,对于,第,,m,,次谐波,,它的,频带下限,、,上限,为:,,,,,,,,其中,,,INT,x,表示取,大于,或,等于,,x,,的,最小整数,。,第,11,章,多带激励声码器,,11.3,,多带激励语音分析,,同济大学电子与信息工程学院,-,30,-,赵晓群,,教授,◆,根据式,:,,,因,窗,选,激励

37、,,P,w,(,ω,),在频带内与,窗,函数,主瓣,包络,形状相同,,,,故用,,W,R,(,ω,),代替,,P,w,(,ω,),。,,◆,这意味着语音,改变,一个样点,窗,改变,,64,,个样点。,,,,,,因此,,最佳用下式,计算,:,,,,,,,③,计算,合成语音谱,。,,◆,按下式,计算,:,第,11,章,多带激励声码器,,11.3,,多带激励语音分析,,同济大学电子与信息工程学院,-,31,-,赵晓群,,教授,,④,计算,加权总拟合误差,,,选择,最佳,,ω,0,,(,或,,T,0,,)。,,◆,采用,,DFT,,的,总拟合误差,为:,,,◆,在细搜索中,主要,考虑,高次谐波,频带拟

38、合的情况,因此,,,,,加权函数在,低频端,可以取,,0,,,求和下限,不从,,1,,开始,;,,,高频端,可以取,,1,,,求和上限,也不必达到,,127,。,,◆,语音,频谱,一般,限制,在,,200~360,0,,Hz,范围内。,,,故,按,下,列公式,确定,求和上限,,q,:,,,总拟合误差,可以,改写成,:,,,,◆,对,,10,,个,候选基音频率,,逐个,计算,出,总拟合误差,,,,,使,其,最,小,的,,ω,0,是当前帧,基音周期,的,精细估计值,。,第,11,章,多带激励声码器,,11.3,,多带激励语音分析,,同济大学电子与信息工程学院,-,32,-,赵晓群,,教授,利用,偶

39、对称性,,,,只,计算,了,一半,的值,,4.,,V/U,,判决,,图,11,.,7,:,V/U,,判决,的方框图。,,◆,利用每个谐波处,合,成,谱,与,窗选,语音谱,拟合的程度来,确定,。,,,,,若,归一化拟合误差,,<,阈,值,,,判,定,该谐波,频,带为,浊音带,;,,,反之为,清音带,。,,◆,采用,,DFT,,时,,前面推导的,归一化误差应,改写,成,:,,,◆,也可,将几个,相,邻,谐波,频带,合并,成一个,频带,,,,,根据该,频,带,总拟合误差,作出该带的,,V/U,,判决。,第,11,章,多带激励声码器,,11.3,,多带激励语音分析,,同济大学电子与信息工程学院,-,3

40、3,-,赵晓群,,教授,图,11.7,清,/,浊判决方框图,计算拟合误差,计算,E,0,更新,E,avg,,E,min,,E,max,计算阈值,与阈值比较,实用,,V/U,,判决,方案:,最,多分,12,,个带,,判决方法,如下:,,①,,确定,谐波,的个数,M,。,,◆,计算式:,,,②,,确定,子带,的个数,K,。,,◆,每个,子带,包含,3,,个,谐波分量,(见,图,11.8,)。,子带数,的,计算式:,,,,第,11,章,多带激励声码器,,11.3,,多带激励语音分析,,同济大学电子与信息工程学院,-,34,-,赵晓群,,教授,图,11.8,改进的,MBE,,频带结构,子带,1,子带,

41、2,子带,K,-1,,子带,,K,,③,,计算,各带的,归一化拟合误差,。,,,,,,◆,计算式:,,,,,,第,11,章,多带激励声码器,,11.3,,多带激励语音分析,,同济大学电子与信息工程学院,-,35,-,赵晓群,,教授,④,,计算,,V/U,,的,判决,阈,值,。,,,◆,计算式:,,,◆,第一项,:,随,,ω,0,增大,而,变大,。,,,当,,ω,0,增加时谐波个数将减少,,拟合误差,会变大,,,,,,,,,,,,,,,,,,,,,,,此项起到,去,偏,作用。,,◆,第二项,:,随,,ω,0,升高,而,变小,。,,,,,,,,,,,,,,,,,,,,由于,话音高频端通常更具有随机

42、谱的特征,,,因此,较多地,判,为,清,音区,会使合成语音听起来自然,。,,◆,第三项,:,是同语音,当前帧能量,,E,0,、,平均能量,,E,avg,、,,,,,,,,,,,,,,,,,,,,,,,最小能量,,E,min,、,最大能,量,,E,max,,有关的参数。,,采用,自适应,方法,,逐帧,更新,这些,参数,,以期获得更好的效果。,第,11,章,多带激励声码器,,11.3,,多带激励语音分析,,同济大学电子与信息工程学院,-,36,-,赵晓群,,教授,◆,若用,,E,(0),,表示,当前帧,的参数,,,E,(-1),表示,前一帧,的参数,,,,,,,相关,量的,定义为,:,,,,,,,

43、,,,,且,满足的,约束条件,:,第,11,章,多带激励声码器,,11.3,,多带激励语音分析,,同济大学电子与信息工程学院,-,37,-,赵晓群,,教授,◆,求出上述几个能量之后,再,确定,函数,:,,,,,,,,,,,⑤,,V/U,,判决,。,,◆,判决,规则,为:,第,11,章,多带激励声码器,,11.3,,多带激励语音分析,,同济大学电子与信息工程学院,-,38,-,赵晓群,,教授,,,5.,,求,各,谐波幅度,或,包络,,图,11,.,9,:,频谱幅度,估计框图,。,,◆,改进,MBE,,语音编码器,每个,分频带,包含,,3,,个,谐波,。,,,,,谐波,结构见,图,11,.,8,。

44、,,◆,对于第,,k,,个,频带,,其,频带范围,为,,a,3,k,-2,≤,ω,,<,b,3,k,,,,需,要,确定,,3,,个,频谱幅度,,,,,,,A,3,k,-2,、,A,3,k,-1,、,A,3,k,。,第,11,章,多带激励声码器,,11.3,,多带激励语音分析,,同济大学电子与信息工程学院,-,39,-,赵晓群,,教授,图,11.9,频谱幅度估计,计算清音幅度,计算浊音幅度,选择清音,/,,浊音谱幅度,图,11.8,改进的,MBE,,频带结构,子带,1,子带,2,,子带,K,-1,,子带,,K,◆,浊音带,时,,,按下式,计算,:,,,,,,,,,,如果,数,码率足够高,也可以,

45、直接传送,,,A,m,(,ω,0,),。,,◆,清音带,时,,,A,m,按下式,计算,:,,,,,◆,对于,最高分频带,,K,,,其,频带范围,是,,a,3,k,-2,≤,ω,<,b,M,,,,,,,,包含,,M,-3,k,+3,个,谱幅度,。,令,直流分量,,A,0,=0,。,第,11,章,多带激励声码器,,11.3,,多带激励语音分析,,同济大学电子与信息工程学院,-,40,-,赵晓群,,教授,改进,MBE,,模型的全部参数,为:,,,基音周期,,T,0,,,,,各带的,,V/U,,判决,,V,k,, (,k,=1,2,,,…,,K,),,,,,各谐波处,的,最佳幅度,,A,m,, (,m

46、,=1,2,,,…,,M,),。,,◆,参数,传送给解码器前,需,量化,、,编码,。,,◆,,INMARSAT-M,,语音编码器的,比特率,为,,6.4,,kbit/s,,,,,帧长,,20,,ms,,,每帧,,128,,bit,,,,,其中,,45,,bit,,留给,信道编码,用,余,,83,,bit,,供量化,模型参数,用,。,,◆,表,11,.2,:,比特分配,表,。,,,(,参数量化的方法从略,),第,11,章,多带激励声码器,,11.3,,多带激励语音分析,,同济大学电子与信息工程学院,-,41,-,赵晓群,,教授,表,11,.2,模型参数比特分配,,,,参数,基音周期,V/U,判决

47、,频谱幅度,每帧比特数,8,K,75,-,K,第,11,章 多带激励声码器,,11.4,多带激励语音合成,,两种,合成方法,:,频域合成法,、,时域合成法,。,,◆,频域合成法,:,重建,语音谱,,,求,Fourier,,反变换,得,时域序列,。,,,相当于分析过程,的,逆过程,。,,,,,,特点:,比较直接,但不能保证合成语音,基音周期,的,平滑变化,。,,◆,时域合成法,:,利用,插值,实现,帧间基音周期,的,平滑过渡,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,可使,合成语音更自然。,,,,,,因,此,,,实际的,,MBE,,算法都采用这种方法。,,◆,下面

48、,介绍,时域合成法,。,,,图,11,.,10,:,改进,,MBE,,语音合成,框图,。,,◆,浊音成分,与,清音成分,分开合成,,,,,,,,,,,再,相加形成,完整的,合成语音,。,,第,11,章,多带激励声码器,,11.4,,多带激励语音合成,,同济大学电子与信息工程学院,-,42,-,赵晓群,,教授,图,11.10,改进,MBE,语音合成方框图,清音合成,⊕,浊音合成,合成语音,,11.4.1,,清音成分的合成,,清音成分,的合成用,白噪声激励,。,,◆,初始值,为,,u,(,-,105) = 3147,。按下式产生一个,白噪声序列,,u,(,n,),:,,,,◆,对相继的,合成语音,

49、帧,,u,(,n,),,移动,,20,,ms,(,160,,样点,),,,,对,,u,(,n,),加窗,,合成窗,,w,x,(,n,),长,:,209,,样点,。,,,因此,在相继合成语音帧之间,,噪声序列,重叠,,49,,样点,。,,,,,对加窗后的,,u,(,n,),进行,,256,,点的,,DFT,,,得,:,第,11,章,多带激励声码器,,11.4,,多带激励语音合成,,同济大学电子与信息工程学院,-,43,-,赵晓群,,教授,◆,再,根据,谐波频带,,m,,是,浊音,区,(,V,k,=1,)或,清音,区,(,V,k,=0,),,,,再对,,U,w,(,l,),进行,修正,得,U,wc

50、,(,l,),:,,,,,,,,式中,,,a,m,,,b,m,,——,定义,见前面;,,,,,A,m,(0),——,当前帧,的,,A,m,值。,,,,γ,m,——,伸缩系数,,,是,合成窗,,w,x,(,n,),,与,,,,基音精细估计窗,,w,R,(,n,),的函数,,,,◆,修正效果相当于用一组,带通滤波器滤,除浊音带的信号。,第,11,章,多带激励声码器,,11.4,,多带激励语音合成,,同济大学电子与信息工程学院,-,44,-,赵晓群,,教授,◆,U,wc,(,l,),中很低及很高的频率成分都置,0,,,即,:,,,◆,对,得到,的,频域各点,,U,wc,(,l,),,,依,下式,计算

51、,其,,IDFT,:,,,,◆,为,平滑,合成语音,,需,与前一帧的,清音序列,作,叠接处理,。,,设,本帧,和,前一帧的,清音序列,分别,用,,,,,,表示,,,,则,当前合成语音的清音部分,,x,U,(,n,),由下式,计算,:,,,,,,式,中,,,N,——,帧长,,,N,=160,;,,且,时,,,。,第,11,章,多带激励声码器,,11.4,,多带激励语音合成,,同济大学电子与信息工程学院,-,45,-,赵晓群,,教授,,11.4.2,浊音成分的合成,,方法:,先,计算,各,谐波分量,,x,V,m,(,n,),,再,叠加,,,得总的浊音,即,:,,,,,式中,,M,(0),,,M,(

52、-1),——,当前帧,、,前一帧,所含谐波的个数,,,◆,第,,m,,次谐波的,谱幅度,,A,m,按以下规则,确定,:,,,,并且,,,,式中,,A,m,(0),,,A,m,(-1),——,当前帧,、,前一帧,第,,m,,次谐波的,谱幅度,。,,,下面算式中的参数,,x,(0),,,x,(-1),表示,当前帧,、,前一帧,的参数,,x,。,第,11,章,多带激励声码器,,11.4,,多带激励语音合成,,同济大学电子与信息工程学院,-,46,-,赵晓群,,教授,分,5,,种不同的前后帧组合情况,,,进行合,成语音的,平滑过渡,:,,,①,当前帧,/,前一帧,的第,,m,,次谐波,皆,为,清音,:

53、,,◆,清音分量按上面,的,合成方法合成,;,浊音分量,置,,0,。,,,②,当前帧,第,,m,,次谐波为,清音,,,前一帧,为,浊音,:,,◆,浊,/,清过渡,,该部分的,浊音分量,为:,,,,③,当前帧,第,,m,,次谐波为,浊音,,,前一帧,为,清音,:,,◆,清,/,浊过渡,,该部分的,浊音分量,为:,,,,④,当前帧,/,前一帧,的第,,m,,次谐波,皆,为浊音,且,,◆,该部分的,浊音分量,为:,第,11,章,多带激励声码器,,11.4,,多带激励语音合成,,同济大学电子与信息工程学院,-,47,-,赵晓群,,教授,计算中,,,时,,⑤,当前帧,/,前一帧,的第,,m,,次谐波,皆

54、,为,浊音,,且,,◆,该部分的,浊音分量,为:,,,,式,中,,a,m,(,n,),——,幅度函数,;,,,θ,m,(,n,),——,相位函数,;,第,11,章,多带激励声码器,,11.4,,多带激励语音合成,,同济大学电子与信息工程学院,-,48,-,赵晓群,,教授,◆,其,中,,,相位参数,,按以下算式每帧进行,更新,:,,,,,,,,,式中,,,——,,当前帧,中清音,谱幅度,的数目,;,,,——,,随机数,,在区间,,[,-,π,,,π,),中均匀分布,,,,,;,,,——,,当前帧,的,噪声序列,。,第,11,章,多带激励声码器,,11.4,,多带激励语音合成,,同济大学电子与信息工程学院,-,49,-,赵晓群,,教授,,11.4.3,重建语音的产生,,,分别求出,:,清音部分,和,浊音部分,后,,,,最后的,合成语音,为,:,,,,◆,,MBE,,声码器是从改善激励源出发的一种语音压缩编码方案。是建立在频谱分析基础上的又一种,激励模式,。,,◆,低码率语音编码中,,,合成音质较传统声码器好得多,,,,且有较好的,自然度,和,容忍环境噪声,的能力。,第,11,章,多带激励声码器,,11.4,,多带激励语音合成,,同济大学电子与信息工程学院,-,50,-,赵晓群,,教授,谢 谢,!,

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

相关资源

更多
正为您匹配相似的精品文档
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!