相关文章  
  • 等离子体显示器驱动装置及方法
  • 等离子体显示面板及其驱动方法
  • 用于驱动等离子体显示面板的装置和方法
  • 具有视觉检查装置的薄膜晶体管阵列面板及其检查方法
  • 液晶显示器的数据驱动设备和方法
  • 用于液晶显示器的数据驱动装置和方法
  • 显示驱动装置以及其驱动控制方法
  • 乐器的键
  • 液晶显示器
  • 带方言背景的汉语语音识别方法
  •   推荐  
      科普之友首页   专利     科普      动物      植物        天文   考古   前沿科技
     您现在的位置在:  首页>>专利 >>专利推广

    基于波形相关法的语音信号基音周期检测方法<%=id%>

    15/00
    颁 证 日:
    优 先 权:
    申请(专利权)人: 北京工业大学
    地 址: 100022北京市朝阳区平乐园100号
    发 明 (设计)人: 鲍长春
    国 际 申 请:
    国 际 公 布:
    进入国家日期:
    专利 代理 机构: 北京工大思海专利代理有限责任公司
    代 理 人: 张慧
    摘要
      基于波形相关法的语音信号基音周期检测方法,属于语音信号处理领域。本发明是由语音采集系统将所需检测的语音信号输入计算机,在计算机处理器中完成对语音信号基音周期的检测,主要方法是在时域内,根据数字语音信号的准周期特性,通过比较原始信号和它的移位后的信号之间的相关性来确定基音周期。特征在于,是利用过去的语音信号样值,来减少传统波形相关估计的延时,同时在基音检测主过程的前端和末端加入了有效的预处理和后处理技术,进行基音周期检测。基音检测方法主要包括四个步骤,第一步为预处理,第二步为语音信号相关系数估计,第三步为后处理,第四步为清音/浊音判决。该方法使得在一般背景噪声环境下,基音周期估计的准确率达到99%。
    主权项
      权利要求书 1、基于波形相关法的语音信号基音周期检测方法,是由语 音采集系统将所需检测的语音信号输入计算机,在计算机 处理器中完成对语音信号基音周期的检测,主要方法是在 时域内,根据数字语音信号的准周期特性,通过比较原始 信号和它的移位后的信号之间的相关性来确定基音周期, 本发明的特征在于:利用过去的语音信号样值,来减少传 统波形相关估计的延时,同时在语音信号相关估计的前后 加入了预处理和后处理技术,进行基音周期检测; 该基音检测方法主要包括四个步骤,第一步为预处理, 第二步为语音信号相关系数估计,第三步为后处理,第四 步为清音/浊音判决,其步骤为: 第一步进行语音的预处理,包括去均值、低通滤波和 数值滤波三部分,各部分分述如下: (1)去均值方法为:对于初始输入的数字语音信号s(n),通常 其均值μ不为零或附带有低频噪声,在计算相关函数时,首 先要减掉均值μ,去均值的信号s′(n)为 s′(n)=s(n)-μ 其中 式中N为数字语音信号分析帧长; (2)低通滤波方法为: 2 对去均值的语音信号进行800Hz低通滤波,去除了第三 和第四个高频共振峰及高频噪声的影响,低通滤波器是依 据双线性变换法设计的一个五阶椭圆低通滤波器,其传递 函数为: 式中的滤波器系数Ai和Bj分别为: {Ai}={0.008233,-0.004879,0.007632,0.007632,-0.004879,0.008233} {Bi}={1.0000,-3.6868,5.8926,-5.0085,2.2518,-0.4271} (3)数值滤波方法为: 在低通滤波器之后级联一个数值滤波器去除了声道第一和 第二个共振峰的影响;该数值滤波器的传递函数为: 式中p为数值滤波器阶数, 为数值滤波器系数; 第二步进行语音信号相关系估计,并以其作为基音检 测的依据,具体步骤如下: 令(n)为预处理后的数字语音信号,则(n)和其移位后的信 号(n-τ)之间的平方误差为 3 式中β为增益因子,τ为介于20和120个样点之间的整数 延时,当n-τ<0时,将用到过去的语音信号样值,使E(τ)最 小的τ值即为当前帧语音信号的基音周期初估值;令 E(τ)/β=0,可以得到这个最小的E(τ)为: 使E(τ)最小等价于使相关系数 最大,使ρ(τ)最大的τ值即为当前帧语音信号的基音周期初 估值; 第三步和第四步为进行后处理和利用ρ(τ)进行语音信 号的清音/浊音判决,具体步骤如下: (1)利用下式求预处理后的语音信号(n)的对数能量 E(dB): 式中ε是一个很小的正常数,当E小于给定门限Eth时,语音 能量太小,判决为清音,当E大于Eth,且在允许的基频范围 内时,判为浊音; 4 (2)对E大于Eth的基音周期进行后处理,措施为:首先,在 三个基音区域内计算ρ(τ),分别得到各自区域内的最大ρ(τ) 值及对应的延迟,记为ρmax1,ρmax2和ρmax3、τ1,τ2,和τ3,这三个区域 分别为80~120,40~79和20~39,其次,按如下逻辑确定 最优基音延迟τopt: τopt=τ1 ρmax=ρmax1 ifρmax2≥cρmax ρmax=ρmax2 τopt=τ2 end ifρmax3≥cρmax ρmax=ρmax3 τopt=τ3 end 这里c=0.96为经验因子; (3)确定周期性水平量Zp,设ρ的最大峰值为ρmax(后处理后 的),ρ的前三个峰的平均值为: 则周期性水平量Zp计算为: Zp=ρmax+ρavr 当Zp小于给定的门限Zth时,说明周期性不强,判决为清音, 当Zp大于给定的门限Zth时,且在允许的基频范围内时,判 5 为浊音,并输出对应的优化基音延迟τopt。 6
         

          设为首页       |       加入收藏       |       广告服务       |       友情链接       |       版权申明      

    Copyriht 2007 - 2008 ©  科普之友 All right reserved