摘要:
文章提出一种提高汉语辅音识别性能的框架,在此框架下构造了一个基于声学-语音层分析的多级分类器,实现对全部汉语辅音的无重叠分类,测试了将辅音分类结果与概率统计模型结合的效果.重点讨论了用于汉语辅音分类的几种特征参数提取技术和实验结果.文章所提取的特征参数包括非嗓音段持续时间(DUP)、归一化的有效频带能量趋势等,涉及时域、频域和小波变换域等不同分析处理方法,特征参数简单、有效,具有较好的与后接元音无关和非特定人性质.分类器将21个汉语辅音分为5类,{m,n,l,r},{b,d,g},{p,t,k,f,h},{zh,ch,sh},{z,c,s,j,q,x};其分类正确率分别达97.21%、97.10%,97.70%,93.31%和94.80%.实验所用的语音资料库包括21个话者的孤立字汉语辅音发音资料.