基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
从语音信号声学特征空间的非线性流形结构特点出发,利用流形上的压缩感知原理,构建新的语音识别声学模型.将特征空间划分为多个局部区域,对每个局部区域用一个低维的因子分析模型进行近似,从而得到混合因子分析模型.将上下文相关状态的观测矢量限定在该非线性低维流形结构上,推导得到其观测概率模型.最终,每个状态由一个服从稀疏约束的权重矢量和若干个服从标准正态分布的低维局部因子矢量所决定.文中给出了局部区域潜在维数的确定准则及模型参数的迭代估计算法.基于RM 语料库的连续语音识别实验表明,相比于传统的高斯混合模型(Gaussian mixture model, GMM)和子空间高斯混合模型(Subspace Gaussian mixture model, SGMM),新声学模型在测试集上的平均词错误率(Word error rate, WER)分别相对下降了33.1%和9.2%.
推荐文章
利用非线性声学测量冰厚的方法研究
非线性声学
差频信号
原波
泵波
基于混沌特性的情感语音非线性特征研究
情感语音识别
混沌特性
非线性特征
支持向量机
基于声学特征信号识别的高速机械开关故障检测方法研究
直流断路器
高速机械开关
声学信号
样本数据
故障识别
基于心理声学模型的高性能语音质量评价算法
心理声学模型
美尔倒谱
感知扰动
质量评价
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于声学特征空间非线性流形结构的语音识别声学模型
来源期刊 自动化学报 学科
关键词 语音识别 声学模型 非线性流形 混合因子分析
年,卷(期) 2015,(5) 所属期刊栏目 论文与报告
研究方向 页码范围 1024-1033
页数 10页 分类号
字数 10631字 语种 中文
DOI 10.16383/j.aas.2015.c140399
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 屈丹 解放军信息工程大学信息系统工程学院 48 205 7.0 12.0
2 牛铜 解放军信息工程大学信息系统工程学院 10 40 4.0 6.0
3 李弼程 解放军信息工程大学信息系统工程学院 77 636 13.0 22.0
4 张文林 解放军信息工程大学信息系统工程学院 13 68 5.0 8.0
5 裴喜龙 解放军信息工程大学信息系统工程学院 3 18 2.0 3.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (12)
节点文献
引证文献  (12)
同被引文献  (52)
二级引证文献  (13)
2004(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(3)
  • 参考文献(3)
  • 二级参考文献(0)
2011(2)
  • 参考文献(2)
  • 二级参考文献(0)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2013(2)
  • 参考文献(2)
  • 二级参考文献(0)
2014(3)
  • 参考文献(3)
  • 二级参考文献(0)
2015(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2015(1)
  • 引证文献(1)
  • 二级引证文献(0)
2016(2)
  • 引证文献(2)
  • 二级引证文献(0)
2017(4)
  • 引证文献(2)
  • 二级引证文献(2)
2018(6)
  • 引证文献(3)
  • 二级引证文献(3)
2019(7)
  • 引证文献(2)
  • 二级引证文献(5)
2020(5)
  • 引证文献(2)
  • 二级引证文献(3)
研究主题发展历程
节点文献
语音识别
声学模型
非线性流形
混合因子分析
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
自动化学报
月刊
0254-4156
11-2109/TP
大16开
北京市海淀区中关村东路95号(北京2728信箱)
2-180
1963
chi
出版文献量(篇)
4124
总下载数(次)
26
总被引数(次)
120705
论文1v1指导