基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
提出一种基于非负矩阵分解(Nonnegative matrix factorization,NMF)后验特征优化和修正分段动态时间规整(Segmental dynamic time warping,SDTW)检索的无监督语音查询样例检测方法.该方法首先应用频域线性预测(Frequency domain linear prediction,FDLP)声学特征参数代替梅尔频率倒谱系数(Mel-frequency cepstral coefficients,MFCCs)训练高斯混合模型(Gaussian mixture model,GM M)模型,然后使用NM F算法对高斯后验特征矩阵进行分解,将得到的基矩阵作为子空间变换矩阵对原始后验特征投影,投影可以突出特征中主要分量,平滑距离矩阵.在检索阶段,使用多相邻输出得分对最佳匹配得分进行修正,用于代替标准SDTW算法的1-best输出得分.实验结果表明,在不增加检索时间的情况下,该方法相比应用MFCCs和FDLP特征的基线系统性能提升明显,检索精度分别相对提升了18.6%和18.1%.
推荐文章
基于后验概率特征的改进无监督语音样例检测
无监督
语音样例检测
后验概率
声学分段模型
主成分分析
基于动态时间规整的语音样例快速检索算法
语音样例检索
音素后验概率
分段累积近似下界估计
动态时间规整
内积距离
基于倒谱特征的重放语音检测
物联网
自动说话人验证
倒谱特征
重放语音检测
倒谱均值方差归一化
逆梅尔倒谱系数
基于唇动特征的语音端点检测
语音端点检测
唇动
特征提取
概率神经网络
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于NMF后验特征优化的语音查询样例检测
来源期刊 数据采集与处理 学科 工学
关键词 无监督 查询样例检测 后验特征 非负矩阵分解优化 修正分段动态时间规整
年,卷(期) 2017,(6) 所属期刊栏目
研究方向 页码范围 1198-1207
页数 10页 分类号 TP391
字数 7173字 语种 中文
DOI 10.16337/j.1004-9037.2017.06.015
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 张连海 信息工程大学信息系统工程学院 35 152 7.0 11.0
2 李勃昊 信息工程大学信息系统工程学院 3 10 1.0 3.0
3 曹建凯 信息工程大学信息系统工程学院 1 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (7)
共引文献  (11)
参考文献  (4)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1999(1)
  • 参考文献(1)
  • 二级参考文献(0)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(2)
  • 参考文献(0)
  • 二级参考文献(2)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(2)
  • 参考文献(2)
  • 二级参考文献(0)
2017(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
无监督
查询样例检测
后验特征
非负矩阵分解优化
修正分段动态时间规整
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
数据采集与处理
双月刊
1004-9037
32-1367/TN
大16开
南京市御道街29号1016信箱
28-235
1986
chi
出版文献量(篇)
3235
总下载数(次)
7
总被引数(次)
25271
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导