基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
引入一种基于贝叶斯切线形状模型(BTSM)的口形轮廓特征提取和基于线性判别分析(LDA)的视觉语音动态特征提取方法,该特征充分体现了口形特征变化的动态性,消除了直接口形轮廓几何特征的冗余.同时采用一种新颖的多流异步动态贝叶斯网络(MS-ADBN)模型来实现音视频的连续语音识别,该模型在词节点级别体现了音视频流的同步异步性.识别实验结果表明:采用LDA视觉语音动态特征的系统性能明显优于静态的口形轮廓几何特征,在语音信噪比为0~30 dB的测试环境下,融合LDA视觉特征的MS-ADBN模型比多流异步HMM的平均识别率提高4.92%,说明MS-ADBN模型更好地表达了音视频流之间的异步关系.
推荐文章
基于DPI技术的语音视频流量监控系统设计与实现
DPI技术
语音视频监控系统
网络协议
流量监控架构
基于发音特征的音视频融合语音识别模型
:动态贝叶斯网络
发音特征
音视频融合
语音识别
异步
基于Android的音视频监控软件的设计
音视频监控
同步
移动
基于MPC的音视频同步码率自适应测试
音视频流媒体
HTTP协议
模型预测控制
码率自适应算法
音视频同步
QoE用户评价指标
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于BTSM-LDA的口形动态特征及多流异步音视频语音识别
来源期刊 数据采集与处理 学科 工学
关键词 动态贝叶斯网络 语音识别 贝叶斯切线形状模型 多流异步 线性判别分析
年,卷(期) 2008,(4) 所属期刊栏目 理论与试验研究
研究方向 页码范围 397-403
页数 7页 分类号 TP391.4
字数 6604字 语种 中文
DOI 10.3969/j.issn.1004-9037.2008.04.004
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 赵荣椿 西北工业大学计算机学院 223 3302 29.0 44.0
2 樊养余 西北工业大学计算机学院 212 1698 20.0 32.0
3 蒋冬梅 西北工业大学计算机学院 33 124 6.0 8.0
4 吕国云 西北工业大学计算机学院 23 76 5.0 7.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (2)
共引文献  (2)
参考文献  (2)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1995(2)
  • 参考文献(1)
  • 二级参考文献(1)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
动态贝叶斯网络
语音识别
贝叶斯切线形状模型
多流异步
线性判别分析
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
数据采集与处理
双月刊
1004-9037
32-1367/TN
大16开
南京市御道街29号1016信箱
28-235
1986
chi
出版文献量(篇)
3235
总下载数(次)
7
总被引数(次)
25271
相关基金
国家高技术研究发展计划(863计划)
英文译名:The National High Technology Research and Development Program of China
官方网址:http://www.863.org.cn
项目类型:重点项目
学科类型:信息技术
论文1v1指导