基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
听觉视觉双模态语音识别在国际上已经逐渐成为当前语音识别的热点之一,汉语的双模态识别研究也已开始启动.然而,由于视觉信息获取及处理难度极大,目前的双模态语音数据库的建设尚显薄弱,汉语方面更是空白.鉴于此,我们在进行听觉视觉双模态语音识别关键技术研究的同时,在分析国外同类数据库的结构的基础上,结合汉语语音的特点,建立了汉语语音的第一个双模态数据库CAVSR1.0.它具有如下特点:采用的语料涵盖所有声韵母,其规模(总数据量、音节量)超出目前国际上同类数据库;语料分布符合汉语声韵母的实际分布概率,因此其反映的规律具有代表性;捆绑了自动音节分割程序及脸部主要特征标定程序,使数据库具有很强的可扩展性.
推荐文章
普通话双模态情感语音数据库的设计与评价
数据库
情感语音
发音动作参数
汉语普通话
信号处理
普通话语音库
用K-D树实现对双模态多媒体数据库的有效查询
k-d树
多媒体数据库
数据库查询
普通话双模态情感语音数据库的设计与评价
数据库
情感语音
发音动作参数
汉语普通话
信号处理
普通话语音库
文档数据库与关系数据库研究
数据库
数据格式
数据结构
数据存储
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 汉语听觉视觉双模态数据库CAVSR1.0
来源期刊 声学学报 学科
关键词
年,卷(期) 2000,(1) 所属期刊栏目
研究方向 页码范围 42-49
页数 8页 分类号
字数 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 杜利民 中国科学院声学研究所 58 892 13.0 29.0
2 李国强 中国科学院声学研究所 19 197 9.0 14.0
3 张欣 中国科学院声学研究所 53 384 10.0 18.0
4 周治 中国科学院声学研究所 2 11 1.0 2.0
5 徐彦君 中国科学院声学研究所 3 110 2.0 3.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (5)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1976(1)
  • 参考文献(1)
  • 二级参考文献(0)
1994(1)
  • 参考文献(1)
  • 二级参考文献(0)
1996(1)
  • 参考文献(1)
  • 二级参考文献(0)
1997(1)
  • 参考文献(1)
  • 二级参考文献(0)
1998(1)
  • 参考文献(1)
  • 二级参考文献(0)
2000(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
引文网络交叉学科
相关学者/机构
期刊影响力
声学学报
双月刊
0371-0025
11-2065/O4
大16开
北京市北四环西路21号
2-181
1964
chi
出版文献量(篇)
2139
总下载数(次)
5
总被引数(次)
26571
论文1v1指导