基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
目前现有的双模态语音数据库多为外文,且绝大部分都是为语音识别或身份认证服务的.鉴于此,我们根据汉语语音的特点,建立了国内第一个较为完备的汉语语音视觉合成数据库CVSS1.0.它具有如下特点:包含136个单音节和265个连续发音语句的视频和音频数据,其语料规模超出目前同类数据库;语料是在汉语发音方式归类的基础上,依据汉字出现频度的高低选取,其中的独白语句涵盖了大部分的韵律结构,因此其反映的规律具有代表性;记录了脸部发音动作的三维运动信息;用绿点标出了部分MPEG4定义的脸部特征点,方便跟踪;可服务于多种视觉语音合成研究,有很高的通用性.
推荐文章
情感语音数据库优化及PAD情感模型量化标注
情感语音数据库
维度情感描述
PAD情感模型
普通话双模态情感语音数据库的设计与评价
数据库
情感语音
发音动作参数
汉语普通话
信号处理
普通话语音库
Authorware中音视频再压缩及数据库集成技术研究
音频再压缩
视频再压缩
数据库集成技术
外部数据库
基于模糊综合评价法的情感语音数据库的建立
情感语音数据库
模糊综合评价
层次分析法
熵权法
情感语音识别
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 汉语语音视觉合成研究数据库CVSS1.0
来源期刊 微计算机应用 学科 工学
关键词 视觉语音合成 数据库 语料 MPEG4
年,卷(期) 2007,(3) 所属期刊栏目 多媒体技术
研究方向 页码范围 260-265
页数 6页 分类号 TN91
字数 5014字 语种 中文
DOI 10.3969/j.issn.2095-347X.2007.03.010
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 杜利民 中国科学院声学研究所 58 892 13.0 29.0
2 张欣 中国科学院声学研究所 53 384 10.0 18.0
3 赵向阳 中国科学院声学研究所 7 403 4.0 7.0
4 陈柯 中国科学院声学研究所 7 89 5.0 7.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (8)
共引文献  (25)
参考文献  (3)
节点文献
引证文献  (6)
同被引文献  (15)
二级引证文献  (24)
1976(1)
  • 参考文献(0)
  • 二级参考文献(1)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(2)
  • 参考文献(0)
  • 二级参考文献(2)
1998(2)
  • 参考文献(0)
  • 二级参考文献(2)
2000(2)
  • 参考文献(1)
  • 二级参考文献(1)
2002(2)
  • 参考文献(2)
  • 二级参考文献(0)
2007(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2008(1)
  • 引证文献(1)
  • 二级引证文献(0)
2009(1)
  • 引证文献(1)
  • 二级引证文献(0)
2012(3)
  • 引证文献(3)
  • 二级引证文献(0)
2013(1)
  • 引证文献(0)
  • 二级引证文献(1)
2014(3)
  • 引证文献(0)
  • 二级引证文献(3)
2015(7)
  • 引证文献(0)
  • 二级引证文献(7)
2016(5)
  • 引证文献(0)
  • 二级引证文献(5)
2017(3)
  • 引证文献(0)
  • 二级引证文献(3)
2019(5)
  • 引证文献(0)
  • 二级引证文献(5)
2020(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
视觉语音合成
数据库
语料
MPEG4
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
网络新媒体技术
双月刊
2095-347X
10-1055/TP
大16开
北京海淀区北四环西路21号
2-304
1980
chi
出版文献量(篇)
3082
总下载数(次)
5
论文1v1指导