基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
为解决语音库裁剪会造成不定长损失的问题,首先提出了 NuClustering-VPA 算法,该算法对不同粒度的不定长变体进行递阶聚类,根据高阶聚类结果调整低阶变体的聚类,从而保留在声韵上最为重要的变体.接着提出了虚拟不定长替换的概念,意图弥补不定长的损失,并结合合成使用变体的频度,给出了可以任意比例裁剪语音库的StaRp-VPA算法.大规模测听表明,两种算法在裁剪率小于50%时,合成自然度几乎没有下降;当裁剪率大于50%时,StaRp-VPA给出的音库合成自然度也不会严重降低.两种裁剪在合成系统的移植中得到了很好的应用.
推荐文章
情感语音数据库优化及PAD情感模型量化标注
情感语音数据库
维度情感描述
PAD情感模型
基于模糊综合评价法的情感语音数据库的建立
情感语音数据库
模糊综合评价
层次分析法
熵权法
情感语音识别
基于C++的数据库驱动库的设计和实现
数据库驱动库
跨平台
C/C++
JDBC
ODBC
普通话双模态情感语音数据库的设计与评价
数据库
情感语音
发音动作参数
汉语普通话
信号处理
普通话语音库
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 数据驱动方法的语音库裁剪研究
来源期刊 高技术通讯 学科 工学
关键词 语音合成 语音库裁剪 可伸缩语音合成系统
年,卷(期) 2008,(1) 所属期刊栏目 计算机与通信技术
研究方向 页码范围 26-32
页数 7页 分类号 TP3
字数 7197字 语种 中文
DOI 10.3772/j.issn.1002-0470.2008.01.006
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 王仁华 中国科学技术大学电子工程与信息科学系 60 608 13.0 22.0
2 张巍 中国海洋大学计算机科学系 16 62 5.0 7.0
3 吴晓如 4 11 2.0 3.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (3)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1989(1)
  • 参考文献(1)
  • 二级参考文献(0)
2001(1)
  • 参考文献(1)
  • 二级参考文献(0)
2003(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
语音合成
语音库裁剪
可伸缩语音合成系统
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
高技术通讯
月刊
1002-0470
11-2770/N
大16开
北京市三里河路54号
82-516
1991
chi
出版文献量(篇)
5099
总下载数(次)
14
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
国家高技术研究发展计划(863计划)
英文译名:The National High Technology Research and Development Program of China
官方网址:http://www.863.org.cn
项目类型:重点项目
学科类型:信息技术
论文1v1指导