一种语料库处理方法、装置及语音合成系统

摘要:
本发明公开了一种语料库处理方法、装置及语音合成系统。其中该方法包括:采集所有领域的语句,获得第一海量文本;对所述第一海量文本进行语音合成,记录语音合成过程从原始语料库选取的预选单元的编号;统计原始语料库中每个预选单元的使用次数,从所述原始语料库中裁减掉语音合成过程中使用次数低于第一预设阈值的预选单元,得到第一语料库。本发明通过利用设计文本和相关算法检查语料库节点的覆盖情况,对于语料库中没有被挑选或挑选次数极少的节点进行删除,降低决策树和语料库的规模形成特定语料库,从而能够在保证合成效果的前提下提高语音合成效率。
基本信息
专利类型 发明
申请(专利)号 CN201310115665.2 申请日 2013-04-03
授权公布号 CN104103268A 授权公告日 2014-10-15
申请人 中国移动通信集团安徽有限公司 
地址 安徽省合肥市长江西路99号
发明人 赵黎 万鹏 周崎 王韬 朱玉成 金文龙 柯晓岚 黄达志 吴晓如 赵志伟 
分类号 G10L13/02(2013.01) G10L13/06(2013.01)  主分类号 G10L13/02(2013.01)
国省代码 安徽 页数 10
代理机构 北京中誉威圣知识产权代理有限公司
代理人 中国移动通信集团安徽有限公司 
法律状态
法律状态公告日 法律状态 法律状态信息
2017.03.29 授权 授权
2014.11.12 实质审查的生效 实质审查的生效IPC(主分类):G10L 13/02申请日:20130403
2014.10.15 公开 公开
专利分析
关键词
关键词热度
相关文献总数  
(/次)
(/年)
相关专利
  • 热门期刊
  • 最新期刊
  • 期刊推荐
论文1v1指导