基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
提出一种改进后的递增式语料抽选方法,通过在递增的每个抽选阶段对所获语料进行二次筛选,加强对语料中语音单元的平衡控制能力.该方法的实验佐证以10年<人民日报>等报刊杂志为待选语料,共约2000万个句子,包括8472个前后语境子音.从这批待选语料中抽选获得的语料仅包括17865个句子,但对出现次数超过10的前后语境子音的覆盖率却达到了94.3%,语料中前后语境子音的分布方差为0.18×10-3.该方法除了在音子单元的覆盖率和分布均匀化方面的优异性能外,还具有较低的计算代价和存储代价,适宜于从报刊杂志、互联网等海量的真实语料中抽选语音识别声学模型的语料.
推荐文章
面向语音转换的汉语语料自动选取算法
中文信息处理
语音库
语音转换
覆盖率
一种DCT域的语音增强改进算法
语音增强
DCT
语音分量
噪声分量
最大后验概率估计
一种递增式归纳学习算法
机器学习
粗集
分辨矩阵
决策函数
基于视频三音子的双模态语料自动选取算法
可视语音合成
双模态语料
视频三音子
评估函数
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种改进后的递增式语音语料抽选算法
来源期刊 中国科学院研究生院学报 学科 工学
关键词 语音识别 声学模型 语料抽选
年,卷(期) 2005,(2) 所属期刊栏目
研究方向 页码范围 140-146
页数 7页 分类号 TP391
字数 5618字 语种 中文
DOI 10.3969/j.issn.1002-1175.2005.02.003
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 杜利民 中国科学院声学研究所语音交互技术研究实验室 58 892 13.0 29.0
2 宁振江 中国科学院声学研究所语音交互技术研究实验室 4 12 1.0 3.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (4)
共引文献  (17)
参考文献  (2)
节点文献
引证文献  (1)
同被引文献  (0)
二级引证文献  (0)
1995(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(1)
  • 二级参考文献(0)
2004(1)
  • 参考文献(1)
  • 二级参考文献(0)
2005(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2012(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
语音识别
声学模型
语料抽选
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
中国科学院大学学报
双月刊
2095-6134
10-1131/N
大16开
北京玉泉路19号(甲)
82-583
1984
chi
出版文献量(篇)
2247
总下载数(次)
2
总被引数(次)
15229
相关基金
国家重点基础研究发展计划(973计划)
英文译名:National Basic Research Program of China
官方网址:http://www.973.gov.cn/
项目类型:
学科类型:农业
论文1v1指导