基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
字-音转换是语音合成系统中的一个重要模块,其中多音词和以单字词形式存在的多音字读音的确定一直是个没有很好解决的问题.本文通过对大量标注有正确拼音的语料的统计,指出着重解决41个重点多音字和22个重点多音词就可基本解决字-音转换的问题.本文采用基于扩展的随机复杂度的随机决策列表方法自动提取多音字(词)的读音规则,将字-音转换的错误率由8.8‰降低到4.4‰.规则的训练和测试的材料的标注是一个耗费人力和时间的工作,而训练材料的数量和质量又直接影响最终的结果.本文提出一种半自动的语料标注流程,可以节省将近一半的人工和时间.
推荐文章
一种基于多音字的中文文本篡改检测水印算法
零水印
多音字
文本水印
鲁棒性
高中数学统计学的学习方法分析
高中数学
统计学
学习方法
宋词字-音转换中多音字处理研究
字音转换
多音字
宋词
格律
字符串匹配
一种并行决策树学习方法研究
决策树
并行学习
故障诊断
分裂属性
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 解决多音字字-音转换的一种统计学习方法
来源期刊 中文信息学报 学科 工学
关键词 基于扩展的随机复杂度的随机决策列表 字-音转换 多音字 多音词
年,卷(期) 2002,(3) 所属期刊栏目
研究方向 页码范围 39-45
页数 7页 分类号 TP391
字数 5851字 语种 中文
DOI 10.3969/j.issn.1003-0077.2002.03.007
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 初敏 7 162 5.0 7.0
2 张子荣 北京理工大学计算机科学与工程系 1 28 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (5)
共引文献  (28)
参考文献  (7)
节点文献
引证文献  (28)
同被引文献  (9)
二级引证文献  (50)
1991(1)
  • 参考文献(1)
  • 二级参考文献(0)
1992(2)
  • 参考文献(1)
  • 二级参考文献(1)
1993(1)
  • 参考文献(1)
  • 二级参考文献(0)
1995(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(3)
  • 参考文献(2)
  • 二级参考文献(1)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(1)
  • 二级参考文献(0)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(1)
  • 二级参考文献(0)
2002(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2003(1)
  • 引证文献(1)
  • 二级引证文献(0)
2004(3)
  • 引证文献(3)
  • 二级引证文献(0)
2005(3)
  • 引证文献(3)
  • 二级引证文献(0)
2006(3)
  • 引证文献(2)
  • 二级引证文献(1)
2007(10)
  • 引证文献(5)
  • 二级引证文献(5)
2008(13)
  • 引证文献(6)
  • 二级引证文献(7)
2009(9)
  • 引证文献(2)
  • 二级引证文献(7)
2010(8)
  • 引证文献(2)
  • 二级引证文献(6)
2011(2)
  • 引证文献(1)
  • 二级引证文献(1)
2012(4)
  • 引证文献(0)
  • 二级引证文献(4)
2013(4)
  • 引证文献(1)
  • 二级引证文献(3)
2014(5)
  • 引证文献(0)
  • 二级引证文献(5)
2015(3)
  • 引证文献(0)
  • 二级引证文献(3)
2016(5)
  • 引证文献(0)
  • 二级引证文献(5)
2017(1)
  • 引证文献(0)
  • 二级引证文献(1)
2018(3)
  • 引证文献(2)
  • 二级引证文献(1)
2019(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
基于扩展的随机复杂度的随机决策列表
字-音转换
多音字
多音词
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
中文信息学报
月刊
1003-0077
11-2325/N
16开
北京海淀区中关村南四街4号
1986
chi
出版文献量(篇)
2723
总下载数(次)
5
总被引数(次)
45413
论文1v1指导