基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
提出一种基于人类计算的语音语料库标注方法.该标注方法的主要思路是通过一个基于Web的语言学习系统来收集由大量学习者(用户)输入的词汇标注和音标标注,并从中选择出现概率最大的用户输入作为语料的正确标注.为了保证通过这种人类计算方法获得的标注文本的质量,使用了一些计算机辅助机制来校验收集到的标注的可靠性.采用这种方法实现语音语料库标注的主要优点在于将语料库标注和语言学习相结合,无需专门投入大量的人力来进行枯燥乏味的语料库标注工作,从而节省了语料库标注的成本.对这种基于人类计算的语音语料库标注技术进行了探讨,说明了用于收集用户输入的语言学习系统的设计以及标注生成系统的设计.系统的应用表明,该标注方法能够有效、低成本地生成语音语料库的词汇标注和音标标注.
推荐文章
面向事件的多语平行语料库构建研究
语料收集原则
标注规范
可控多语语料库
关于旅游英语语料库的运用
旅游英语
语料库
标示语翻译
运用
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 利用人类计算技术的语音语料库标注方法及其实现
来源期刊 智能系统学报 学科 工学
关键词 语音语料库标注 人类计算 分布式知识获取 基于Web的语言学习
年,卷(期) 2009,(3) 所属期刊栏目
研究方向 页码范围 270-277
页数 8页 分类号 TP39
字数 7506字 语种 中文
DOI 10.3969/j.issn.1673-4785.2009.03.013
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 史晓东 厦门大学智能科学与技术系 31 290 8.0 16.0
2 刘勇进 厦门大学智能科学与技术系 2 6 2.0 2.0
3 沈映泉 厦门大学智能科学与技术系 1 4 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (4)
节点文献
引证文献  (4)
同被引文献  (2)
二级引证文献  (27)
1997(1)
  • 参考文献(1)
  • 二级参考文献(0)
2000(1)
  • 参考文献(1)
  • 二级参考文献(0)
2001(1)
  • 参考文献(1)
  • 二级参考文献(0)
2002(1)
  • 参考文献(1)
  • 二级参考文献(0)
2009(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2012(1)
  • 引证文献(1)
  • 二级引证文献(0)
2015(1)
  • 引证文献(1)
  • 二级引证文献(0)
2016(2)
  • 引证文献(1)
  • 二级引证文献(1)
2017(10)
  • 引证文献(0)
  • 二级引证文献(10)
2018(8)
  • 引证文献(1)
  • 二级引证文献(7)
2019(5)
  • 引证文献(0)
  • 二级引证文献(5)
2020(4)
  • 引证文献(0)
  • 二级引证文献(4)
研究主题发展历程
节点文献
语音语料库标注
人类计算
分布式知识获取
基于Web的语言学习
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
智能系统学报
双月刊
1673-4785
23-1538/TP
大16开
哈尔滨市南岗区南通大街145-1号楼
2006
chi
出版文献量(篇)
2770
总下载数(次)
11
总被引数(次)
12401
相关基金
国家留学基金
英文译名:
官方网址:http://www.csc.edu.cn/gb/
项目类型:
学科类型:
福建省自然科学基金
英文译名:Natural Science Foundation of Fujian Province of China
官方网址:http://www.fjinfo.gov.cn/fz/zrjj.htm
项目类型:重大项目
学科类型:
论文1v1指导