基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
自然语言处理系统的性能和鲁棒性在很大程度上取决于建模过程中是否有足够的深度标注语料.传统的人工标注方法难以满足大规模 、高质量的深度语料标注需求,该文提出了基于群体智慧的语料标注方法,设计了标注模型,并就用户能力评测 、语料筛选 、任务管理 、协作标注 、行为分析 、质量控制 、决策加总 、考核激励等具体环节进行分析,提出了解决方案.项目实践表明:基于群体智慧的语料标注方法在应对创新性很强的自然语言处理研究项目时具有明显的优势.
推荐文章
吕苏语口语标注语料的自动分词方法研究
吕苏语
汉语标注语料
自动分词
改进结巴算法
一种基于规则优先级的词性标注方法
汉语自动分词
词性标注
兼类词
规则优先级
基于UG的工程图自动标注方法研究
工程图
自动标注
特征识别
UG二次开发
挤出模
肝癌领域精准医学语料标注研究
精准医学
肝肿瘤
本体
语料
标注
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于群体智慧的语料标注方法研究
来源期刊 中文信息学报 学科 工学
关键词 群体智慧 语料标注 自然语言处理
年,卷(期) 2017,(4) 所属期刊栏目 语言资源建设
研究方向 页码范围 108-113,131
页数 7页 分类号 TP391
字数 6562字 语种 中文
DOI 10.3969/j.issn.1003-0077.2017.04.016
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 俞士汶 北京大学计算语言学教育部重点实验室 88 2372 23.0 47.0
2 宋继华 北京师范大学信息科学与技术学院 57 461 11.0 18.0
3 穗志方 北京大学计算语言学教育部重点实验室 32 446 14.0 20.0
4 柯永红 北京大学计算语言学教育部重点实验室 3 9 2.0 3.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (21)
共引文献  (19)
参考文献  (9)
节点文献
引证文献  (4)
同被引文献  (21)
二级引证文献  (3)
1970(1)
  • 参考文献(0)
  • 二级参考文献(1)
1984(1)
  • 参考文献(0)
  • 二级参考文献(1)
1990(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(3)
  • 参考文献(0)
  • 二级参考文献(3)
2006(2)
  • 参考文献(1)
  • 二级参考文献(1)
2007(5)
  • 参考文献(2)
  • 二级参考文献(3)
2008(4)
  • 参考文献(1)
  • 二级参考文献(3)
2010(4)
  • 参考文献(2)
  • 二级参考文献(2)
2011(2)
  • 参考文献(1)
  • 二级参考文献(1)
2012(3)
  • 参考文献(1)
  • 二级参考文献(2)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
2017(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2018(1)
  • 引证文献(1)
  • 二级引证文献(0)
2019(3)
  • 引证文献(2)
  • 二级引证文献(1)
2020(3)
  • 引证文献(1)
  • 二级引证文献(2)
研究主题发展历程
节点文献
群体智慧
语料标注
自然语言处理
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
中文信息学报
月刊
1003-0077
11-2325/N
16开
北京海淀区中关村南四街4号
1986
chi
出版文献量(篇)
2723
总下载数(次)
5
相关基金
中国博士后科学基金
英文译名:China Postdoctoral Science Foundation
官方网址:http://www.chinapostdoctor.org.cn/index.asp
项目类型:
学科类型:
论文1v1指导