基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
近年来,条件随机场在汉语分词领域得到了广泛的应用。在对条件随机场模型进行训练时,训练语料的规模直接影响模型稳定性以及分词的准确率,但目前对语料规模的选取尚无指导性结论。针对上述问题选取Bakeoff2005和Bakeoff2006的一组不同规模的评测语料,使用cRF++0.53工具包实现字串序列词位标注分词,定量分析了训练语料规模对分词性能的影响,得出了基于条件随机场的汉语分词方法中,训练语料规模选取的量化结论。
推荐文章
基于条件随机场的汉语分词系统
汉语分词
条件随机场
感知机
基于条件随机场的汉语词汇特征研究
条件随机场
汉语词汇特征
信息提取
命名实体识别
基于条件随机场的汉语命名实体识别
可视化工作室2008
条件随机场
汉语分词
命名实体识别
基于条件随机场的古汉语词义消歧研究
中文信息处理
古汉语
词义消歧
条件随机场
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于条件随机场汉语分词的语料规模量化研究
来源期刊 电脑与电信 学科 工学
关键词 汉语分词 条件随机场 语料规模 词位标注
年,卷(期) 2012,(7) 所属期刊栏目 学术探讨
研究方向 页码范围 56-59
页数 4页 分类号 TN919.81
字数 3695字 语种 中文
DOI 10.3969/j.issn.1008-6609.2012.07.035
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 韩建敏 河南经贸职业学院信息管理系 15 49 4.0 6.0
2 周雪燕 中原工学院计算机学院 10 14 3.0 3.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (37)
共引文献  (354)
参考文献  (8)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1989(1)
  • 参考文献(0)
  • 二级参考文献(1)
1994(2)
  • 参考文献(1)
  • 二级参考文献(1)
1996(2)
  • 参考文献(0)
  • 二级参考文献(2)
1997(5)
  • 参考文献(0)
  • 二级参考文献(5)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(3)
  • 参考文献(0)
  • 二级参考文献(3)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(5)
  • 参考文献(1)
  • 二级参考文献(4)
2005(2)
  • 参考文献(0)
  • 二级参考文献(2)
2006(7)
  • 参考文献(0)
  • 二级参考文献(7)
2007(10)
  • 参考文献(3)
  • 二级参考文献(7)
2009(2)
  • 参考文献(1)
  • 二级参考文献(1)
2010(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
汉语分词
条件随机场
语料规模
词位标注
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
电脑与电信
月刊
1008-6609
44-1606/TN
大16开
广州市连新路171号国际科技中心B108室
1995
chi
出版文献量(篇)
8962
总下载数(次)
13
总被引数(次)
9565
论文1v1指导