原文服务方: 计算机应用研究       
摘要:
汉语语言在书面表达时不具有天然分词的特性,词汇与词汇之间没有分词标记,因此在汉语文本的识别中需结合其行文的习惯及规则,即所谓的词汇特征.已有研究通常在实验中显式地标注词汇特征来提高识别效果,增加了人工处理流程,极大地加重了算法移植的工作量.研究并归纳了常用汉语语言的词汇特征,并利用条件随机场(conditional random fields,CRF)的特征提取能力,自行实现了复杂特征函数,在语料只具有简单标注的前提下,隐式地提取词汇特征,提高了识别效果.实验证明,在汉语分词中应用复杂词汇特征能有效提高识别性能,提供了在应用中提高识别算法可移植性的新思路.
推荐文章
基于条件随机场的古汉语词义消歧研究
中文信息处理
古汉语
词义消歧
条件随机场
基于条件随机场的汉语分词系统
汉语分词
条件随机场
感知机
基于条件随机场的汉语命名实体识别
可视化工作室2008
条件随机场
汉语分词
命名实体识别
汉语词汇词义可变性初探
汉语
词汇
语义
可变性
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于条件随机场的汉语词汇特征研究
来源期刊 计算机应用研究 学科
关键词 条件随机场 汉语词汇特征 信息提取 命名实体识别
年,卷(期) 2020,(6) 所属期刊栏目 算法研究探讨
研究方向 页码范围 1724-1728,1754
页数 6页 分类号 TP391
字数 语种 中文
DOI 10.19734/j.issn.1001-3695.2018.10.0859
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 史晟辉 北京化工大学信息科学与技术学院 13 82 5.0 8.0
2 黄定琦 北京化工大学信息科学与技术学院 1 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (51)
共引文献  (13)
参考文献  (15)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1964(1)
  • 参考文献(0)
  • 二级参考文献(1)
1965(1)
  • 参考文献(0)
  • 二级参考文献(1)
1983(1)
  • 参考文献(0)
  • 二级参考文献(1)
1992(1)
  • 参考文献(0)
  • 二级参考文献(1)
1994(2)
  • 参考文献(0)
  • 二级参考文献(2)
1997(2)
  • 参考文献(0)
  • 二级参考文献(2)
2003(2)
  • 参考文献(0)
  • 二级参考文献(2)
2004(3)
  • 参考文献(0)
  • 二级参考文献(3)
2005(4)
  • 参考文献(0)
  • 二级参考文献(4)
2006(1)
  • 参考文献(1)
  • 二级参考文献(0)
2007(2)
  • 参考文献(0)
  • 二级参考文献(2)
2008(4)
  • 参考文献(1)
  • 二级参考文献(3)
2009(4)
  • 参考文献(0)
  • 二级参考文献(4)
2010(5)
  • 参考文献(1)
  • 二级参考文献(4)
2011(6)
  • 参考文献(1)
  • 二级参考文献(5)
2012(3)
  • 参考文献(0)
  • 二级参考文献(3)
2014(5)
  • 参考文献(0)
  • 二级参考文献(5)
2015(8)
  • 参考文献(3)
  • 二级参考文献(5)
2016(4)
  • 参考文献(1)
  • 二级参考文献(3)
2017(2)
  • 参考文献(2)
  • 二级参考文献(0)
2018(5)
  • 参考文献(5)
  • 二级参考文献(0)
2020(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
条件随机场
汉语词汇特征
信息提取
命名实体识别
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用研究
月刊
1001-3695
51-1196/TP
大16开
1984-01-01
chi
出版文献量(篇)
21004
总下载数(次)
0
总被引数(次)
238385
论文1v1指导