原文服务方: 计算机应用研究       
摘要:
现有分词系统不能及时收录新词语,因而不能有效识别领域组合词。针对此问题,提出一种位置标签与词性相结合的组合词抽取方法。首先对语料进行文本预处理、添加位置标签、加权词频过滤等建立词条的位置标签集;然后依据位置标签集计算词条在句子中的相邻度判定组合词;最后制定反规则对抽取结果进行过滤,并对垃圾串进行两端逐步消减再判定进一步识别组合词。通过在不同语料库上进行实验,结果表明本方法具有更高的准确率。
推荐文章
基于组合词和同义词集的关键词提取算法
组合词
同义词集
中文网页
关键词提取
基于依存句法分析与分类器融合的触发词抽取方法
事件抽取
触发词
依存句法分析
触发词-实体描述对
支持向量机
分类器融合
基于主题特征的关键词抽取
关键词抽取
主题特征
主题模型
装袋决策树
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于位置标签与词性结合的组合词抽取方法
来源期刊 计算机应用研究 学科
关键词 组合词抽取 位置标签集 相邻度 反规则过滤 新词发现
年,卷(期) 2016,(4) 所属期刊栏目 算法研究探讨
研究方向 页码范围 1062-1065
页数 4页 分类号 TP391.1
字数 语种 中文
DOI 10.3969/j.issn.1001-3695.2016.04.022
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 欧阳柳波 湖南大学信息科学与工程学院 34 560 11.0 23.0
2 周伟光 湖南大学信息科学与工程学院 1 4 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (62)
共引文献  (102)
参考文献  (12)
节点文献
引证文献  (4)
同被引文献  (23)
二级引证文献  (0)
1975(1)
  • 参考文献(0)
  • 二级参考文献(1)
1983(1)
  • 参考文献(0)
  • 二级参考文献(1)
1993(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(2)
  • 参考文献(0)
  • 二级参考文献(2)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(2)
  • 参考文献(0)
  • 二级参考文献(2)
2002(2)
  • 参考文献(0)
  • 二级参考文献(2)
2003(2)
  • 参考文献(0)
  • 二级参考文献(2)
2004(5)
  • 参考文献(0)
  • 二级参考文献(5)
2005(6)
  • 参考文献(0)
  • 二级参考文献(6)
2006(14)
  • 参考文献(1)
  • 二级参考文献(13)
2007(10)
  • 参考文献(1)
  • 二级参考文献(9)
2008(3)
  • 参考文献(2)
  • 二级参考文献(1)
2009(12)
  • 参考文献(1)
  • 二级参考文献(11)
2010(6)
  • 参考文献(2)
  • 二级参考文献(4)
2011(2)
  • 参考文献(2)
  • 二级参考文献(0)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2013(2)
  • 参考文献(1)
  • 二级参考文献(1)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2016(1)
  • 引证文献(1)
  • 二级引证文献(0)
2018(1)
  • 引证文献(1)
  • 二级引证文献(0)
2020(2)
  • 引证文献(2)
  • 二级引证文献(0)
研究主题发展历程
节点文献
组合词抽取
位置标签集
相邻度
反规则过滤
新词发现
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用研究
月刊
1001-3695
51-1196/TP
大16开
1984-01-01
chi
出版文献量(篇)
21004
总下载数(次)
0
总被引数(次)
238385
论文1v1指导