作者:
基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
[目的/意义]鉴于目前同义词抽取方法无法避免抽取结果含有较多的噪音,需要较高的人工代价去除噪音,提出一种对同义词抽取结果排序的方法,使得正确结果排序提前,以达到提高抽取结果准确性及降低人工去噪代价的目的.[方法/过程]将抽取结果转化为抽取关系有向图,基于该有向图计算抽取结果中每个词汇与被抽取词汇的词义相似性,并按照词义相似性高低进行排序.排序方法的最大特点是只利用了当前的同义词抽取方法,不需要人工参与和额外的语义知识.[结果/结论]通过在真实数据集上进行验证,得出排序效果与抽取结果的规模呈正向关系的论点,即一个给定词汇的同义词抽取结果数量越多,排序的效果就会越好.
推荐文章
基于组合词和同义词集的关键词提取算法
组合词
同义词集
中文网页
关键词提取
结合依存关系与同义词词林的相似度计算
依存关系
同义词词林
语义相似度
关系路径
平均偏差率
基于同义词词林的文本特征选择方法
特征选择
同义词词林
遗传算法
文本分类
基于组合词和同义词集的关键词提取算法
组合词
同义词集
中文网页
关键词提取
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种基于有向图的同义词抽取结果排序方法
来源期刊 图书情报工作 学科 社会科学
关键词 同义词 信息抽取 噪音清洗 结果排序
年,卷(期) 2015,(12) 所属期刊栏目 知识组织
研究方向 页码范围 128-134
页数 分类号 G250
字数 语种 中文
DOI 10.13266/j.issn.0252-3116.2015.12.019
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 刘伟 422 5903 37.0 59.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (28)
共引文献  (37)
参考文献  (7)
节点文献
引证文献  (1)
同被引文献  (0)
二级引证文献  (0)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(3)
  • 参考文献(0)
  • 二级参考文献(3)
2004(5)
  • 参考文献(0)
  • 二级参考文献(5)
2005(3)
  • 参考文献(0)
  • 二级参考文献(3)
2006(4)
  • 参考文献(1)
  • 二级参考文献(3)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(4)
  • 参考文献(0)
  • 二级参考文献(4)
2009(3)
  • 参考文献(1)
  • 二级参考文献(2)
2010(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(3)
  • 参考文献(1)
  • 二级参考文献(2)
2012(6)
  • 参考文献(2)
  • 二级参考文献(4)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2016(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
同义词
信息抽取
噪音清洗
结果排序
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
图书情报工作
半月刊
0252-3116
11-1541/G2
16开
北京中关村北四环西路33号
2-412
1980
chi
出版文献量(篇)
11437
总下载数(次)
32
总被引数(次)
130230
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导