基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对现存的单纯借助同义词词林或知识词典扩展关键词方法中存在噪音数据和计算量大的问题,提出了先扩展后精简的方法,即先利用同义词词林进行同义扩展,再利用知网义原树计算扩展词之间的语义距离,依据语义距离剔除相似度较小的噪音数据,实现关键词集合的精简.实验表明,当词语相似度阈值取0.8时,精简比例高达46.9%,精简后的关键词集合有效剔除了噪音数据,兼顾了信息检索的召回率和准确率,表现出良好的综合性能.
推荐文章
基于语义的文档关键词提取方法
语义距离
密度聚类
关键词提取
基于组合词和同义词集的关键词提取算法
组合词
同义词集
中文网页
关键词提取
基于语义的关键词过滤权重算法
向量空间模型
网页过滤
权重策略
矩阵词典
基于完全化语义的关键词检索研究
关系数据库
关键词检索
检索核
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 限定语义距离的关键词同义扩展及精简
来源期刊 计算机工程与应用 学科 工学
关键词 汉语问答系统 关键词扩展 义原树 关键词集合精简
年,卷(期) 2011,(23) 所属期刊栏目 博士论坛
研究方向 页码范围 13-16,24
页数 分类号 TP311
字数 5619字 语种 中文
DOI 10.3778/j.issn.1002-8331.2011.23.004
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 陈俊杰 太原理工大学计算机科学与技术学院 220 1728 20.0 30.0
2 段利国 太原理工大学计算机科学与技术学院 41 364 10.0 18.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (26)
共引文献  (266)
参考文献  (8)
节点文献
引证文献  (2)
同被引文献  (5)
二级引证文献  (4)
1984(1)
  • 参考文献(0)
  • 二级参考文献(1)
1987(1)
  • 参考文献(0)
  • 二级参考文献(1)
1994(2)
  • 参考文献(0)
  • 二级参考文献(2)
1995(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(2)
  • 参考文献(0)
  • 二级参考文献(2)
1997(2)
  • 参考文献(0)
  • 二级参考文献(2)
1998(2)
  • 参考文献(0)
  • 二级参考文献(2)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(4)
  • 参考文献(1)
  • 二级参考文献(3)
2003(3)
  • 参考文献(1)
  • 二级参考文献(2)
2004(4)
  • 参考文献(1)
  • 二级参考文献(3)
2006(3)
  • 参考文献(1)
  • 二级参考文献(2)
2007(3)
  • 参考文献(1)
  • 二级参考文献(2)
2008(1)
  • 参考文献(0)
  • 二级参考文献(1)
2009(2)
  • 参考文献(2)
  • 二级参考文献(0)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2016(2)
  • 引证文献(1)
  • 二级引证文献(1)
2017(2)
  • 引证文献(1)
  • 二级引证文献(1)
2019(1)
  • 引证文献(0)
  • 二级引证文献(1)
2020(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
汉语问答系统
关键词扩展
义原树
关键词集合精简
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程与应用
半月刊
1002-8331
11-2127/TP
大16开
北京619信箱26分箱
82-605
1964
chi
出版文献量(篇)
39068
总下载数(次)
102
总被引数(次)
390217
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导