基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
关键词自动提取一直都是自然语言处理领域的一个基础问题与研究热点,随着文本数据的指数级增长与应用场景的不断扩展,如何高效且准确地自动提取关键词进一步得到了研究者的广泛关注.在语义相似度计算中,对两个文本进行关键词抽取的效果都对判断两个文本是否相似的结果有重大影响.论文提出了一种在语义相似度领域融合KL散度,TF-IDF,词性,词语长度等多种特征,基于XGBOOST算法的关键词自动抽取方法,实验结果表明,该方法与KL散度,TF-IDF以及基于传统机器学习算法的有监督方法相比,效果有显著提升.
推荐文章
基于语义的文档关键词提取方法
语义距离
密度聚类
关键词提取
基于语义的关键词过滤权重算法
向量空间模型
网页过滤
权重策略
矩阵词典
基于特定领域的加权语义相似度算法研究
自动问答系统
信息检索
相似度
语义
词语权重
基于关键词相似度的短文本分类方法研究
词向量
特征选择
短文本分类
特征权重
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 语义相似度领域基于XGBOOST算法的关键词自动抽取方法
来源期刊 计算机与数字工程 学科 工学
关键词 自动抽取 KL散度 XGBOOST
年,卷(期) 2020,(6) 所属期刊栏目 算法与分析
研究方向 页码范围 1300-1303,1385
页数 5页 分类号 TP391
字数 4731字 语种 中文
DOI 10.3969/j.issn.1672-9722.2020.06.008
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 魏银珍 5 17 2.0 4.0
2 王成柱 1 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (6)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2000(1)
  • 参考文献(1)
  • 二级参考文献(0)
2001(1)
  • 参考文献(1)
  • 二级参考文献(0)
2007(2)
  • 参考文献(2)
  • 二级参考文献(0)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2020(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
自动抽取
KL散度
XGBOOST
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机与数字工程
月刊
1672-9722
42-1372/TP
大16开
武汉市东湖新技术开发区凤凰产业园藏龙北路1号
1973
chi
出版文献量(篇)
9945
总下载数(次)
28
总被引数(次)
47579
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导