基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
现实世界存在着大量的多主题文本,多主题在信息检索、图书情报等领域有着广泛的应用。传统主题提取算法大多是针对文本整体提取一个主题,且存在缺乏语义信息、向量高维和稀疏等缺陷。以《知网》为知识库,构建概念向量表示文本,根据概念的语义及上下文背景对同义词进行归并、对多义词进行排歧,并利用概念间语义关系实现语义相似度计算;在此基础上提出基于概念簇的多主题提取算法MEABCC,该算法通过对概念进行聚类,得到多个主题簇;在使用K?means算法进行概念聚类时,通过“预设种子”方法对其进行改进,以弥补传统K?means算法对初始中心的敏感性所引起的时空开销不稳定、结果波动较大的缺陷。实验结果表明,该算法具有较好的准确率、召回率和F1值。
推荐文章
基于多模型预测的WSN动态簇目标跟踪算法
无线传感器网络
交互式多模型
动态簇
目标跟踪
基于可信度的簇间多跳LEACH算法
无线传感器网络
低功耗自适应集簇分层型协议
可信度
多跳
生存时间
基于主题相关概念和网页分块的主题爬虫研究
主题爬虫
主题相关概念
网页分块
优先级计算
R-HITS
一种基于多主题的网络模型构建算法
多主题
网络模型
超级节点
对等网络
社区
信息检索
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于概念簇的多主题提取算法
来源期刊 智能系统学报 学科 工学
关键词 语义 稀疏 上下文背景 知识库 概念簇 多主题提取 K-means MEABCC
年,卷(期) 2015,(2) 所属期刊栏目
研究方向 页码范围 261-266
页数 6页 分类号 TP18
字数 5771字 语种 中文
DOI 10.3969/j.issn.1673-4785.201405066
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 王志坚 河海大学计算机与信息学院 212 2079 22.0 37.0
2 马甲林 河海大学计算机与信息学院 9 34 4.0 5.0
4 张永军 河海大学计算机与信息学院 18 60 5.0 6.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (18)
共引文献  (118)
参考文献  (9)
节点文献
引证文献  (7)
同被引文献  (19)
二级引证文献  (17)
1992(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(3)
  • 参考文献(0)
  • 二级参考文献(3)
2004(2)
  • 参考文献(0)
  • 二级参考文献(2)
2006(3)
  • 参考文献(0)
  • 二级参考文献(3)
2007(2)
  • 参考文献(0)
  • 二级参考文献(2)
2008(4)
  • 参考文献(1)
  • 二级参考文献(3)
2009(3)
  • 参考文献(2)
  • 二级参考文献(1)
2010(3)
  • 参考文献(1)
  • 二级参考文献(2)
2011(2)
  • 参考文献(2)
  • 二级参考文献(0)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2013(2)
  • 参考文献(2)
  • 二级参考文献(0)
2015(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2015(1)
  • 引证文献(1)
  • 二级引证文献(0)
2016(2)
  • 引证文献(2)
  • 二级引证文献(0)
2017(5)
  • 引证文献(2)
  • 二级引证文献(3)
2018(4)
  • 引证文献(1)
  • 二级引证文献(3)
2019(9)
  • 引证文献(1)
  • 二级引证文献(8)
2020(3)
  • 引证文献(0)
  • 二级引证文献(3)
研究主题发展历程
节点文献
语义
稀疏
上下文背景
知识库
概念簇
多主题提取
K-means
MEABCC
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
智能系统学报
双月刊
1673-4785
23-1538/TP
大16开
哈尔滨市南岗区南通大街145-1号楼
2006
chi
出版文献量(篇)
2770
总下载数(次)
11
总被引数(次)
12401
论文1v1指导