基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
短文本因具有特征信息不足且高维稀疏等特点,使得传统文本聚类算法应用于短文本聚类任务时性能有限.针对上述情况,提出一种结合上下文语义的短文本聚类算法.首先借鉴社会网络分析领域的中心性和权威性思想设计了一种结合上下文语义的特征词权重计算方法,在此基础上构建词条一文本矩阵;然后对该矩阵进行奇异值分解,进一步将原始特征词空间映射到低维的潜在语义空间;最后通过改进的K-means聚类算法在低维潜在语义空间完成短文本聚类.实验结果表明,与传统的基于词频及逆向文档频权重的文本聚类算法相比,该算法能有效改善短文本特征不足及高维稀疏性,提高了短文的本聚类效果.
推荐文章
一种基于上下文的语义相似度算法
语义相似度
本体
上下文
知网
一种基于上下文的语义映射方法
本体
本体映射
语义
上下文
一种源码级的上下文敏感性检测算法
行为建模
函数调用图
上下文敏感性
过程间分析
基于语义特征空间上下文的短文本表示学习
语义特征空间
相似度计算
文本映射矩阵
短文本表示
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种结合上下文语义的短文本聚类算法
来源期刊 计算机科学 学科 工学
关键词 短文本聚类 上下文语义 奇异值分解 K均值算法
年,卷(期) 2016,(z2) 所属期刊栏目 数据挖掘
研究方向 页码范围 443-446,450
页数 5页 分类号 TP181
字数 5874字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 王红军 14 82 6.0 8.0
2 王伦文 7 43 4.0 6.0
3 张群 2 22 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (74)
共引文献  (176)
参考文献  (14)
节点文献
引证文献  (16)
同被引文献  (27)
二级引证文献  (17)
1975(1)
  • 参考文献(0)
  • 二级参考文献(1)
1979(1)
  • 参考文献(0)
  • 二级参考文献(1)
1988(1)
  • 参考文献(0)
  • 二级参考文献(1)
1990(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(2)
  • 参考文献(0)
  • 二级参考文献(2)
2002(3)
  • 参考文献(0)
  • 二级参考文献(3)
2003(5)
  • 参考文献(0)
  • 二级参考文献(5)
2004(3)
  • 参考文献(0)
  • 二级参考文献(3)
2005(4)
  • 参考文献(0)
  • 二级参考文献(4)
2006(7)
  • 参考文献(0)
  • 二级参考文献(7)
2007(9)
  • 参考文献(0)
  • 二级参考文献(9)
2008(9)
  • 参考文献(0)
  • 二级参考文献(9)
2009(12)
  • 参考文献(2)
  • 二级参考文献(10)
2010(7)
  • 参考文献(1)
  • 二级参考文献(6)
2011(8)
  • 参考文献(4)
  • 二级参考文献(4)
2012(5)
  • 参考文献(1)
  • 二级参考文献(4)
2013(3)
  • 参考文献(3)
  • 二级参考文献(0)
2014(2)
  • 参考文献(1)
  • 二级参考文献(1)
2015(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(1)
  • 参考文献(1)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2017(1)
  • 引证文献(1)
  • 二级引证文献(0)
2018(10)
  • 引证文献(9)
  • 二级引证文献(1)
2019(16)
  • 引证文献(3)
  • 二级引证文献(13)
2020(6)
  • 引证文献(3)
  • 二级引证文献(3)
研究主题发展历程
节点文献
短文本聚类
上下文语义
奇异值分解
K均值算法
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机科学
月刊
1002-137X
50-1075/TP
大16开
重庆市渝北区洪湖西路18号
78-68
1974
chi
出版文献量(篇)
18527
总下载数(次)
68
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导