基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
K-Means聚类算法由于无法准确确定初始化聚类中心,容易造成聚类结果准确率低下.对微博数据聚类时,可能会导致无法正确反映兴趣热点.本文设计了基于主动学习的聚类算法,在确定初始聚类中心过程中应用Min-Max主动学习策略,使得算法每次在很小数量的查询后都会提供数据点供用户进行初始中心点确认,并在K-Means算法中重新计算聚类中心时设置其权重值,从而减少迭代的数量,提高聚类结果的准确率,并将这一算法运用于微博聚类分析,得出微博热门话题.
推荐文章
基于主动学习的微博数据分类
微博数据
主动学习
支持向量机
分类模型
训练集
基于稀疏特征的中文微博短文本聚类方法研究
微博
短文本
聚类
LDA
文本表示
基于深度学习的多维特征微博情感分析
情感分析
卷积神经网络
微博短文本
表情字符
基于上下文语境的微博情感分析
中文微博
情感分析
上下文语境
文本表示
标签序列学习
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于主动学习的微博聚类分析
来源期刊 数据采集与处理 学科 工学
关键词 主动学习 K-Means 微博
年,卷(期) 2016,(3) 所属期刊栏目
研究方向 页码范围 599-605
页数 7页 分类号 TP3
字数 4580字 语种 中文
DOI 10.16337/j.1004-9037.2016.03.021
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 朱丽 南京理工大学计算机科学与工程学院 41 260 8.0 14.0
2 陆建峰 南京理工大学计算机科学与工程学院 77 1217 17.0 33.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (20)
共引文献  (215)
参考文献  (7)
节点文献
引证文献  (1)
同被引文献  (20)
二级引证文献  (0)
1998(3)
  • 参考文献(0)
  • 二级参考文献(3)
1999(1)
  • 参考文献(1)
  • 二级参考文献(0)
2002(2)
  • 参考文献(0)
  • 二级参考文献(2)
2003(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(1)
  • 参考文献(1)
  • 二级参考文献(0)
2007(3)
  • 参考文献(0)
  • 二级参考文献(3)
2008(2)
  • 参考文献(0)
  • 二级参考文献(2)
2009(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(1)
  • 参考文献(0)
  • 二级参考文献(1)
2011(9)
  • 参考文献(0)
  • 二级参考文献(9)
2012(3)
  • 参考文献(3)
  • 二级参考文献(0)
2016(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2017(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
主动学习
K-Means
微博
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
数据采集与处理
双月刊
1004-9037
32-1367/TN
大16开
南京市御道街29号1016信箱
28-235
1986
chi
出版文献量(篇)
3235
总下载数(次)
7
总被引数(次)
25271
论文1v1指导