基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
伴随着互联网的广泛流行,以微博为代表的社交网络产生了大量的数据.从这些数据中挖掘到有用的信息成为当今研究的一项重要方向.根据微博文本的特点,本文提出来一种基于联合分类器过滤掉噪声微博,然后利用LDA模型进行主题发现.联合分类器模型是由朴素贝叶斯、支持向量机和决策树三种模型通过简单投票机制结合构成的,实验结果联合分类器的准确度达到87%,显然这种分类方法是可行的,也是有效的.
推荐文章
基于PBTM的海量微博主题发现
主题模型
主题发现
PBTM
吉布斯采样
分布式计算
基于主题和链接分析的微博社区发现算法
微博
社区发现
潜层Dirichlet分配
主题模型
链接分析
标签传递算法
基于隐主题分析的中文微博话题发现
中文微博
话题发现
隐主题模型
文本聚类
频繁项集挖掘
基于微博的主题社区发现
领域领袖
微博营销
最大流
社区发现
信息检索
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于联合分类器过滤噪声的微博主题发现
来源期刊 计算机系统应用 学科
关键词 支持向量机 朴素贝叶斯 决策树 联合分类器 LDA模型
年,卷(期) 2018,(1) 所属期刊栏目 软件技术·算法
研究方向 页码范围 132-136
页数 5页 分类号
字数 4495字 语种 中文
DOI 10.15888/j.cnki.csa.006141
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 崔超远 中国科学院合肥物质科学研究院智能机械研究所 15 107 5.0 10.0
2 严曙 中国科学院合肥物质科学研究院智能机械研究所 9 21 3.0 4.0
3 孙丙宇 中国科学院合肥物质科学研究院智能机械研究所 31 121 7.0 9.0
4 高森 中国科学院合肥物质科学研究院智能机械研究所 1 2 1.0 1.0
8 汪六三 中国科学院合肥物质科学研究院智能机械研究所 9 18 3.0 4.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (69)
共引文献  (279)
参考文献  (14)
节点文献
引证文献  (2)
同被引文献  (0)
二级引证文献  (0)
1948(1)
  • 参考文献(0)
  • 二级参考文献(1)
1988(1)
  • 参考文献(0)
  • 二级参考文献(1)
1990(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(2)
  • 参考文献(0)
  • 二级参考文献(2)
2001(4)
  • 参考文献(1)
  • 二级参考文献(3)
2002(4)
  • 参考文献(0)
  • 二级参考文献(4)
2003(6)
  • 参考文献(0)
  • 二级参考文献(6)
2004(8)
  • 参考文献(2)
  • 二级参考文献(6)
2005(5)
  • 参考文献(0)
  • 二级参考文献(5)
2006(2)
  • 参考文献(1)
  • 二级参考文献(1)
2007(3)
  • 参考文献(0)
  • 二级参考文献(3)
2008(6)
  • 参考文献(2)
  • 二级参考文献(4)
2009(3)
  • 参考文献(0)
  • 二级参考文献(3)
2010(3)
  • 参考文献(0)
  • 二级参考文献(3)
2011(9)
  • 参考文献(0)
  • 二级参考文献(9)
2012(6)
  • 参考文献(1)
  • 二级参考文献(5)
2013(11)
  • 参考文献(3)
  • 二级参考文献(8)
2014(5)
  • 参考文献(2)
  • 二级参考文献(3)
2016(1)
  • 参考文献(1)
  • 二级参考文献(0)
2017(1)
  • 参考文献(1)
  • 二级参考文献(0)
2018(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2019(2)
  • 引证文献(2)
  • 二级引证文献(0)
研究主题发展历程
节点文献
支持向量机
朴素贝叶斯
决策树
联合分类器
LDA模型
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机系统应用
月刊
1003-3254
11-2854/TP
大16开
北京中关村南四街4号
82-558
1991
chi
出版文献量(篇)
10349
总下载数(次)
20
总被引数(次)
57078
论文1v1指导