基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
社交网络中存在大量营销、招聘等垃圾信息以及无实质内容的短文,为话题建模工作带来很多干扰,更严重影响社交网络方面的学术研究及商业应用.因此,该文提出了一种结合支持向量机与k近邻模型(pSVM-kNN)的半监督话题噪声过滤方法.该方法融合了SVM和kNN算法,在SVM计算得到超平面的基础上使用kNN算法在局部范围内迭代寻找分类超平面的最优解;同时为减少误分类发生,分别在SVM和kNN阶段引入惩罚代价和比例权重,以提高噪声过滤的效果.通过选取新浪微博中不同大小的数据集进行实验与其他方法进行比较,结果表明:该方法只利用了少量的标注样本进行训练,在准确率、召回率和F值方面均优于其他的对比方法.
推荐文章
基于评论树的微博社区热门话题检测方法
微博社区
热门话题
过滤
评论树
话题热度评价模型
基于可区分语言模型的微博在线话题检测
话题检测
特征选择
微博
语言模型
可区分语言模型
孤立点预处理和 Single-Pass 聚类结合的微博话题检测方法
微博
热点话题
增量聚类
孤立点
话题检测
微博负向情感热点话题发现模型
微博
负向情感
热点分析
事件发现
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 半监督的微博话题噪声过滤方法
来源期刊 清华大学学报(自然科学版) 学科 工学
关键词 社交网络 支持向量机 k近邻 噪声过滤 惩罚代价
年,卷(期) 2019,(3) 所属期刊栏目 计算机科学与技术
研究方向 页码范围 178-185
页数 8页 分类号 TP391.1
字数 语种 中文
DOI 10.16511/j.cnki.qhdxxb.2019.26.060
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (48)
共引文献  (63)
参考文献  (8)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1986(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(2)
  • 参考文献(0)
  • 二级参考文献(2)
2007(4)
  • 参考文献(0)
  • 二级参考文献(4)
2009(5)
  • 参考文献(1)
  • 二级参考文献(4)
2010(4)
  • 参考文献(0)
  • 二级参考文献(4)
2011(16)
  • 参考文献(0)
  • 二级参考文献(16)
2012(11)
  • 参考文献(0)
  • 二级参考文献(11)
2013(6)
  • 参考文献(3)
  • 二级参考文献(3)
2014(2)
  • 参考文献(2)
  • 二级参考文献(0)
2015(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(1)
  • 参考文献(1)
  • 二级参考文献(0)
2019(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
社交网络
支持向量机
k近邻
噪声过滤
惩罚代价
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
清华大学学报(自然科学版)
月刊
1000-0054
11-2223/N
大16开
北京市海淀区清华园清华大学
2-90
1915
chi
出版文献量(篇)
7846
总下载数(次)
26
总被引数(次)
132043
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导