基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
微博上大量的垃圾评论对个人、社会,甚至是对国家都会造成不良影响.为对微博中的垃圾评论进行识别,提出基于协同训练的微博垃圾评论识别方法.定义一种基于规则的识别方法过滤出显式垃圾评论,剩余的评论归为相关评论,构建AdaBoost分类器和支持向量机分类器,通过Co-Training算法进行协同训练,判断其是否为垃圾评论,以提高分类精度,节省样本标注工作.实验结果表明,与基于相似度计算的垃圾评论识别方法、基于评论多特征的垃圾评论识别方法相比,该方法具有较好的识别效果.
推荐文章
垃圾评论识别研究综述
垃圾评论
识别方法
机器学习
Web2.0
基于评论树的微博社区热门话题检测方法
微博社区
热门话题
过滤
评论树
话题热度评价模型
一种基于支持向量机的垃圾微博识别方法
博文特征
用户特征
支持向量机
垃圾微博识别
基于 Co-training训练 CRF模型的评价对象识别
CRF模型
评价对象
特征模板
Co-training
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于Co-Training的微博垃圾评论识别方法
来源期刊 计算机工程 学科 工学
关键词 微博垃圾评论 协同训练 同义词词林 支持向量机 相似度计算
年,卷(期) 2018,(7) 所属期刊栏目 人工智能及识别技术
研究方向 页码范围 212-218
页数 7页 分类号 TP391
字数 5993字 语种 中文
DOI 10.19678/j.issn.1000-3428.0047259
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 李志欣 广西师范大学广西多源信息挖掘与安全重点实验室 30 144 7.0 11.0
3 张灿龙 广西师范大学广西多源信息挖掘与安全重点实验室 41 194 8.0 11.0
9 兰丹媚 广西师范大学广西多源信息挖掘与安全重点实验室 1 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (60)
共引文献  (305)
参考文献  (13)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(1)
  • 二级参考文献(0)
2001(1)
  • 参考文献(1)
  • 二级参考文献(0)
2003(5)
  • 参考文献(0)
  • 二级参考文献(5)
2004(4)
  • 参考文献(0)
  • 二级参考文献(4)
2005(2)
  • 参考文献(1)
  • 二级参考文献(1)
2006(3)
  • 参考文献(0)
  • 二级参考文献(3)
2007(11)
  • 参考文献(1)
  • 二级参考文献(10)
2008(12)
  • 参考文献(0)
  • 二级参考文献(12)
2009(2)
  • 参考文献(0)
  • 二级参考文献(2)
2010(5)
  • 参考文献(1)
  • 二级参考文献(4)
2011(16)
  • 参考文献(3)
  • 二级参考文献(13)
2012(4)
  • 参考文献(1)
  • 二级参考文献(3)
2013(4)
  • 参考文献(2)
  • 二级参考文献(2)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(1)
  • 参考文献(1)
  • 二级参考文献(0)
2018(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
微博垃圾评论
协同训练
同义词词林
支持向量机
相似度计算
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程
月刊
1000-3428
31-1289/TP
大16开
上海市桂林路418号
4-310
1975
chi
出版文献量(篇)
31987
总下载数(次)
53
总被引数(次)
317027
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导