作者:
基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对电子商务平台存在的大量垃圾评论,提出一种基于随机森林和规则匹配的垃圾识别方法.该方法对样本进行有放回的重复抽取样以建立随机模型,以减弱评论数据集不平衡性的影响.一部分垃圾评论数据特征明显,采用规则匹配进一步提高评论识别的召回率.从现有的电商平台上提取评论数据集进行实验,结果表明基于随机森林分类模型比其他基于基线分类模型分类效果更好,且引入规则匹配机制后,分类效果也有一定程度的提高.
推荐文章
基于Adaboost算法与规则匹配的垃圾评论识别
垃圾评论识别
随机森林
Adaboost
集成学习算法
垃圾评论识别研究综述
垃圾评论
识别方法
机器学习
Web2.0
基于条件随机场的网络评论与事件中命名实体匹配研究
条件随机场
命名实体
变体形式
综合相似度
基于规则和语义匹配的模型合成研究
模型合成
语义匹配
合成规则
模型驱动体系架构
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于随机森林和规则匹配的垃圾评论识别
来源期刊 软件 学科 工学
关键词 垃圾评论识别 随机森林 集成学习算法 不平衡问题
年,卷(期) 2017,(12) 所属期刊栏目 基金项目论文
研究方向 页码范围 90-94
页数 5页 分类号 TP301.6
字数 4790字 语种 中文
DOI 10.3969/j.issn.1003-6970.2017.12.017
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 康准 中南民族大学计算机科学学院 2 6 1.0 2.0
2 魏伟 中南民族大学计算机科学学院 1 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (62)
共引文献  (81)
参考文献  (10)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1969(2)
  • 参考文献(0)
  • 二级参考文献(2)
1970(1)
  • 参考文献(0)
  • 二级参考文献(1)
1975(1)
  • 参考文献(0)
  • 二级参考文献(1)
1986(1)
  • 参考文献(0)
  • 二级参考文献(1)
1990(2)
  • 参考文献(0)
  • 二级参考文献(2)
1995(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(3)
  • 参考文献(0)
  • 二级参考文献(3)
2002(2)
  • 参考文献(1)
  • 二级参考文献(1)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(3)
  • 参考文献(0)
  • 二级参考文献(3)
2005(2)
  • 参考文献(1)
  • 二级参考文献(1)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(5)
  • 参考文献(0)
  • 二级参考文献(5)
2008(3)
  • 参考文献(1)
  • 二级参考文献(2)
2009(9)
  • 参考文献(1)
  • 二级参考文献(8)
2010(8)
  • 参考文献(0)
  • 二级参考文献(8)
2011(7)
  • 参考文献(0)
  • 二级参考文献(7)
2012(7)
  • 参考文献(1)
  • 二级参考文献(6)
2013(6)
  • 参考文献(2)
  • 二级参考文献(4)
2014(2)
  • 参考文献(2)
  • 二级参考文献(0)
2015(1)
  • 参考文献(1)
  • 二级参考文献(0)
2017(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
垃圾评论识别
随机森林
集成学习算法
不平衡问题
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
软件
月刊
1003-6970
12-1151/TP
16开
北京市3108信箱
1979
chi
出版文献量(篇)
9374
总下载数(次)
40
论文1v1指导