基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对海量文本邮件的挖掘过滤需要更大的存储空间、以及更强的计算能力,提出一种基于Hadoop云计算平台的垃圾邮件过滤方法.其思想:把相对孤立的数据集合并成易于云平台处理的大文件集合;依据评估函数构建文本向量,将邮件转换为结构化的描述;基于MapReduce分布式编程模型改进SVM算法,利用集群整体的计算能力求解最优平面.实验表明:该方法能利用廉价的计算机集群代替昂贵的高性能机器实现海量邮件数据的挖掘过滤;并且,分类效率能随着集群规模的扩增而提升较快.
推荐文章
基于KNN-SVM的垃圾邮件过滤模型
垃圾邮件
模式识别提取
K近邻算法
特征提取
LS-SVM在垃圾邮件过滤中的应用
统计学习理论
支持向量机
LS-SVM
垃圾邮件过滤
贝叶斯垃圾邮件过滤算法的改进与实现
贝叶斯
垃圾邮件过滤
模式匹配
模糊匹配
基于改进的局部敏感哈希算法实现图像型垃圾邮件过滤
垃圾图像过滤
局部敏感哈希
图像特征提取
高维数据索引
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于MapReduce的SVM改进算法及在邮件过滤中的实现
来源期刊 无线通信技术 学科 工学
关键词 邮件过滤 MapReduce SVM算法 Hadoop 文本分类
年,卷(期) 2013,(2) 所属期刊栏目
研究方向 页码范围 52-56,62
页数 6页 分类号 TP391.1
字数 3438字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 杨鹤标 江苏大学计算机学院 78 637 13.0 22.0
2 陈锦富 江苏大学计算机学院 17 78 4.0 8.0
3 黄文青 江苏大学计算机学院 1 4 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (31)
共引文献  (37)
参考文献  (9)
节点文献
引证文献  (4)
同被引文献  (3)
二级引证文献  (1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(2)
  • 参考文献(0)
  • 二级参考文献(2)
2002(5)
  • 参考文献(0)
  • 二级参考文献(5)
2003(4)
  • 参考文献(0)
  • 二级参考文献(4)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(4)
  • 参考文献(1)
  • 二级参考文献(3)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(4)
  • 参考文献(2)
  • 二级参考文献(2)
2008(1)
  • 参考文献(0)
  • 二级参考文献(1)
2009(8)
  • 参考文献(1)
  • 二级参考文献(7)
2010(2)
  • 参考文献(1)
  • 二级参考文献(1)
2011(3)
  • 参考文献(2)
  • 二级参考文献(1)
2012(2)
  • 参考文献(2)
  • 二级参考文献(0)
2013(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2017(2)
  • 引证文献(2)
  • 二级引证文献(0)
2018(1)
  • 引证文献(1)
  • 二级引证文献(0)
2019(2)
  • 引证文献(1)
  • 二级引证文献(1)
研究主题发展历程
节点文献
邮件过滤
MapReduce
SVM算法
Hadoop
文本分类
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
无线通信技术
季刊
1003-8329
61-1361/TN
16开
西安市翠华路275号
1971
chi
出版文献量(篇)
1210
总下载数(次)
1
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导