基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对传统邮件分类模型中较少对邮件主题进行描述和分析的问题,提出一种代价敏感多主题学习的邮件分类算法,用以实现垃圾邮件过滤。首先,基于LDA (潜在狄利克雷分布)对邮件的多个主题进行提取,对邮件语义进行描述;其次,利用CS‐SVM (代价敏感支持向量机)对邮件进行代价敏感学习,实现对不同类别邮件的惩罚;最后,结合MI‐SVM(多示例支持向量机)进行代价敏感的多主题学习,实现邮件分类。实验采用四组ling‐spam处理数据集。实验结果证明:该分类算法较比传统邮件分类算法,可以取得更高的准确性、特异性与敏感性。
推荐文章
采用多类代价指数损失函数的代价敏感AdaBoost算法
代价敏感
AdaBoost算法
多分类
贝叶斯决策
损失函数
基于改进的局部敏感哈希算法实现图像型垃圾邮件过滤
垃圾图像过滤
局部敏感哈希
图像特征提取
高维数据索引
多标签代价敏感分类集成学习算法
多标签分类
代价敏感学习
集成学习
自适应提升算法
多分类
多代价下的代价敏感属性选择算法比较
粗糙集
粒计算
代价敏感
属性选择
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 代价敏感多主题学习的邮件过滤算法
来源期刊 华中科技大学学报(自然科学版) 学科 工学
关键词 潜在狄利克雷分布 支持向量机 垃圾邮件过滤 文本分类 多示例学习
年,卷(期) 2016,(z1) 所属期刊栏目 校园网工程与应用
研究方向 页码范围 176-180
页数 5页 分类号 TP393.098|TP301
字数 语种 中文
DOI 10.13245/j.hust.16S136
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 王丹华 辽宁大学信息化中心 13 47 4.0 6.0
2 刘威 沈阳建筑大学信息网络中心 21 26 3.0 4.0
3 张绍成 辽宁大学信息化中心 23 138 6.0 11.0
4 程子傲 辽宁大学信息化中心 15 39 4.0 5.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (5)
共引文献  (12)
参考文献  (4)
节点文献
引证文献  (4)
同被引文献  (26)
二级引证文献  (12)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(2)
  • 参考文献(0)
  • 二级参考文献(2)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2012(2)
  • 参考文献(2)
  • 二级参考文献(0)
2013(2)
  • 参考文献(2)
  • 二级参考文献(0)
2016(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2017(2)
  • 引证文献(2)
  • 二级引证文献(0)
2018(3)
  • 引证文献(2)
  • 二级引证文献(1)
2019(8)
  • 引证文献(0)
  • 二级引证文献(8)
2020(3)
  • 引证文献(0)
  • 二级引证文献(3)
研究主题发展历程
节点文献
潜在狄利克雷分布
支持向量机
垃圾邮件过滤
文本分类
多示例学习
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
华中科技大学学报(自然科学版)
月刊
1671-4512
42-1658/N
大16开
武汉市珞喻路1037号
38-9
1973
chi
出版文献量(篇)
9146
总下载数(次)
26
总被引数(次)
88536
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导