基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
潜在语义索引(LSI)是一种有效的信息查询方法,同时也被成功地应用到了文本分类中.LSI能解决同义和多义的问题,通过降低原始文档-术语矩阵的噪声来凸现出词条和文档之间的语义关系.为了识别和过滤有害的、不期望的定题的信息或Email,在双语言环境下(包括中文和英文),提出了一个基于改进的LSI方法的定题邮件类信息过滤系统,该系统采用潜在语义模型来表示被过滤的信息类,通过奇异值分解和正例监护学习方法,选择支持向量机(SVM)来识别和分类预定义的定题信息.实验结果表明:基于LSI的特征选择的SVM分类算法是一种更有效的信息识别和文本分类方法,不但具有较好的分类性能,同时也能大大减小计算的复杂性.
推荐文章
基于KNN-SVM的垃圾邮件过滤模型
垃圾邮件
模式识别提取
K近邻算法
特征提取
基于自动分类的邮件过滤系统
特征值
向量空间模型
邮件过滤
LS-SVM在垃圾邮件过滤中的应用
统计学习理论
支持向量机
LS-SVM
垃圾邮件过滤
基于贝叶斯最小风险分类的邮件过滤系统
垃圾邮件
贝叶斯分类
最小风险
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于LSI和SVM分类法的定题邮件过滤研究
来源期刊 计算机工程与应用 学科 工学
关键词 支持向量机 潜在语义索引 信息查询 监护学习 文本分类
年,卷(期) 2006,(35) 所属期刊栏目 数据库与信息处理
研究方向 页码范围 168-171
页数 4页 分类号 TP181
字数 3704字 语种 中文
DOI 10.3321/j.issn:1002-8331.2006.35.049
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 李方敏 湖南科技大学计算机学院 6 31 3.0 5.0
2 杨清 湖南科技大学计算机学院 6 33 4.0 5.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (104)
参考文献  (5)
节点文献
引证文献  (6)
同被引文献  (18)
二级引证文献  (23)
1990(1)
  • 参考文献(1)
  • 二级参考文献(0)
1994(1)
  • 参考文献(1)
  • 二级参考文献(0)
1995(1)
  • 参考文献(1)
  • 二级参考文献(0)
1999(1)
  • 参考文献(1)
  • 二级参考文献(0)
2003(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2007(1)
  • 引证文献(1)
  • 二级引证文献(0)
2008(3)
  • 引证文献(1)
  • 二级引证文献(2)
2009(5)
  • 引证文献(2)
  • 二级引证文献(3)
2010(5)
  • 引证文献(1)
  • 二级引证文献(4)
2011(1)
  • 引证文献(0)
  • 二级引证文献(1)
2012(2)
  • 引证文献(1)
  • 二级引证文献(1)
2014(1)
  • 引证文献(0)
  • 二级引证文献(1)
2015(3)
  • 引证文献(0)
  • 二级引证文献(3)
2016(3)
  • 引证文献(0)
  • 二级引证文献(3)
2017(1)
  • 引证文献(0)
  • 二级引证文献(1)
2018(4)
  • 引证文献(0)
  • 二级引证文献(4)
研究主题发展历程
节点文献
支持向量机
潜在语义索引
信息查询
监护学习
文本分类
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程与应用
半月刊
1002-8331
11-2127/TP
大16开
北京619信箱26分箱
82-605
1964
chi
出版文献量(篇)
39068
总下载数(次)
102
总被引数(次)
390217
相关基金
湖南省自然科学基金
英文译名:Natural Science Foundation of Hunan Province
官方网址:http://jj.hnst.gov.cn/
项目类型:一般面上项目
学科类型:
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导