基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对邮件文本分词效果较差的特点,提出采用一种改进的最大匹配法来进行中文分词的方法.该方法对于普通的邮件文本和一些具有特定格式的邮件文本都可以进行有效的分词;文中还利用φ2统计法生成新词,对词典起到了动态更新的作用,提高了分词的精度和准确度.两种方法在邮件过滤系统中结合应用,使分词的误分率低于0.025.
推荐文章
基于事例推理的中文垃圾邮件过滤
垃圾邮件过滤
实例推理
预计算实例检索网络
一种基于N-gram组合的中文垃圾邮件过滤方法
反垃圾邮件
中文邮件
贝叶斯模型
N-gram
代价敏感
基于模糊支持向量机的中文垃圾邮件过滤方法
垃圾邮件
支持向量机
模糊支持向量机
模糊隶属度
隶属度函数
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 中文分词在邮件过滤系统中的应用
来源期刊 华南理工大学学报(自然科学版) 学科 工学
关键词 分词 φ2统计法 最大匹配法 垃圾邮件
年,卷(期) 2004,(z1) 所属期刊栏目
研究方向 页码范围 112-116
页数 5页 分类号 TP391.1
字数 4876字 语种 中文
DOI 10.3321/j.issn:1000-565X.2004.z1.025
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 林珊 华南理工大学广东省计算机网络重点实验室 5 38 3.0 5.0
2 宁国宁 华南理工大学广东省计算机网络重点实验室 4 52 3.0 4.0
3 赵之霖 华南理工大学广东省计算机网络重点实验室 1 17 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (8)
共引文献  (44)
参考文献  (3)
节点文献
引证文献  (17)
同被引文献  (2)
二级引证文献  (51)
1996(2)
  • 参考文献(0)
  • 二级参考文献(2)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(4)
  • 参考文献(1)
  • 二级参考文献(3)
2003(2)
  • 参考文献(2)
  • 二级参考文献(0)
2004(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2005(1)
  • 引证文献(1)
  • 二级引证文献(0)
2006(4)
  • 引证文献(3)
  • 二级引证文献(1)
2007(11)
  • 引证文献(7)
  • 二级引证文献(4)
2008(6)
  • 引证文献(1)
  • 二级引证文献(5)
2009(11)
  • 引证文献(1)
  • 二级引证文献(10)
2010(9)
  • 引证文献(0)
  • 二级引证文献(9)
2011(2)
  • 引证文献(0)
  • 二级引证文献(2)
2012(3)
  • 引证文献(1)
  • 二级引证文献(2)
2013(2)
  • 引证文献(1)
  • 二级引证文献(1)
2014(4)
  • 引证文献(1)
  • 二级引证文献(3)
2015(6)
  • 引证文献(0)
  • 二级引证文献(6)
2016(5)
  • 引证文献(1)
  • 二级引证文献(4)
2017(2)
  • 引证文献(0)
  • 二级引证文献(2)
2018(1)
  • 引证文献(0)
  • 二级引证文献(1)
2020(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
分词
φ2统计法
最大匹配法
垃圾邮件
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
华南理工大学学报(自然科学版)
月刊
1000-565X
44-1251/T
大16开
广州市天河区五山路华南理工大学内
46-174
1957
chi
出版文献量(篇)
6648
总下载数(次)
17
总被引数(次)
75046
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导