基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
短信作为一种重要的交流手段,发挥着越来越重要的作用.但伴随着短信的广泛使用,垃圾短信则严重影响着人们的生活,因此文中基于短信文本特征词对短信进行分类研究.其中,TF-IDF特征词权重计算方法是对文本词汇权重计算的一种经典算法,得到了广泛应用.但此方法为了简化计算,忽略了词语之间的相互关系.针对此问题,依据同一短信文本中的词汇之间存在的相互关系,文中对权重计算法进行了调整,提出了基于模糊K均值的短信文本分类算法.即先将短信文本集用TF-IDF算法处理,得到词汇-文本集,再用模糊K均值算法对得到的词汇-文本集进行处理.最后通过实验,验证了基于模糊K均值的短信文本分类算法,其分类结果的查全率和查准率都较高,有效辨别了垃圾短信.
推荐文章
基于主题的中文短信文本分类研究
短信文本
KNN算法
主题句
基于文本挖掘的民声通道短信分类研究
文本挖掘
短信分类
特征选取
民声通道
文本分类技术研究
文本分类
文本模型
数据挖掘
基于上下文的短信文本分类方法
短信文本
词语共现
上下文
词语相似度
短信文本分类
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 短信文本分类技术的研究
来源期刊 计算机技术与发展 学科 工学
关键词 短信文本分类 向量空间模型 模糊聚类 模糊K均值
年,卷(期) 2016,(5) 所属期刊栏目 应用开发研究
研究方向 页码范围 145-148
页数 4页 分类号 TP301
字数 3843字 语种 中文
DOI 10.3969/j.issn.1673-629X.2016.05.031
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 王春红 运城学院计算机科学与技术系 57 187 7.0 10.0
2 王文霞 运城学院计算机科学与技术系 32 73 4.0 7.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (41)
共引文献  (42)
参考文献  (13)
节点文献
引证文献  (4)
同被引文献  (20)
二级引证文献  (0)
1973(2)
  • 参考文献(0)
  • 二级参考文献(2)
1982(1)
  • 参考文献(0)
  • 二级参考文献(1)
1989(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(2)
  • 参考文献(0)
  • 二级参考文献(2)
2000(2)
  • 参考文献(0)
  • 二级参考文献(2)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(4)
  • 参考文献(0)
  • 二级参考文献(4)
2003(9)
  • 参考文献(0)
  • 二级参考文献(9)
2004(2)
  • 参考文献(0)
  • 二级参考文献(2)
2005(5)
  • 参考文献(2)
  • 二级参考文献(3)
2006(5)
  • 参考文献(1)
  • 二级参考文献(4)
2007(2)
  • 参考文献(0)
  • 二级参考文献(2)
2008(4)
  • 参考文献(1)
  • 二级参考文献(3)
2009(2)
  • 参考文献(1)
  • 二级参考文献(1)
2010(5)
  • 参考文献(3)
  • 二级参考文献(2)
2011(3)
  • 参考文献(3)
  • 二级参考文献(0)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2013(1)
  • 参考文献(0)
  • 二级参考文献(1)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2016(1)
  • 引证文献(1)
  • 二级引证文献(0)
2017(2)
  • 引证文献(2)
  • 二级引证文献(0)
2018(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
短信文本分类
向量空间模型
模糊聚类
模糊K均值
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机技术与发展
月刊
1673-629X
61-1450/TP
大16开
西安市雁塔路南段99号
52-127
1991
chi
出版文献量(篇)
12927
总下载数(次)
40
总被引数(次)
111596
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导