作者:
基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
对互联网海量短文本进行分类挖掘是网络内容安全的一种主要方法。然而,短文本固有的关键词特征稀疏和样本高度不均衡等特点,使得难以直接使用现有针对常规文本的分类算法。为此,使用逻辑运算数学模型和统计方法等对互联网海量短文本进行规则建模,并对互联网海量短文本的样本进行分析后建立一系列分类规则,然后与基于KNN+SVM混合模型进行测试比较。测试结果表明,针对互联网海量短文本,基于规则的分类模型更适用于互联网海量短文本的分类挖掘,同时该模型已经成功应用在上百个项目上,应用效果较好。
推荐文章
Web文本挖掘在互联网信息统计中的研究与设计
互联网
信息统计
Web挖掘
文本挖掘
文本分类
模式匹配
基于卷积神经网络模型的互联网短文本情感分类
互联网短文本
情感分类
卷积神经网络
自然语言处理
深度学习
基于卷积神经网络的互联网短文本分类方法
卷积神经网络
短文本分类
深度学习
机器学习
基于Hadoop的互联网隐式文本感知技术
Hadoop
互联网隐式文本
感知技术
信息吞吐量
分布式框架
图像特征向量
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于规则的互联网海量短文本的分类挖掘
来源期刊 中国西部科技 学科
关键词 网络内容安全 规则 海量 短文本 分类
年,卷(期) 2015,(6) 所属期刊栏目 论著
研究方向 页码范围 10-11,19
页数 3页 分类号
字数 1822字 语种 中文
DOI 10.3969/j.issn.1671-6396.2015.06.005
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 朱贺军 4 8 1.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (20)
共引文献  (46)
参考文献  (8)
节点文献
引证文献  (1)
同被引文献  (0)
二级引证文献  (0)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(2)
  • 参考文献(0)
  • 二级参考文献(2)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(3)
  • 参考文献(0)
  • 二级参考文献(3)
2006(4)
  • 参考文献(0)
  • 二级参考文献(4)
2008(2)
  • 参考文献(0)
  • 二级参考文献(2)
2009(4)
  • 参考文献(2)
  • 二级参考文献(2)
2010(3)
  • 参考文献(1)
  • 二级参考文献(2)
2011(2)
  • 参考文献(2)
  • 二级参考文献(0)
2012(2)
  • 参考文献(2)
  • 二级参考文献(0)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2018(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
网络内容安全
规则
海量
短文本
分类
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
中国西部科技
月刊
1671-6396
51-1633/N
大16开
中国成都237信箱(中科院成都分院)
62-223
2002
chi
出版文献量(篇)
15585
总下载数(次)
18
总被引数(次)
38742
论文1v1指导