基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对传统网页分类中存在的准确率和查全率不高、分类效率低的情况,提出一种基于朴素贝叶斯分类的网页预分类算法.算法根据用户的网上活动情况提取相关网址,分析网页内容和网页关键词,利用朴素贝叶斯分类算法进行分类,根据用户对各类网页的浏览情况分析用户的行为特征.采用改进的文本权值计算方法,并引进网址预分类机制,提高数据的处理效率以及分类的准确率.结果表明,网址分类算法准确,能够充分发掘用户的兴趣喜好,可以作为用户行为分析的数据算法进行商业推广和司法取证.
推荐文章
基于引力模型的朴素贝叶斯分类算法
分类算法
朴素贝叶斯
引力模型
遥感图像
基于改进特征加权的朴素贝叶斯分类算法
文本分类
朴素贝叶斯
JS散度
词频
文本频率
类别频率
基于属性约简的PLS加权朴素贝叶斯分类
加权朴素贝叶斯分类
属性约简
偏最小二乘回归
一种新型加权朴素贝叶斯分类算法
数据挖掘
朴素贝叶斯
属性频率
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于朴素贝叶斯网页分类的用户行为推衍
来源期刊 沈阳工业大学学报 学科 工学
关键词 网页关键词 朴素贝叶斯 网页分类 行为特征 权值计算方法 网址预分类 商业推广 司法取证
年,卷(期) 2018,(1) 所属期刊栏目 信息科学与工程
研究方向 页码范围 82-87
页数 6页 分类号 TP181
字数 4294字 语种 中文
DOI 10.7688/j.issn.1000-1646.2018.01.15
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 曹天杰 中国矿业大学计算机科学与技术学院 56 486 10.0 20.0
2 秦鹏 六盘水师范学院计算机科学与信息技术系 7 13 2.0 3.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (82)
共引文献  (44)
参考文献  (16)
节点文献
引证文献  (5)
同被引文献  (8)
二级引证文献  (0)
1975(1)
  • 参考文献(0)
  • 二级参考文献(1)
1988(1)
  • 参考文献(0)
  • 二级参考文献(1)
1994(2)
  • 参考文献(0)
  • 二级参考文献(2)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(3)
  • 参考文献(0)
  • 二级参考文献(3)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(4)
  • 参考文献(0)
  • 二级参考文献(4)
2003(5)
  • 参考文献(0)
  • 二级参考文献(5)
2004(2)
  • 参考文献(0)
  • 二级参考文献(2)
2005(6)
  • 参考文献(0)
  • 二级参考文献(6)
2006(7)
  • 参考文献(0)
  • 二级参考文献(7)
2007(3)
  • 参考文献(0)
  • 二级参考文献(3)
2008(6)
  • 参考文献(0)
  • 二级参考文献(6)
2009(4)
  • 参考文献(0)
  • 二级参考文献(4)
2010(9)
  • 参考文献(1)
  • 二级参考文献(8)
2011(10)
  • 参考文献(1)
  • 二级参考文献(9)
2012(6)
  • 参考文献(0)
  • 二级参考文献(6)
2013(5)
  • 参考文献(0)
  • 二级参考文献(5)
2014(9)
  • 参考文献(5)
  • 二级参考文献(4)
2015(3)
  • 参考文献(1)
  • 二级参考文献(2)
2016(10)
  • 参考文献(8)
  • 二级参考文献(2)
2018(2)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(2)
  • 二级引证文献(0)
2018(2)
  • 引证文献(2)
  • 二级引证文献(0)
2019(1)
  • 引证文献(1)
  • 二级引证文献(0)
2020(2)
  • 引证文献(2)
  • 二级引证文献(0)
研究主题发展历程
节点文献
网页关键词
朴素贝叶斯
网页分类
行为特征
权值计算方法
网址预分类
商业推广
司法取证
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
沈阳工业大学学报
双月刊
1000-1646
21-1189/T
大16开
沈阳市铁西区南十三路1号
8-165
1964
chi
出版文献量(篇)
2983
总下载数(次)
5
总被引数(次)
22269
论文1v1指导