基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
为了研究不对称数据集下,分类算法敏感网页后验错误率高,实时性不足的问题,提出了一种基于网页结构化倾向的网页分类算法.首先,选取网页结构化内容,将计算得到的倾向性作为分类特征;其次,采用决策树以倾向特征作为分类特征对网页分类.仿真试验表明,在互联网环境中正负样本不对称情况下,在保证分类速度的同时,分类的敏感网页后验错误率为0.6456,较传统的基于关键字分类模型有较大幅度降低.
推荐文章
面向网页分类的网页摘要方法
网页分类
网页摘要
Content Body
混合摘要方法
中文网页作者情感态度倾向性分类研究
褒贬倾向性分类
KNN
Naive Bayes
基于论坛主题的网页褒贬倾向性识别
论坛主题分析
倾向性识别
网页评价
词语相似度
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于网页结构化倾向的网页分类方法研究
来源期刊 信息网络安全 学科 工学
关键词 网页分类 结构化内容 语义倾向 决策树
年,卷(期) 2009,(9) 所属期刊栏目 学习交流
研究方向 页码范围 76-79
页数 4页 分类号 TP391
字数 4823字 语种 中文
DOI 10.3969/j.issn.1671-1122.2009.09.029
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 刘宏志 北京工商大学计算机与信息工程学院 60 418 10.0 17.0
2 朱贺军 5 44 3.0 5.0
3 万月亮 北京工商大学计算机与信息工程学院 11 137 5.0 11.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (8)
共引文献  (481)
参考文献  (6)
节点文献
引证文献  (1)
同被引文献  (9)
二级引证文献  (2)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(2)
  • 参考文献(0)
  • 二级参考文献(2)
2003(4)
  • 参考文献(1)
  • 二级参考文献(3)
2004(2)
  • 参考文献(2)
  • 二级参考文献(0)
2006(1)
  • 参考文献(1)
  • 二级参考文献(0)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2009(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2019(2)
  • 引证文献(1)
  • 二级引证文献(1)
2020(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
网页分类
结构化内容
语义倾向
决策树
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
信息网络安全
月刊
1671-1122
31-1859/TN
大16开
上海岳阳路76号4号楼211室
4-688
2001
chi
出版文献量(篇)
7165
总下载数(次)
26
总被引数(次)
26089
论文1v1指导