基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
提出一种基于向量空间模型的多层网页分类方法.该方法用主题词、修正主题词和主题概念从3个层次构建网页表示向量,从而在概念层次上更贴近网页的语义,且向量维数低于传统的特征向量.实验结果表明,该方法降低了分类时的计算量.提高了网页分类速度和分类精度.
推荐文章
基于向量空间模型的多主题Web文本分类方法
向量空间模型
文本分类
多主题
数据挖掘
基于链接信息的网页分类算法
网页分类
类别
K近邻方法
链接信息分类
基于向量空间模型的文本自动分类系统的研究与实现
文本分类
中文信息处理
向量空间模型
融合LSI和支持向量聚类的网页文本分类算法
特征提取
潜在语义索引
网页文本
语义聚类
支持向量聚类
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于向量空间模型的分层网页分类方法
来源期刊 南通大学学报(自然科学版) 学科 工学
关键词 向量空间模型 网页分类 特征提取 主题概念
年,卷(期) 2010,(1) 所属期刊栏目
研究方向 页码范围 24-29
页数 分类号 TP311
字数 5411字 语种 中文
DOI 10.3969/j.issn.1673-2340.2010.01.005
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 陈继红 南通大学计算机科学与技术学院 24 181 7.0 13.0
2 邵浩然 南通大学计算机科学与技术学院 15 69 6.0 7.0
3 鞠小林 南通大学计算机科学与技术学院 29 298 9.0 16.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (14)
共引文献  (64)
参考文献  (9)
节点文献
引证文献  (1)
同被引文献  (1)
二级引证文献  (5)
1975(1)
  • 参考文献(1)
  • 二级参考文献(0)
1979(1)
  • 参考文献(0)
  • 二级参考文献(1)
1984(1)
  • 参考文献(0)
  • 二级参考文献(1)
1987(1)
  • 参考文献(1)
  • 二级参考文献(0)
1990(1)
  • 参考文献(1)
  • 二级参考文献(0)
1992(1)
  • 参考文献(1)
  • 二级参考文献(0)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(5)
  • 参考文献(0)
  • 二级参考文献(5)
1999(3)
  • 参考文献(1)
  • 二级参考文献(2)
2001(1)
  • 参考文献(1)
  • 二级参考文献(0)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(2)
  • 参考文献(1)
  • 二级参考文献(1)
2008(2)
  • 参考文献(2)
  • 二级参考文献(0)
2010(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2011(2)
  • 引证文献(1)
  • 二级引证文献(1)
2012(2)
  • 引证文献(0)
  • 二级引证文献(2)
2017(1)
  • 引证文献(0)
  • 二级引证文献(1)
2019(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
向量空间模型
网页分类
特征提取
主题概念
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
南通大学学报(自然科学版)
季刊
1673-2340
32-1755/N
大16开
江苏省南通市啬园路9号
2002
chi
出版文献量(篇)
1549
总下载数(次)
7
总被引数(次)
6139
论文1v1指导