作者:
原文服务方: 现代电子技术       
摘要:
网页分类存在着新词多、特征维数高的问题,提出了一种新的网页分类方法.首先利用桥本体对分类领域本体进行集成,建立多本体语义标注模型,对文本特征进行降维.在此基础上,对不同类标号的关键词进行聚类,解决新词无法识别的问题,同时考虑网页标签的不同权重,用改进的SVM模型对中文网页进行分类.实验结果表明,上述方法改进了传统SVM分类器的性能.
推荐文章
融合LSI和支持向量聚类的网页文本分类算法
特征提取
潜在语义索引
网页文本
语义聚类
支持向量聚类
基于聚类选择的分类器集成
分类器集成
聚类
分类器选择
差异性
神经网络
基于相关随机子空间的分类数据聚类集成
分类数据
粗糙集
属性约简
相关子空间
聚类集成
利用本体技术的文本聚类模型
本体
文本聚类
概念主题
WordNet
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 利用本体集成和特征聚类的网页分类研究
来源期刊 现代电子技术 学科
关键词 文本分类 本体集成 支持向量机 维数约简 聚类
年,卷(期) 2012,(14) 所属期刊栏目 科学计算及信息处理
研究方向 页码范围 93-96
页数 分类号 TN911-34|TP393
字数 语种 中文
DOI 10.3969/j.issn.1004-373X.2012.14.029
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 孙少波 西安文理学院计算机系 11 47 4.0 6.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (31)
共引文献  (75)
参考文献  (9)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1971(1)
  • 参考文献(0)
  • 二级参考文献(1)
1993(1)
  • 参考文献(0)
  • 二级参考文献(1)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(2)
  • 参考文献(0)
  • 二级参考文献(2)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(4)
  • 参考文献(0)
  • 二级参考文献(4)
2004(5)
  • 参考文献(1)
  • 二级参考文献(4)
2005(3)
  • 参考文献(0)
  • 二级参考文献(3)
2006(8)
  • 参考文献(0)
  • 二级参考文献(8)
2007(3)
  • 参考文献(2)
  • 二级参考文献(1)
2008(2)
  • 参考文献(1)
  • 二级参考文献(1)
2009(3)
  • 参考文献(3)
  • 二级参考文献(0)
2010(2)
  • 参考文献(2)
  • 二级参考文献(0)
2012(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
文本分类
本体集成
支持向量机
维数约简
聚类
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
现代电子技术
半月刊
1004-373X
61-1224/TN
大16开
1977-01-01
chi
出版文献量(篇)
23937
总下载数(次)
0
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导