基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
Web网页的自动分类有助于更好地对其内容进行组织和管理,针对XML网页的分类问题,提出了一种基于Web挖掘和文档对象模型(DOM)树的XML网页分类方法.首先,收集XML网页的文本信息.然后,对XML文本进行去冗余操作,并提取网页源代码.再后,利用DOM树结构进行标签提取,创建知识库.最后,通过从测试网页中获取的标签与知识库进行匹配来分类网页.实验结果表明,提出的方法在各种XML网页下获得了97%的整体准确度.
推荐文章
基于XML的Web数据挖掘关键技术的研究
Web数据挖掘
XML模型
关键技术
基于XML个性化Web挖掘框架设计
数据挖掘
Web挖掘
XML
个性化
利用决策树和聚类理论对XML文档数据挖掘的研究
数据挖掘
决策树
聚类
XML文档
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于Web挖掘和文档对象模型树的XML网页分类方法
来源期刊 微型电脑应用 学科 工学
关键词 XML网页分类 Web挖掘 文档对象模型树 标签匹配
年,卷(期) 2016,(7) 所属期刊栏目 基金项目
研究方向 页码范围 47-49,52
页数 4页 分类号 TP393
字数 3017字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 黎远松 四川理工学院计算机学院 40 95 6.0 8.0
2 马勇 四川工程职业技术学院电气信息工程系 15 38 4.0 6.0
3 鲜敏 四川工程职业技术学院电气信息工程系 24 17 2.0 3.0
4 郑翔 四川工程职业技术学院电气信息工程系 14 18 2.0 4.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (31)
共引文献  (17)
参考文献  (7)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(2)
  • 参考文献(0)
  • 二级参考文献(2)
2006(5)
  • 参考文献(0)
  • 二级参考文献(5)
2007(10)
  • 参考文献(0)
  • 二级参考文献(10)
2008(5)
  • 参考文献(0)
  • 二级参考文献(5)
2009(3)
  • 参考文献(0)
  • 二级参考文献(3)
2010(3)
  • 参考文献(2)
  • 二级参考文献(1)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(6)
  • 参考文献(3)
  • 二级参考文献(3)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
XML网页分类
Web挖掘
文档对象模型树
标签匹配
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
微型电脑应用
月刊
1007-757X
31-1634/TP
16开
上海市华山路1954号上海交通大学铸锻楼314室
4-506
1984
chi
出版文献量(篇)
6963
总下载数(次)
20
总被引数(次)
28091
论文1v1指导