基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
为了有效地从Web页面上提取数据信息,本文建立一种基于XML的Web信息收集数据库.利用开源工具JTidy将Web页面加以整理,利用XML良好的结构特性,使用Dom4j工具包解析XML文件;按照XML中的标签层次特点作为对数据进行储存的依据;最后使用Hibernate将数据持久化地储存于数据库中,方便数据的储存与查询.
推荐文章
基于XML数据库的Web应用研究
XML
数据库
Web
应用
转换
链接
WEB数据库XML数据发布及信息提取系统
XML
相关转出
数据发布
信息提取
WEB服务
基于原生XML数据库技术的IETM数据库设计
原生XML数据库
存储和索引模式
IETM
S1000D
利用Web服务和XML实现数据库同步
Web服务
XML
数据库同步
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于XML的Web信息数据库的建立
来源期刊 计算机与现代化 学科 工学
关键词 XML Web 信息挖掘 数据库
年,卷(期) 2012,(9) 所属期刊栏目 应用与开发
研究方向 页码范围 222-224
页数 3页 分类号 TP391
字数 1789字 语种 中文
DOI 10.3969/j.issn.1006-2475.2012.09.057
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 黄昱阳 华南理工大学生物科学与工程学学院 3 6 2.0 2.0
2 李慧伦 山东理工大学生命科学院 1 1 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (35)
共引文献  (23)
参考文献  (7)
节点文献
引证文献  (1)
同被引文献  (0)
二级引证文献  (0)
2000(4)
  • 参考文献(0)
  • 二级参考文献(4)
2001(2)
  • 参考文献(0)
  • 二级参考文献(2)
2002(2)
  • 参考文献(0)
  • 二级参考文献(2)
2003(2)
  • 参考文献(0)
  • 二级参考文献(2)
2004(8)
  • 参考文献(0)
  • 二级参考文献(8)
2005(2)
  • 参考文献(0)
  • 二级参考文献(2)
2006(6)
  • 参考文献(0)
  • 二级参考文献(6)
2007(4)
  • 参考文献(1)
  • 二级参考文献(3)
2008(2)
  • 参考文献(0)
  • 二级参考文献(2)
2009(6)
  • 参考文献(3)
  • 二级参考文献(3)
2010(3)
  • 参考文献(2)
  • 二级参考文献(1)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2014(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
XML
Web
信息挖掘
数据库
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机与现代化
月刊
1006-2475
36-1137/TP
大16开
南昌市井冈山大道1416号
44-121
1985
chi
出版文献量(篇)
9036
总下载数(次)
25
总被引数(次)
56782
论文1v1指导