基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
提出了一种基于XML的结构进行数据挖掘的算法,该方法使用现有的XML解析工具JAVA DOM对XML文件进行解析,形成XML文档树,把XML中的标签按照层次作为标记路径存储起来,再对标记路径进行关联规则挖掘,得到频繁事务.通过实验表明,只有当XML的结构呈不规则时,挖掘效率才会随最小支持度的增大而提高.
推荐文章
基于TreeMiner算法的XML文档结构相似度量方法
频繁结构向量模型
嵌入子树
频繁子树
结构挖掘
XML文档结构相似测度研究
可扩展标记语言
结构相似测度
编辑距离
基于XML数据的频繁模式挖掘算法
XML
数据挖掘
频繁模式
算法
XML文档结构定义规范-XML Schema
XML
XML Schema
结构定义
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于单个XML文档结构的数据挖掘
来源期刊 石油化工高等学校学报 学科 工学
关键词 XML文档 标记路径 关联规则 数据挖掘 频繁事务
年,卷(期) 2007,(1) 所属期刊栏目 计算机与自动化
研究方向 页码范围 94-98
页数 5页 分类号 TP82
字数 3170字 语种 中文
DOI 10.3969/j.issn.1006-396X.2007.01.025
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 张晓明 52 257 10.0 13.0
2 梅东霞 3 22 2.0 3.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (21)
共引文献  (69)
参考文献  (4)
节点文献
引证文献  (5)
同被引文献  (11)
二级引证文献  (11)
1979(1)
  • 参考文献(0)
  • 二级参考文献(1)
1987(1)
  • 参考文献(0)
  • 二级参考文献(1)
1990(2)
  • 参考文献(0)
  • 二级参考文献(2)
1992(1)
  • 参考文献(0)
  • 二级参考文献(1)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(3)
  • 参考文献(0)
  • 二级参考文献(3)
2001(2)
  • 参考文献(0)
  • 二级参考文献(2)
2002(6)
  • 参考文献(0)
  • 二级参考文献(6)
2003(2)
  • 参考文献(1)
  • 二级参考文献(1)
2004(3)
  • 参考文献(3)
  • 二级参考文献(0)
2007(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2008(1)
  • 引证文献(1)
  • 二级引证文献(0)
2010(2)
  • 引证文献(1)
  • 二级引证文献(1)
2011(2)
  • 引证文献(1)
  • 二级引证文献(1)
2012(2)
  • 引证文献(1)
  • 二级引证文献(1)
2014(3)
  • 引证文献(0)
  • 二级引证文献(3)
2015(2)
  • 引证文献(0)
  • 二级引证文献(2)
2017(3)
  • 引证文献(1)
  • 二级引证文献(2)
2020(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
XML文档
标记路径
关联规则
数据挖掘
频繁事务
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
石油化工高等学校学报
双月刊
1006-396X
21-1345/TE
大16开
辽宁省抚顺市望花区丹东路西段1号
8-267
1988
chi
出版文献量(篇)
2213
总下载数(次)
7
论文1v1指导