基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
提出了一种层数敏感的XML文档数据集聚类方法CXLI.首先提出结构表概念,消除XML文档的重复和嵌套结构.然后提出考虑层数信息的XML文档基本编辑操作约束.进一步给出考虑层数信息的XML文档间相似性度量方法.最后使用凝聚型层次聚类方法对XML文档数据集进行聚类.在ACM SIGMOD数据集和人工生成的数据集上进行了实验验证,结果表明:在计算时间基本相同的情况下,CXLI方法具有更好的精确度.
推荐文章
八邻域网格聚类的多样性XML文档近似查询算法
多样性
近似查询
语义距离
八邻域
静态有序选择
一种快速有效的Web文档聚类方法
Web挖掘
文档聚类
矢量空间模型VSM
关联规则
基于量子遗传算法的XML聚类集成
XML文档
KNN分类
量子遗传算法
聚类集成
聚类质量
基于XML Schema XML文档验证算法
XMLSchema
XML
文档验证算法
语法错误
错误信息处理
错误位置追踪
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 考虑层数信息的XML文档聚类方法
来源期刊 吉林大学学报(工学版) 学科 工学
关键词 人工智能 数据挖掘 可扩展标记语言 相似性度量 聚类 层数
年,卷(期) 2014,(1) 所属期刊栏目
研究方向 页码范围 124-128
页数 5页 分类号 TP18
字数 4262字 语种 中文
DOI 10.13229/j.cnki.jdxbgxb201401022
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 李雄飞 60 783 13.0 27.0
3 王婧 35 114 6.0 9.0
5 李巍 59 466 10.0 19.0
7 刘兆军 3 8 2.0 2.0
9 赵浩宇 吉林大学软件学院 7 31 2.0 5.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (2)
共引文献  (13)
参考文献  (9)
节点文献
引证文献  (2)
同被引文献  (0)
二级引证文献  (0)
1977(1)
  • 参考文献(1)
  • 二级参考文献(0)
1989(1)
  • 参考文献(1)
  • 二级参考文献(0)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(2)
  • 参考文献(2)
  • 二级参考文献(0)
2006(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2009(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2015(1)
  • 引证文献(1)
  • 二级引证文献(0)
2020(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
人工智能
数据挖掘
可扩展标记语言
相似性度量
聚类
层数
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
吉林大学学报(工学版)
双月刊
1671-5497
22-1341/T
大16开
长春市人民大街5988号
12-46
1957
chi
出版文献量(篇)
4941
总下载数(次)
5
总被引数(次)
43316
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导