原文服务方: 计算技术与自动化       
摘要:
XML文档分类技术可以高效地管理海量存在的数据,XML文档同时拥有结构信息和文本信息.为充分利用XML特点,优化分类效果,在结构链接表达模型(structured link vector model,简称SLVM)的基础上,提出了一种新的特征表达方法,即P-SLVM表达模型.该模型在传统的tf*idf的权重设置方式基础上,根据特征词在类中的分布情况,对特征词权重设置进行改进,同时利用泊松分布理论、特征词所在位置等对结构单元进行加权,以更为有效地表达结构信息和内容信息.实验结果表明,在P-SLVM表达模型下进行的XML文档的分类,有更好的分类效果.
推荐文章
XML文档相似性度量方法研究
XML文档
相似性
约束
编辑距离
XML文档结构相似测度研究
可扩展标记语言
结构相似测度
编辑距离
基于XML Schema XML文档验证算法
XMLSchema
XML
文档验证算法
语法错误
错误信息处理
错误位置追踪
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 XML文档分类中特征表达方法的研究
来源期刊 计算技术与自动化 学科
关键词 XML文档 分类 结构链接模型 tf*idf 泊松分布
年,卷(期) 2020,(3) 所属期刊栏目 计算机软件及应用
研究方向 页码范围 91-96
页数 6页 分类号 TP311
字数 语种 中文
DOI 10.16339/j.cnki.jsjsyzdh.202003019
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (8)
共引文献  (12)
参考文献  (10)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2002(3)
  • 参考文献(2)
  • 二级参考文献(1)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(4)
  • 参考文献(2)
  • 二级参考文献(2)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(2)
  • 参考文献(0)
  • 二级参考文献(2)
2011(2)
  • 参考文献(1)
  • 二级参考文献(1)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(2)
  • 参考文献(2)
  • 二级参考文献(0)
2016(1)
  • 参考文献(1)
  • 二级参考文献(0)
2020(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
XML文档
分类
结构链接模型
tf*idf
泊松分布
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算技术与自动化
季刊
1003-6199
43-1138/TP
16开
1982-01-01
chi
出版文献量(篇)
2979
总下载数(次)
0
总被引数(次)
14675
论文1v1指导