基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对当前常用的XML压缩算法没有考虑中文特点的情况,结合中文与XML的特点,提出一种高压缩率的适合中文XML文档的压缩算法COX.利用中文分词技术对XML文档进行分词处理,通过统计词频后获得排序的词典,利用Huffman编码思想对高频及长词汇进行压缩编码;解析XML文档后,把文档元素进行分类,同一类型的元素放入同一容器之中;算法还特别针对数字类型的数据进行了特殊处理.实验结果显示,相对于通用的压缩软件,COX具有更好的压缩效果,但压缩和解压缩时间要慢一些.
推荐文章
XCfde:高压缩率的XML文档压缩技术
XML压缩
LZ77
数据分类
数据交换
深亚微米SOC高压缩率EDT设计
微电子技术
嵌入式测试
研究与设计
测试矢量压缩
固定压缩率算法的开发及实现
Hadamard变换
概率分布
标量量化
FPGA
无损高压缩率电路设计
无损压缩
Deflate算法
双哈希
并行匹配
哈夫曼编码
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 COX:高压缩率的中文XML文档压缩技术
来源期刊 计算机工程与应用 学科 工学
关键词 中文XML文档 数据压缩 中文分词 词典
年,卷(期) 2012,(17) 所属期刊栏目 数据库、信号与信息处理
研究方向 页码范围 143-147
页数 分类号 TP391
字数 4096字 语种 中文
DOI 10.3778/j.issn.1002-8331.2012.17.028
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 路松峰 华中科技大学计算机科学与技术学院 34 277 8.0 14.0
2 赵友桥 华中科技大学计算机科学与技术学院 5 18 3.0 4.0
3 张山山 华中科技大学计算机科学与技术学院 1 4 1.0 1.0
4 吴志杰 中国工程物理研究院计算机应用研究所 14 339 7.0 14.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (3)
共引文献  (3)
参考文献  (4)
节点文献
引证文献  (4)
同被引文献  (10)
二级引证文献  (1)
1977(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(1)
  • 参考文献(1)
  • 二级参考文献(0)
2007(2)
  • 参考文献(2)
  • 二级参考文献(0)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2013(2)
  • 引证文献(2)
  • 二级引证文献(0)
2014(1)
  • 引证文献(1)
  • 二级引证文献(0)
2018(1)
  • 引证文献(1)
  • 二级引证文献(0)
2019(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
中文XML文档
数据压缩
中文分词
词典
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程与应用
半月刊
1002-8331
11-2127/TP
大16开
北京619信箱26分箱
82-605
1964
chi
出版文献量(篇)
39068
总下载数(次)
102
总被引数(次)
390217
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导