基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
在实际工作中经常需要进行文件格式分析,以方便数据资源共享与交换,而 目前数据文件格式分析方法存在解析效率低下等问题.为此提出基于聚类分析的数据文件格式分析方法,该方法应用聚类思想,通过同类型不同文件同一字节位置的聚类、文件组内不同字节位置的聚类,获得数据文件字节重复度分布并分析相应的聚类分布特征;将数据文件的文件头部分、文件数据体部分及分界处的重复度分布特征作为文件格式分析的依据,并提出以字节组聚类分析的方法提升文件格式分析效率.基于文件存储结构和聚类分布特征,制定了聚类分析的文件样本选取原则;同时开发了相应的格式解析辅助工具软件,该软件能自动进行选定文件合理性判断、自动分组等,简化了相应的格式解析处理过程.应用该方法和开发的工具进行了型号为Agilent GC 6890N MSD 5793N的质谱仪产生的MS数据文件格式解析试验,实验结果表明,该方法分析得到的文件格式准确、效率明显提高,通过对该方法复用,可以有效促进大型科研仪器数据资源共享,提高数据资源利用率.
推荐文章
两类数据文件格式的转换
文件格式
解密
数据库
新一代天气雷达基数据文件格式自动识别及软件实现方法
天气雷达
基数据格式
自动识别
动态链接库
PE文件格式剖析
PE文件格式
PE扩展
ELF文件格式及应用
目标文件格式
静态重定位
动态重定位
调试信息
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于聚类分析的数据文件格式分析方法
来源期刊 武汉理工大学学报 学科 工学
关键词 聚类分析 仪器资源共享 数据文件格式分析
年,卷(期) 2022,(1) 所属期刊栏目 机电与信息工程|Mechatronics and Information Engineering
研究方向 页码范围 93-99
页数 7页 分类号 TP311.1
字数 语种 中文
DOI 10.3963/j.issn.1671-4431.2022.01.014
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2022(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
聚类分析
仪器资源共享
数据文件格式分析
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
武汉理工大学学报
月刊
1671-4431
42-1657/N
大16开
武昌珞狮路122号武汉理工大学(西院)
38-41
1979
chi
出版文献量(篇)
8296
总下载数(次)
17
总被引数(次)
86904
论文1v1指导