基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
代码克隆能够加速软件开发但是也会导致缺陷重复发生和软件质量问题.部分类型的代码克隆在字面上相似度低,导致识别困难.针对这一问题,提出一种基于程序向量树的代码克隆检测方法.首先,基于统计语言模型抽取词法单元的特征表示,分析不同字面单词之间的语义相似性;接着,通过语法分析提取程序的抽象语法树(AST),为叶子节点赋予对应字面单词的特征表示,将抽象语法树转化为程序向量树;最后,提出一种加权编码规则,在考虑区分不同树节点重要程度的基础上,将程序向量树编码为定长向量,而具有相似向量表示的代码片段被判定为代码克隆.实验结果表明,在真实代码克隆的大规模标准数据集BigCloneBench上,针对在字面上相似度较低的Moderately Type-3和Type-4类型克隆进行检测时,该方法均优于当前的主流方法,包括NiCad、Deckard、SourcererCC和Oreo等,证实了该方法的有效性.
推荐文章
克隆代码分析方法研究
克隆代码
克隆代码分析
克隆代码维护
缺陷检测
基于多叉树的RFID克隆攻击快速检测
克隆标签检测
无线射频识别
不可调解碰撞
基于软件漏洞的克隆代码稳定性评估
克隆代码
漏洞
软件漏洞
曼—惠特尼检验
层次聚类
基于bugs的克隆代码稳定性评估方法
克隆代码
bugs
修改频度
稳定性
SVN
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于程序向量树的代码克隆检测
来源期刊 计算机科学与探索 学科 工学
关键词 代码克隆 代码克隆检测 抽象语法树(AST) 程序向量树
年,卷(期) 2020,(10) 所属期刊栏目 学术研究
研究方向 页码范围 1656-1669
页数 14页 分类号 TP391
字数 语种 中文
DOI 10.3778/j.issn.1673-9418.1910019
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (19)
共引文献  (6)
参考文献  (6)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1981(1)
  • 参考文献(0)
  • 二级参考文献(1)
1993(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(4)
  • 参考文献(1)
  • 二级参考文献(3)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(5)
  • 参考文献(1)
  • 二级参考文献(4)
2008(3)
  • 参考文献(1)
  • 二级参考文献(2)
2010(1)
  • 参考文献(0)
  • 二级参考文献(1)
2011(1)
  • 参考文献(0)
  • 二级参考文献(1)
2013(3)
  • 参考文献(1)
  • 二级参考文献(2)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(1)
  • 参考文献(0)
  • 二级参考文献(1)
2018(1)
  • 参考文献(0)
  • 二级参考文献(1)
2019(1)
  • 参考文献(1)
  • 二级参考文献(0)
2020(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
代码克隆
代码克隆检测
抽象语法树(AST)
程序向量树
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机科学与探索
月刊
1673-9418
11-5602/TP
大16开
北京市海淀区北四环中路211号北京619信箱26分箱
82-560
2007
chi
出版文献量(篇)
2215
总下载数(次)
4
论文1v1指导