作者:
基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
系统中的克隆代码会增加程序员理解代码、修改代码的时间,并且在代码中一处克隆代码出现错误可能会导致系统中多个相同代位置的代码出现错误,大大增大了程序员进行软件维护的成本.为了找到系统文件中的克隆代码,利用基于Word2vec的克隆代码检测方法,针对新疆马业电商平台中的代码进行克隆检测.通过对系统源代码进行数据清洗,去除不需要的字符;Word2vec模型是一群浅并且双层的神经网络,选择Word2vec中的skip-gram模型进行训练并且构造词向量.训练完成后,模型可用来映射每个词到一个向量,用来表示词对词之间的关系.最后通过夹角余弦的方法来计算代码相似度,从而自动检测代码中的克隆代码.研究结果表明:基于Word2vec的克隆代码检测方法可以很好地检测出代码文件中的克隆代码,并且以指定的方式进行输出.
推荐文章
基于LDA和word2vec的英文作文跑题检测
作文跑题检测
向量空间模型
潜在狄利克雷分配
词语间语义关系
基于word2vec和双向LSTM的情感分类深度模型
文本分类
情感分析
双向长短时记忆循环神经网络
词向量
社交网络
基于word2vec的数字图书馆本体构建技术研究
本体构建
领域本体
概念抽取
关系抽取
数字图书馆现状
基于word2vec的跨领域情感分类方法
语义特征
共现特征
词向量
跨领域情感分类
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于Word2vec的克隆代码检测方法研究
来源期刊 计算机技术与发展 学科 工学
关键词 Word2vec 克隆代码 自动检测 相似度 软件维护
年,卷(期) 2020,(8) 所属期刊栏目 安全与防范
研究方向 页码范围 124-128
页数 5页 分类号 TP311
字数 4124字 语种 中文
DOI 10.3969/j.issn.1673-629X.2020.08.021
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 杨抒 新疆农业大学计算机与信息工程学院 21 44 4.0 5.0
2 贾清 新疆农业大学计算机与信息工程学院 2 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (58)
共引文献  (24)
参考文献  (10)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1954(1)
  • 参考文献(0)
  • 二级参考文献(1)
1984(1)
  • 参考文献(0)
  • 二级参考文献(1)
1987(1)
  • 参考文献(0)
  • 二级参考文献(1)
1990(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(3)
  • 参考文献(0)
  • 二级参考文献(3)
2001(2)
  • 参考文献(0)
  • 二级参考文献(2)
2002(4)
  • 参考文献(1)
  • 二级参考文献(3)
2003(2)
  • 参考文献(0)
  • 二级参考文献(2)
2004(2)
  • 参考文献(0)
  • 二级参考文献(2)
2005(5)
  • 参考文献(0)
  • 二级参考文献(5)
2006(2)
  • 参考文献(0)
  • 二级参考文献(2)
2007(3)
  • 参考文献(0)
  • 二级参考文献(3)
2008(2)
  • 参考文献(0)
  • 二级参考文献(2)
2009(6)
  • 参考文献(2)
  • 二级参考文献(4)
2010(6)
  • 参考文献(1)
  • 二级参考文献(5)
2011(3)
  • 参考文献(2)
  • 二级参考文献(1)
2012(2)
  • 参考文献(0)
  • 二级参考文献(2)
2013(2)
  • 参考文献(0)
  • 二级参考文献(2)
2014(4)
  • 参考文献(0)
  • 二级参考文献(4)
2015(2)
  • 参考文献(1)
  • 二级参考文献(1)
2016(3)
  • 参考文献(0)
  • 二级参考文献(3)
2017(5)
  • 参考文献(0)
  • 二级参考文献(5)
2018(3)
  • 参考文献(3)
  • 二级参考文献(0)
2020(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
Word2vec
克隆代码
自动检测
相似度
软件维护
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机技术与发展
月刊
1673-629X
61-1450/TP
大16开
西安市雁塔路南段99号
52-127
1991
chi
出版文献量(篇)
12927
总下载数(次)
40
总被引数(次)
111596
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导