原文服务方: 计算机应用研究       
摘要:
针对克隆群映射大多基于相邻版本对比,当克隆群在中期版本短暂消失,实现多版本间映射存在困难,提出一种基于LDA和DBSCAN的软件多版本克隆群映射方法.首先,对所有版本的克隆群进行预处理,获得克隆群文档集合;其次,根据贝叶斯信息准则选取合适主题数T,进行主题概率模型训练,将所有克隆群都表示成T个主题的概率分布向量;再次,计算克隆群之间的JS距离,利用DBSCAN算法将同源的克隆群聚成一簇;最后,对同簇的克隆群按版本先后排序,得到多版本克隆群映射结果.对五款开源软件83个版本进行了映射实验,结果表明查全率、查准率均在98%以上,为克隆代码分析、管理提供了有力支持.
推荐文章
基于LDA模型和HowNet的多粒度子话题划分方法
新闻报道
子话题划分
多粒度
狄利克雷分配模型
语义相似度计算
基于区域划分的DBSCAN多密度聚类算法
区域划分
多密度
相对密度差
DBSCAN聚类
一种基于增量存储的多副本文件版本控制方法
云存储
多副本
文件版本控制
CSP
基于Stacking方法的多策略本体映射
本体映射
Stacking方法
概念相似度
分类
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于LDA和DBSCAN的软件多版本克隆群映射方法
来源期刊 计算机应用研究 学科
关键词 克隆群映射 软件演化 LDA DBSCAN 克隆代码
年,卷(期) 2017,(2) 所属期刊栏目 软件技术研究
研究方向 页码范围 481-486
页数 6页 分类号 TP311.54
字数 语种 中文
DOI 10.3969/j.issn.1001-3695.2017.02.036
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 刘东升 内蒙古师范大学计算机与信息工程学院 76 464 12.0 18.0
2 侯敏 内蒙古师范大学计算机与信息工程学院 13 52 5.0 7.0
3 葛广帅 内蒙古师范大学计算机与信息工程学院 4 6 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (39)
共引文献  (91)
参考文献  (14)
节点文献
引证文献  (2)
同被引文献  (9)
二级引证文献  (0)
1984(1)
  • 参考文献(0)
  • 二级参考文献(1)
1990(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(2)
  • 参考文献(0)
  • 二级参考文献(2)
2002(3)
  • 参考文献(1)
  • 二级参考文献(2)
2003(1)
  • 参考文献(1)
  • 二级参考文献(0)
2004(2)
  • 参考文献(1)
  • 二级参考文献(1)
2005(2)
  • 参考文献(0)
  • 二级参考文献(2)
2006(4)
  • 参考文献(1)
  • 二级参考文献(3)
2007(2)
  • 参考文献(1)
  • 二级参考文献(1)
2008(5)
  • 参考文献(0)
  • 二级参考文献(5)
2009(2)
  • 参考文献(1)
  • 二级参考文献(1)
2010(4)
  • 参考文献(1)
  • 二级参考文献(3)
2011(4)
  • 参考文献(0)
  • 二级参考文献(4)
2012(1)
  • 参考文献(0)
  • 二级参考文献(1)
2013(9)
  • 参考文献(2)
  • 二级参考文献(7)
2014(4)
  • 参考文献(2)
  • 二级参考文献(2)
2015(3)
  • 参考文献(3)
  • 二级参考文献(0)
2017(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2018(1)
  • 引证文献(1)
  • 二级引证文献(0)
2019(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
克隆群映射
软件演化
LDA
DBSCAN
克隆代码
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用研究
月刊
1001-3695
51-1196/TP
大16开
1984-01-01
chi
出版文献量(篇)
21004
总下载数(次)
0
总被引数(次)
238385
论文1v1指导