基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
源代码检索任务是指将自然语言作为查询语句,从代码库中搜索相关代码片段.在代码检索任务中,大多数代码检索算法只考虑代码片段的文本序列信息而未考虑代码的结构信息,导致不能充分捕获代码片段包含的语义和语法信息.为了提高对程序语言的理解,提出了注意力机制和图嵌入相结合的代码检索算法(GraphCS).在特征提取部分,以LSTM提取文本特征向量表示,以Graph2Vec提取图的向量特征表示.在特征融合部分中引入注意力机制,更好地为每一个特征分配相应的权重,从而提升程序的理解.考虑源代码和自然语言为异构数据,将代码片段特征和自然语言特征映射到同一个向量空间,以排名损失来保证语义相似的点在特征空间拥有较近的距离.为了验证算法的高效性,与目前最好的算法CODEnn进行对比.实验结果表明,在Precision@1/5/10、SuccessRate@1/5/10以及MRR上均有一定的提升.
推荐文章
融合注意力机制和区域生长的裂缝识别算法研究
数字图像
裂缝识别
区域生长
注意力机制
具有全局特征的空间注意力机制
卷积神经网络
空间注意力机制
全局特征
特征融合
目标分类
目标检测
基于多尺度融合注意力机制的人脸表情识别研究
计算机视觉
深度学习
人脸表情识别
特征提取
多尺度特征融合
注意力机制
基于注意力机制的全景分割网络
全景分割
背景类实例重叠
三重态注意力机制
语义增强注意力机制
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 融合图嵌入和注意力机制的代码搜索
来源期刊 计算机科学与探索 学科 工学
关键词 源代码检索 注意力机制 图嵌入 自然语言 语义相似 向量空间
年,卷(期) 2022,(4) 所属期刊栏目 系统软件与软件工程|System Software and Software Engineering
研究方向 页码范围 844-854
页数 11页 分类号 TP391
字数 语种 中文
DOI 10.3778/j.issn.1673-9418.2010087
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2022(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
源代码检索
注意力机制
图嵌入
自然语言
语义相似
向量空间
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机科学与探索
月刊
1673-9418
11-5602/TP
大16开
北京市海淀区北四环中路211号北京619信箱26分箱
82-560
2007
chi
出版文献量(篇)
2215
总下载数(次)
4
总被引数(次)
10748
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导