基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
提出了一种基于信息检索技术的程序源代码与中文文档关联信息的自动提取方法.假设程序员在编写代码时使用了有意义的类、函数和变量名,利用信息检索方法得到对应的包含有这些意义的文档.通过提取文档中的词汇建立文档的语言概率模型,在此基础上采用由代码信息组成的检索项来检索文档集,由此得到代码和文档的相关性列表和关联矩阵.通过三个软件系统对此方法进行测试,结果表明,当提取项大于5时可获得95%以上的关联.
推荐文章
一种代码和中文文档关联信息的自动提取方法
软件维护
信息检索
程序理解
基于词平台的中文文档实验系统的构建
中文信息处理
汉字编码
词平台
自动分词
一种句子级别的中文文本复制检测方法
复制检测
句子级别
倒排索引
中文信息处理
中文WEB文档自动分类系统的设计与实现
网络蜘蛛
中文分词
文档频度
NaIve
贝叶斯分类器
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种代码与中文文档关联信息的自动提取方法
来源期刊 浙江大学学报(工学版) 学科 工学
关键词 自动提取 信息检索 关联矩阵
年,卷(期) 2004,(11) 所属期刊栏目 自动化技术、计算机技术
研究方向 页码范围 1417-1421
页数 5页 分类号 TP311
字数 4142字 语种 中文
DOI 10.3785/j.issn.1008-973X.2004.11.006
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 陈奇 浙江大学计算机科学与技术学院 65 998 14.0 30.0
2 俞瑞钊 浙江大学计算机科学与技术学院 42 1043 12.0 32.0
3 陈华 浙江大学计算机科学与技术学院 44 551 11.0 23.0
4 钱剑飞 浙江大学计算机科学与技术学院 7 30 3.0 5.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (5)
节点文献
引证文献  (7)
同被引文献  (2)
二级引证文献  (19)
1989(1)
  • 参考文献(1)
  • 二级参考文献(0)
1991(2)
  • 参考文献(2)
  • 二级参考文献(0)
1993(1)
  • 参考文献(1)
  • 二级参考文献(0)
2002(1)
  • 参考文献(1)
  • 二级参考文献(0)
2004(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2009(2)
  • 引证文献(2)
  • 二级引证文献(0)
2010(2)
  • 引证文献(1)
  • 二级引证文献(1)
2011(2)
  • 引证文献(0)
  • 二级引证文献(2)
2012(5)
  • 引证文献(2)
  • 二级引证文献(3)
2013(4)
  • 引证文献(1)
  • 二级引证文献(3)
2014(1)
  • 引证文献(0)
  • 二级引证文献(1)
2015(1)
  • 引证文献(0)
  • 二级引证文献(1)
2017(2)
  • 引证文献(0)
  • 二级引证文献(2)
2018(7)
  • 引证文献(1)
  • 二级引证文献(6)
研究主题发展历程
节点文献
自动提取
信息检索
关联矩阵
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
浙江大学学报(工学版)
月刊
1008-973X
33-1245/T
大16开
杭州市浙大路38号
32-40
1956
chi
出版文献量(篇)
6865
总下载数(次)
6
总被引数(次)
81907
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导