基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
随着论文数量的增多,如何有效地利用从各种渠道获取的大量论文是本研究的重点.相对于围绕英文论文的相关工作,目前针对中文学术论文的提取和挖掘工作比较缺乏.以2004年全国软件与应用学术会议(NASAC2004)的论文投稿为测试集,对提取、索引和挖掘的中文学术论文的方法进行研究.针对提取论文元数据的困难提出了解决方案,并提出了经过分字段索引后,面向具体问题利用各种分析方法获取问题答案(知识)的方法.实验表明,利用计算机辅助人们自动分析中文学术论文是有意义并可行的.
推荐文章
基于PDFBox抽取学术论文信息的实现
数据挖掘
信息抽取
PDF格式
学术论文
IT领域英文学术论文中的中介语现象实证研究
中介语
学术论文
科技英语教学
从发表学术论文情况看研究生教育存在的问题
科技期刊
学术论文
研究生教育
学术论文"报告"与"报道"用法辨析
学术论文
语法修辞
报告
报道
辨析
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 提取、索引和挖掘中文学术论文
来源期刊 南京大学学报(自然科学版) 学科 工学
关键词 自动提取 搜索引擎 学术论文 文本挖掘
年,卷(期) 2005,(z1) 所属期刊栏目 应用技术研究
研究方向 页码范围 845-852
页数 8页 分类号 TP391.1
字数 4777字 语种 中文
DOI 10.3321/j.issn:0469-5097.2005.z1.137
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 金茂忠 北京航空航天大学计算机学院 124 2563 23.0 48.0
2 刘超 北京航空航天大学计算机学院 138 2512 20.0 47.0
3 曹勇刚 北京航空航天大学计算机学院 5 204 3.0 5.0
4 曹羽中 北京航空航天大学计算机学院 4 194 3.0 4.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (4)
共引文献  (42)
参考文献  (5)
节点文献
引证文献  (1)
同被引文献  (2)
二级引证文献  (26)
1999(2)
  • 参考文献(1)
  • 二级参考文献(1)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(4)
  • 参考文献(2)
  • 二级参考文献(2)
2002(1)
  • 参考文献(1)
  • 二级参考文献(0)
2004(1)
  • 参考文献(1)
  • 二级参考文献(0)
2005(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2008(3)
  • 引证文献(1)
  • 二级引证文献(2)
2009(7)
  • 引证文献(0)
  • 二级引证文献(7)
2010(1)
  • 引证文献(0)
  • 二级引证文献(1)
2011(6)
  • 引证文献(0)
  • 二级引证文献(6)
2012(1)
  • 引证文献(0)
  • 二级引证文献(1)
2013(3)
  • 引证文献(0)
  • 二级引证文献(3)
2014(3)
  • 引证文献(0)
  • 二级引证文献(3)
2015(1)
  • 引证文献(0)
  • 二级引证文献(1)
2016(1)
  • 引证文献(0)
  • 二级引证文献(1)
2017(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
自动提取
搜索引擎
学术论文
文本挖掘
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
南京大学学报(自然科学版)
双月刊
0469-5097
32-1169/N
江苏省南京市南京大学
chi
出版文献量(篇)
2526
总下载数(次)
6
总被引数(次)
23071
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导