基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
互联网和科学研究的高速发展导致可利用的科技文献的数量急剧增加,为了更有效地利用这些文献、特别是英文文献,迫切需要对它们进行机器自动分类.传统的文本分类算法没有考虑科技文本具有明显层次结构的这一特征,在进行分类时无法达到满意的效果.论文针对这一特征提出了一种基于层次结构的文本分类模型,并对环境类科技论文进行了分类研究.结果表明,该模型能够稳定并有效地提高分类的精度,提高的幅度在1%到24%之间;同时,该模型还具有良好的泛化能力.
推荐文章
一种基于图的层次多标记文本分类方法
文本分类
层次分类
多标记分类
有向无圈图
拓扑排序
一种层次结构的Web内容自适应模型
Web服务质量
内容自适应
区分服务
层次结构
一种风车形状层次结构的WSN组播模型
无线传感器网络
风车形状
分层结构
节能
一种多值返回的层次化分类方法
分类
层次化分类
多值分类
错误路径长度
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种基于层次结构的科技论文分类模型
来源期刊 计算机工程与应用 学科 工学
关键词 科技论文 文本分类 层次结构 精度 泛化
年,卷(期) 2004,(6) 所属期刊栏目 博士论坛
研究方向 页码范围 18-22
页数 5页 分类号 TP18
字数 5514字 语种 中文
DOI 10.3321/j.issn:1002-8331.2004.06.006
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 吴高巍 中国科学院计算技术研究所 5 60 3.0 5.0
2 姚力群 中国科学院自动化研究所复杂系统与智能科学重点实验室 3 33 3.0 3.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (9)
节点文献
引证文献  (8)
同被引文献  (4)
二级引证文献  (33)
1975(1)
  • 参考文献(1)
  • 二级参考文献(0)
1980(1)
  • 参考文献(1)
  • 二级参考文献(0)
1989(1)
  • 参考文献(1)
  • 二级参考文献(0)
1995(1)
  • 参考文献(1)
  • 二级参考文献(0)
1998(2)
  • 参考文献(2)
  • 二级参考文献(0)
2000(3)
  • 参考文献(3)
  • 二级参考文献(0)
2004(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2006(3)
  • 引证文献(3)
  • 二级引证文献(0)
2007(8)
  • 引证文献(1)
  • 二级引证文献(7)
2008(5)
  • 引证文献(1)
  • 二级引证文献(4)
2009(7)
  • 引证文献(1)
  • 二级引证文献(6)
2010(4)
  • 引证文献(0)
  • 二级引证文献(4)
2011(4)
  • 引证文献(0)
  • 二级引证文献(4)
2012(1)
  • 引证文献(0)
  • 二级引证文献(1)
2013(2)
  • 引证文献(1)
  • 二级引证文献(1)
2014(2)
  • 引证文献(1)
  • 二级引证文献(1)
2015(1)
  • 引证文献(0)
  • 二级引证文献(1)
2016(1)
  • 引证文献(0)
  • 二级引证文献(1)
2017(1)
  • 引证文献(0)
  • 二级引证文献(1)
2018(2)
  • 引证文献(0)
  • 二级引证文献(2)
研究主题发展历程
节点文献
科技论文
文本分类
层次结构
精度
泛化
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程与应用
半月刊
1002-8331
11-2127/TP
大16开
北京619信箱26分箱
82-605
1964
chi
出版文献量(篇)
39068
总下载数(次)
102
总被引数(次)
390217
相关基金
国家重点基础研究发展计划(973计划)
英文译名:National Basic Research Program of China
官方网址:http://www.973.gov.cn/
项目类型:
学科类型:农业
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导