基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
E研究中学科交叉广泛存在,因此对多学科的电子文献进行自动分类非常必要.针对E研究中的电子文献特征维数较高的特点,以上海高校比较语言学E-研究院为例,提出了一种可逐层降低分类难度、分而治之的层次化自动分类方法.该方法首先利用不需要矩阵运算的几何分类算法对文本向量进行初步分类;然后,利用fisher的线性判别方法将向量投影一维特征空间;最后,在一维空间中运用NBayes决策进行平均错误率最小的文献分类.实验结果表明该分类方法具有较好的精确性和速度:在闭集测试和开集测试中,均获得了较高的分类准确率、召回率及F1值,文献分类平均耗时0.29s.以上工作为E研究提供了智能化支持.
推荐文章
层次化中文文档分类
文档分类
属性选择
层次分类
分类器
一种基于层次结构的科技论文分类模型
科技论文
文本分类
层次结构
精度
泛化
中医药期刊文献分析自动化实验系统的设计与应用
中医药文献及情报学
中医肿瘤学
文献分析自动化
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 E研究中电子文献的层次化自动分类方法
来源期刊 计算机应用与软件 学科 工学
关键词 E研究 Fisher线性判别 NBayes决策 层次化自动分类
年,卷(期) 2009,(11) 所属期刊栏目 基金项目论文
研究方向 页码范围 46-49,94
页数 5页 分类号 TP3
字数 5563字 语种 中文
DOI 10.3969/j.issn.1000-386X.2009.11.015
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (41)
共引文献  (178)
参考文献  (5)
节点文献
引证文献  (1)
同被引文献  (5)
二级引证文献  (7)
1989(1)
  • 参考文献(0)
  • 二级参考文献(1)
1992(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(3)
  • 参考文献(0)
  • 二级参考文献(3)
1997(6)
  • 参考文献(0)
  • 二级参考文献(6)
1998(3)
  • 参考文献(0)
  • 二级参考文献(3)
1999(6)
  • 参考文献(0)
  • 二级参考文献(6)
2000(3)
  • 参考文献(0)
  • 二级参考文献(3)
2001(10)
  • 参考文献(0)
  • 二级参考文献(10)
2002(7)
  • 参考文献(2)
  • 二级参考文献(5)
2003(3)
  • 参考文献(1)
  • 二级参考文献(2)
2005(2)
  • 参考文献(2)
  • 二级参考文献(0)
2009(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2015(1)
  • 引证文献(1)
  • 二级引证文献(0)
2016(1)
  • 引证文献(0)
  • 二级引证文献(1)
2017(3)
  • 引证文献(0)
  • 二级引证文献(3)
2018(1)
  • 引证文献(0)
  • 二级引证文献(1)
2019(2)
  • 引证文献(0)
  • 二级引证文献(2)
研究主题发展历程
节点文献
E研究
Fisher线性判别
NBayes决策
层次化自动分类
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用与软件
月刊
1000-386X
31-1260/TP
大16开
上海市愚园路546号
4-379
1984
chi
出版文献量(篇)
16532
总下载数(次)
47
总被引数(次)
101489
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导