作者:
基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
文本自动分类是一种有效的组织信息和管理信息的工具,传统分类方法一般在分类效果和运行效率上两者不可兼得,通过综合Rocchio和KNN 2种分类方法的优点,设计出一种基于多代表点的文本分类方法,该方法通过对各类挖掘出多个有效的代表点(真实或虚拟的),再使用基于这些代表点的Rocchio和KNN方法进行分类.实验表明,该方法以较少的训练时间达到令人满意的分类效果,并且能很好地解决不平衡类问题,实验结果显示,该方法能达到与SVM相当的分类效果.
推荐文章
多类型分类器融合的文本分类方法研究
文本分类
分类器融合
主成分分析
潜在语义索引
基于改进KNFL算法的海量文本分类研究
K最近特征线
离群点
类中心距
基于大数据挖掘技术的文本分类研究
大规模文本数据
高维特征
大数据挖掘技术
文本分类器
分类精度
分类时间
文本分类技术研究
文本分类
文本模型
数据挖掘
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于多代表点的文本分类研究
来源期刊 郑州大学学报(工学版) 学科 工学
关键词 文本分类 多代表点 Rocchio KNN
年,卷(期) 2010,(6) 所属期刊栏目
研究方向 页码范围 116-118,125
页数 分类号 TP391.1
字数 2939字 语种 中文
DOI 10.3969/j.issn.1671-6833.2010.06.028
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 陈可华 宁德师范学院计算机系 11 8 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (21)
共引文献  (291)
参考文献  (2)
节点文献
引证文献  (1)
同被引文献  (7)
二级引证文献  (3)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(9)
  • 参考文献(1)
  • 二级参考文献(8)
2004(4)
  • 参考文献(0)
  • 二级参考文献(4)
2005(7)
  • 参考文献(0)
  • 二级参考文献(7)
2006(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2014(1)
  • 引证文献(1)
  • 二级引证文献(0)
2015(2)
  • 引证文献(0)
  • 二级引证文献(2)
2016(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
文本分类
多代表点
Rocchio
KNN
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
郑州大学学报(工学版)
双月刊
1671-6833
41-1339/T
大16开
河南省郑州市科学大道100号
36-232
1980
chi
出版文献量(篇)
3118
总下载数(次)
0
总被引数(次)
21814
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导