作者:
基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
提出一种基于改进TFIDF算法的海量文本分类识别方法,将特征之间的信息熵与特征内信息熵作为文本分类识别的加权因子,采用神经网络的非线性映射能力实现权值计算和TFIDF算法的模糊化,从而解决文本分类不准确和海量文本的分类问题。采用5个类别文档,每个类别5个文档,3个特征项来进行实际试验验证,结果表明,改进的TFIDF算法能够更好的实现文本识别分类,具有更小的方差特性,对随机文本分布具有更强的鲁棒性,收敛速度更快,具有很好的应用价值。
推荐文章
基于改进的聚类平均信息量文本数据挖掘算法研究
文本分类
层次聚类
信息量
仿真
高维数据集中局部离散文本数据挖掘方法研究
高维数据
数据特征聚类
数据挖掘
关联规则
动态自适应特征权重的多类文本分类算法研究
文本分类
特征权重
TF-IDF
分散度
梯度差
基于聚类改进的 KN N文本分类算法
文本分类
KNN
聚类化
训练集
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 强鲁棒性小方差类间类内特征文本数据分类
来源期刊 科技通报 学科 工学
关键词 改进TFIDF 文本分类 神经网络 特征
年,卷(期) 2014,(4) 所属期刊栏目 工业技术
研究方向 页码范围 191-193
页数 3页 分类号 TP393
字数 1727字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 余敦一 北京印刷学院教学技术与网络信息中心 10 9 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (27)
共引文献  (286)
参考文献  (7)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1958(1)
  • 参考文献(0)
  • 二级参考文献(1)
1972(1)
  • 参考文献(0)
  • 二级参考文献(1)
1989(1)
  • 参考文献(0)
  • 二级参考文献(1)
1990(1)
  • 参考文献(0)
  • 二级参考文献(1)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(2)
  • 参考文献(0)
  • 二级参考文献(2)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(2)
  • 参考文献(0)
  • 二级参考文献(2)
2001(2)
  • 参考文献(0)
  • 二级参考文献(2)
2003(4)
  • 参考文献(0)
  • 二级参考文献(4)
2004(4)
  • 参考文献(1)
  • 二级参考文献(3)
2005(5)
  • 参考文献(2)
  • 二级参考文献(3)
2006(3)
  • 参考文献(1)
  • 二级参考文献(2)
2007(2)
  • 参考文献(1)
  • 二级参考文献(1)
2008(2)
  • 参考文献(2)
  • 二级参考文献(0)
2014(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
改进TFIDF
文本分类
神经网络
特征
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
科技通报
月刊
1001-7119
33-1079/N
大16开
杭州西湖文化广场省科技馆东门6楼
32-95
1985
chi
出版文献量(篇)
8071
总下载数(次)
25
总被引数(次)
37961
论文1v1指导