作者:
原文服务方: 科技与创新       
摘要:
文本信息处理已成为一门日趋成熟、应用面日趋广泛的学科.文本分类和聚类技术是应信息检索和查询需要而出现的自然语言处理领域的重要研究课题.面对急速膨胀的各种文本信息,通过使用文本分类和聚类技术,人们能对这些信息进行高效地组织和整理,以便于实现信息的准确定位和分流,从而提高用户查询和检索的效率.本文针对文本信息处理中最重要的研究方向--文本分类和聚类技术展开了研究,分析了特征抽取法在文本分类和文本聚类中应用的重要性,以及论证了为何要对文本进行特征抽取,最后分别阐述了用于文本分类和文本聚类的特征抽取方法.
推荐文章
基于模糊聚类的文本分类器
文本分类
模糊聚类
编网法
模糊相似度
基于聚类改进的 KN N文本分类算法
文本分类
KNN
聚类化
训练集
基于聚类降维的改进KNN文本分类
特征降维
聚类
文本分类
K平均
K近邻
基于改进的最大熵均值聚类方法在文本分类中的应用
文本分类
最大熵
C-均值聚类
特征选择
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 用于文本分类和文本聚类的特征抽取方法的研究
来源期刊 科技与创新 学科
关键词 文本分类 文本聚类 特征抽取
年,卷(期) 2009,(9) 所属期刊栏目 软件时空
研究方向 页码范围 149-150
页数 2页 分类号 TP311
字数 语种 中文
DOI 10.3969/j.issn.1008-0570.2009.09.062
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (14)
共引文献  (235)
参考文献  (4)
节点文献
引证文献  (32)
同被引文献  (42)
二级引证文献  (98)
1990(1)
  • 参考文献(0)
  • 二级参考文献(1)
1991(1)
  • 参考文献(0)
  • 二级参考文献(1)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(2)
  • 参考文献(0)
  • 二级参考文献(2)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(1)
  • 二级参考文献(0)
2003(4)
  • 参考文献(1)
  • 二级参考文献(3)
2004(3)
  • 参考文献(0)
  • 二级参考文献(3)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2009(2)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(2)
  • 二级引证文献(0)
2009(2)
  • 引证文献(2)
  • 二级引证文献(0)
2010(5)
  • 引证文献(5)
  • 二级引证文献(0)
2011(8)
  • 引证文献(3)
  • 二级引证文献(5)
2012(4)
  • 引证文献(1)
  • 二级引证文献(3)
2013(7)
  • 引证文献(6)
  • 二级引证文献(1)
2014(15)
  • 引证文献(4)
  • 二级引证文献(11)
2015(12)
  • 引证文献(2)
  • 二级引证文献(10)
2016(31)
  • 引证文献(5)
  • 二级引证文献(26)
2017(20)
  • 引证文献(2)
  • 二级引证文献(18)
2018(18)
  • 引证文献(2)
  • 二级引证文献(16)
2019(7)
  • 引证文献(0)
  • 二级引证文献(7)
2020(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
文本分类
文本聚类
特征抽取
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
科技与创新
半月刊
2095-6835
14-1369/N
大16开
2014-01-01
chi
出版文献量(篇)
41653
总下载数(次)
0
总被引数(次)
202805
论文1v1指导