基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对文本分类中特征空间的高维性导致的“维数灾难”问题,提出了一种基于流形学习的文本分类模型,该模型利用流形学习算法对高维文本特征数据降维后再分类.同时针对夹角余弦中存在的相似性偏移问题,提出了一种新的文本相似性度量措施——特征词相交距离,其实质是计算两个文档中所包含的特征词的交集,并将该措施作为流形学习算法中选择邻域的依据.实验结果表明,特征词相交距离较好地表达了文档之间的相似性,利用基于特征词相交的流形学习算法对文本数据降维后再分类,在保证分类精度的前提下极大地提高了分类算法的执行效率,克服了采用欧式距离和夹角余弦选择邻域造成低维流形的扭曲从而导致的分类精度降低的问题.
推荐文章
基于特征词匹配的政策文本分类算法研究与实现
字符串匹配算法
阈值计算
文本分类
一种基于特征词句子环境的文本分类器
文本分类
特征词句子环境
训练算法
语句聚集算法
基于词共现的文本分类算法
词共现
TF-IDF
向量空间模型
特征选择
基于特征词权重的文本分类
文本分类
特征选择
特征词类相关性
文本类相关性
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于特征词相交和流形学习的文本分类方法
来源期刊 河北工业大学学报 学科 工学
关键词 文本分类 特征词相交 流形学习 相似性偏移 夹角余弦
年,卷(期) 2014,(2) 所属期刊栏目
研究方向 页码范围 1-7
页数 7页 分类号 TP181
字数 6343字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 张军 河北工业大学计算机科学与软件学院 28 59 5.0 5.0
2 杨璐 河北工业大学计算机科学与软件学院 9 17 3.0 3.0
3 石陆魁 河北工业大学计算机科学与软件学院 27 112 5.0 9.0
4 王歌 河北工业大学计算机科学与软件学院 3 11 2.0 3.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (86)
共引文献  (139)
参考文献  (13)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1984(1)
  • 参考文献(0)
  • 二级参考文献(1)
1989(1)
  • 参考文献(0)
  • 二级参考文献(1)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(2)
  • 参考文献(0)
  • 二级参考文献(2)
1999(4)
  • 参考文献(0)
  • 二级参考文献(4)
2000(9)
  • 参考文献(2)
  • 二级参考文献(7)
2001(2)
  • 参考文献(0)
  • 二级参考文献(2)
2002(7)
  • 参考文献(1)
  • 二级参考文献(6)
2003(13)
  • 参考文献(1)
  • 二级参考文献(12)
2004(11)
  • 参考文献(1)
  • 二级参考文献(10)
2005(15)
  • 参考文献(1)
  • 二级参考文献(14)
2006(13)
  • 参考文献(2)
  • 二级参考文献(11)
2007(4)
  • 参考文献(0)
  • 二级参考文献(4)
2008(6)
  • 参考文献(0)
  • 二级参考文献(6)
2009(4)
  • 参考文献(2)
  • 二级参考文献(2)
2010(1)
  • 参考文献(0)
  • 二级参考文献(1)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(2)
  • 参考文献(2)
  • 二级参考文献(0)
2014(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
文本分类
特征词相交
流形学习
相似性偏移
夹角余弦
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
河北工业大学学报
双月刊
1007-2373
13-1208/T
大16开
天津市北辰区双口镇西平道5340号
1917
chi
出版文献量(篇)
3202
总下载数(次)
10
总被引数(次)
21785
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
河北省自然科学基金
英文译名:
官方网址:
项目类型:
学科类型:
论文1v1指导