原文服务方: 安徽工业大学学报(自然科学版)       
摘要:
特征权重计算是文本表示的关键,权重计算方法的优劣直接影响文本分类和聚类的准确度.基于词形和词频统计的特征加权方法过于近似和粗糙,不能有效突出具有较强类别区分度的重要特征,难以有效区分两类特征,造成了高维稀疏问题,使文本分类性能不够理想,这是特征权重计算的主要障碍.提出一种基于概念层次的特征权重计算方法,将词空间转移为概念空间,在概念层次上引入特征支持度与类别强度两个参数对特征权重进行调整.实验表明,新的方法表现了较好的分类性能.在空间维度的压缩与计算效率上也有明显的改善.
推荐文章
用于综合评判的一种权重计算方法
粗糙集
近似精度
属性重要性
综合权重
基于类别信息和特征熵的文本特征权重计算
文本分类
文本特征
权重计算
类别频率
基于SE序列的MR图像权重计算方法
SE序列
磁共振图像对比度
SE加权像
一种基于多重因子加权的文本特征项权值计算方法
特征项
文本聚类
中文文本
自然语言处理
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种基于概念层次的文本特征权重计算方法
来源期刊 安徽工业大学学报(自然科学版) 学科
关键词 概念空间 特征权重 概念层次 特征支持度 类别强度
年,卷(期) 2008,(3) 所属期刊栏目
研究方向 页码范围 329-333
页数 5页 分类号 TP181
字数 语种 中文
DOI 10.3969/j.issn.1671-7872.2008.03.023
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 杨学兵 安徽工业大学计算机学院 23 407 9.0 20.0
3 毛林 安徽工业大学计算机学院 3 6 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (3)
共引文献  (123)
参考文献  (2)
节点文献
引证文献  (1)
同被引文献  (1)
二级引证文献  (1)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(2)
  • 参考文献(2)
  • 二级参考文献(0)
2008(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2009(1)
  • 引证文献(1)
  • 二级引证文献(0)
2010(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
概念空间
特征权重
概念层次
特征支持度
类别强度
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
安徽工业大学学报(自然科学版)
季刊
1671-7872
34-1254/N
大16开
1984-01-01
chi
出版文献量(篇)
2187
总下载数(次)
0
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导