基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
本文根据中文文本的特点,以一种新的同义概念来替代传统的词为单位,并给出了同义概念之间权值的全新计算方法.我们不仅考虑了文本中词汇概率信息,还结合文本语义等多方面来提取文本特征值,从而提出了一种基于多重启发式规则的中文文本特征值提取方法,并给出了特征值提取模型和算法.通过与传统特征值提取方法的比较实验,证明本文中提出的特征值提取方法能有效地提高文本分类正确率,并达到了有效降低特征向量维数的目的.
推荐文章
基于启发式规则的网页主题信息精确定位方法
启发式规则
信息抽取
主题信息定位
模板化网页
基于遗传算法优化综合启发式的中文网页特征提取
特征提取
遗传算法
文本分类
文本聚类
词频
关联度
论启发式教学
启发
教学
形式
模式
基于启发式规则与和声搜索的配电网重构算法
配电网络
网络重构
网络简化
和声搜索算法
启发式规则
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于多重启发式规则的中文文本特征值提取方法
来源期刊 计算机工程与科学 学科 工学
关键词 文本分类 特征值提取 自然语言处理
年,卷(期) 2006,(8) 所属期刊栏目 算法研究
研究方向 页码范围 78-80,104
页数 4页 分类号 TP391
字数 4645字 语种 中文
DOI 10.3969/j.issn.1007-130X.2006.08.027
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 周经野 湘潭大学信息工程学院 70 530 12.0 20.0
2 邹娟 湘潭大学信息工程学院 12 122 6.0 11.0
3 邓成 湘潭大学信息工程学院 10 65 5.0 8.0
4 刘玲 湘潭大学信息工程学院 9 47 4.0 6.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (2)
共引文献  (249)
参考文献  (2)
节点文献
引证文献  (5)
同被引文献  (6)
二级引证文献  (62)
1994(1)
  • 参考文献(1)
  • 二级参考文献(0)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2008(1)
  • 引证文献(1)
  • 二级引证文献(0)
2009(16)
  • 引证文献(2)
  • 二级引证文献(14)
2010(24)
  • 引证文献(1)
  • 二级引证文献(23)
2011(7)
  • 引证文献(0)
  • 二级引证文献(7)
2012(2)
  • 引证文献(1)
  • 二级引证文献(1)
2013(7)
  • 引证文献(0)
  • 二级引证文献(7)
2014(4)
  • 引证文献(0)
  • 二级引证文献(4)
2015(1)
  • 引证文献(0)
  • 二级引证文献(1)
2016(1)
  • 引证文献(0)
  • 二级引证文献(1)
2017(1)
  • 引证文献(0)
  • 二级引证文献(1)
2018(2)
  • 引证文献(0)
  • 二级引证文献(2)
2020(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
文本分类
特征值提取
自然语言处理
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程与科学
月刊
1007-130X
43-1258/TP
大16开
湖南省长沙市开福区德雅路109号国防科技大学计算机学院
42-153
1973
chi
出版文献量(篇)
8622
总下载数(次)
11
总被引数(次)
59030
相关基金
湖南省自然科学基金
英文译名:Natural Science Foundation of Hunan Province
官方网址:http://jj.hnst.gov.cn/
项目类型:一般面上项目
学科类型:
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导