基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对特征向量分量的权重和文本大小对分类规则产生的影响,提出一种可以提高关联文本分类性能的文本分类规则挖掘方法,提出了加权频繁项集的概念和相应的加权频繁项集挖掘算法,在分类规则中突出特征向量权重大的向量分量;提出一种特征向量预处理方法,消除文本大小对挖掘分类规则的影响.实验表明,解决上述两个问题将可以很好的提高文本分类的性能.
推荐文章
基于WNegNodeset结构的加权频繁项集挖掘算法
加权频繁项集
加权支持度
位图加权树
按位运算符
差集策略
基于双阈值Apriori算法和非频繁项集的关联规则挖掘方法
正负关联规则挖掘
双支持度阈值
Apriori算法
非频繁项集
IDF加权
基于频繁项集的多标签文本分类算法
多标签
相似度
频繁项集
关联规则
基于索引数组的频繁项集挖掘算法
数据挖掘
关联规则
频繁项集
索引数组
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于加权频繁项集的文本分类规则挖掘
来源期刊 四川大学学报(工程科学版) 学科 工学
关键词 关联规则 文本分类 加权频繁项集
年,卷(期) 2008,(6) 所属期刊栏目 信息工程
研究方向 页码范围 110-114
页数 5页 分类号 TP311
字数 5093字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 唐常杰 四川大学计算机学院 164 2750 30.0 45.0
2 乔少杰 四川大学计算机学院 29 470 14.0 21.0
3 刘齐宏 四川大学计算机学院 24 281 9.0 16.0
4 段磊 四川大学计算机学院 49 685 13.0 24.0
5 邱江涛 西南财经大学经济信息工程学院 11 142 5.0 11.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (2)
共引文献  (17)
参考文献  (2)
节点文献
引证文献  (7)
同被引文献  (7)
二级引证文献  (31)
1975(1)
  • 参考文献(1)
  • 二级参考文献(0)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2009(1)
  • 引证文献(1)
  • 二级引证文献(0)
2010(2)
  • 引证文献(1)
  • 二级引证文献(1)
2011(5)
  • 引证文献(2)
  • 二级引证文献(3)
2012(6)
  • 引证文献(1)
  • 二级引证文献(5)
2013(7)
  • 引证文献(2)
  • 二级引证文献(5)
2014(4)
  • 引证文献(0)
  • 二级引证文献(4)
2015(5)
  • 引证文献(0)
  • 二级引证文献(5)
2016(2)
  • 引证文献(0)
  • 二级引证文献(2)
2017(3)
  • 引证文献(0)
  • 二级引证文献(3)
2018(3)
  • 引证文献(0)
  • 二级引证文献(3)
研究主题发展历程
节点文献
关联规则
文本分类
加权频繁项集
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
工程科学与技术
双月刊
1009-3087
51-1773/TB
大16开
成都市一环路南一段24号
62-55
1957
chi
出版文献量(篇)
4421
总下载数(次)
4
总被引数(次)
42422
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导