基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
随着信息技术以及电子病历和病案在医疗机构的应用,医院数据库产生了大量的医学数据.决策树因其分类精度高、计算速度快,且分类规则简单、易于理解,而被广泛应用于医学数据分析中.然而,医学数据固有的高维特征空间和高度特征冗余等特点,使得传统的决策树在医学数据上的分类精度并不理想.基于此,提出了一种融合信息增益比排序分组和分组进化遗传算法的混合式特征选择算法(GRRGA).该算法首先使用基于信息增益比的过滤式算法对原始特征集合进行排序,然后按照密度等分的原理对排序后的特征进行分组,最后再使用分组进化遗传算法对排序后的特征组进行遗传搜索.其中,分组进化遗传算法共分为种群内和种群外两种进化方法,并使用两种不同的适应度函数来控制进化过程.此外,针对决策树的不稳定性,提出使用Bagging方法对C4.5算法进行集成学习.实验结果显示,GRRGA算法在6组UCI数据集上的Precision指标均值为87.13%,显著优于传统的特征选择算法.此外,与另外两种分类算法对比可知,GRRGA算法的特征筛选性能依然是最优的.更重要的是,Bagging方法在Arrhythmia和Cancer医学数据集上的Precision指标分别为84.7%和78.7%,充分证明了该算法的实际应用意义.
推荐文章
基于互信息和遗传算法的两阶段特征选择方法
标准化互信息
遗传算法
特征选择
特征约简
基于遗传算法和蚁群算法融合的QoS路由算法
遗传算法
蚁群算法
服务质量路由
基于遗传算法的入侵检测特征选择
入侵检测
特征选择
偏F检验
遗传算法
基于遗传算法的特征子集选择方法
数据挖掘
特征子集选择
遗传算法
人工智能
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 融合信息增益比和遗传算法的混合式特征选择算法
来源期刊 软件学报 学科 工学
关键词 医学数据 决策树 特征选择 遗传算法 信息增益比
年,卷(期) 2022,(3) 所属期刊栏目 模式识别与人工智能|PATTERN RECOGNITION AND ARTIFICIAL INTELLIGENCE
研究方向 页码范围 1128-1140
页数 13页 分类号 TP18
字数 语种 中文
DOI 10.13328/j.cnki.jos.006099
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2022(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
医学数据
决策树
特征选择
遗传算法
信息增益比
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
软件学报
月刊
1000-9825
11-2560/TP
16开
北京8718信箱
82-367
1990
chi
出版文献量(篇)
5820
总下载数(次)
36
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导