基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
进行重复投影会使数据库中出现大量冗余数据,使得数据特征之间出现相似性干扰.传统的挖掘方法,遇到特征相似性情况时,以模糊规则建立挖掘关联规则,在建立模糊规则时,一旦特征过于接近,需要加入很多的约束条件,计算过程较为繁琐,导致数据挖掘准确性差、效率低的问题.提出基于贝努里模型的大量重复投影数据库下优化挖掘方法,依据等级分组识别重复投影数据,建立贝努里模型.根据冗余属性的贡献及区分能力的不同,确定两个分类贡献系数.依据两个先验概率值,依次放大两个分类贡献系数倍.通过改进贝努里事件模型中条件概率中的估计方法,划分大量重复投影数据库下的重复数据,实现大量重复投影数据库下的优化挖掘,提高数据搜索效率.仿真结果表明,改进方法不仅具有较优的挖掘性能,而且挖掘效率高.
推荐文章
大型数据库重复记录检测与优化研究
大型数据库
重复记录检测
重复记录优化
学习样本构建
最优位置确定
权值设置
并行数据库中异常数据优化分类挖掘方法研究
并行数据库
异常数据
挖掘
聚类
数据库读写策略在文本挖掘中的优化研究
文本挖掘
海量数据
数据库读写策略
优化研究
视景仿真模型数据库优化技术研究
视景仿真
模型数据库
层级结构
LOD
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 重复投影数据库下的优化挖掘方法研究与仿真
来源期刊 计算机仿真 学科 工学
关键词 重复投影数据库 挖掘 贝努里模型
年,卷(期) 2016,(5) 所属期刊栏目 仿真智能化
研究方向 页码范围 318-321
页数 4页 分类号 TP392
字数 4089字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 石林 常州大学信息科学与工程学院 29 75 6.0 7.0
2 杨长春 常州大学信息科学与工程学院 52 366 10.0 17.0
3 林荫 常州大学怀德学院 20 72 4.0 8.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (48)
共引文献  (12)
参考文献  (10)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1975(1)
  • 参考文献(0)
  • 二级参考文献(1)
1992(1)
  • 参考文献(0)
  • 二级参考文献(1)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(2)
  • 参考文献(0)
  • 二级参考文献(2)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(4)
  • 参考文献(0)
  • 二级参考文献(4)
2002(4)
  • 参考文献(0)
  • 二级参考文献(4)
2003(2)
  • 参考文献(0)
  • 二级参考文献(2)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(3)
  • 参考文献(0)
  • 二级参考文献(3)
2007(3)
  • 参考文献(0)
  • 二级参考文献(3)
2008(4)
  • 参考文献(0)
  • 二级参考文献(4)
2009(4)
  • 参考文献(0)
  • 二级参考文献(4)
2010(3)
  • 参考文献(1)
  • 二级参考文献(2)
2011(8)
  • 参考文献(1)
  • 二级参考文献(7)
2012(6)
  • 参考文献(3)
  • 二级参考文献(3)
2013(6)
  • 参考文献(2)
  • 二级参考文献(4)
2014(3)
  • 参考文献(3)
  • 二级参考文献(0)
2016(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
重复投影数据库
挖掘
贝努里模型
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机仿真
月刊
1006-9348
11-3724/TP
大16开
北京海淀阜成路14号
82-773
1984
chi
出版文献量(篇)
20896
总下载数(次)
43
总被引数(次)
127174
论文1v1指导