基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
提出了规则合并的优化方法和重复记录聚类清除的方法.应用模糊等值理论,避免了传统等值理论非此即彼的僵硬方式,但清理过程中部分规则可能存在包含与被包含的关系,被包含的规则其等值度显然会相对较小,根据用户阀值提出了规则合并的优化方法,可减少重复记录的计算时间.基于同样的原因,规则间的包含与被包含关系将影响模糊等值度的误差分析,因此提出了利用忽略被包含的规则等值度提高误差分析精度的改进模糊等值理论误差分析方法.重复记录的核实通常需要人工逐条检测,易于出错,本文提出的聚类算法,可节省大量的用户劳动.最后给出一个实验,表明了规则优化的可能性.
推荐文章
数据清理及其在数据仓库中的应用
数据仓库
数据清理
模式冲突
FTL(Extraction,Transformation,Loading)
AFS理论在数据挖掘中的应用
AFS理论
数据挖掘
分类研究
FNN在数据库模糊查询中的研究
模糊神经网络
隶属函数
模糊查询
数据库
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 模糊等值理论在数据清理中的应用
来源期刊 东南大学学报(英文版) 学科 工学
关键词 等值理论 等值度 数据清理
年,卷(期) 2004,(4) 所属期刊栏目
研究方向 页码范围 454-457
页数 4页 分类号 TP3
字数 505字 语种 英文
DOI 10.3969/j.issn.1003-7985.2004.04.012
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 刘玉葆 华中科技大学计算机科学与技术学院 5 12 2.0 3.0
2 李华旸 华中科技大学计算机科学与技术学院 6 57 4.0 6.0
4 李又奎 华为技术有限公司南京研究所 2 23 1.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (1)
同被引文献  (0)
二级引证文献  (0)
2004(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2005(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
等值理论
等值度
数据清理
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
东南大学学报(英文版)
季刊
1003-7985
32-1325/N
大16开
南京四牌楼2号
1984
eng
出版文献量(篇)
2004
总下载数(次)
1
论文1v1指导