基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
聚类分析是数据挖掘领域一项重要的课题. 针对重复数据与孤立数据的预处理可以优化聚类结果. 重复数据处理方面,文中在传统的重复数据查找算法SNM的基础上加入了伸缩窗口与变化移动速度的思想,提高了查找的准确率与效率;孤立数据方面,文中提出基于层次聚类分簇搜寻算法,算法利用层次聚类将数据分成独立的簇再依次搜寻孤立点提高了查询速率,并加入恢复检验的部分恢复被误删的非孤立点提高查找的准确率. 实验仿真中,首先抽取部分数据验证了改进后的数据预处理算法的准确性,然后将数据预处理算法用于处理移动用户消费数据后再对数据进行聚类分析,从而达到对客户的归属地信息识别的目的. 实验结果表明,文中提出的预处理算法具有很高的准确率与效率.
推荐文章
基于海洋潜标观测数据压缩的数据预处理算法
海洋潜标
数据压缩
无损压缩算法
数据预处理算法
基于分层聚类的并行数据预处理算法
分层聚类
并行算法
预处理
海面声探测多目标数据预处理算法
声探测
数据关联
杂波剔除
指纹图像的预处理算法
预处理
方向图
Gabor滤波器
分割
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 改进的数据预处理算法及其应用
来源期刊 计算机技术与发展 学科 工学
关键词 数据预处理 SNM算法 层次聚类 聚类分析
年,卷(期) 2015,(12) 所属期刊栏目 应用开发研究
研究方向 页码范围 143-146,151
页数 5页 分类号 TP301.6
字数 3296字 语种 中文
DOI 10.3969/j.issn.1673-629X.2015.12.032
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 宫婧 南京邮电大学理学院 35 222 8.0 14.0
2 许必宵 南京邮电大学理学院 7 82 4.0 7.0
3 陈升波 南京邮电大学理学院 2 13 2.0 2.0
4 韩重阳 南京邮电大学理学院 1 7 1.0 1.0
5 马梦环 南京邮电大学理学院 1 7 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (38)
共引文献  (32)
参考文献  (9)
节点文献
引证文献  (7)
同被引文献  (40)
二级引证文献  (22)
1983(1)
  • 参考文献(0)
  • 二级参考文献(1)
1992(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(3)
  • 参考文献(1)
  • 二级参考文献(2)
2001(3)
  • 参考文献(0)
  • 二级参考文献(3)
2002(3)
  • 参考文献(0)
  • 二级参考文献(3)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(3)
  • 参考文献(0)
  • 二级参考文献(3)
2006(3)
  • 参考文献(0)
  • 二级参考文献(3)
2007(2)
  • 参考文献(0)
  • 二级参考文献(2)
2008(8)
  • 参考文献(0)
  • 二级参考文献(8)
2010(4)
  • 参考文献(1)
  • 二级参考文献(3)
2011(3)
  • 参考文献(0)
  • 二级参考文献(3)
2012(5)
  • 参考文献(1)
  • 二级参考文献(4)
2013(4)
  • 参考文献(4)
  • 二级参考文献(0)
2014(2)
  • 参考文献(2)
  • 二级参考文献(0)
2015(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2016(1)
  • 引证文献(1)
  • 二级引证文献(0)
2017(4)
  • 引证文献(2)
  • 二级引证文献(2)
2018(3)
  • 引证文献(1)
  • 二级引证文献(2)
2019(18)
  • 引证文献(2)
  • 二级引证文献(16)
2020(3)
  • 引证文献(1)
  • 二级引证文献(2)
研究主题发展历程
节点文献
数据预处理
SNM算法
层次聚类
聚类分析
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机技术与发展
月刊
1673-629X
61-1450/TP
大16开
西安市雁塔路南段99号
52-127
1991
chi
出版文献量(篇)
12927
总下载数(次)
40
总被引数(次)
111596
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导