基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
在机器学习和数据挖掘过程中,数据缺失现象经常发生.对缺失值的有效补全是数据预处理的重要组成部分,也是后续分析挖掘工作的基础.最近邻填充算法(kNNI)因其易于实现、计算方便和局部填充效果好等特性而被广泛应用.但是,它并不涉及全局信息,因而当大段缺失值发生时,补全效果会有所降低,而对于具有周期成分的时序数据,其效果更是急剧下降.幸运的是,傅里叶变换能够解析出周期数据中的不同周期成分,并能在此基础上通过逆变换基本实现数据复原,只不过其局部复原能力较弱.因此,本文结合傅里叶变换对周期性数据的全局复原能力和kNNI对局部数据的补全能力,提出了基于傅里叶变换的kNNI缺失值补全算法(FkNNI).通过对大量模拟数据的测试结果表明,该算法比单纯的kNNI算法的缺失值补全准确性有很大提升.
推荐文章
时序数据相似性挖掘算法研究
相似性挖掘
时间序列
数据挖掘
知识发现
基于多视角缺失补全算法的数据挖掘研究
机器学习
多视角数据
视角缺失
核回归
核函数
利用傅里叶谐波分析法的时序数据周期迭代辨识算法
时序数据
周期成分
迭代辨识
傅里叶谐波分析法
方差分析法
利用自回归模型的平稳时序数据快速辨识算法
平稳时序数据
自回归模型
递阶辨识
自相关函数
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于傅里叶变换和kNNI的周期性时序数据缺失值补全算法
来源期刊 软件工程 学科 工学
关键词 缺失值补全 最近邻填充算法 周期数据 傅里叶变换
年,卷(期) 2017,(3) 所属期刊栏目 方法与技术
研究方向 页码范围 9-13
页数 5页 分类号 TP391.4
字数 5594字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 王建新 北京林业大学信息学院 35 165 8.0 11.0
2 贾梓健 北京林业大学信息学院 1 5 1.0 1.0
3 宋腾炜 北京林业大学信息学院 1 5 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (12)
共引文献  (4)
参考文献  (9)
节点文献
引证文献  (5)
同被引文献  (15)
二级引证文献  (7)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(2)
  • 参考文献(0)
  • 二级参考文献(2)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2013(4)
  • 参考文献(1)
  • 二级参考文献(3)
2014(2)
  • 参考文献(1)
  • 二级参考文献(1)
2015(2)
  • 参考文献(1)
  • 二级参考文献(1)
2016(4)
  • 参考文献(4)
  • 二级参考文献(0)
2017(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2018(4)
  • 引证文献(3)
  • 二级引证文献(1)
2019(6)
  • 引证文献(1)
  • 二级引证文献(5)
2020(2)
  • 引证文献(1)
  • 二级引证文献(1)
研究主题发展历程
节点文献
缺失值补全
最近邻填充算法
周期数据
傅里叶变换
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
软件工程
月刊
2096-1472
21-1603/TP
大16开
辽宁省沈阳市浑南新区新秀街2号
8-198
1985
chi
出版文献量(篇)
5636
总下载数(次)
15
论文1v1指导