基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
石油工业早已进入大数据时代,数据挖掘是充分利用数据资产价值的有效途径,而数据预处理是数据挖掘研究的热点之一.分析了数据挖掘以及数据预处理的意义及其现状,提出了在石油工业进行数据挖掘的基本思路;以某国际石油勘探开发技术服务与咨询公司研制的全球典型油气田数据库为例,以"采收率"为挖掘对象,详细解析了各种常用的数据挖掘预处理方法和具体做法,主要包括数据获取、属性选择、数据清理、数据集成、数据变换、数据规约和数据消密;提出了源数据的"5C"标准,即Correctness(正确性)、Currency(适时性)、Completeness(完整性)、Consistency(一致性)、Confidentiality(保密性).研究成果可为石油行业开展数据预处理等工作提供参考.
推荐文章
基于CORBA的异构油气田信息系统集成与数据交换
公共对象请求代理体系结构
分布式
信息集成
数据交换
异构数据库
油气田开发数据信息管理系统研究及应用
油气开采
信息处理
计算机网络
数据管理
数据库
油气田安全信息系统设计
分布式数据库
数据库链接
事务处理
管理信息系统
中医方剂数据库文本挖掘数据预处理的尝试
中医方剂
方剂数据库
文本挖掘
数据预处理
数据清洗
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于全球典型油气田数据库的数据挖掘预处理
来源期刊 大庆石油地质与开发 学科 工学
关键词 数据挖掘 预处理 油气田 数据库 5C标准
年,卷(期) 2016,(1) 所属期刊栏目 油藏工程
研究方向 页码范围 66-70
页数 5页 分类号 TE19
字数 4960字 语种 中文
DOI 10.3969/J.ISSN.1000-3754.2016.01.013
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 石广仁 31 509 13.0 21.0
2 李大伟 35 249 9.0 15.0
3 牛敏 7 33 3.0 5.0
4 熊华平 大庆油田有限责任公司勘探开发研究院 9 80 6.0 8.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (21)
共引文献  (12)
参考文献  (2)
节点文献
引证文献  (9)
同被引文献  (57)
二级引证文献  (10)
2003(3)
  • 参考文献(0)
  • 二级参考文献(3)
2004(3)
  • 参考文献(0)
  • 二级参考文献(3)
2005(5)
  • 参考文献(0)
  • 二级参考文献(5)
2006(2)
  • 参考文献(0)
  • 二级参考文献(2)
2007(5)
  • 参考文献(0)
  • 二级参考文献(5)
2008(4)
  • 参考文献(1)
  • 二级参考文献(3)
2009(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2017(2)
  • 引证文献(2)
  • 二级引证文献(0)
2018(4)
  • 引证文献(3)
  • 二级引证文献(1)
2019(7)
  • 引证文献(3)
  • 二级引证文献(4)
2020(6)
  • 引证文献(1)
  • 二级引证文献(5)
研究主题发展历程
节点文献
数据挖掘
预处理
油气田
数据库
5C标准
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
大庆石油地质与开发
双月刊
1000-3754
23-1286/TE
大16开
黑龙江省大庆让胡路区勘探开发研究院
14-105
1982
chi
出版文献量(篇)
4317
总下载数(次)
9
总被引数(次)
45256
论文1v1指导