基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
在我国电力信息化快速发展的背景下,有大量的网络文本数据在电力系统中产生,这就在一定程度上增加了信息资源数量.其中,这些海量数据绝大多数属于无用信息,不存在研究价值.而其大规模的数据积累,却导致处理传统文本工作繁琐.为此,在数据繁杂的条件下,快速而又精准地捕捉目标数据,再对其进行相应的分析和处理,最终获得具有高价值密度的信息数据意义重大.本发明属于一种大数据的数据采集、过滤、统计的算法.通过对大文本数据文件做有效切割,实现对数据的并发高效分析,然后按照业务需求将分析结果汇总,呈现出有价值的数据.
推荐文章
不确定噪声下海量文本数据的模糊挖掘算法研究
不确定噪声
海量文本数据
模糊数据挖掘算法
特征系数
关联规则
面向政务文本数据的事件级时空模型研究
时空信息模型
政务文本挖掘
非结构化数据
事件信息抽取
高维数据集中局部离散文本数据挖掘方法研究
高维数据
数据特征聚类
数据挖掘
关联规则
测井专利文本挖掘与数据统计分析
测井技术
专利
文本挖掘
数理统计
特征
研究
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 大文本数据快速分析统计理论与算法
来源期刊 电子元器件与信息技术 学科
关键词 大文本数据文件 大数据分析
年,卷(期) 2019,(1) 所属期刊栏目 信息技术
研究方向 页码范围 72-75
页数 4页 分类号
字数 3585字 语种 中文
DOI 10.19772/j.cnki.2096-4455.2019.1.021
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 马欣欣 广州市增城区人民政府永宁街道办事处 2 2 1.0 1.0
2 林克 1 1 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (71)
共引文献  (8)
参考文献  (9)
节点文献
引证文献  (1)
同被引文献  (11)
二级引证文献  (0)
1994(1)
  • 参考文献(1)
  • 二级参考文献(0)
2000(1)
  • 参考文献(1)
  • 二级参考文献(0)
2002(2)
  • 参考文献(0)
  • 二级参考文献(2)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(1)
  • 参考文献(1)
  • 二级参考文献(0)
2005(5)
  • 参考文献(0)
  • 二级参考文献(5)
2006(7)
  • 参考文献(0)
  • 二级参考文献(7)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(1)
  • 参考文献(0)
  • 二级参考文献(1)
2009(2)
  • 参考文献(0)
  • 二级参考文献(2)
2010(4)
  • 参考文献(0)
  • 二级参考文献(4)
2011(5)
  • 参考文献(0)
  • 二级参考文献(5)
2012(1)
  • 参考文献(0)
  • 二级参考文献(1)
2013(2)
  • 参考文献(0)
  • 二级参考文献(2)
2014(7)
  • 参考文献(0)
  • 二级参考文献(7)
2015(8)
  • 参考文献(1)
  • 二级参考文献(7)
2016(9)
  • 参考文献(0)
  • 二级参考文献(9)
2017(11)
  • 参考文献(0)
  • 二级参考文献(11)
2018(3)
  • 参考文献(0)
  • 二级参考文献(3)
2019(8)
  • 参考文献(5)
  • 二级参考文献(3)
2019(8)
  • 参考文献(5)
  • 二级参考文献(3)
  • 引证文献(0)
  • 二级引证文献(0)
2020(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
大文本数据文件
大数据分析
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
电子元器件与信息技术
月刊
2096-4455
10-1509/TN
16开
北京市石景山区鲁谷路35号
2017
chi
出版文献量(篇)
2445
总下载数(次)
25
总被引数(次)
1757
论文1v1指导