基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
随着互联网与信息化的普及,数据数量、数据来源与数据格式的复杂性愈加突出.互联网、传感器、人工收集等多种来源产生了海量异构数据,为解决多源异构数据处理问题,设计一种将海量异构数据自动化集成到同一数据仓库的方法.通过建立元数据模型(以数据集为单位)将来源数据按数据集分类,映射整合到数据仓库中,通过CRF序列标注模型、Skip-Gram神经网络、TF*IDF等机器学习技术,解决了数据仓库集成中语义映射的难题,实现了海量多源异构数据的自动化入库,为之后的数据分析挖掘提供了良好基础.
推荐文章
异构数据语义集成中本体映射研究
异构数据
本体
本体映射
概念相似度
基于XML的虚拟法异构数据集成方法研究
虚拟法
包装器
查询引擎
数据清洗
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于语义匹配的海量异构数据自动化集成方法研究
来源期刊 软件导刊 学科 工学
关键词 海量异构数据处理 元数据 CRF序列标注 Skip-Gram神经网络 TF*IDF算法
年,卷(期) 2018,(4) 所属期刊栏目 数据库与信息处理
研究方向 页码范围 194-196
页数 3页 分类号 TP391
字数 1810字 语种 中文
DOI 10.11907/rjdk.172628
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 李贺 1 3 1.0 1.0
2 李晓琳 1 3 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (42)
共引文献  (235)
参考文献  (8)
节点文献
引证文献  (3)
同被引文献  (5)
二级引证文献  (2)
1958(1)
  • 参考文献(0)
  • 二级参考文献(1)
1962(1)
  • 参考文献(0)
  • 二级参考文献(1)
1982(1)
  • 参考文献(0)
  • 二级参考文献(1)
1986(1)
  • 参考文献(0)
  • 二级参考文献(1)
1988(2)
  • 参考文献(0)
  • 二级参考文献(2)
1989(2)
  • 参考文献(0)
  • 二级参考文献(2)
1991(1)
  • 参考文献(0)
  • 二级参考文献(1)
1992(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(2)
  • 参考文献(0)
  • 二级参考文献(2)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(2)
  • 参考文献(0)
  • 二级参考文献(2)
2004(2)
  • 参考文献(0)
  • 二级参考文献(2)
2006(2)
  • 参考文献(0)
  • 二级参考文献(2)
2007(3)
  • 参考文献(0)
  • 二级参考文献(3)
2008(2)
  • 参考文献(1)
  • 二级参考文献(1)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(2)
  • 参考文献(0)
  • 二级参考文献(2)
2011(3)
  • 参考文献(1)
  • 二级参考文献(2)
2012(4)
  • 参考文献(0)
  • 二级参考文献(4)
2013(5)
  • 参考文献(1)
  • 二级参考文献(4)
2014(3)
  • 参考文献(1)
  • 二级参考文献(2)
2015(2)
  • 参考文献(1)
  • 二级参考文献(1)
2016(3)
  • 参考文献(2)
  • 二级参考文献(1)
2017(1)
  • 参考文献(1)
  • 二级参考文献(0)
2018(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2018(1)
  • 引证文献(1)
  • 二级引证文献(0)
2019(2)
  • 引证文献(2)
  • 二级引证文献(0)
2020(2)
  • 引证文献(0)
  • 二级引证文献(2)
研究主题发展历程
节点文献
海量异构数据处理
元数据
CRF序列标注
Skip-Gram神经网络
TF*IDF算法
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
软件导刊
月刊
1672-7800
42-1671/TP
16开
湖北省武汉市
38-431
2002
chi
出版文献量(篇)
9809
总下载数(次)
57
论文1v1指导