基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
Entity matching is a fundamental problem of data integration. It groups records according to underlying real-world entities. There is a growing trend of entity matching via deep learning techniques. We design mixed hierarchical deep neural networks (MHN) for entity matching, exploiting semantics from different abstract levels in the record internal hierarchy. A family of attention mechanisms is utilized in different periods of entity matching. Self-attention focuses on internal dependency, inter-attention targets at alignments, and multi-perspective weight attention is devoted to importance discrimination. Especially, hybrid soft token alignment is proposed to address corrupted data. Attribute order is for the first time considered in deep entity matching. Then, to reduce utilization of labeled training data, we propose an adversarial domain adaption approach (DA-MHN) to transfer matching knowledge between different entity matching tasks by maximizing classifier discrepancy. Finally, we conduct comprehensive experimental evaluations on 10 datasets (seven for MHN and three for DA-MHN), which illustrate our two proposed approaches' superiorities. MHN apparently outperforms previous studies in accuracy, and also each component of MHN is tested. DA-MHN greatly surpasses existing studies in transferability.
推荐文章
Entity Framework浅析
EDM
ADO.NET
Entity Framework
编程员
Entity Framework数据库访问
数据库
模型
代码
Entity Framework技术
Deep web接口查询能力估计
查询接口
查询能力
Deep Web数据源自动分类
Deep Web
查询接口
朴素贝叶斯分类
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 Mixed Hierarchical Networks for Deep Entity Matching
来源期刊 计算机科学技术学报(英文版) 学科
关键词
年,卷(期) 2021,(4) 所属期刊栏目 Special Section on AI4DB and DB4AI
研究方向 页码范围 822-838
页数 17页 分类号
字数 语种 英文
DOI
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (6)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1969(1)
  • 参考文献(1)
  • 二级参考文献(0)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(2)
  • 参考文献(2)
  • 二级参考文献(0)
2021(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
引文网络交叉学科
相关学者/机构
期刊影响力
计算机科学技术学报(英文版)
双月刊
1000-9000
11-2296/TP
16开
北京中关村科学院南路6号 《计算机科学技术学报(英)》编辑部
1986
eng
出版文献量(篇)
2207
总下载数(次)
1
总被引数(次)
12378
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导