人在回路的数据融合系统

孙佶; 李国良

文献导航

搜索文章

搜索思路

人在回路的数据融合系统

作者：

孙佶李国良

基本信息来源于合作网站，原文需代理用户跳转至来源网站获取

数据融合

实体匹配

实体合并

人在回路

机器学习

相似查询

代价优化

摘要：

一个端到端的数据融合系统在如下几个阶段需要用户的反馈,包括为实体匹配收集训练数据的阶段,对计算出来的实体聚类进行纠错的阶段以及对每个实体聚类中的数据形式进行转换的阶段.经过这些步骤之后,数据融合系统可以将每个实体分组中的实体合并成一条权威的实体表示(被称作"黄金记录").传统的数据融合系统通常会按照特定的顺序,在用户时间代价不超过预算的前提下,依次询问特定集合中的问题并且获得用户反馈.可是,由于这些问题是高度相关的,一个问题的答案会影响到数据处理管道中任何一个阶段的结果,所以将各个阶段交替进行并且对他们的执行顺序进行全局优化能带来显著的收益.在这篇文章中,我们提出一个"人在回路"的数据融合系统,通过交替询问不同种类的问题来减少获得用户回答的代价.基于这个框架,我们提出了一些不同种类问题能够带来的数据融合质量提升的收益评价模型,以及不同问题需要的用户回答时间的代价评估模型.在这个端到端的"人在回路"数据融合系统中,我们开发出一个问题调度框架来精心选择问题集合以及问题询问的顺序,最终实现利用同等的用户代价让实体合并的精确度从基线方法的70％提升到90％.

内容分析

关键词云

关键词热度

相关文献

推荐文献

根据相关规定，获取原文需跳转至原文服务方进行注册认证身份信息

完成下面三个步骤操作后即可获取文献，阅读后请点击下方页面【继续获取】按钮

钛学术文献服务平台

学术出版新技术应用与公共服务实验室出品

原文合作方

获取文献流程

1.访问原文合作方请等待几秒系统会自动跳转至登录页，首次访问请先注册账号，填写基本信息后，点击【注册】

2.注册后进行实名认证，实名认证成功后点击【返回】

3.检查邮箱地址是否正确，若错误或未填写请填写正确邮箱地址，点击【确认支付】完成获取，文献将在1小时内发送至您的邮箱

*若已注册过原文合作方账号的用户，可跳过上述操作，直接登录后获取原文即可

点击【获取原文】按钮，跳转至合作网站。

首次获取需要在合作网站进行注册。

注册并实名认证，认证后点击【返回】按钮。

确认邮箱信息，点击【确认支付】，订单将在一小时内发送至您的邮箱。

* 若已经注册过合作网站账号，请忽略第二、三步，直接登录即可。

期刊分类
期刊（年）
期刊（期）
期刊推荐

一般工业技术交通运输军事科技冶金工业动力工程化学工业原子能技术大学学报建筑科学无线电电子学与电信技术机械与仪表工业水利工程环境科学与安全科学电工技术石油与天然气工业矿业工程自动化技术与计算机技术航空航天轻工业与手工业金属学与金属工艺

计算机学报2022 计算机学报2021 计算机学报2020 计算机学报2019 计算机学报2018 计算机学报2017 计算机学报2016 计算机学报2015 计算机学报2014 计算机学报2013 计算机学报2012 计算机学报2011 计算机学报2010 计算机学报2009 计算机学报2008 计算机学报2007 计算机学报2006 计算机学报2005 计算机学报2004 计算机学报2003 计算机学报2002 计算机学报2001 计算机学报2000 计算机学报1999 计算机学报1998

计算机学报2022年第5期计算机学报2022年第4期计算机学报2022年第3期计算机学报2022年第2期计算机学报2022年第1期

按字母查找期刊：

A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他

联系合作广告推广: shenyukuan@paperpass.com

篇名	人在回路的数据融合系统
来源期刊	计算机学报	学科	工学
关键词	数据融合实体匹配实体合并人在回路机器学习相似查询代价优化
年，卷（期）	2022,（3）	所属期刊栏目
研究方向		页码范围	654-668
页数	15页	分类号	TP311
字数		语种	中文
DOI	10.11897/SP.J.1016.2022.00654