基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
一个端到端的数据融合系统在如下几个阶段需要用户的反馈,包括为实体匹配收集训练数据的阶段,对计算出来的实体聚类进行纠错的阶段以及对每个实体聚类中的数据形式进行转换的阶段.经过这些步骤之后,数据融合系统可以将每个实体分组中的实体合并成一条权威的实体表示(被称作"黄金记录").传统的数据融合系统通常会按照特定的顺序,在用户时间代价不超过预算的前提下,依次询问特定集合中的问题并且获得用户反馈.可是,由于这些问题是高度相关的,一个问题的答案会影响到数据处理管道中任何一个阶段的结果,所以将各个阶段交替进行并且对他们的执行顺序进行全局优化能带来显著的收益.在这篇文章中,我们提出一个"人在回路"的数据融合系统,通过交替询问不同种类的问题来减少获得用户回答的代价.基于这个框架,我们提出了一些不同种类问题能够带来的数据融合质量提升的收益评价模型,以及不同问题需要的用户回答时间的代价评估模型.在这个端到端的"人在回路"数据融合系统中,我们开发出一个问题调度框架来精心选择问题集合以及问题询问的顺序,最终实现利用同等的用户代价让实体合并的精确度从基线方法的70%提升到90%.
推荐文章
人在回路中的末制导系统性能测试与评估
图像制导
末制导系统
人在回路
测试评估
人在回路的电视末制导数学建模研究
电视制导技术
人在回路
数学模型
“人在回路”图像制导导弹射手建模技术研究
图像制导导弹
人在回路
建模
辨识
射手
对"人在回路"末制导武器的组合干扰技术
通信对抗
数据链
人在回路
干扰
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 人在回路的数据融合系统
来源期刊 计算机学报 学科 工学
关键词 数据融合 实体匹配 实体合并 人在回路 机器学习 相似查询 代价优化
年,卷(期) 2022,(3) 所属期刊栏目
研究方向 页码范围 654-668
页数 15页 分类号 TP311
字数 语种 中文
DOI 10.11897/SP.J.1016.2022.00654
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2022(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
数据融合
实体匹配
实体合并
人在回路
机器学习
相似查询
代价优化
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机学报
月刊
0254-4164
11-1826/TP
大16开
中国科学院计算技术研究所(北京2704信箱)
2-833
1978
chi
出版文献量(篇)
5154
总下载数(次)
49
论文1v1指导