基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
现如今,很多数据处理与分析的任务仅仅依靠机器算法难以达到理想的效果.因此,众包技术应运而生,其利用群体的智慧来解决对于计算机而言比较难的问题.其中,众包平台(例如Amazon Mechanical Turk)为众包技术的应用提供了有力的支撑.平台上有成千上万的网络大众来为任务发布者解决问题.然而,对于任务发布者而言,其与众包平台交互是不方便的,因为平台会要求任务发布者设置很多参数甚至书写代码.所以研究者们借鉴传统数据库的思想,提出了众包数据库的概念,其封装了任务发布者、众包平台以及众包工人之间的复杂交互过程,为发布者提供友好的API.使发布者可以通过简单的类SQL语言与平台交互.在这篇综述中,我们首先介绍众包的概念;然后介绍设计众包数据库时需考虑的一些基本技术,例如真值推理、任务分配,代价优化等;接着我们介绍几种主流的众包数据库系统.此外,我们会介绍对于不同的数据库算子,包括选择、连接、排序等优化技术.最后我们会介绍该领域未来的研究方向与挑战.
推荐文章
移动数据库技术研究综述
移动数据库
移动计算
客户/服务器
体系结构
纯XML数据库研究综述
扩展标记语言
XML数据库
Native XML数据库
存储策略
查询优化
X-代数
数据库物理自调优研究技术综述
物理自调优
查询优化器
what-if分析
物理结构
工作负载
物理空间搜索
文档数据库与关系数据库研究
数据库
数据格式
数据结构
数据存储
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 众包数据库综述
来源期刊 计算机学报 学科 工学
关键词 数据库 众包 查询优化 质量控制 成本控制
年,卷(期) 2020,(5) 所属期刊栏目 自然语言与数据处理
研究方向 页码范围 948-972
页数 25页 分类号 TP391
字数 21165字 语种 中文
DOI 10.11897/SP.J.1016.2020.00948
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 李国良 清华大学计算机系 20 425 8.0 20.0
2 柴成亮 清华大学计算机系 1 0 0.0 0.0
3 赵天宇 清华大学计算机系 2 1 1.0 1.0
4 骆昱宇 清华大学计算机系 1 0 0.0 0.0
5 于明鹤 东北大学软件学院 4 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (15)
共引文献  (60)
参考文献  (20)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1953(1)
  • 参考文献(1)
  • 二级参考文献(0)
1977(1)
  • 参考文献(1)
  • 二级参考文献(0)
1979(2)
  • 参考文献(1)
  • 二级参考文献(1)
1994(1)
  • 参考文献(1)
  • 二级参考文献(0)
2003(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(1)
  • 参考文献(0)
  • 二级参考文献(1)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(1)
  • 参考文献(0)
  • 二级参考文献(1)
2011(5)
  • 参考文献(3)
  • 二级参考文献(2)
2012(5)
  • 参考文献(2)
  • 二级参考文献(3)
2013(8)
  • 参考文献(4)
  • 二级参考文献(4)
2014(2)
  • 参考文献(1)
  • 二级参考文献(1)
2015(4)
  • 参考文献(4)
  • 二级参考文献(0)
2016(1)
  • 参考文献(1)
  • 二级参考文献(0)
2020(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
数据库
众包
查询优化
质量控制
成本控制
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机学报
月刊
0254-4164
11-1826/TP
大16开
中国科学院计算技术研究所(北京2704信箱)
2-833
1978
chi
出版文献量(篇)
5154
总下载数(次)
49
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导