基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
真值发现作为整合由不同数据源提供的冲突信息的一种手段,在传统数据库领域已经得到了广泛的研究.然而现有的很多真值发现方法不适用于数据流应用,主要原因是它们都包含迭代的过程.针对一种特殊的数据流——感知数据流上的连续真值发现问题进行了研究.结合感知数据本身及其应用特点,提出一种变频评估数据源可信度的策略,减少了迭代过程的执行,提高了每一时刻多源感知数据流真值发现的效率.首先定义并研究了当感知数据流真值发现的相对误差和累积误差较小时,相邻时刻数据源的可信度变化需要满足的条件,进而给出了一种概率模型,以预测数据源的可信度满足该条件的概率.之后,通过整合上述结论,实现在预测的累积误差以一定概率不超过给定阈值的前提下,最大化数据源可信度的评估周期以提高效率,并将该问题转化为一个最优化问题.在此基础上,提出了一种变频评估数据源可信度的算法——CTF-Stream(continuous truth finding over sensor data streams),CTF-Stream结合历史数据动态地确定数据源可信度的评估时刻,在保证真值发现结果达到用户给定精度的同时提高了效率.最后,通过在真实的感知数据集合上进行实验,进一步验证了算法在处理感知数据流的真值发现问题时的效率和准确率.
推荐文章
一种高效的隐私保护群智感知真值发现机制
群智感知系统
真值发现
隐私保护
高效
一种基于对称加密的隐私保护增量真值发现算法
群智感知
增量真值发现
隐私保护
对称加密
轻量级
权重
分布式数据流上的连续异常检测
异常检测
核密度估计
分布数据流
数据流挖掘
基于多蚁群同步优化的多真值发现算法
数据清洗
数据冲突
多真值发现
子集问题
蚁群优化
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种多源感知数据流上的连续真值发现技术
来源期刊 软件学报 学科 工学
关键词 多源 数据流 感知数据 真值发现 数据源可信度
年,卷(期) 2016,(7) 所属期刊栏目 大数据可用性理论、方法和技术专题
研究方向 页码范围 1655-1670
页数 16页 分类号 TP311
字数 13665字 语种 中文
DOI 10.13328/j.cnki.jos.005033
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 于戈 东北大学计算机科学与工程学院 426 6587 38.0 64.0
2 李芳芳 东北大学计算机科学与工程学院 22 92 6.0 8.0
3 谷峪 东北大学计算机科学与工程学院 43 456 10.0 20.0
4 马茜 东北大学计算机科学与工程学院 4 43 4.0 4.0
5 李天义 东北大学计算机科学与工程学院 2 11 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (3)
共引文献  (502)
参考文献  (4)
节点文献
引证文献  (6)
同被引文献  (11)
二级引证文献  (1)
2002(2)
  • 参考文献(0)
  • 二级参考文献(2)
2003(2)
  • 参考文献(1)
  • 二级参考文献(1)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2016(1)
  • 引证文献(1)
  • 二级引证文献(0)
2017(1)
  • 引证文献(1)
  • 二级引证文献(0)
2018(3)
  • 引证文献(2)
  • 二级引证文献(1)
2019(2)
  • 引证文献(2)
  • 二级引证文献(0)
研究主题发展历程
节点文献
多源
数据流
感知数据
真值发现
数据源可信度
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
软件学报
月刊
1000-9825
11-2560/TP
16开
北京8718信箱
82-367
1990
chi
出版文献量(篇)
5820
总下载数(次)
36
总被引数(次)
226394
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导