基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
实体解析是指发现并聚合描述现实世界中同一对象的记录。纯粹的机器算法虽然可以获得较高的效率,但是准确率难以保证。提出了一种机器计算与众包相结合的实体解析方法。该方法首先采用MapReduce并行计算框架排除不可能匹配的记录对,减少人类智能任务的数量,然后由人工进行确定性标注。为了支持隐私保护,在众包计算时提出了基于角色的访问控制模型和重要信息隐藏策略。该方法和模型被应用于某医院患者主索引构建平台,实验结果表明,人机结合方法充分利用了机器和人工处理的优势,可以进行高效率和高精度的患者实体解析,并且有效地避免了患者信息的泄漏。
推荐文章
众包环境下的隐私保护研究
众包计算
隐私保护
差分隐私
机制设计
空间众包中的位置隐私保护技术综述
空间众包
隐私保护
k-匿名
差分隐私
空间众包中的位置隐私保护技术综述
空间众包
隐私保护
k-匿名
差分隐私
基于众包标注的中文微博命名实体识别
舆论监测
众包标注
EM算法
中文微博
命名实体识别
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 支持隐私保护的众包实体解析
来源期刊 计算机科学与探索 学科 工学
关键词 实体解析 众包 MapReduce编程模型 隐私保护 患者主索引
年,卷(期) 2014,(7) 所属期刊栏目 数据库技术
研究方向 页码范围 802-811
页数 10页 分类号 TP311
字数 7221字 语种 中文
DOI 10.3778/j.issn.1673-9418.1312024
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 徐光伟 东华大学计算机科学与技术学院 9 53 5.0 7.0
3 燕彩蓉 东华大学计算机科学与技术学院 21 155 8.0 12.0
4 张洋舜 东华大学计算机科学与技术学院 1 9 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (12)
共引文献  (5)
参考文献  (8)
节点文献
引证文献  (9)
同被引文献  (24)
二级引证文献  (6)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(3)
  • 参考文献(0)
  • 二级参考文献(3)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2009(2)
  • 参考文献(1)
  • 二级参考文献(1)
2010(3)
  • 参考文献(0)
  • 二级参考文献(3)
2011(5)
  • 参考文献(4)
  • 二级参考文献(1)
2012(1)
  • 参考文献(0)
  • 二级参考文献(1)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2015(5)
  • 引证文献(4)
  • 二级引证文献(1)
2016(1)
  • 引证文献(1)
  • 二级引证文献(0)
2017(3)
  • 引证文献(2)
  • 二级引证文献(1)
2018(1)
  • 引证文献(1)
  • 二级引证文献(0)
2019(2)
  • 引证文献(0)
  • 二级引证文献(2)
2020(3)
  • 引证文献(1)
  • 二级引证文献(2)
研究主题发展历程
节点文献
实体解析
众包
MapReduce编程模型
隐私保护
患者主索引
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机科学与探索
月刊
1673-9418
11-5602/TP
大16开
北京市海淀区北四环中路211号北京619信箱26分箱
82-560
2007
chi
出版文献量(篇)
2215
总下载数(次)
4
总被引数(次)
10748
论文1v1指导