基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
在清洗算法不能有效地纠正不一致数据的情况下,“知情”用户给出的关于其正确取值的评论,对数据库的其他用户意义重大,可以帮助他们甄别错误数据,并在不丢失信息的前提下,尽可能地从不一致数据库中获取有用信息,但只有正确可信的评论才能有如此意义。因此,评论的可信度估算是这类应用中的一个关键问题。和互联网评论不同,数据库一般向系统内用户开放,用户的特征更易于提取,其语义确定。由于数据是对现实世界的描述,能对同一评论对象,发出类似评论的用户往往具有相同的背景或语义特征。文章提出了一种基于用户的特征分析的评论可信度计算算法,有针对性地解决了上述问题。算法首先根据语义特征,对历史评论者进行用户社区挖掘,得到在某准确度下评论过某对象的用户公共特征,形成用户模板;其次,对于任意给定新评论,通过其评论者和用户公共特征模板的匹配程度,并综合该评论者可信度、评论者和评论对象的语义相关性等关键因素,计算出该评论的可信度。实验证明,该算法在时间和准确率两方面都是有效的。
推荐文章
基于标记的不一致数据查询处理框架
不一致数据
数据质量
完整性约束
一致的查询回答
标记
基于链接的微博用户可信度研究
微博
用户可信度
影响力
PageRank算法
结构平衡
基于空值修复的数据库一致性查询方法
一致性查询
完整性约束
结构查询语言查询重写
修复
数据库
基于用户可信度聚类的协同过滤推荐模型
协同过滤
用户可信度
动态聚类
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 不一致数据库中基于用户语义模板的评论可信度计算
来源期刊 燕山大学学报 学科 工学
关键词 关系数据库 频繁子图挖掘 聚类 公共特征 可信度计算
年,卷(期) 2014,(6) 所属期刊栏目 计算机科学与技术
研究方向 页码范围 523-531,543
页数 10页 分类号 TP391
字数 8994字 语种 中文
DOI 10.3969/j.issn.1007-791X.2014.06.007
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 吴爱华 上海海事大学信息工程学院 25 91 6.0 8.0
2 唐晓婷 上海海事大学信息工程学院 2 1 1.0 1.0
3 曾卫明 上海海事大学信息工程学院 33 65 4.0 6.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (18)
共引文献  (133)
参考文献  (10)
节点文献
引证文献  (1)
同被引文献  (10)
二级引证文献  (2)
1980(1)
  • 参考文献(0)
  • 二级参考文献(1)
1982(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(4)
  • 参考文献(1)
  • 二级参考文献(3)
2006(3)
  • 参考文献(1)
  • 二级参考文献(2)
2007(4)
  • 参考文献(2)
  • 二级参考文献(2)
2008(1)
  • 参考文献(0)
  • 二级参考文献(1)
2009(4)
  • 参考文献(2)
  • 二级参考文献(2)
2010(3)
  • 参考文献(1)
  • 二级参考文献(2)
2012(2)
  • 参考文献(2)
  • 二级参考文献(0)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2016(1)
  • 引证文献(1)
  • 二级引证文献(0)
2017(2)
  • 引证文献(0)
  • 二级引证文献(2)
研究主题发展历程
节点文献
关系数据库
频繁子图挖掘
聚类
公共特征
可信度计算
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
燕山大学学报
双月刊
1007-791X
13-1219/N
大16开
河北省秦皇岛市河北大街西段438号
18-73
1963
chi
出版文献量(篇)
2254
总下载数(次)
2
总被引数(次)
12529
论文1v1指导