基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
基于用户的协同过滤通过获取最近邻的偏好实现对目标用户偏好的预测推荐,相似度计算为其核心步骤.传统数值相似度计算依赖于用户共同评分项的评分数值,用户-项目评分矩阵稀疏程度的加剧导致数值相似度计算准确性降低,难以为目标用户选取可靠的最近邻,影响推荐效果;现有结构相似度大多利用用户共同评分项占比度量,计算简单,受数据稀疏影响较小但区分度低.针对上述协同过滤任务中数据稀疏带来的相似度计算问题,提出一种稀疏余弦相似度.首先定义新的结构相似度——稀疏集合相似度,将用户区分为高相关用户与低相关用户,并进一步针对不同类型用户设计差异化的数值相似度计算方式,以缓解传统数值相似度在面临数据稀疏时的不足,最终综合数值相似度与结构相似度形成稀疏余弦相似度.实验结果表明,与七种相似度计算方法相比,稀疏余弦相似度解决了传统数值相似度受数据稀疏影响严重和结构相似度计算结果区分度低的问题,可更准确计算用户相似度,提升推荐效果.
推荐文章
分步填充缓解数据稀疏性的协同过滤算法
协同过滤
条件概率
推荐系统
数据稀疏
分步填充
一种基于Dice-Euclidean相似度计算的协同过滤算法
协同过滤
个性化信息推荐
相似度计算
平均绝对偏差
数据稀疏性
修正余弦相似度
社会化标签语义相似度的协同过滤算法
协同过滤
推荐系统
社会化标签
语义相似度
预测性能
基于改进协同过滤算法的用户页面兴趣度预测研究
大数据
奇异值分解
用户兴趣度
协作过滤算法
数据稀疏性
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 面向稀疏数据的协同过滤用户相似度计算研究
来源期刊 计算机科学与探索 学科 工学
关键词 相似度计算 协同过滤 稀疏数据 推荐系统
年,卷(期) 2022,(5) 所属期刊栏目 数据库技术|Database Technology
研究方向 页码范围 1043-1052
页数 10页 分类号 TP391
字数 语种 中文
DOI 10.3778/j.issn.1673-9418.2011062
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2022(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
相似度计算
协同过滤
稀疏数据
推荐系统
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机科学与探索
月刊
1673-9418
11-5602/TP
大16开
北京市海淀区北四环中路211号北京619信箱26分箱
82-560
2007
chi
出版文献量(篇)
2215
总下载数(次)
4
总被引数(次)
10748
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导