原文服务方: 西安交通大学学报       
摘要:
标签传播算法的主要思想是利用已标注数据的标签信息预测未标注数撼的标签信息.然而,传统传播算法没有区别对待未标注数据与已标注数据相互之间的转移信息,导致算法的收敛速度较慢,影响了算法的性能.针对传统算法的不足,提出了差异权重标签传播算法,算法按标注信息的重要性赋予不同的权重.在解决了大规模特征矩阵相乘问题之后,将提出的差异权重标签传播算法应用到Hadoop框架下,采用分布式计算,实现了能够处理大规模数据的多标签分类算法(HSML),并将提出的HSML算法与现有主流多标签分类算法进行了性能比较.实验结果表明,HSML算法在多标签分类的各项性能评测指标和执行速度上都是有效的.
推荐文章
基于Hadoop框架下的Fast-Newman算法改进
Hadoop
Fast-newman
分布式
社区发现
多特征融合的标签传播算法
社区发现
LPA
SimRank
主题模型
基于多标签传播的重叠社区发现优化算法
复杂网络
重叠社区
标签传播
K-核分解
基于LeaderRank的多标签传播重叠社区发现算法
重叠社区发现
多标签传播
COPRA
LeaderRank
节点重要性
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 Hadoop框架下的多标签传播算法
来源期刊 西安交通大学学报 学科
关键词 Hadoop 多标签分类 标签传播算法
年,卷(期) 2015,(5) 所属期刊栏目
研究方向 页码范围 134-139
页数 6页 分类号 TP391
字数 语种 中文
DOI 10.7652/xjtuxb201505021
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 张蕾 西北大学信息科学与技术学院 54 638 13.0 23.0
2 冯筠 西北大学信息科学与技术学院 57 259 9.0 12.0
3 张敏超 西北大学信息科学与技术学院 2 6 2.0 2.0
4 孙霞 西北大学信息科学与技术学院 13 60 5.0 7.0
5 何绯娟 西安交通大学城市学院 8 14 3.0 3.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (6)
共引文献  (12)
参考文献  (5)
节点文献
引证文献  (4)
同被引文献  (10)
二级引证文献  (1)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(2)
  • 参考文献(1)
  • 二级参考文献(1)
2006(2)
  • 参考文献(1)
  • 二级参考文献(1)
2007(2)
  • 参考文献(1)
  • 二级参考文献(1)
2008(2)
  • 参考文献(0)
  • 二级参考文献(2)
2010(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2016(2)
  • 引证文献(2)
  • 二级引证文献(0)
2017(2)
  • 引证文献(2)
  • 二级引证文献(0)
2019(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
Hadoop
多标签分类
标签传播算法
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
西安交通大学学报
月刊
0253-987X
61-1069/T
大16开
1960-01-01
chi
出版文献量(篇)
7020
总下载数(次)
0
总被引数(次)
81310
论文1v1指导