基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
在许多分类任务中,存在大量未标记的样本,并且获取样本标签耗时且昂贵.利用主动学习算法确定最应被标记的关键样本,来构建高精度分类器,可以最大限度地减少标记成本.本文提出一种基于PageRank的主动学习算法(PAL),充分利用数据分布信息进行有效的样本选择.利用PageRank根据样本间的相似度关系依次计算邻域、分值矩阵和排名向量;选择代表样本,并根据其相似度关系构建二叉树,利用该二叉树对代表样本进行聚类,标记和预测;将代表样本作为训练集,对其他样本进行分类.实验采用8个公开数据集,与5种传统的分类算法和3种流行的主动学习算法比较,结果表明PAL算法能取得更好的分类效果.
推荐文章
基于用户反馈的PageRank改进算法
PageRank
排序算法
搜索引擎
基于MapReduce的PageRank算法的研究
云计算
MapReduce模型
PageRank算法
Hadoop
并行计算
基于主动学习的有监督在线多核学习算法
主动学习
在线学习
多核学习
一种基于PageRank的页面排序改进算法
搜索引擎
信息检索
排序算法
数据挖掘
PageRank
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于PageRank的主动学习算法
来源期刊 智能系统学报 学科 工学
关键词 分类 主动学习 PageRank 邻域 聚类 二叉树
年,卷(期) 2019,(3) 所属期刊栏目
研究方向 页码范围 551-559
页数 9页 分类号 TP181
字数 5972字 语种 中文
DOI 10.11992/tis.201804052
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 刘福伦 西南石油大学计算机科学学院 4 7 2.0 2.0
2 汪敏 西南石油大学电气信息学院 20 65 5.0 7.0
3 黄雨婷 西南石油大学计算机科学学院 5 2 1.0 1.0
4 邓思宇 西南石油大学计算机科学学院 2 1 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (40)
共引文献  (13)
参考文献  (14)
节点文献
引证文献  (1)
同被引文献  (10)
二级引证文献  (0)
1968(1)
  • 参考文献(0)
  • 二级参考文献(1)
1980(1)
  • 参考文献(0)
  • 二级参考文献(1)
1989(1)
  • 参考文献(0)
  • 二级参考文献(1)
1993(2)
  • 参考文献(0)
  • 二级参考文献(2)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(1)
  • 二级参考文献(0)
2001(2)
  • 参考文献(0)
  • 二级参考文献(2)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(2)
  • 参考文献(0)
  • 二级参考文献(2)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2009(2)
  • 参考文献(1)
  • 二级参考文献(1)
2010(2)
  • 参考文献(0)
  • 二级参考文献(2)
2011(3)
  • 参考文献(0)
  • 二级参考文献(3)
2012(7)
  • 参考文献(1)
  • 二级参考文献(6)
2013(7)
  • 参考文献(0)
  • 二级参考文献(7)
2014(5)
  • 参考文献(2)
  • 二级参考文献(3)
2015(6)
  • 参考文献(3)
  • 二级参考文献(3)
2016(5)
  • 参考文献(3)
  • 二级参考文献(2)
2017(2)
  • 参考文献(2)
  • 二级参考文献(0)
2018(1)
  • 参考文献(1)
  • 二级参考文献(0)
2019(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2019(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
分类
主动学习
PageRank
邻域
聚类
二叉树
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
智能系统学报
双月刊
1673-4785
23-1538/TP
大16开
哈尔滨市南岗区南通大街145-1号楼
2006
chi
出版文献量(篇)
2770
总下载数(次)
11
总被引数(次)
12401
论文1v1指导