基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
网页分类中存在类别多、训练样本少等问题,一般分类器训练应用效果不佳.为了解决这个问题,提出基于类中心的统计学习方法.在较少人工标注网页的训练集情况下,此方法能取得很好的分类性能并且大幅度加快训练时间,并可以通过加入网页层次目录信息提升推理速度.在第一届LSHTC评测数据集上进行实验,结果表明:基于类中心的统计学习方法拥有较快的训练以及推理速度,并且在正确率上有很强的竞争力.
推荐文章
一种适用于可视电话的快速运动估计算法
运动估计
块匹配算法
可视电话
一种适用于大规模无线传感器网络的定位算法
无线传感器网络
定位
多维定标
分布式
Euclidean
一种适用于任意形状区域的快速孔洞填充算法
孔洞填充
计算机图形学
封闭图形区域
卷积的一种快速算法分析
卷积
算法
多项式
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种适用于大规模网页分类的快速算法
来源期刊 计算机应用与软件 学科 工学
关键词 类中心 文本分类 统计学习
年,卷(期) 2012,(7) 所属期刊栏目 算法
研究方向 页码范围 260-263,281
页数 分类号 TP391
字数 5980字 语种 中文
DOI 10.3969/j.issn.1000-386X.2012.07.075
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 黄萱菁 复旦大学计算机科学技术学院 49 2106 18.0 45.0
2 邱锡鹏 复旦大学计算机科学技术学院 12 100 6.0 9.0
3 缪有栋 复旦大学计算机科学技术学院 1 3 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (4)
节点文献
引证文献  (3)
同被引文献  (0)
二级引证文献  (0)
1958(1)
  • 参考文献(1)
  • 二级参考文献(0)
1975(1)
  • 参考文献(1)
  • 二级参考文献(0)
2004(1)
  • 参考文献(1)
  • 二级参考文献(0)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2017(1)
  • 引证文献(1)
  • 二级引证文献(0)
2018(2)
  • 引证文献(2)
  • 二级引证文献(0)
研究主题发展历程
节点文献
类中心
文本分类
统计学习
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用与软件
月刊
1000-386X
31-1260/TP
大16开
上海市愚园路546号
4-379
1984
chi
出版文献量(篇)
16532
总下载数(次)
47
总被引数(次)
101489
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导