作者:
基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
互联网中存在大量重复网页,降低了用户体验并使搜索变得复杂化。为解决这些问题,把相似网页的比较转换成二元分类问题,使用监督学习算法构造判别函数,避免人为设定相似度阈值所带来的误差;通过SVM 训练出的判别函数检测网页对,以此检测网页是否重复。
推荐文章
结合SVM与免疫遗传算法设计IDS的检测算法
网络安全
入侵检测
支持向量机
免疫遗传算法
算法设计
基于2维能量特征和快速SVM的涡轮泵实时故障检测算法
涡轮泵
2维能量特征
快速SVM
实时故障检测
一种欺骗网页检测判定算法
欺骗网页检测
网页分割
相似度
基于线性SVM的级联检测算子的构建
级联
节点学习
支持向量机
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于SVM的重复网页检测算法
来源期刊 软件导刊 学科
关键词 SVM 重复网页 支持向量机 编辑距离 最长公共子串
年,卷(期) 2015,(3) 所属期刊栏目 算法与语言
研究方向 页码范围 57-58
页数 2页 分类号
字数 2054字 语种 中文
DOI 10.11907/rjdk.143993
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 冯金波 江苏大学计算机科学与通信工程学院 2 1 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (15)
共引文献  (95)
参考文献  (4)
节点文献
引证文献  (1)
同被引文献  (0)
二级引证文献  (0)
1974(1)
  • 参考文献(0)
  • 二级参考文献(1)
1975(1)
  • 参考文献(0)
  • 二级参考文献(1)
1977(1)
  • 参考文献(0)
  • 二级参考文献(1)
1979(1)
  • 参考文献(0)
  • 二级参考文献(1)
1980(1)
  • 参考文献(0)
  • 二级参考文献(1)
1987(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(2)
  • 参考文献(0)
  • 二级参考文献(2)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(2)
  • 参考文献(2)
  • 二级参考文献(0)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(3)
  • 参考文献(0)
  • 二级参考文献(3)
2009(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2016(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
SVM
重复网页
支持向量机
编辑距离
最长公共子串
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
软件导刊
月刊
1672-7800
42-1671/TP
16开
湖北省武汉市
38-431
2002
chi
出版文献量(篇)
9809
总下载数(次)
57
总被引数(次)
30383
论文1v1指导