原文服务方: 计算机应用研究       
摘要:
首先将垃圾网页特征分为两个不同的视图, 即基于内容特征的视图和基于链接特征的视图, 利用典型相关分析及其相关改进方法进行特征提取, 生成两组新的特征; 再对新生成的两视图特征采用不同组合方式产生单视图数据, 并用这组数据作为训练数据构建分类算法。实验结果表明, 将垃圾网页看成两视图数据, 并应用多视图典型相关分析技术, 可有效提高垃圾网页的识别精度。
推荐文章
基于半监督典型相关分析的多视图维数约简
典型相关分析
人脸识别
多视图
维数约简
标签传播
半监督
基于内容与链接特征的中文垃圾网页分类
网页作弊
搜索引擎
机器学习
基于典型相关分析的多视图降维算法综述
多视图学习
典型相关分析
监督学习
广义特征值
降维
基于结构信息和时域信息的垃圾网页检测技术
Spam技术
搜索引擎优化
PageRank
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于多视图典型相关分析的垃圾网页检测
来源期刊 计算机应用研究 学科
关键词 垃圾网页检测 典型相关分析 多视图分类 特征抽取
年,卷(期) 2013,(3) 所属期刊栏目 系统应用开发
研究方向 页码范围 810-813
页数 4页 分类号 TP391
字数 语种 中文
DOI 10.3969/j.issn.1001-3695.2013.03.043
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (6)
节点文献
引证文献  (6)
同被引文献  (7)
二级引证文献  (6)
2003(1)
  • 参考文献(1)
  • 二级参考文献(0)
2004(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(3)
  • 参考文献(3)
  • 二级参考文献(0)
2013(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2014(3)
  • 引证文献(3)
  • 二级引证文献(0)
2015(3)
  • 引证文献(2)
  • 二级引证文献(1)
2016(6)
  • 引证文献(1)
  • 二级引证文献(5)
研究主题发展历程
节点文献
垃圾网页检测
典型相关分析
多视图分类
特征抽取
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用研究
月刊
1001-3695
51-1196/TP
大16开
1984-01-01
chi
出版文献量(篇)
21004
总下载数(次)
0
总被引数(次)
238385
论文1v1指导