原文服务方: 科技与创新       
摘要:
网页去重处理是提高检索质量的有效途径,本文给出了一个基于特征码的网页去重算法,介绍了算法的具体实现步骤,采用二叉排序树实现.算法有较高的判断正确率,在信息检索中有较好的应用前景.
推荐文章
基于特征串的网页文本并行去重算法
搜索引擎
特征串
网页去重
Simhash
Map/Reduce
基于正文结构和长句提取的网页去重算法
网页去重
正文结构树
长句提取
层次指纹
基于网页正文主题和摘要的网页去重算法
去重
网页
分词
相似度
元搜索
改进的基于布尔模型的网页查重算法
网络
特征
布尔模型
相似网页
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于特征码的网页去重
来源期刊 科技与创新 学科
关键词 网页去重 网页特征码 二叉排序树
年,卷(期) 2006,(9) 所属期刊栏目 网络与通信
研究方向 页码范围 113-115
页数 3页 分类号 TP285
字数 语种 中文
DOI 10.3969/j.issn.1008-0570.2006.09.040
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (3)
共引文献  (7)
参考文献  (1)
节点文献
引证文献  (30)
同被引文献  (46)
二级引证文献  (66)
2002(2)
  • 参考文献(0)
  • 二级参考文献(2)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2007(3)
  • 引证文献(2)
  • 二级引证文献(1)
2008(8)
  • 引证文献(7)
  • 二级引证文献(1)
2009(8)
  • 引证文献(4)
  • 二级引证文献(4)
2010(11)
  • 引证文献(4)
  • 二级引证文献(7)
2011(11)
  • 引证文献(2)
  • 二级引证文献(9)
2012(7)
  • 引证文献(2)
  • 二级引证文献(5)
2013(6)
  • 引证文献(3)
  • 二级引证文献(3)
2014(6)
  • 引证文献(0)
  • 二级引证文献(6)
2015(8)
  • 引证文献(2)
  • 二级引证文献(6)
2016(8)
  • 引证文献(3)
  • 二级引证文献(5)
2017(11)
  • 引证文献(1)
  • 二级引证文献(10)
2018(5)
  • 引证文献(0)
  • 二级引证文献(5)
2019(3)
  • 引证文献(0)
  • 二级引证文献(3)
2020(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
网页去重
网页特征码
二叉排序树
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
科技与创新
半月刊
2095-6835
14-1369/N
大16开
2014-01-01
chi
出版文献量(篇)
41653
总下载数(次)
0
总被引数(次)
202805
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导