基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
互联网上大量重复网页的存在,严重地影响信息的检索质量.因此提出了一种基于特征码散列的网页去重算法,利用特征码对特征语句集散列以缩小其比较的范围,提高了网页去重的准确性.实验表明该算法准确率高,性能良好,基于上述算法实现了基于Web的企业情报竞争平台中的网页去重.
推荐文章
陶瓷企业竞争情报的收集与管理
竞争情报
情报收集
情报管理
企业竞争情报的应用方向与发展战略
竞争情报
发展战略
信息技术
农业企业中竞争情报的应用
竞争情报
农业情报
情报服务
网络环境下的企业的竞争情报平台建设
网络环境
情报平台
建设
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 网页去重在基于Web企业竞争情报平台中的应用与研究
来源期刊 云南民族大学学报(自然科学版) 学科 工学
关键词 网页去重 特征码 特征语句集
年,卷(期) 2008,(4) 所属期刊栏目
研究方向 页码范围 380-382
页数 3页 分类号 TP393.09
字数 2762字 语种 中文
DOI 10.3969/j.issn.1672-8513.2008.04.027
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 黄青松 昆明理工大学信息工程与自动化学院 91 265 9.0 12.0
2 杨申彦 昆明理工大学信息工程与自动化学院 1 1 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (3)
共引文献  (49)
参考文献  (3)
节点文献
引证文献  (1)
同被引文献  (20)
二级引证文献  (21)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(1)
  • 二级参考文献(0)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(1)
  • 参考文献(1)
  • 二级参考文献(0)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2011(1)
  • 引证文献(1)
  • 二级引证文献(0)
2012(2)
  • 引证文献(0)
  • 二级引证文献(2)
2013(1)
  • 引证文献(0)
  • 二级引证文献(1)
2014(1)
  • 引证文献(0)
  • 二级引证文献(1)
2015(6)
  • 引证文献(0)
  • 二级引证文献(6)
2016(1)
  • 引证文献(0)
  • 二级引证文献(1)
2017(6)
  • 引证文献(0)
  • 二级引证文献(6)
2018(2)
  • 引证文献(0)
  • 二级引证文献(2)
2019(2)
  • 引证文献(0)
  • 二级引证文献(2)
研究主题发展历程
节点文献
网页去重
特征码
特征语句集
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
云南民族大学学报(自然科学版)
双月刊
1672-8513
53-1192/N
大16开
中国昆明市一二·一大街134号
1992
chi
出版文献量(篇)
2286
总下载数(次)
5
总被引数(次)
8502
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导