基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
传统的互联网有害信息发现方法是依据Google、百度等元搜索工具,用户输入关键词进行检索,然后对获取的结果进行研判,但是用户经常无法准确地描述所需的资料,给出的关键词不准确,搜索结果常有用户不关心的垃圾数据,而一些有用的数据却不能列出。文中探讨了一种基于元搜索,引入关键词扩充技术的爬虫方法。该方法在网页抓取,用户检索的时候能扩充输入的关键词,从而提高搜索覆盖率和精度。该方法投入小,效果好,还可通过扩展应用到其他领域。
推荐文章
基于语义的文档关键词提取方法
语义距离
密度聚类
关键词提取
中文时间关键词识别研究
时间关键词
时间关键词识别
谱聚类
基于主题特征的关键词抽取
关键词抽取
主题特征
主题模型
装袋决策树
基于关键词相关度的Deep Web爬虫爬行策略
Deep Web页面
爬行策略
关键词选择
相关度权重
覆盖率
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于关键词相关性的有害信息爬虫系统研究
来源期刊 计算机技术与发展 学科 工学
关键词 元搜索 爬虫 扩充 索引
年,卷(期) 2014,(3) 所属期刊栏目 安 全 与 防 范
研究方向 页码范围 143-146
页数 4页 分类号 TP302.1
字数 3796字 语种 中文
DOI 10.3969/j.issn.1673-629X.2014.03.036
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 杨柳 3 10 1.0 3.0
2 刘跃 8 10 1.0 3.0
3 朱剑宇 4 8 2.0 2.0
4 苏金波 2 2 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (14)
共引文献  (15)
参考文献  (3)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1984(1)
  • 参考文献(0)
  • 二级参考文献(1)
1988(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(3)
  • 参考文献(0)
  • 二级参考文献(3)
2006(2)
  • 参考文献(0)
  • 二级参考文献(2)
2007(2)
  • 参考文献(0)
  • 二级参考文献(2)
2008(1)
  • 参考文献(0)
  • 二级参考文献(1)
2009(2)
  • 参考文献(2)
  • 二级参考文献(0)
2010(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
元搜索
爬虫
扩充
索引
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机技术与发展
月刊
1673-629X
61-1450/TP
大16开
西安市雁塔路南段99号
52-127
1991
chi
出版文献量(篇)
12927
总下载数(次)
40
总被引数(次)
111596
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导