基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
本文对当今主流的几种抓取算法进行了研究,并在OPIC算法的基础上,针对藏文网络信息的特点及特性,增加了对关键词进行检索的步骤,确保了反馈抓取到的信息的相关度及准确性.在理论的基础上,根据当前的藏文网络信息进行了实验,最后得出改进后的算法的工作效率.
推荐文章
结合关键词混淆网络的关键词检出系统
关键词检出
混淆网络
语音识别
基于PageRank的新闻关键词提取算法
成为用户搜索信息必不可少的工具.关键词以凝练简洁的形式对文本主题进行有效概括
通过提取关键词
可以结构化地表示目标文本
提高人们的文献管理与检索效率.
用于关系数据库关键词查询的基于划分的候选网络生成算法
候选网络
关系数据库
关键词查询
划分策略
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于藏文网络信息的关键词抓取算法改进
来源期刊 中文信息 学科 工学
关键词 藏文网络信息 搜索策略 抓取算法 检索算法
年,卷(期) 2014,(11) 所属期刊栏目 计算机工程与应用
研究方向 页码范围 1-2
页数 2页 分类号 TP393
字数 1577字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 戴玉刚 西北民族大学中国民族信息技术研究院 32 97 5.0 9.0
2 杨南 西北民族大学数学与计算机科学学院 1 1 1.0 1.0
3 李佩 西北民族大学中国民族信息技术研究院 2 3 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (6)
共引文献  (5)
参考文献  (4)
节点文献
引证文献  (1)
同被引文献  (5)
二级引证文献  (1)
1998(2)
  • 参考文献(0)
  • 二级参考文献(2)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(2)
  • 参考文献(1)
  • 二级参考文献(1)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2009(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2018(2)
  • 引证文献(1)
  • 二级引证文献(1)
研究主题发展历程
节点文献
藏文网络信息
搜索策略
抓取算法
检索算法
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
中文信息
月刊
1003-9082
51-1269/TP
16开
四川省成都市
62-56
1984
chi
出版文献量(篇)
28107
总下载数(次)
38
总被引数(次)
4053
论文1v1指导