原文服务方: 计算机应用研究       
摘要:
WWW上大量信息的涌现,对信息的查询提出了严峻的挑战。XML作为一种扩展标记语言,具有许多HTML所不具备的优点,使得开展WWW上的深层应用成为可能。对基于XML的搜索引擎中涉及的关键技术进行了研究,并提出了对XML这种半结构化文档建立索引和查询时采用的数据结构和算法。它在不丢失文档中结构信息的情况下,充分利用XML的标签所带来的上下文信息,能够大幅度提高查询的准确率。
推荐文章
基于XML的搜索引擎倒排索引研究
XML
搜索引擎
倒排索引
面向XML Repository搜索引擎的研究与实现
XML Repository
搜索引擎
本体论
元搜索引擎研究
搜索引擎
信息检索
元搜索引擎
基于Lucene\XML技术的Web搜索引擎设计与实现
搜索引擎
Lucene
XML
索引
检索
Wap
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 XML搜索引擎研究
来源期刊 计算机应用研究 学科
关键词 XML 搜索引擎 采集器 倒排表
年,卷(期) 2001,(4) 所属期刊栏目 网络及网管技术
研究方向 页码范围 68-71
页数 4页 分类号 TP393
字数 语种 中文
DOI 10.3969/j.issn.1001-3695.2001.04.022
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 白硕 中国科学院计算技术研究所 50 2124 21.0 46.0
2 王海波 中国科学院计算技术研究所 41 644 9.0 25.0
3 耿晖 中国科学院计算技术研究所 7 429 5.0 7.0
4 姜吉发 中国科学院计算技术研究所 9 535 7.0 9.0
5 祝明发 1 99 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (99)
同被引文献  (36)
二级引证文献  (477)
2001(2)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(2)
  • 二级引证文献(0)
2001(2)
  • 引证文献(2)
  • 二级引证文献(0)
2002(7)
  • 引证文献(7)
  • 二级引证文献(0)
2003(17)
  • 引证文献(14)
  • 二级引证文献(3)
2004(27)
  • 引证文献(12)
  • 二级引证文献(15)
2005(66)
  • 引证文献(9)
  • 二级引证文献(57)
2006(68)
  • 引证文献(14)
  • 二级引证文献(54)
2007(57)
  • 引证文献(11)
  • 二级引证文献(46)
2008(71)
  • 引证文献(11)
  • 二级引证文献(60)
2009(52)
  • 引证文献(7)
  • 二级引证文献(45)
2010(49)
  • 引证文献(4)
  • 二级引证文献(45)
2011(32)
  • 引证文献(1)
  • 二级引证文献(31)
2012(27)
  • 引证文献(2)
  • 二级引证文献(25)
2013(28)
  • 引证文献(0)
  • 二级引证文献(28)
2014(17)
  • 引证文献(2)
  • 二级引证文献(15)
2015(13)
  • 引证文献(0)
  • 二级引证文献(13)
2016(11)
  • 引证文献(1)
  • 二级引证文献(10)
2017(12)
  • 引证文献(2)
  • 二级引证文献(10)
2018(10)
  • 引证文献(0)
  • 二级引证文献(10)
2019(4)
  • 引证文献(0)
  • 二级引证文献(4)
2020(5)
  • 引证文献(0)
  • 二级引证文献(5)
研究主题发展历程
节点文献
XML
搜索引擎
采集器
倒排表
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用研究
月刊
1001-3695
51-1196/TP
大16开
1984-01-01
chi
出版文献量(篇)
21004
总下载数(次)
0
总被引数(次)
238385
论文1v1指导