基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
分布式文本检索系统难以兼顾高效率的数据检索和低成本的索引维护。为此,提出一种基于计数型布隆过滤器的文本检索模型 CBFTRM。该模型将物理节点分为数据节点和索引节点,分别采用结构化 P2P 进行网络覆盖。每个数据节点负责存储文档数据并维护与之相应的倒排索引,同时通过倒排索引中的关键词集合计算出计数型布隆过滤器值,发送给相应的索引节点。每个索引节点建立一棵以部分数据节点的特征信息(包括过滤器值)为叶节点、以过滤器值运算结果为内部节点的搜索树,并在叶节点发生变化时对搜索树进行维护。仿真实验结果表明,该模型文档定位快,索引维护通信量小,而且具有较高的查准率。
推荐文章
基于布隆过滤器的事务存储架构中的高速缓存
多核处理器
事务存储
布隆过滤器
高速缓存
基于向量空间模型的文本检索系统
向量空间模型
VSM
文本检索
信息获取
基于本体的企业文本检索模型研究
文本检索
文本分析
本体描述符
自然段
基于非结构化文本检索模型综述
相似度计算
检索模型
语义检索
概率相关性
数学理论
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于计数型布隆过滤器的文本检索模型
来源期刊 计算机工程 学科 工学
关键词 计数型布隆过滤器 搜索树 结构化P2P 文本检索 倒排索引
年,卷(期) 2014,(2) 所属期刊栏目 体系结构与软件技术
研究方向 页码范围 58-61
页数 4页 分类号 TP311.13
字数 3700字 语种 中文
DOI 10.3969/j.issn.1000-3428.2014.02.013
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 王晓琳 山东大学计算机科学与技术学院 41 392 9.0 19.0
2 田青 山东大学计算机科学与技术学院 3 11 2.0 3.0
3 冯加军 山东大学计算机科学与技术学院 1 6 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (6)
共引文献  (3)
参考文献  (6)
节点文献
引证文献  (6)
同被引文献  (12)
二级引证文献  (20)
1970(1)
  • 参考文献(1)
  • 二级参考文献(0)
1975(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(2)
  • 参考文献(1)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(2)
  • 参考文献(0)
  • 二级参考文献(2)
2009(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2014(1)
  • 引证文献(1)
  • 二级引证文献(0)
2016(8)
  • 引证文献(2)
  • 二级引证文献(6)
2017(4)
  • 引证文献(1)
  • 二级引证文献(3)
2018(9)
  • 引证文献(1)
  • 二级引证文献(8)
2019(3)
  • 引证文献(1)
  • 二级引证文献(2)
2020(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
计数型布隆过滤器
搜索树
结构化P2P
文本检索
倒排索引
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程
月刊
1000-3428
31-1289/TP
大16开
上海市桂林路418号
4-310
1975
chi
出版文献量(篇)
31987
总下载数(次)
53
论文1v1指导