基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
局部比对是一种衡量字符串间相似程度的技术,它在生物信息学领域具有十分重要的作用。介于此,许多学者已对其进行了深入的研究。然而,随着数据规模的扩大,常规的内存算法已不适用于支持大规模文本数据的局部比对。为解决上述问题,该文研究了基于外存后缀树的 top-k 局部比对算法。它从根本上消除了内存空间对算法的束缚。为了提高算法的性能,该文首先将经典内存算法中的过滤策略引入该文。通过适当的修改,这些策略可以基于外存后缀树有效地降低计算开销。其次,该文提出一种巧妙的算法支持 top-k 局部比对查询。该算法通过引入启发式策略有效规避了 TA 算法的固有问题。具体地,它一方面可以提高算法的过滤能力,另一方面可以降低候选对象的维护代价。再次,该文对外存后缀树和磁盘的工作原理进行了研究。基于此,该文提出一种槽的结构支持查询。该结构既可以实现磁盘的顺序访问,又可以降低磁盘的访问次数。因此,它可以有效提高算法的查询效率。最后,大量的实验验证了该文所提出算法的有效性。
推荐文章
基于MapReduce的top-k高效用模式挖掘算法
数据挖掘
top-k
高效用模式
MapReduce
并行算法
一种处理Top-k逆向查询的分支界定算法
Top-k逆向查询
分支界定算法
逆向Top-k算法
一种快速挖掘top-k高效用模式的算法
高效用模式
top-k模式挖掘
效用挖掘
数据挖掘
多维数据流下的top-k支配查询算法研究
数据流
滑动窗口
top-k
Skyline
网格
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于外存后缀树的 top-k 局部比对算法
来源期刊 计算机学报 学科 工学
关键词 局部比对 top-k 外存后缀树 叉子区域
年,卷(期) 2016,(10) 所属期刊栏目 数据科学与工程
研究方向 页码范围 2061-2074
页数 14页 分类号 TP301
字数 14694字 语种 中文
DOI 10.11897/SP.J.1016.2016.02061
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 王国仁 东北大学信息科学与工程学院 228 2804 25.0 45.0
2 于戈 东北大学信息科学与工程学院 426 6587 38.0 64.0
3 杨晓春 东北大学信息科学与工程学院 65 1090 16.0 32.0
4 王斌 东北大学信息科学与工程学院 101 945 14.0 28.0
5 朱睿 东北大学信息科学与工程学院 3 6 1.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (17)
节点文献
引证文献  (1)
同被引文献  (0)
二级引证文献  (0)
1980(1)
  • 参考文献(1)
  • 二级参考文献(0)
1981(1)
  • 参考文献(1)
  • 二级参考文献(0)
1988(1)
  • 参考文献(1)
  • 二级参考文献(0)
1990(1)
  • 参考文献(1)
  • 二级参考文献(0)
1993(1)
  • 参考文献(1)
  • 二级参考文献(0)
1996(1)
  • 参考文献(1)
  • 二级参考文献(0)
2004(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(1)
  • 参考文献(1)
  • 二级参考文献(0)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2009(2)
  • 参考文献(2)
  • 二级参考文献(0)
2011(2)
  • 参考文献(2)
  • 二级参考文献(0)
2012(3)
  • 参考文献(3)
  • 二级参考文献(0)
2016(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2017(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
局部比对
top-k
外存后缀树
叉子区域
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机学报
月刊
0254-4164
11-1826/TP
大16开
中国科学院计算技术研究所(北京2704信箱)
2-833
1978
chi
出版文献量(篇)
5154
总下载数(次)
49
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导