基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
研究基于编辑距离的top-k相似字符串查询处理方法,即对于给定的字符串集合S和查询串σ,返回S中前k个与σ编辑距离最小的字符串.首先提出了基于长度跳跃索引的2种自适应过滤策略来减少字符串之间编辑距离的计算次数;其次提出了查询字符串与不匹配字符串集合的编辑距离下界,以便在处理和σ无公共特征的字符串时,进一步减少编辑距离的计算次数;最后给出了基于上述过滤策略的高效top-k相似字符串查询算法,并在3个真实的数据集上进行了实验,实验结果验证了所提算法的高效性.
推荐文章
计算字符串相似度的矩阵算法
匹配率
相似度
匹配矩阵
信息量
一种处理Top-k逆向查询的分支界定算法
Top-k逆向查询
分支界定算法
逆向Top-k算法
多维数据流下的top-k支配查询算法研究
数据流
滑动窗口
top-k
Skyline
网格
情境相关的室内空间群组Top-k查询
情境
室内空间
移动对象
群组查询
Top-k查询
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 高效的top-k相似字符串查询算法
来源期刊 通信学报 学科 工学
关键词 字符串相似性 非对称特征方案 长度跳跃索引
年,卷(期) 2014,(12) 所属期刊栏目 学术论文
研究方向 页码范围 10-20
页数 11页 分类号 TP311
字数 9496字 语种 中文
DOI 10.3969/j.issn.1000-436x.2014.12.002
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 陈子阳 燕山大学信息科学与工程学院 27 100 6.0 9.0
3 周军锋 燕山大学信息科学与工程学院 21 167 6.0 12.0
5 王璿 燕山大学信息科学与工程学院 14 49 4.0 6.0
13 韩玉俊 燕山大学信息科学与工程学院 1 4 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (4)
同被引文献  (7)
二级引证文献  (0)
2014(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2016(1)
  • 引证文献(1)
  • 二级引证文献(0)
2017(3)
  • 引证文献(3)
  • 二级引证文献(0)
研究主题发展历程
节点文献
字符串相似性
非对称特征方案
长度跳跃索引
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
通信学报
月刊
1000-436X
11-2102/TN
大16开
北京市丰台区成寿路11号邮电出版大厦8层
2-676
1980
chi
出版文献量(篇)
6235
总下载数(次)
17
总被引数(次)
85479
论文1v1指导