基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对大数据库中正则表达式查询,提出了一种基于索引的有效算法.首先,构造索引.该索引结构在前缀树基础上加以改进,为每个节点创建二维数组存放该节点所辖子树各层的首次关键节点,并对每个节点附加关键节点指针以指向同层的下一关键节点.然后,通过所提出的索引结构进行查询.最后,分析了所提出算法的时间和空间复杂度,并进行了实验.实验结果证明:随着数据集的增加,其查询时间和输入/输出(I/0)时间增长速度较缓慢,说明其可扩展性较好,适合于大数据库中正则表达式查询.并且,随着查询字串的增加,查询时间与I/O时间均呈递减趋势,证明了该算法的效率和有效性.
推荐文章
面向网络流的自适应正则表达式分组匹配算法
深度包检测
正则表达式
分组
有限自动机
伸展树
面向高效深度包检测的启发式正则表达式分组算法
深度包检测
正则表达式
分组算法
确定型有限自动机
基于Bloom filter的高效正则表达式匹配算法
正则表达式
确定有限自动机
布鲁姆过滤器
比特向量
确定字符串
匹配概率
匹配速率
网页清洗系统基于静态正则表达式的实现
网页清洗
,静态正则表达式
Xpressive
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 面向大数据库正则表达式查询的有效算法
来源期刊 河南科技大学学报(自然科学版) 学科 工学
关键词 正则表达式 查询处理 大数据库 索引
年,卷(期) 2015,(4) 所属期刊栏目 电工电信、自动化与计算机
研究方向 页码范围 56-61
页数 6页 分类号 TP3
字数 6116字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 张晓煜 郑州航空工业管理学院计算机科学与应用系 17 66 5.0 7.0
2 林晓 上海交通大学计算机科学与工程系 9 32 4.0 4.0
3 王志杰 上海交通大学计算机科学与工程系 2 2 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (26)
共引文献  (35)
参考文献  (6)
节点文献
引证文献  (2)
同被引文献  (15)
二级引证文献  (11)
1975(2)
  • 参考文献(0)
  • 二级参考文献(2)
1977(2)
  • 参考文献(0)
  • 二级参考文献(2)
1990(1)
  • 参考文献(0)
  • 二级参考文献(1)
1993(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(1)
  • 参考文献(1)
  • 二级参考文献(0)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(2)
  • 参考文献(0)
  • 二级参考文献(2)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(5)
  • 参考文献(1)
  • 二级参考文献(4)
2009(5)
  • 参考文献(0)
  • 二级参考文献(5)
2010(6)
  • 参考文献(2)
  • 二级参考文献(4)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2015(1)
  • 引证文献(1)
  • 二级引证文献(0)
2016(1)
  • 引证文献(1)
  • 二级引证文献(0)
2017(3)
  • 引证文献(0)
  • 二级引证文献(3)
2018(3)
  • 引证文献(0)
  • 二级引证文献(3)
2019(4)
  • 引证文献(0)
  • 二级引证文献(4)
2020(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
正则表达式
查询处理
大数据库
索引
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
河南科技大学学报(自然科学版)
双月刊
1672-6871
41-1362/N
大16开
河南省洛阳市开元大道263号
36-285
1980
chi
出版文献量(篇)
3214
总下载数(次)
7
总被引数(次)
19453
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导