基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
对于大规模中文模式串匹配,由于汉字的散度较高,导致AC算法有限状态自动机中的零状态过长,算法的效率急剧下降。文章提出了一种基于汉字编码特征的改进算法,考虑到汉字的首字节范围比尾字节的小,先查找首字节,再查找尾字节,若失败则直接跳转,降低了查找时间。该算法通过给零状态中字符设置标记,有效避免重复匹配和部分匹配,提高了匹配效率。
推荐文章
一种面向PDF文本内容审查的高效多模式匹配算法
多模式匹配
Wu-Manber算法
PDF文本编码
布隆过滤器
入侵检测中一种新的多模式匹配算法
入侵检测
多模式匹配
AC算法
Wu-Manber算法
AC-WM算法
一种基于Aho-Corasick算法改进的 多模式匹配算法
字符串匹配
多模式匹配
Trie树
双数组
AC算法
匹配速度
一种大容量模式匹配算法
模式匹配
编号压缩
集合切分
TCAM
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种基于汉字编码特征的中文多模式匹配算法
来源期刊 合肥工业大学学报(自然科学版) 学科 工学
关键词 AC算法 多模式匹配 汉字编码特征 标记
年,卷(期) 2016,(8) 所属期刊栏目 ?计算机与信息工程?
研究方向 页码范围 1060-1065
页数 6页 分类号 TP393.08
字数 5282字 语种 中文
DOI 10.3969/j.issn.1003-5060.2016.08.011
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 侯整风 合肥工业大学计算机与信息学院 136 717 11.0 20.0
2 黄宇 合肥工业大学计算机与信息学院 5 15 2.0 3.0
3 余虎 合肥工业大学计算机与信息学院 2 3 1.0 1.0
4 刘春晖 合肥工业大学计算机与信息学院 3 10 1.0 3.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (54)
共引文献  (82)
参考文献  (13)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1975(4)
  • 参考文献(1)
  • 二级参考文献(3)
1977(7)
  • 参考文献(1)
  • 二级参考文献(6)
1979(1)
  • 参考文献(0)
  • 二级参考文献(1)
1980(4)
  • 参考文献(1)
  • 二级参考文献(3)
1987(1)
  • 参考文献(0)
  • 二级参考文献(1)
1990(4)
  • 参考文献(0)
  • 二级参考文献(4)
1991(1)
  • 参考文献(0)
  • 二级参考文献(1)
1993(2)
  • 参考文献(0)
  • 二级参考文献(2)
2000(2)
  • 参考文献(0)
  • 二级参考文献(2)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(4)
  • 参考文献(1)
  • 二级参考文献(3)
2003(2)
  • 参考文献(0)
  • 二级参考文献(2)
2004(5)
  • 参考文献(0)
  • 二级参考文献(5)
2005(3)
  • 参考文献(0)
  • 二级参考文献(3)
2006(2)
  • 参考文献(0)
  • 二级参考文献(2)
2007(8)
  • 参考文献(2)
  • 二级参考文献(6)
2008(3)
  • 参考文献(0)
  • 二级参考文献(3)
2009(3)
  • 参考文献(0)
  • 二级参考文献(3)
2010(4)
  • 参考文献(1)
  • 二级参考文献(3)
2011(4)
  • 参考文献(4)
  • 二级参考文献(0)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
AC算法
多模式匹配
汉字编码特征
标记
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
合肥工业大学学报(自然科学版)
月刊
1003-5060
34-1083/N
大16开
合肥市屯溪路193号
26-61
1956
chi
出版文献量(篇)
7881
总下载数(次)
18
总被引数(次)
57827
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导