基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
提出一种适用于大规模语料的频繁模式增量发现算法.统计局部区域提取的字符串频度,对局部相对低频字符串进行剪枝.利用多模式串匹配算法,统计剪枝后局部相对高频字符串在整个语料中的频度,得到频度大于阈值的频繁模式.实验结果表明,该算法具有较低的空间复杂度和时间复杂度,内存消耗为基于后缀数组的频繁模式发现算法的20%左右.
推荐文章
大规模语料的频繁模式快速发现算法
频繁模式
语料划分
重复串
适于大规模数据集的块增量学习算法: BISVM
支持向量机
块增量算法
大规模训练
构建大规模的汉英双语平行语料库
机器翻译
双语平行语料库
语料库构建
事件序列中频繁并行情节的增量式发现算法
数据发掘
事件序列
频繁情节
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 大规模语料中频繁模式增量发现算法
来源期刊 计算机工程 学科 工学
关键词 频繁模式 增量式 多模式串匹配算法 后缀树 后缀数组
年,卷(期) 2011,(23) 所属期刊栏目 软件技术与数据库
研究方向 页码范围 27-29,32
页数 分类号 TP306
字数 3808字 语种 中文
DOI 10.3969/j.issn.1000-3428.2011.23.009
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 陈洁 中国科学院计算技术研究所 90 1445 18.0 36.0
5 谭建龙 中国科学院计算技术研究所 43 444 11.0 19.0
6 廖豪 中国科学院计算技术研究所 3 5 1.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (4)
共引文献  (46)
参考文献  (4)
节点文献
引证文献  (4)
同被引文献  (6)
二级引证文献  (0)
1975(1)
  • 参考文献(1)
  • 二级参考文献(0)
2002(1)
  • 参考文献(1)
  • 二级参考文献(0)
2005(2)
  • 参考文献(0)
  • 二级参考文献(2)
2006(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(1)
  • 参考文献(0)
  • 二级参考文献(1)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2013(1)
  • 引证文献(1)
  • 二级引证文献(0)
2014(1)
  • 引证文献(1)
  • 二级引证文献(0)
2015(2)
  • 引证文献(2)
  • 二级引证文献(0)
研究主题发展历程
节点文献
频繁模式
增量式
多模式串匹配算法
后缀树
后缀数组
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程
月刊
1000-3428
31-1289/TP
大16开
上海市桂林路418号
4-310
1975
chi
出版文献量(篇)
31987
总下载数(次)
53
总被引数(次)
317027
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导