基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
现有的很多序列聚类算法是基于"局部特征可以表征整个序列"的假设来进行的,即不区分实际应用中序列的整体相似性和局部相似性.这对存在保守子模式的序列,如DNA和蛋白质序列是适用的,但对一些注重整体序列相似性的应用领域,如:在交易数据库中用户购买行为的比较,时间序列数据中全局模式的匹配等,由于难以产生频繁子模式,用基于全局相似性的度量方法进行聚类显得更为合理.此外,在基于局部相似性的序列聚类算法中,选取的局部子模式表征序列的能力也有待进一步提高.由此,针对不同应用领域,分别提出基于整体相似性的序列聚类算法GSClu和基于局部相似性的序列聚类算法LSClu.GSClu和LSClu分别利用带剪枝策略的二分k均值算法和基于有gap约束的强区分度子模式方法对各自领域的序列数据进行聚类.实验采用交易序列数据和蛋白质序列数据,实验结果表明,GSClu和LSClu对各自领域的序列数据具有较快的处理速度和良好的聚类质量.
推荐文章
基于趋势的时间序列相似性度量和聚类研究
时间序列
不确定性
相似性度量
聚类
趋势符号
基于超边相似性的超图聚类改进算法
聚类
超图
超边距离阈值
基于最大偏差相似性准则的交通流聚类算法
交通流曲线
聚类算法
曲线形态
相似性
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于整体和局部相似性的序列聚类算法
来源期刊 软件学报 学科 工学
关键词 序列数据 相似性 聚类
年,卷(期) 2010,(4) 所属期刊栏目 数据库技术
研究方向 页码范围 702-717
页数 16页 分类号 TP311
字数 13534字 语种 中文
DOI 10.3724/SP.J.1001.2010.03609
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 熊赟 复旦大学计算机科学技术学院 26 277 7.0 16.0
2 戴东波 复旦大学计算机科学技术学院 6 156 5.0 6.0
3 汤春蕾 复旦大学计算机科学技术学院 6 53 3.0 6.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (51)
共引文献  (27)
参考文献  (6)
节点文献
引证文献  (35)
同被引文献  (84)
二级引证文献  (137)
1970(2)
  • 参考文献(1)
  • 二级参考文献(1)
1974(1)
  • 参考文献(1)
  • 二级参考文献(0)
1983(1)
  • 参考文献(0)
  • 二级参考文献(1)
1984(1)
  • 参考文献(0)
  • 二级参考文献(1)
1985(1)
  • 参考文献(0)
  • 二级参考文献(1)
1988(1)
  • 参考文献(0)
  • 二级参考文献(1)
1989(1)
  • 参考文献(0)
  • 二级参考文献(1)
1990(3)
  • 参考文献(0)
  • 二级参考文献(3)
1992(1)
  • 参考文献(0)
  • 二级参考文献(1)
1993(1)
  • 参考文献(0)
  • 二级参考文献(1)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(5)
  • 参考文献(1)
  • 二级参考文献(4)
1997(3)
  • 参考文献(0)
  • 二级参考文献(3)
1998(4)
  • 参考文献(0)
  • 二级参考文献(4)
1999(4)
  • 参考文献(0)
  • 二级参考文献(4)
2001(6)
  • 参考文献(1)
  • 二级参考文献(5)
2002(2)
  • 参考文献(0)
  • 二级参考文献(2)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(4)
  • 参考文献(0)
  • 二级参考文献(4)
2005(8)
  • 参考文献(0)
  • 二级参考文献(8)
2006(4)
  • 参考文献(1)
  • 二级参考文献(3)
2007(2)
  • 参考文献(1)
  • 二级参考文献(1)
2010(4)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(4)
  • 二级引证文献(0)
2010(4)
  • 引证文献(4)
  • 二级引证文献(0)
2011(6)
  • 引证文献(5)
  • 二级引证文献(1)
2012(6)
  • 引证文献(3)
  • 二级引证文献(3)
2013(12)
  • 引证文献(2)
  • 二级引证文献(10)
2014(18)
  • 引证文献(5)
  • 二级引证文献(13)
2015(24)
  • 引证文献(2)
  • 二级引证文献(22)
2016(27)
  • 引证文献(5)
  • 二级引证文献(22)
2017(20)
  • 引证文献(1)
  • 二级引证文献(19)
2018(26)
  • 引证文献(3)
  • 二级引证文献(23)
2019(19)
  • 引证文献(3)
  • 二级引证文献(16)
2020(10)
  • 引证文献(2)
  • 二级引证文献(8)
研究主题发展历程
节点文献
序列数据
相似性
聚类
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
软件学报
月刊
1000-9825
11-2560/TP
16开
北京8718信箱
82-367
1990
chi
出版文献量(篇)
5820
总下载数(次)
36
总被引数(次)
226394
相关基金
国家高技术研究发展计划(863计划)
英文译名:The National High Technology Research and Development Program of China
官方网址:http://www.863.org.cn
项目类型:重点项目
学科类型:信息技术
论文1v1指导