原文服务方: 计算机应用研究       
摘要:
针对符号序列聚类中表示模型及序列间距离度量定义的困难问题,提出一种基于概率向量的表示模型及基于该模型的符号序列聚类算法.该模型引入符号序列的概率分布表示法,定义了一种基于概率分布差异的符号序列距离度量及该模型的目标函数,最后给出了一种符号序列K-均值型聚类算法,并在来自不同领域的实际应用序列集上进行了实验验证.实验结果表明,与基于子序列表示模型的符号序列聚类算法相比,所提方法在DNA序列和语音序列等具有较多符号的实际数据上,在有效提高聚类精度的同时降低聚类时间50%以上.
推荐文章
基于数据挖掘的符号序列聚类相似度量模型
符号序列聚类
数据挖掘
相似性模型
基于聚类和支持向量机的非线性时间序列故障预报
故障预报
K-均值聚类
支持向量回归
时间序列预测
一种改进的符号化时间序列聚类方法
时间序列符号化
聚类
相似性度量
最长公共子序列
一种基于概率的快速聚类算法
聚类
样本
特征
概率
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 符号序列的概率向量聚类方法
来源期刊 计算机应用研究 学科
关键词 数据聚类 符号序列 向量空间模型 概率向量 马尔可夫模型
年,卷(期) 2018,(6) 所属期刊栏目 算法研究探讨
研究方向 页码范围 1676-1680
页数 5页 分类号 TP391
字数 语种 中文
DOI 10.3969/j.issn.1001-3695.2018.06.017
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 陈黎飞 福建师范大学数学与计算机科学学院 42 344 9.0 17.0
2 程铃钫 福建农林大学金山学院 15 27 3.0 4.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (64)
共引文献  (14)
参考文献  (12)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1967(1)
  • 参考文献(0)
  • 二级参考文献(1)
1983(1)
  • 参考文献(0)
  • 二级参考文献(1)
1987(1)
  • 参考文献(0)
  • 二级参考文献(1)
1989(2)
  • 参考文献(0)
  • 二级参考文献(2)
1990(1)
  • 参考文献(0)
  • 二级参考文献(1)
1994(2)
  • 参考文献(0)
  • 二级参考文献(2)
1995(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(5)
  • 参考文献(0)
  • 二级参考文献(5)
2000(3)
  • 参考文献(0)
  • 二级参考文献(3)
2001(2)
  • 参考文献(0)
  • 二级参考文献(2)
2002(3)
  • 参考文献(0)
  • 二级参考文献(3)
2003(3)
  • 参考文献(1)
  • 二级参考文献(2)
2004(2)
  • 参考文献(0)
  • 二级参考文献(2)
2005(3)
  • 参考文献(1)
  • 二级参考文献(2)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(6)
  • 参考文献(1)
  • 二级参考文献(5)
2008(9)
  • 参考文献(0)
  • 二级参考文献(9)
2009(10)
  • 参考文献(2)
  • 二级参考文献(8)
2010(6)
  • 参考文献(0)
  • 二级参考文献(6)
2011(5)
  • 参考文献(2)
  • 二级参考文献(3)
2012(4)
  • 参考文献(2)
  • 二级参考文献(2)
2014(2)
  • 参考文献(2)
  • 二级参考文献(0)
2017(1)
  • 参考文献(1)
  • 二级参考文献(0)
2018(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
数据聚类
符号序列
向量空间模型
概率向量
马尔可夫模型
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用研究
月刊
1001-3695
51-1196/TP
大16开
1984-01-01
chi
出版文献量(篇)
21004
总下载数(次)
0
总被引数(次)
238385
论文1v1指导