原文服务方: 计算机应用研究       
摘要:
针对传统字符串相似度算法复杂的局限,在向量空间模型(VSM)的基础上,提出一种同时考虑字符相邻位置关系和词序的字符串相似度计算模型。通过计算 VSM中向量的汉明距离来描述字符串相邻程度,并以向量的曼哈顿距离作为衡量字符先后次序的指标。最后对两个指标加权求和得到字符串相似度的定量描述。与传统的算法比较,该算法更简便,时间复杂度为 O(n log(n))。实验结果表明,该方法提高了字符串相似度的准确率,得到的数据结果更合理。
推荐文章
字符串相似度度量中LCS和GST算法比较
LCS算法
GST算法
算法实现
算法效率
基于改进编辑距离的字符串相似度求解算法
编辑距离
LD算法
回溯路径
最长公共子串
相似度
模糊查询
一种融合多种编辑距离的字符串相似度计算方法
数据清洗
相似重复记录
字符串匹配
字符串相似度
编辑距离
计算字符串相似度的矩阵算法
匹配率
相似度
匹配矩阵
信息量
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种融合位置信息的字符串相似度度量方法
来源期刊 计算机应用研究 学科
关键词 字符串相似度 相邻字符 词序 汉明距离
年,卷(期) 2015,(11) 所属期刊栏目 算法研究探讨
研究方向 页码范围 3287-3290
页数 4页 分类号 TP301.5
字数 语种 中文
DOI 10.3969/j.issn.1001-3695.2015.11.019
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (65)
共引文献  (255)
参考文献  (13)
节点文献
引证文献  (6)
同被引文献  (12)
二级引证文献  (0)
1958(1)
  • 参考文献(0)
  • 二级参考文献(1)
1975(1)
  • 参考文献(1)
  • 二级参考文献(0)
1976(1)
  • 参考文献(0)
  • 二级参考文献(1)
1980(1)
  • 参考文献(0)
  • 二级参考文献(1)
1985(1)
  • 参考文献(0)
  • 二级参考文献(1)
1990(1)
  • 参考文献(0)
  • 二级参考文献(1)
1992(2)
  • 参考文献(0)
  • 二级参考文献(2)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(2)
  • 参考文献(0)
  • 二级参考文献(2)
1999(4)
  • 参考文献(0)
  • 二级参考文献(4)
2000(2)
  • 参考文献(0)
  • 二级参考文献(2)
2001(3)
  • 参考文献(0)
  • 二级参考文献(3)
2002(2)
  • 参考文献(0)
  • 二级参考文献(2)
2003(3)
  • 参考文献(0)
  • 二级参考文献(3)
2004(5)
  • 参考文献(0)
  • 二级参考文献(5)
2005(3)
  • 参考文献(2)
  • 二级参考文献(1)
2006(6)
  • 参考文献(0)
  • 二级参考文献(6)
2007(8)
  • 参考文献(1)
  • 二级参考文献(7)
2008(9)
  • 参考文献(1)
  • 二级参考文献(8)
2009(5)
  • 参考文献(2)
  • 二级参考文献(3)
2010(4)
  • 参考文献(1)
  • 二级参考文献(3)
2011(8)
  • 参考文献(1)
  • 二级参考文献(7)
2012(3)
  • 参考文献(2)
  • 二级参考文献(1)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2015(1)
  • 引证文献(1)
  • 二级引证文献(0)
2016(1)
  • 引证文献(1)
  • 二级引证文献(0)
2017(3)
  • 引证文献(3)
  • 二级引证文献(0)
2018(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
字符串相似度
相邻字符
词序
汉明距离
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用研究
月刊
1001-3695
51-1196/TP
大16开
1984-01-01
chi
出版文献量(篇)
21004
总下载数(次)
0
总被引数(次)
238385
论文1v1指导