原文服务方: 计算机应用研究       
摘要:
为了解决多源异构民航旅客服务数据集成过程中存在多模式匹配的效率不高、精确性不足、完整模式信息获取难度较大等问题,提出了一种基于SimHash和混合相似度的多模式匹配方法.该方法首先基于PMI计算特征单元权重,并通过SimHash算法构造属性列的签名来表示属性特征,以降低特征维度,进而引入K-means++算法对属性聚类并生成候选匹配集.最后基于属性的混合相似度构建属性映射图,以直观的方式展示属性间的匹配关系,同时提高多模式匹配效率.实验结果表明该方法具有可行性,为高效地解决多源异构民航旅客服务数据集成中的模式冲突问题提供新的解决方案.
推荐文章
多策略相似度整合的XML模式匹配方法
数据交换
模式匹配
可扩展标记语言(XML)
相似度度量
多策略组合
基于语义的服务混合匹配方法研究
Web服务
服务匹配
混合匹配
功能描述模型
基于素数的多源模式匹配方法的研究
在线数据库
多源模式匹配
数据集成
素数
复杂匹配
基于Simhash的协议数据高频相似序列提取算法
协议分析
二进制序列
Simhash
高频相似序列
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于SimHash和混合相似度的多模式匹配方法
来源期刊 计算机应用研究 学科
关键词 多模式匹配 签名 点互信息 混合相似度 属性映射图
年,卷(期) 2020,(1) 所属期刊栏目 系统应用开发
研究方向 页码范围 198-202
页数 5页 分类号 TP311
字数 语种 中文
DOI 10.19734/j.issn.1001-3695.2018.06.0462
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 曹卫东 中国民航大学计算机科学与技术学院 39 264 10.0 15.0
2 王静 中国民航大学计算机科学与技术学院 41 100 5.0 8.0
3 王家亮 中国民航大学计算机科学与技术学院 13 19 2.0 4.0
4 胡炜 中国民航大学计算机科学与技术学院 2 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (26)
共引文献  (5)
参考文献  (7)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1965(1)
  • 参考文献(0)
  • 二级参考文献(1)
1989(2)
  • 参考文献(0)
  • 二级参考文献(2)
1991(1)
  • 参考文献(0)
  • 二级参考文献(1)
1992(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(2)
  • 参考文献(0)
  • 二级参考文献(2)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(3)
  • 参考文献(1)
  • 二级参考文献(2)
2001(2)
  • 参考文献(0)
  • 二级参考文献(2)
2002(2)
  • 参考文献(0)
  • 二级参考文献(2)
2003(2)
  • 参考文献(0)
  • 二级参考文献(2)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(2)
  • 参考文献(1)
  • 二级参考文献(1)
2009(3)
  • 参考文献(0)
  • 二级参考文献(3)
2010(1)
  • 参考文献(0)
  • 二级参考文献(1)
2012(1)
  • 参考文献(0)
  • 二级参考文献(1)
2013(2)
  • 参考文献(0)
  • 二级参考文献(2)
2015(2)
  • 参考文献(1)
  • 二级参考文献(1)
2016(1)
  • 参考文献(1)
  • 二级参考文献(0)
2017(3)
  • 参考文献(3)
  • 二级参考文献(0)
2020(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
多模式匹配
签名
点互信息
混合相似度
属性映射图
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用研究
月刊
1001-3695
51-1196/TP
大16开
1984-01-01
chi
出版文献量(篇)
21004
总下载数(次)
0
总被引数(次)
238385
论文1v1指导