基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对基于EMD(Earth Mover's Distance)的文档语义相似性算法不满足度量公理因而难以在信息检索与数据挖掘中推广应用的问题,该文提出了一种新的基于EMD的文档语义相似性度量--Mdss EMD(Metric fordocument semantic similarity based EMD).首先在分析EMD及现有改进方法缺陷的基础上,给出了文档宽度、虚拟项的概念;随后通过增加虚拟项来对齐文档矢量的总权值,使所有度量公理得到满足;最后,为提高该度量的适应能力及处理速度,还实现了虚拟项相似距离的弹性设计并对EMD算法进行了简化.该方法把EMD扩展到度量空间中来,很大程度上提高了EMD的索引能力与精度,初步实验表明,Mdss EMD的整体性能优于原EMD及现有其它类似方法.
推荐文章
XML文档相似性度量方法研究
XML文档
相似性
约束
编辑距离
一种多元台风时间序列的相似性度量方法
相似性度量
多元时间序列
完整性
一致性
权值计算
动态时间弯曲
一种新的度量证据相似性测度方法
D-S证据理论
冲突证据
目标识别
一种移动物体时空轨迹聚类的相似性度量方法
时空数据挖掘
移动物体轨迹
轨迹聚类
轨迹相似性度量
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种基于EMD的文档语义相似性度量
来源期刊 电子与信息学报 学科 工学
关键词 信息检索 EMD(Earth Mover's Distance) 度量 文档相似性 匹配 语义距离
年,卷(期) 2008,(9) 所属期刊栏目 论文
研究方向 页码范围 2156-2161
页数 6页 分类号 TP391
字数 5751字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 王晓东 空军工程大学电讯工程学院 39 523 9.0 22.0
3 郭雷 西北工业大学自动化学院 262 2986 27.0 40.0
4 董淑福 空军工程大学电讯工程学院 89 650 14.0 20.0
5 方俊 西北工业大学自动化学院 17 171 6.0 13.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (6)
共引文献  (2)
参考文献  (3)
节点文献
引证文献  (9)
同被引文献  (14)
二级引证文献  (21)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(3)
  • 参考文献(1)
  • 二级参考文献(2)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(3)
  • 参考文献(1)
  • 二级参考文献(2)
2004(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2011(1)
  • 引证文献(1)
  • 二级引证文献(0)
2012(2)
  • 引证文献(2)
  • 二级引证文献(0)
2014(4)
  • 引证文献(2)
  • 二级引证文献(2)
2015(3)
  • 引证文献(1)
  • 二级引证文献(2)
2016(3)
  • 引证文献(1)
  • 二级引证文献(2)
2017(1)
  • 引证文献(0)
  • 二级引证文献(1)
2018(2)
  • 引证文献(1)
  • 二级引证文献(1)
2019(8)
  • 引证文献(1)
  • 二级引证文献(7)
2020(6)
  • 引证文献(0)
  • 二级引证文献(6)
研究主题发展历程
节点文献
信息检索
EMD(Earth Mover's Distance)
度量
文档相似性
匹配
语义距离
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
电子与信息学报
月刊
1009-5896
11-4494/TN
大16开
北京市北四环西路19号
2-179
1979
chi
出版文献量(篇)
9870
总下载数(次)
11
总被引数(次)
95911
论文1v1指导