基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
为了改进传统以向量空间模型(VSM)为代表的基于词频统计的方法在中文段落相似度计算时存在的精度不高问题,在基于加权二部图匹配的思想上提出了一种计算中文段落之间相似度的方法.该方法将相似度计算分为段落和句子两个层次,将句子作为简单段落看待,也使用二部图匹配进行相似度计算.首先利用句子主干词汇提取算法来提取句子的主干词汇,将主干词汇作为二部图的顶点,把主干词汇之间的相似度作为二部图顶点之间的权值系数,进行句子相似度的计算.其次,将句子作为加权二部图的顶点,把句子之间的相似度作为二部图顶点之间的权值系数,进行段落之间的相似度计算.实验结果表明,该方法与VSM相比,由于它能准确识别同义词,自动匹配两个在段落中不同位置的相似词语,因而在准确度上有了很大的提高.
推荐文章
基于自适应加权二部图的多特征目标匹配
多特征
目标匹配
自适应加权二部图
Kuhn-Munkres算法
MAP问题
基于二部图模型的大本体分块与映射方法
大本体
二部图
分块
映射
最佳匹配
映射修正
基于用户兴趣度的改进二部图随机游走推荐方法
个性化推荐
二部图
兴趣度
随机游走
基于加权二部图的Slope One推荐算法
推荐系统
Slope One
加权二部图
5-折交叉验证
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于加权二部图匹配的中文段落相似度计算
来源期刊 计算机工程与应用 学科 工学
关键词 段落相似度 句子主干提取 二部图匹配 向量空间模型 中文分词
年,卷(期) 2017,(18) 所属期刊栏目 模式识别与人工智能
研究方向 页码范围 95-101
页数 7页 分类号 TP301
字数 8334字 语种 中文
DOI 10.3778/j.issn.1002-8331.1603-0302
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 张绍阳 长安大学信息工程学院 42 258 9.0 14.0
2 曲卫东 长安大学信息工程学院 2 3 1.0 1.0
3 曹家波 长安大学信息工程学院 1 3 1.0 1.0
4 王子凡 长安大学信息工程学院 1 3 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (95)
共引文献  (231)
参考文献  (18)
节点文献
引证文献  (3)
同被引文献  (18)
二级引证文献  (0)
1955(1)
  • 参考文献(0)
  • 二级参考文献(1)
1975(1)
  • 参考文献(0)
  • 二级参考文献(1)
1979(1)
  • 参考文献(0)
  • 二级参考文献(1)
1990(1)
  • 参考文献(0)
  • 二级参考文献(1)
1991(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(3)
  • 参考文献(0)
  • 二级参考文献(3)
1999(3)
  • 参考文献(0)
  • 二级参考文献(3)
2001(3)
  • 参考文献(0)
  • 二级参考文献(3)
2003(6)
  • 参考文献(0)
  • 二级参考文献(6)
2004(6)
  • 参考文献(0)
  • 二级参考文献(6)
2005(3)
  • 参考文献(0)
  • 二级参考文献(3)
2006(4)
  • 参考文献(0)
  • 二级参考文献(4)
2007(9)
  • 参考文献(1)
  • 二级参考文献(8)
2008(5)
  • 参考文献(0)
  • 二级参考文献(5)
2009(5)
  • 参考文献(0)
  • 二级参考文献(5)
2010(17)
  • 参考文献(2)
  • 二级参考文献(15)
2011(11)
  • 参考文献(1)
  • 二级参考文献(10)
2012(12)
  • 参考文献(1)
  • 二级参考文献(11)
2013(7)
  • 参考文献(2)
  • 二级参考文献(5)
2014(8)
  • 参考文献(8)
  • 二级参考文献(0)
2015(4)
  • 参考文献(3)
  • 二级参考文献(1)
2017(1)
  • 参考文献(0)
  • 二级参考文献(1)
2017(2)
  • 参考文献(0)
  • 二级参考文献(1)
  • 引证文献(1)
  • 二级引证文献(0)
2017(1)
  • 引证文献(1)
  • 二级引证文献(0)
2019(1)
  • 引证文献(1)
  • 二级引证文献(0)
2020(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
段落相似度
句子主干提取
二部图匹配
向量空间模型
中文分词
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程与应用
半月刊
1002-8331
11-2127/TP
大16开
北京619信箱26分箱
82-605
1964
chi
出版文献量(篇)
39068
总下载数(次)
102
总被引数(次)
390217
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导