基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对当前句子检索方法中因数据稀疏而存在的“词不匹配”问题,提出了一种WordNet和词向量相结合的句子检索方法.首先在WordNet语义关系图中应用个性化PageRank算法计算与查询项最相关的同义词集合,实现查询项扩展,从而在一定程度上解决了查询项数据稀疏的问题;然后利用在大规模语料中训练神经网络语言模型获取的词向量对查询项和句子进行表示;最后引入WMD(word mover's distance)计算查询项与句子的语义相似度,从而利用语义信息进一步降低“词不匹配”问题带来的影响,将句子按相似度值从高到低排序作为句子检索结果.文章方法在TREC2003和TREC2004会议的项目中进行评测,MAP和R-Precision值相较于次优结果分别提高了13.29%和13.54%.
推荐文章
基于词向量的句子相似度计算及其应用研究
计算机辅助翻译
相似度计算
词向量
IAT系统
NMF和Isomap相结合的图像检索新方法
非负矩阵分解
数据降维
多维尺度分析
Isomap
图像检索
一种规则与统计相结合的应用题句子语义角色识别方法
应用题自动求解
题意理解
语义角色
特征词
n-gram
基于词向量与TextRank的关键词提取方法
抽取
语义差异性
TextRank
词向量
隐含主题分布
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 WordNet和词向量相结合的句子检索方法
来源期刊 信息工程大学学报 学科 工学
关键词 WordNet 查询项扩展 词向量 语义相似度 句子检索
年,卷(期) 2017,(4) 所属期刊栏目 计算机技术与应用
研究方向 页码范围 486-491
页数 6页 分类号 TP391.1
字数 5219字 语种 中文
DOI 10.3969/j.issn.1671-0673.2017.04.020
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 魏晗 11 23 3.0 4.0
2 王波 21 524 6.0 21.0
3 席耀一 5 13 3.0 3.0
4 刘欣 5 5 1.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (1)
共引文献  (4)
参考文献  (7)
节点文献
引证文献  (3)
同被引文献  (9)
二级引证文献  (1)
1986(1)
  • 参考文献(1)
  • 二级参考文献(0)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(1)
  • 参考文献(1)
  • 二级参考文献(0)
2017(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2019(3)
  • 引证文献(3)
  • 二级引证文献(0)
2020(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
WordNet
查询项扩展
词向量
语义相似度
句子检索
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
信息工程大学学报
双月刊
1671-0673
41-1196/N
大16开
郑州市科学大道62号
2000
chi
出版文献量(篇)
2792
总下载数(次)
2
论文1v1指导