基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
文本语义相关度计算在自然语言处理、语义信息检索等方面起着重要作用,以Wikipedia为知识库,基于词汇特征的ESA(Explicit Semantic Analysis)因简单有效的特点在这些领域中受到学术界的广泛关注和应用.然而其语义相关度计算因为有大量冗余概念的参与变成了一种高维度、低效率的计算方式,同时也忽略了文本所属主题因素对语义相关度计算的作用.引入LDA(Latent Dirichlet Allocation)主题模型,对ESA返回的相关度较高的概念转换为模型的主题概率向量,从而达到降低维度和提高效率的目的;将JSD距离(Jensen-Shannon Divergence)替换余弦距离的测量方法,使得文本语义相关度计算更加合理和有效.最后对不同层次的数据集进行算法的测试评估,结果表明混合词汇特征和主题模型的语义相关度计算方法的皮尔逊相关系数比ESA和LDA分别高出3%和9%以上.
推荐文章
基于知网的词汇语义相似度计算方法研究
知网
描述语言结构
词汇相似度
补充义原
基于词汇语义信息的文本相似度计算
文本相似度
词向量
词频—逆文档频率
利用词汇分布相似度的中文词汇语义倾向性计算
中文信息处理
词汇分布相似度
语义倾向
依存句法分析
知网
一种PST_LDA中文文本相似度计算方法
词性标注
LDA模型
PST_LDA模型
文本相似度计算
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 混合词汇特征和LDA的语义相关度计算方法
来源期刊 计算机工程与应用 学科 工学
关键词 主题模型 词汇特征 显式语义分析(ESA) 隐含狄利克雷分布(LDA) 语义相关度计算
年,卷(期) 2017,(12) 所属期刊栏目 模式识别与人工智能
研究方向 页码范围 152-157,165
页数 7页 分类号 TP391
字数 4597字 语种 中文
DOI 10.3778/j.issn.1002-8331.1606-0088
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 蒋运承 华南师范大学计算机学院 22 57 5.0 5.0
2 肖宝 钦州学院电子与信息工程学院 11 42 4.0 6.0
3 李璞 华南师范大学计算机学院 15 33 3.0 4.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (17)
共引文献  (24)
参考文献  (12)
节点文献
引证文献  (5)
同被引文献  (17)
二级引证文献  (4)
1975(1)
  • 参考文献(1)
  • 二级参考文献(0)
1990(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(3)
  • 参考文献(1)
  • 二级参考文献(2)
2004(1)
  • 参考文献(1)
  • 二级参考文献(0)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(4)
  • 参考文献(1)
  • 二级参考文献(3)
2009(4)
  • 参考文献(0)
  • 二级参考文献(4)
2010(1)
  • 参考文献(0)
  • 二级参考文献(1)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(4)
  • 参考文献(1)
  • 二级参考文献(3)
2013(2)
  • 参考文献(2)
  • 二级参考文献(0)
2015(2)
  • 参考文献(2)
  • 二级参考文献(0)
2016(1)
  • 参考文献(1)
  • 二级参考文献(0)
2017(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2018(1)
  • 引证文献(1)
  • 二级引证文献(0)
2019(6)
  • 引证文献(3)
  • 二级引证文献(3)
2020(2)
  • 引证文献(1)
  • 二级引证文献(1)
研究主题发展历程
节点文献
主题模型
词汇特征
显式语义分析(ESA)
隐含狄利克雷分布(LDA)
语义相关度计算
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程与应用
半月刊
1002-8331
11-2127/TP
大16开
北京619信箱26分箱
82-605
1964
chi
出版文献量(篇)
39068
总下载数(次)
102
总被引数(次)
390217
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导