基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对文本表示模型中语义信息提取不充分的问题,提出基于点互信息的CLSVSM (Co-occurrence Latent Semantic Vector Space Model)和语义增强的CLSVSM.首先利用点互信息计算关键词间的语义相似性,建立基于点互信息的CLSVSM;其次,通过潜在语义分析对关键词权重的修正,构建了语义增强的CLSVSM,改善了原模型对已有关键词权重不改变的不足.两种新模型都与CLSVSM、word2vec模型进行实验比较.结果 表明,基于点互信息的CLSVSM具有与原CLSVSM相当的聚类效果,而较word2vec有更好的聚类效果;语义增强的CLSVSM的聚类精度明显优于其他模型,以凡值为例,在3个数据集上分别较CLSVSM提高了2%、9.2%和12.3%,同时该模型的聚类精度也明显优于word2vec.语义增强的CLSVSM更优的聚类效果,将有效提高信息检索、文本聚类的准确性,降低检索成本.
推荐文章
基于向量空间模型结合语义的文本相似度算法
文本相似度
向量空间模型
语义
词频
召回率
特征项
基于最大特征点对互信息的图像配准
互信息
特征点对
图像配准
基于联合互信息的动液面预测模型
动液面
最小二乘支持向量机
联合互信息
动态模型
隐Markov模型互信息率存在定理
隐Markov模型
Cesaro平均收敛
互信息率
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于点互信息语义相似性的向量空间模型
来源期刊 山西大学学报(自然科学版) 学科
关键词 CLSVSM 语义增强 点互信息 文献聚类
年,卷(期) 2021,(2) 所属期刊栏目 基础数学与应用数学|Mathematics and Applied Mathematics
研究方向 页码范围 220-228
页数 9页 分类号 O213.9|G354
字数 语种 中文
DOI 10.13451/j.sxu.ns.2020001
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (170)
共引文献  (124)
参考文献  (23)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1948(1)
  • 参考文献(1)
  • 二级参考文献(0)
1974(1)
  • 参考文献(0)
  • 二级参考文献(1)
1975(2)
  • 参考文献(1)
  • 二级参考文献(1)
1977(1)
  • 参考文献(0)
  • 二级参考文献(1)
1983(1)
  • 参考文献(0)
  • 二级参考文献(1)
1989(3)
  • 参考文献(0)
  • 二级参考文献(3)
1990(3)
  • 参考文献(0)
  • 二级参考文献(3)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(3)
  • 参考文献(0)
  • 二级参考文献(3)
1997(2)
  • 参考文献(0)
  • 二级参考文献(2)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(8)
  • 参考文献(2)
  • 二级参考文献(6)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(3)
  • 参考文献(0)
  • 二级参考文献(3)
2002(3)
  • 参考文献(1)
  • 二级参考文献(2)
2003(9)
  • 参考文献(0)
  • 二级参考文献(9)
2004(3)
  • 参考文献(1)
  • 二级参考文献(2)
2005(8)
  • 参考文献(0)
  • 二级参考文献(8)
2006(7)
  • 参考文献(0)
  • 二级参考文献(7)
2007(11)
  • 参考文献(0)
  • 二级参考文献(11)
2008(4)
  • 参考文献(0)
  • 二级参考文献(4)
2009(9)
  • 参考文献(2)
  • 二级参考文献(7)
2010(16)
  • 参考文献(0)
  • 二级参考文献(16)
2011(15)
  • 参考文献(0)
  • 二级参考文献(15)
2012(15)
  • 参考文献(1)
  • 二级参考文献(14)
2013(14)
  • 参考文献(2)
  • 二级参考文献(12)
2014(11)
  • 参考文献(2)
  • 二级参考文献(9)
2015(15)
  • 参考文献(1)
  • 二级参考文献(14)
2016(9)
  • 参考文献(0)
  • 二级参考文献(9)
2017(4)
  • 参考文献(3)
  • 二级参考文献(1)
2018(6)
  • 参考文献(3)
  • 二级参考文献(3)
2019(2)
  • 参考文献(2)
  • 二级参考文献(0)
2020(1)
  • 参考文献(1)
  • 二级参考文献(0)
2021(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
CLSVSM
语义增强
点互信息
文献聚类
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
山西大学学报(自然科学版)
季刊
0253-2395
14-1105/N
大16开
太原市坞城路92号
22-42
1960
chi
出版文献量(篇)
2646
总下载数(次)
7
总被引数(次)
12039
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导