作者:
基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
向量空间模型是目前比较主流的文本表示模型,在多个领域内都有着很好的表现,但它却有着维度较高、不能有效提取特征词语义、文本表示稀疏等缺陷.针对以上不足,在传统的向量空间模型的基础上引入能高效获取语义的词向量,提出一种新的文本表示模型.该模型首先通过对特征词的词向量聚类,用聚类质心代表该类的其他特征词,求出聚类质心的TF-IDF权值,能够降低文本表示向量的维度、优化文本表示稀疏的问题和改进在计算TF-IDF权值中遇到的一词多义和同义词问题;再将聚类质心的权值与其词向量结合生成文本表示向量,使其能有效获取文本语义信息;最后用于文本分类.在搜狗语料库中验证该模型的有效性.
推荐文章
融合词向量特征的双词主题模型
主题模型
潜在狄利克雷分配
短文本
双词主题模型
词向量
吉布斯采样
基于特征权重的词向量文本表示模型
TF-IDF模型
N-Gram模型
Glove模型
文本表示
一种基于词义和词频的向量空间模型改进方法
文本分类
特征选择
卡方分布
向量空间模型
基于领域本体的文档向量空间模型构建
领域本体
向量空间模型
相似度
语义关系
基于领域本体向量空间模型
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于词向量的向量空间模型的改进
来源期刊 现代计算机 学科
关键词 向量空间模型 词向量 文本表示 文本分类
年,卷(期) 2018,(36) 所属期刊栏目 研究与开发
研究方向 页码范围 32-35,41
页数 5页 分类号
字数 3873字 语种 中文
DOI 10.3969/j.issn.1007-1423.2018.36.007
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 殷功俊 四川大学计算机学院 1 1 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (9)
共引文献  (75)
参考文献  (7)
节点文献
引证文献  (1)
同被引文献  (0)
二级引证文献  (0)
1975(1)
  • 参考文献(1)
  • 二级参考文献(0)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(1)
  • 参考文献(1)
  • 二级参考文献(0)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(1)
  • 参考文献(0)
  • 二级参考文献(1)
2011(1)
  • 参考文献(0)
  • 二级参考文献(1)
2015(2)
  • 参考文献(1)
  • 二级参考文献(1)
2016(6)
  • 参考文献(3)
  • 二级参考文献(3)
2018(1)
  • 参考文献(1)
  • 二级参考文献(0)
2018(1)
  • 参考文献(1)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2019(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
向量空间模型
词向量
文本表示
文本分类
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
现代计算机
旬刊
1007-1423
44-1415/TP
16开
广东省广州市
46-121
1984
chi
出版文献量(篇)
11312
总下载数(次)
39
总被引数(次)
33178
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导