基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
常见的词嵌入向量模型存在每个词只具有一个词向量的问题,词的主题值是重要的多义性条件,可以作为获得多原型词向量的附加信息.在skip-gram(cbow)模型和文本主题结构基础上,该文研究了两种改进的多原型词向量方法和基于词与主题的嵌入向量表示的文本生成结构.该模型通过联合训练,能同时获得文本主题、词和主题的嵌入向量,实现了使用词的主题信息获得多原型词向量,和使用词和主题的嵌入式向量学习文本主题.实验表明,该文提出的方法不仅能够获得具有上下文语义的多原型词向量,也可以获得关联性更强的文本主题.
推荐文章
融合词向量特征的双词主题模型
主题模型
潜在狄利克雷分配
短文本
双词主题模型
词向量
吉布斯采样
基于向量空间模型的多主题Web文本分类方法
向量空间模型
文本分类
多主题
数据挖掘
基于特征权重的词向量文本表示模型
TF-IDF模型
N-Gram模型
Glove模型
文本表示
词共现文本主题聚类算法
词共现
关联规则
数据挖掘
层次聚类
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 多原型词向量与文本主题联合学习模型
来源期刊 中文信息学报 学科 工学
关键词 多原型词向量 多义词 主题模型 神经网络
年,卷(期) 2020,(3) 所属期刊栏目 信息抽取与文本挖掘
研究方向 页码范围 64-71,106
页数 9页 分类号 TP391
字数 7963字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 曹中华 江西财经大学信息管理学院财政大数据中心 10 49 4.0 7.0
3 夏家莉 江西财经大学信息管理学院财政大数据中心 26 268 7.0 16.0
6 张志斌 江西财经大学信息管理学院财政大数据中心 2 1 1.0 1.0
7 彭文忠 江西财经大学信息管理学院财政大数据中心 2 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (3)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2003(2)
  • 参考文献(2)
  • 二级参考文献(0)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2020(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
多原型词向量
多义词
主题模型
神经网络
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
中文信息学报
月刊
1003-0077
11-2325/N
16开
北京海淀区中关村南四街4号
1986
chi
出版文献量(篇)
2723
总下载数(次)
5
总被引数(次)
45413
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导