基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
词嵌入技术能从大语料库中捕获词语的语义信息,将其与概率主题模型结合可解决标准主题模型缺乏语义信息的问题.为此,同时对词嵌入和主题模型进行改进,构建词-主题混合模型.在主题词嵌入(TWE)模型中引入外部语料库获得初始主题和单词表示,通过定义主题向量和词嵌入的条件概率分布,将词嵌入特征表示和主题向量集成到主题模型中,同时最小化新词-主题分布函数和原始词-主题分布函数的KL散度.实验结果表明,与Word2vec、TWE、LDA和LFLDA模型相比,该模型在词表示和主题检测方面性能更好.
推荐文章
基于CRFs模型的敏感话题识别研究
条件随机场
敏感话题识别
相关性概率值
基于贝叶斯信念网络的话题识别模型
话题识别
贝叶斯信念网络
报道
基于中心词的上下文主题模型
潜在狄利克雷分配
主题模型
上下文信息
融合词向量特征的双词主题模型
主题模型
潜在狄利克雷分配
短文本
双词主题模型
词向量
吉布斯采样
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于词嵌入与概率主题模型的社会媒体话题识别
来源期刊 计算机工程 学科 工学
关键词 社会媒体 话题检测 特征表示 词嵌入 话题模型 词-主题混合模型
年,卷(期) 2017,(12) 所属期刊栏目 人工智能及识别技术
研究方向 页码范围 184-191
页数 8页 分类号 TP18
字数 8091字 语种 中文
DOI 10.3969/j.issn.1000-3428.2017.12.034
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 傅向华 深圳大学计算机与软件学院 28 259 9.0 15.0
2 李晶 深圳大学计算机与软件学院 5 22 2.0 4.0
3 余冲 深圳大学计算机与软件学院 1 9 1.0 1.0
4 孙旭东 深圳大学计算机与软件学院 1 9 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (4)
共引文献  (3)
参考文献  (5)
节点文献
引证文献  (9)
同被引文献  (40)
二级引证文献  (2)
2003(3)
  • 参考文献(2)
  • 二级参考文献(1)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(1)
  • 参考文献(0)
  • 二级参考文献(1)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(1)
  • 参考文献(1)
  • 二级参考文献(0)
2017(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2018(1)
  • 引证文献(1)
  • 二级引证文献(0)
2019(4)
  • 引证文献(4)
  • 二级引证文献(0)
2020(6)
  • 引证文献(4)
  • 二级引证文献(2)
研究主题发展历程
节点文献
社会媒体
话题检测
特征表示
词嵌入
话题模型
词-主题混合模型
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程
月刊
1000-3428
31-1289/TP
大16开
上海市桂林路418号
4-310
1975
chi
出版文献量(篇)
31987
总下载数(次)
53
总被引数(次)
317027
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导