基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
由于文档中的词符合幂律分布,使得LDA模型的主题分布向高频词倾斜,导致能够代表主题的多数词被少量的高频词淹没使得主题表达能力降低.通过一种高斯函数对特征词加权,改进LDA主题模型的主题分布.实验显示加权LDA模型获得的主题间的相关性以及复杂度(Perplexity)值都降低,说明改进模型在主题表达和预测性能方面都有所提高.
推荐文章
基于权重微博链的改进LDA微博主题模型
短文本
主题挖掘
微博链
潜在狄利克雷分布
perplexity
一种结合主题模型的推荐算法
推荐算法
矩阵分解
隐式狄利克雷分布
KL散度
主题模型
LSI_LDA:一种混合特征降维方法
文本分类
特征降维
潜在语义索引
潜在狄利克雷分配
基于LDA主题模型的用户电信轨迹恢复算法
电信轨迹
轨迹恢复
LDA主题模型
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种改进的LDA主题模型
来源期刊 北京交通大学学报 学科 工学
关键词 LDA Dirichlet分布 加权主题模型
年,卷(期) 2010,(2) 所属期刊栏目 计算机与信息技术
研究方向 页码范围 111-114
页数 4页 分类号 TP391.43
字数 2749字 语种 中文
DOI 10.3969/j.issn.1673-0291.2010.02.025
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 陈世波 32 251 8.0 15.0
2 周雪忠 北京交通大学计算机与信息技术学院 53 1039 17.0 31.0
3 黄厚宽 北京交通大学计算机与信息技术学院 139 2476 26.0 44.0
4 焦宏官 中国中医科学院中医药信息研究所 17 129 4.0 11.0
5 张小平 北京交通大学计算机与信息技术学院 3 82 2.0 3.0
6 冯奇 北京交通大学计算机与信息技术学院 5 97 3.0 5.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (5)
节点文献
引证文献  (64)
同被引文献  (105)
二级引证文献  (166)
1990(1)
  • 参考文献(1)
  • 二级参考文献(0)
2001(1)
  • 参考文献(1)
  • 二级参考文献(0)
2003(1)
  • 参考文献(1)
  • 二级参考文献(0)
2004(1)
  • 参考文献(1)
  • 二级参考文献(0)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2011(1)
  • 引证文献(1)
  • 二级引证文献(0)
2012(4)
  • 引证文献(4)
  • 二级引证文献(0)
2013(3)
  • 引证文献(3)
  • 二级引证文献(0)
2014(12)
  • 引证文献(8)
  • 二级引证文献(4)
2015(24)
  • 引证文献(7)
  • 二级引证文献(17)
2016(32)
  • 引证文献(10)
  • 二级引证文献(22)
2017(45)
  • 引证文献(10)
  • 二级引证文献(35)
2018(53)
  • 引证文献(11)
  • 二级引证文献(42)
2019(42)
  • 引证文献(8)
  • 二级引证文献(34)
2020(14)
  • 引证文献(2)
  • 二级引证文献(12)
研究主题发展历程
节点文献
LDA
Dirichlet分布
加权主题模型
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
北京交通大学学报
双月刊
1673-0291
11-5258/U
大16开
北京西直门外上园村3号
1975
chi
出版文献量(篇)
3626
总下载数(次)
7
总被引数(次)
38401
相关基金
国家科技支撑计划
英文译名:
官方网址:http://kjzc.jhgl.org/
项目类型:重大项目
学科类型:能源
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导