基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
有监督的隐狄里克雷分配(s-LDA)模型在分类时不能处理多标签问题,且存在部分主题未正确分配从而导致分配主题精确度下降.为此,在给予响应变量的基础上加入类别标签,构建一种带标签的有监督的隐狄里克雷分配(sl-LDA)模型.分析s-LDA模型以及该模型主题分类存在的问题,通过验证sl-LDA模型的分类精度,对sl-LDA模型与s-LDA模型进行新闻主题分类实验.在中文和英文新闻语料库上的实验结果表明,英文语料库分类精度提高约3.80%,中文语料库提高约1.77%.
推荐文章
一种PST_LDA中文文本相似度计算方法
词性标注
LDA模型
PST_LDA模型
文本相似度计算
基于LDA-wSVM模型的文本分类研究
文本分类
潜在狄利克雷分布
支持向量机
权重计算
吉普斯抽样
一种改进的图像中的文本检测模型
深度神经网络
文本检测
实例分割
LSI_LDA:一种混合特征降维方法
文本分类
特征降维
潜在语义索引
潜在狄利克雷分配
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种改进的Supervised-LDA文本模型及其应用
来源期刊 计算机工程 学科 工学
关键词 s-LDA模型 响应变量 新闻主题 主题模型 类别标签
年,卷(期) 2018,(1) 所属期刊栏目 先进计算与数据处理
研究方向 页码范围 69-73,78
页数 6页 分类号 TP391
字数 4876字 语种 中文
DOI 10.3969/j.issn.1000-3428.2018.01.011
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 黄恒君 兰州财经大学统计学院 13 55 5.0 7.0
2 许腾腾 兰州财经大学统计学院 2 5 1.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (77)
共引文献  (138)
参考文献  (15)
节点文献
引证文献  (4)
同被引文献  (17)
二级引证文献  (1)
1975(1)
  • 参考文献(0)
  • 二级参考文献(1)
1990(5)
  • 参考文献(1)
  • 二级参考文献(4)
1991(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(1)
  • 参考文献(1)
  • 二级参考文献(0)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(2)
  • 参考文献(0)
  • 二级参考文献(2)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(2)
  • 参考文献(1)
  • 二级参考文献(1)
2003(12)
  • 参考文献(1)
  • 二级参考文献(11)
2004(5)
  • 参考文献(0)
  • 二级参考文献(5)
2005(4)
  • 参考文献(0)
  • 二级参考文献(4)
2006(2)
  • 参考文献(0)
  • 二级参考文献(2)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(7)
  • 参考文献(1)
  • 二级参考文献(6)
2010(3)
  • 参考文献(1)
  • 二级参考文献(2)
2011(8)
  • 参考文献(0)
  • 二级参考文献(8)
2012(9)
  • 参考文献(1)
  • 二级参考文献(8)
2013(11)
  • 参考文献(1)
  • 二级参考文献(10)
2014(5)
  • 参考文献(1)
  • 二级参考文献(4)
2015(5)
  • 参考文献(1)
  • 二级参考文献(4)
2016(5)
  • 参考文献(5)
  • 二级参考文献(0)
2018(2)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(2)
  • 二级引证文献(0)
2018(2)
  • 引证文献(2)
  • 二级引证文献(0)
2019(2)
  • 引证文献(2)
  • 二级引证文献(0)
2020(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
s-LDA模型
响应变量
新闻主题
主题模型
类别标签
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程
月刊
1000-3428
31-1289/TP
大16开
上海市桂林路418号
4-310
1975
chi
出版文献量(篇)
31987
总下载数(次)
53
总被引数(次)
317027
论文1v1指导