基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
在如今信息数据大爆炸的时代,数据的增长呈现指数级增长,而且其中大部分数据是非结构化数据,这些数据中蕴藏着大量且重要的知识等待着我们用合理的办法将其挖掘出来,如何方便合理快速的进行文本分类也是一个非常重要的课题。LDA模型是一种无监督的模型,它可以发现隐性的主题,为了更有效的发现隐性主题,本文提出一种基于半监督的LDA主题模型,找到一个主题集作为隐性层的知识集,通过这种方法找到的主题与文本更相关,另外,将LDA模型与基于半监督LDA模型应用于文本的特征提取,并与其它特征提取方法比对,实验表明,半监督LDA模型性能略好。
推荐文章
基于LDA-wSVM模型的文本分类研究
文本分类
潜在狄利克雷分布
支持向量机
权重计算
吉普斯抽样
一种半监督局部线性嵌入算法的文本分类方法
局部线性嵌入算法
半监督学习
流形学习
文本分类
核函数
半监督文本分类综述
文本分类
半监督学习
朴素贝叶斯
流形和谱图
基于LDA模型的文本分类研究
文本分类
潜在狄利克雷分配(LDA)模型
Gibbs抽样
贝叶斯统计理论
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于半监督LDA的文本分类应用研究
来源期刊 软件 学科 工学
关键词 文本分类 主题模型 LDA模型 半监督LDA
年,卷(期) 2014,(1) 所属期刊栏目 理论计算机科学
研究方向 页码范围 46-48
页数 3页 分类号 TP391.1
字数 2650字 语种 中文
DOI 10.3969/j.issn.1003-6970.2014.1.012
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 崔晓燕 北京邮电大学自动化学院 20 142 6.0 11.0
2 郑世卓 北京邮电大学自动化学院 1 19 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (10)
共引文献  (51)
参考文献  (5)
节点文献
引证文献  (19)
同被引文献  (69)
二级引证文献  (129)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(3)
  • 参考文献(1)
  • 二级参考文献(2)
2004(2)
  • 参考文献(1)
  • 二级参考文献(1)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(3)
  • 参考文献(0)
  • 二级参考文献(3)
2008(2)
  • 参考文献(1)
  • 二级参考文献(1)
2012(2)
  • 参考文献(2)
  • 二级参考文献(0)
2014(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2014(1)
  • 引证文献(1)
  • 二级引证文献(0)
2015(11)
  • 引证文献(3)
  • 二级引证文献(8)
2016(17)
  • 引证文献(5)
  • 二级引证文献(12)
2017(24)
  • 引证文献(4)
  • 二级引证文献(20)
2018(28)
  • 引证文献(4)
  • 二级引证文献(24)
2019(51)
  • 引证文献(2)
  • 二级引证文献(49)
2020(16)
  • 引证文献(0)
  • 二级引证文献(16)
研究主题发展历程
节点文献
文本分类
主题模型
LDA模型
半监督LDA
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
软件
月刊
1003-6970
12-1151/TP
16开
北京市3108信箱
1979
chi
出版文献量(篇)
9374
总下载数(次)
40
论文1v1指导