一种具有降噪能力的概率主题模型

李晶; 秦永彬; 黄瑞章

文献导航

搜索文章

搜索思路

一种具有降噪能力的概率主题模型

作者：

李晶秦永彬黄瑞章

基本信息来源于合作网站，原文需代理用户跳转至来源网站获取

概率主题模型

隐含狄利克雷分布

吉布斯抽样

降噪

摘要：

大数据时代的到来使得文本数据的数据量暴增,因此准确而高效地识别和分析文本数据的潜在结构变得越来越重要.要从海量的数据中挖掘模式和知识,需要借助于强大的计算工具,所以机器学习科学家提出了概率主题模型.当前,以隐含狄利克雷分布(LDA)模型为代表的经典概率主题模型已经被广泛地应用到数据挖掘的各个方面.由于LDA模型对区分相似主题的能力非常差,影响了LDA的实际应用性能,为解决这一重要问题,论文基于LDA模型提出了一种名为NRLDA的新模型.考虑到相似主题的文本中存在大量的对区分不同主题没有贡献的噪音词语,在NRLDA中引入了相关变量来区分有用词和噪音词,使噪音词从一个噪音主题的词分布中产生,而有用词从多个特征主题的词分布中产生,从而削弱噪音词所带来的不良影响.此外,我们还使用吉布斯抽样方法对NRLDA的参数进行了推断,这些参数对分析文本数据中潜藏的结构有至关重要的作用.实验结果表明我们的NRLDA模型有较强的区分相似主题的能力,这同时也验证了我们建模思想的正确性.

内容分析

关键词云

关键词热度

相关文献

推荐文献

根据相关规定，获取原文需跳转至原文服务方进行注册认证身份信息

完成下面三个步骤操作后即可获取文献，阅读后请点击下方页面【继续获取】按钮

钛学术文献服务平台

学术出版新技术应用与公共服务实验室出品

原文合作方

获取文献流程

1.访问原文合作方请等待几秒系统会自动跳转至登录页，首次访问请先注册账号，填写基本信息后，点击【注册】

2.注册后进行实名认证，实名认证成功后点击【返回】

3.检查邮箱地址是否正确，若错误或未填写请填写正确邮箱地址，点击【确认支付】完成获取，文献将在1小时内发送至您的邮箱

*若已注册过原文合作方账号的用户，可跳过上述操作，直接登录后获取原文即可

点击【获取原文】按钮，跳转至合作网站。

首次获取需要在合作网站进行注册。

注册并实名认证，认证后点击【返回】按钮。

确认邮箱信息，点击【确认支付】，订单将在一小时内发送至您的邮箱。

* 若已经注册过合作网站账号，请忽略第二、三步，直接登录即可。

期刊分类
期刊（年）
期刊（期）
期刊推荐

一般工业技术交通运输军事科技冶金工业动力工程化学工业原子能技术大学学报建筑科学无线电电子学与电信技术机械与仪表工业水利工程环境科学与安全科学电工技术石油与天然气工业矿业工程自动化技术与计算机技术航空航天轻工业与手工业金属学与金属工艺

计算机与数字工程2017年第9期计算机与数字工程2017年第8期计算机与数字工程2017年第7期计算机与数字工程2017年第6期计算机与数字工程2017年第5期计算机与数字工程2017年第4期计算机与数字工程2017年第3期计算机与数字工程2017年第2期计算机与数字工程2017年第12期计算机与数字工程2017年第11期计算机与数字工程2017年第10期计算机与数字工程2017年第1期

按字母查找期刊：

A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他

联系合作广告推广: shenyukuan@paperpass.com

篇名	一种具有降噪能力的概率主题模型
来源期刊	计算机与数字工程	学科	工学
关键词	概率主题模型隐含狄利克雷分布吉布斯抽样降噪
年，卷（期）	2017,（2）	所属期刊栏目	信息处理与网络安全
研究方向		页码范围	367-372
页数	6页	分类号	TP181
字数	5431字	语种	中文
DOI	10.3969/j.issn.1672-9722.2017.02.032

序号	姓名	发文数	被引次数	H指数	G指数
1	秦永彬	63	213	8.0	10.0
3	黄瑞章	16	47	4.0	6.0
7	李晶	2	1	1.0	1.0