作者:
基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
评论文本中的词符合幂律分布,使LDA模型词的分布偏向高频词,导致主题相似度大,表达能力下降.提出幂函数加权LDA(Latent Dirichlet Allocation)模型以提高低频词的表达能力.使用iForest算法,选择出与众不同且具有价值的评论集合.实验结果表明,选择的评论子集特征覆盖率较高,且有较高的平均信息量.
推荐文章
基于在线评论和改进LDA模型的新闻传播推荐技术研究
新闻传播
在线评论
LDA模型
推荐结果生成
相似度预测
关联度计算
基于权重微博链的改进LDA微博主题模型
短文本
主题挖掘
微博链
潜在狄利克雷分布
perplexity
基于LDA模型的餐馆评论排序
LDA模型
餐馆评论
排序
观点挖掘
逻辑回归
基于数据集对象平均离群因子的离群点选择算法
离群点
局部偏离因子
加权属性
数据挖掘
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于改进LDA模型的离群评论选择
来源期刊 软件导刊 学科 工学
关键词 LDA iForest 特征覆盖率 平均信息量
年,卷(期) 2018,(1) 所属期刊栏目 软件理论与方法
研究方向 页码范围 38-40
页数 3页 分类号 TP301
字数 1915字 语种 中文
DOI 10.11907/rjdk.172218
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 董振涛 西安石油大学计算机学院 3 2 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (18)
共引文献  (75)
参考文献  (5)
节点文献
引证文献  (1)
同被引文献  (12)
二级引证文献  (2)
1973(1)
  • 参考文献(0)
  • 二级参考文献(1)
1975(1)
  • 参考文献(0)
  • 二级参考文献(1)
1990(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(3)
  • 参考文献(0)
  • 二级参考文献(3)
2004(2)
  • 参考文献(0)
  • 二级参考文献(2)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(2)
  • 参考文献(0)
  • 二级参考文献(2)
2009(2)
  • 参考文献(0)
  • 二级参考文献(2)
2010(2)
  • 参考文献(1)
  • 二级参考文献(1)
2012(3)
  • 参考文献(1)
  • 二级参考文献(2)
2013(2)
  • 参考文献(1)
  • 二级参考文献(1)
2015(2)
  • 参考文献(2)
  • 二级参考文献(0)
2018(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2019(2)
  • 引证文献(1)
  • 二级引证文献(1)
2020(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
LDA
iForest
特征覆盖率
平均信息量
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
软件导刊
月刊
1672-7800
42-1671/TP
16开
湖北省武汉市
38-431
2002
chi
出版文献量(篇)
9809
总下载数(次)
57
总被引数(次)
30383
论文1v1指导