基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
This contribution deals with a generative approach for the analysis of textual data. Instead of creating heuristic rules forthe representation of documents and word counts, we employ a distribution able to model words along texts considering different topics. In this regard, following Minka proposal (2003), we implement a Dirichlet Compound Multinomial (DCM) distribution, then we propose an extension called sbDCM that takes explicitly into account the different latent topics that compound the document. We follow two alternative approaches: on one hand the topics can be unknown, thus to be estimated on the basis of the data, on the other hand topics are determined in advance on the basis of a predefined ontological schema. The two possible approaches are assessed on the basis of real data.
推荐文章
Spatial prediction of landslide susceptibility using GIS-based statistical and machine learning mode
Landslide susceptibility mapping
Statistical model
Machine learning model
Four cases
下侧Dirichlet级数与下侧随机Dirichlet级数
下侧Dirichlet级数
下侧随机Dirichlet级数
增长性
左半平面
零(R)级解析Dirichlet级数
Dirichlet 级数
准确零(R)级
增长性
三重Dirichlet级数收敛性
三重Dirichlet级数
收敛性
Vaaliron公式
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 Dirichlet Compound Multinomials Statistical Models
来源期刊 应用数学(英文) 学科 医学
关键词 TEXTUAL Data Analysis MIXTURE Models ONTOLOGY SCHEMA Reputational Risk
年,卷(期) 2012,(12) 所属期刊栏目
研究方向 页码范围 2089-2097
页数 9页 分类号 R73
字数 语种
DOI
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2012(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
TEXTUAL
Data
Analysis
MIXTURE
Models
ONTOLOGY
SCHEMA
Reputational
Risk
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
应用数学(英文)
月刊
2152-7385
武汉市江夏区汤逊湖北路38号光谷总部空间
出版文献量(篇)
1878
总下载数(次)
0
总被引数(次)
0
论文1v1指导