基于高通量测序的RNA-Seq(RNA-sequencing)是用于转录组研究的一种新技术,针对该技术在转录组表达分析研究中存在的读段多源映射和读段非均匀分布等难点,提出一个改进的转录组表达研究方法LDASeqⅡ(Improvement of latent Dirichlet allocation for sequencing data).模型利用剪接异构体结构信息对参数进行约束并进行外显子读段数目归一化处理,解决了读段非均匀分布下的多源映射问题.通过引入"伪外显子"和"伪转录本"分别处理接合区读段和噪声读段.将模型应用到真实数据集上,并与原LDASeq(Latent Dirichlet allocation for sequencing data)模型和目前流行的Cuff links与RSEM(RNA-Seq by expectation maximization)方法进行对比.结果显示,改进方法获得了更为准确的转录本及基因表达水平计算结果.