基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
目前对于中文影视剧本的分类主要借助人工经验,具有成本高、效率低等特点.当前没有针对中文影视剧本主题自动分类的相关研究,本文将对主题提取进行研究,传统主题生成模型借助于文档和段落、段落和语句、语句和词的相似性,而忽略了文本语句与语句之间的相似性.首先,采用ISOMAP方法降低样本集的向量空间维度;其次,提出交叉熵结合困惑度的算法模型,进而确定LDA需要提取的最优主题数目;最后,通过剧本-主题的方式,利用LDA算法挖掘剧本的隐含主题词,同时利用SVM对主题词做出进一步的分类.
推荐文章
基于LDA主题模型的中医药方剂相似度计算
LDA主题模型
古布斯采样
中医药信息
方剂相似度
基于WMF_LDA主题模型的文本相似度计算
词语语义
词语合并
词性筛选
文本相似度
基于SVM与物元信息熵的变压器健康度分析与预测
变压器
光声光谱
复合物元
AHP
关联熵
健康度
支持向量机
基于重叠度与完整度的LDA主题优选方法
LDA模型
TF-IDF
主题识别
重叠度
完整度
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于交叉熵与困惑度的LDA-SVM主题研究
来源期刊 智能计算机与应用 学科 工学
关键词 中文影视剧本 ISOMAP降维 LDA 交叉熵 困惑度 SVM
年,卷(期) 2019,(4) 所属期刊栏目 学术研究与应用
研究方向 页码范围 45-50
页数 6页 分类号 TP391.1
字数 4549字 语种 中文
DOI 10.3969/j.issn.2095-2163.2019.04.010
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 杨凡 西安建筑科技大学理学院 7 0 0.0 0.0
2 薛佳奇 西安建筑科技大学信息与控制工程学院 3 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (13)
共引文献  (21)
参考文献  (8)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1998(2)
  • 参考文献(0)
  • 二级参考文献(2)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(1)
  • 参考文献(1)
  • 二级参考文献(0)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(1)
  • 参考文献(0)
  • 二级参考文献(1)
2012(1)
  • 参考文献(0)
  • 二级参考文献(1)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(5)
  • 参考文献(2)
  • 二级参考文献(3)
2015(1)
  • 参考文献(0)
  • 二级参考文献(1)
2016(2)
  • 参考文献(1)
  • 二级参考文献(1)
2017(1)
  • 参考文献(1)
  • 二级参考文献(0)
2018(1)
  • 参考文献(1)
  • 二级参考文献(0)
2019(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
中文影视剧本
ISOMAP降维
LDA
交叉熵
困惑度
SVM
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
智能计算机与应用
双月刊
2095-2163
23-1573/TN
大16开
哈尔滨市南岗区繁荣街155号(哈工大新技术楼916室)
14-144
1985
chi
出版文献量(篇)
6183
总下载数(次)
26
总被引数(次)
14240
论文1v1指导