基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
传统的主题模型在进行文本分类时,特征词多选取统计规律下的高频词,而在专利文献分类中,多数专业词汇往往被高频词所淹没,造成主题模型在专利文献分类的准确率不高.对此,提出一种基于词加权的有监督LDA主题模型用于专利文献的分类.从专业词与高频词的共现关系出发,利用KeyGraph算法选取特征表征能力更优的关键词,再利用互信息函数计算各关键词权重,建立专业词字典.在此基础上,建立一个有监督的LDA模型,将词加权扩展至LDA模型,并采用Gibbs Sampling进行参数估计.在专利文献上进行分类实验,与LDA模型及其两种变型模型相比,该模型分类准确率分别平均提高了4.62%、3.74%和3.26%.表明该模型选取的高区分度的专业词汇与主题关联度更高,分类效率和准确率均有明显提高.
推荐文章
WPCA-LDA:一种数据分类新方法
主成分分析
线性判别分析
数据预处理
权值
数据分类
LSI_LDA:一种混合特征降维方法
文本分类
特征降维
潜在语义索引
潜在狄利克雷分配
基于LDA-wSVM模型的文本分类研究
文本分类
潜在狄利克雷分布
支持向量机
权重计算
吉普斯抽样
中国竹类文献分类与分析研究
竹类文献
分类系统
文献分析
重要值分析
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种基于词加权LDA模型的专利文献分类方法
来源期刊 计算机技术与发展 学科 工学
关键词 加权模型 LDA KeyGraph算法 专利文献分类
年,卷(期) 2019,(3) 所属期刊栏目 智能、算法、系统工程
研究方向 页码范围 23-29
页数 7页 分类号 TP18
字数 6852字 语种 中文
DOI 10.3969/j.issn.1673-629X.2019.03.005
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 孙伟 上海海事大学信息工程学院 22 126 6.0 11.0
2 葛丽阁 上海海事大学信息工程学院 4 11 2.0 3.0
3 刘文静 上海海事大学信息工程学院 1 6 1.0 1.0
4 余璇 上海海事大学信息工程学院 4 10 2.0 3.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (58)
共引文献  (79)
参考文献  (9)
节点文献
引证文献  (6)
同被引文献  (24)
二级引证文献  (2)
1975(1)
  • 参考文献(0)
  • 二级参考文献(1)
1990(2)
  • 参考文献(1)
  • 二级参考文献(1)
1993(1)
  • 参考文献(0)
  • 二级参考文献(1)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(2)
  • 参考文献(0)
  • 二级参考文献(2)
2002(2)
  • 参考文献(0)
  • 二级参考文献(2)
2003(8)
  • 参考文献(1)
  • 二级参考文献(7)
2004(2)
  • 参考文献(0)
  • 二级参考文献(2)
2005(5)
  • 参考文献(0)
  • 二级参考文献(5)
2006(3)
  • 参考文献(0)
  • 二级参考文献(3)
2007(2)
  • 参考文献(0)
  • 二级参考文献(2)
2008(3)
  • 参考文献(1)
  • 二级参考文献(2)
2009(6)
  • 参考文献(0)
  • 二级参考文献(6)
2010(6)
  • 参考文献(1)
  • 二级参考文献(5)
2011(9)
  • 参考文献(0)
  • 二级参考文献(9)
2012(4)
  • 参考文献(1)
  • 二级参考文献(3)
2013(3)
  • 参考文献(0)
  • 二级参考文献(3)
2014(1)
  • 参考文献(0)
  • 二级参考文献(1)
2015(4)
  • 参考文献(3)
  • 二级参考文献(1)
2016(1)
  • 参考文献(1)
  • 二级参考文献(0)
2019(6)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(5)
  • 二级引证文献(1)
2019(6)
  • 引证文献(5)
  • 二级引证文献(1)
2020(2)
  • 引证文献(1)
  • 二级引证文献(1)
研究主题发展历程
节点文献
加权模型
LDA
KeyGraph算法
专利文献分类
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机技术与发展
月刊
1673-629X
61-1450/TP
大16开
西安市雁塔路南段99号
52-127
1991
chi
出版文献量(篇)
12927
总下载数(次)
40
总被引数(次)
111596
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导