原文服务方: 计算机应用研究       
摘要:
针对现有很多文本分类算法必须进行训练一测试一再训练的缺点以及通用模型的语法表现度较差等问题,提出一种改进的模糊语法算法(IFGA).根据一些选取的文本片段建立学习模型;为了适应轻微变化,采用增量式模型,将选取的文本片段转换到底层架构中,形成模糊语法;利用模糊联合操作将单个文本片段语法进行整合,并将所学习的文本片段转换成更加一般的表示形式.与决策表算法、改进的朴素贝叶斯算法等进行了两组对比实验,第一个实验结果表明,IFGA和其他机器学习算法性能并无明显差异;第二个实验结果说明,增量式学习算法比标准机器学习算法更加具有优势,其性能较平稳,数据的尺寸影响更小.提出的算法具有较低的模型重新训练时间.
推荐文章
基于模糊K最近邻和证据理论的增量式超文本分类方法
超文本分类
模糊K最近邻
证据理论
基于聚类改进的 KN N文本分类算法
文本分类
KNN
聚类化
训练集
基于改进KNFL算法的海量文本分类研究
K最近特征线
离群点
类中心距
基于模糊聚类的文本分类器
文本分类
模糊聚类
编网法
模糊相似度
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于改进模糊语法增量式算法的文本分类方法
来源期刊 计算机应用研究 学科
关键词 文本分类 机器学习 增量式 模糊语法 重新训练
年,卷(期) 2017,(11) 所属期刊栏目 系统应用开发
研究方向 页码范围 3355-3358,3378
页数 5页 分类号 TP391.1
字数 语种 中文
DOI 10.3969/j.issn.1001-3695.2017.11.034
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 龚静 湖南环境生物职业技术学院信息技术系 61 321 10.0 15.0
2 黄欣阳 南华大学计算机学院 15 53 3.0 6.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (79)
共引文献  (335)
参考文献  (11)
节点文献
引证文献  (3)
同被引文献  (12)
二级引证文献  (1)
1990(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(2)
  • 参考文献(0)
  • 二级参考文献(2)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(2)
  • 参考文献(0)
  • 二级参考文献(2)
2002(2)
  • 参考文献(0)
  • 二级参考文献(2)
2003(8)
  • 参考文献(0)
  • 二级参考文献(8)
2004(6)
  • 参考文献(0)
  • 二级参考文献(6)
2005(8)
  • 参考文献(0)
  • 二级参考文献(8)
2006(4)
  • 参考文献(1)
  • 二级参考文献(3)
2007(4)
  • 参考文献(0)
  • 二级参考文献(4)
2008(3)
  • 参考文献(0)
  • 二级参考文献(3)
2009(5)
  • 参考文献(1)
  • 二级参考文献(4)
2010(2)
  • 参考文献(0)
  • 二级参考文献(2)
2011(10)
  • 参考文献(1)
  • 二级参考文献(9)
2012(7)
  • 参考文献(1)
  • 二级参考文献(6)
2013(15)
  • 参考文献(2)
  • 二级参考文献(13)
2014(5)
  • 参考文献(2)
  • 二级参考文献(3)
2015(3)
  • 参考文献(2)
  • 二级参考文献(1)
2016(1)
  • 参考文献(1)
  • 二级参考文献(0)
2017(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2019(3)
  • 引证文献(3)
  • 二级引证文献(0)
2020(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
文本分类
机器学习
增量式
模糊语法
重新训练
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用研究
月刊
1001-3695
51-1196/TP
大16开
1984-01-01
chi
出版文献量(篇)
21004
总下载数(次)
0
总被引数(次)
238385
论文1v1指导