基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
本文提出了一个基于n-gram语言模型进行文本表示,采用链状朴素贝叶斯分类器进行分类的中文文本分类系统.介绍了如何用n-gram语言模型进行文本表示,阐述了链状朴素贝叶斯分类器与n-gram语言模型相结合的优势,分析了n-gram语言模型参数的选取,讨论了分类系统的若干重要问题,研究了训练集的规模和质量对分类系统的影响.根据863计划文本分类测评组所提供的测试标准、训练集以及测试集对本文所设计的分类系统进行测试,实验结果表明该分类系统有良好的分类效果.
推荐文章
中文文本分类系统的设计与实现
文本分类
向量空间模型
特征项选择
权重
不同情境下中文文本分类模型的表现及选择?
中文文本
文本分类
数据挖掘
情报分析
中文文本分类研究
文本分类
k 近邻
支持向量机
最大熵
基于AdaBoost-Bayes算法的中文文本分类系统
中文分词
文本分类
AdaBoost
Bayes
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于n-gram语言模型和链状朴素贝叶斯分类器的中文文本分类系统
来源期刊 中文信息学报 学科 工学
关键词 计算机应用 中文信息处理 中文文本分类 n-gram语言模型 链状朴素贝叶斯分类器
年,卷(期) 2006,(3) 所属期刊栏目
研究方向 页码范围 29-35
页数 7页 分类号 TP391
字数 4819字 语种 中文
DOI 10.3969/j.issn.1003-0077.2006.03.005
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 郭军 北京邮电大学模式识别与智能系统实验室 101 1335 20.0 31.0
2 徐蔚然 北京邮电大学模式识别与智能系统实验室 22 369 9.0 19.0
3 毛伟 北京邮电大学模式识别与智能系统实验室 1 54 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (29)
共引文献  (259)
参考文献  (9)
节点文献
引证文献  (54)
同被引文献  (64)
二级引证文献  (58)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(5)
  • 参考文献(1)
  • 二级参考文献(4)
1997(2)
  • 参考文献(0)
  • 二级参考文献(2)
1998(3)
  • 参考文献(0)
  • 二级参考文献(3)
1999(7)
  • 参考文献(0)
  • 二级参考文献(7)
2000(4)
  • 参考文献(0)
  • 二级参考文献(4)
2001(4)
  • 参考文献(1)
  • 二级参考文献(3)
2002(6)
  • 参考文献(2)
  • 二级参考文献(4)
2003(1)
  • 参考文献(1)
  • 二级参考文献(0)
2004(2)
  • 参考文献(1)
  • 二级参考文献(1)
2005(3)
  • 参考文献(3)
  • 二级参考文献(0)
2006(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2007(7)
  • 引证文献(7)
  • 二级引证文献(0)
2008(11)
  • 引证文献(7)
  • 二级引证文献(4)
2009(11)
  • 引证文献(4)
  • 二级引证文献(7)
2010(7)
  • 引证文献(1)
  • 二级引证文献(6)
2011(4)
  • 引证文献(1)
  • 二级引证文献(3)
2012(5)
  • 引证文献(3)
  • 二级引证文献(2)
2013(9)
  • 引证文献(5)
  • 二级引证文献(4)
2014(8)
  • 引证文献(2)
  • 二级引证文献(6)
2015(7)
  • 引证文献(4)
  • 二级引证文献(3)
2016(7)
  • 引证文献(4)
  • 二级引证文献(3)
2017(4)
  • 引证文献(1)
  • 二级引证文献(3)
2018(11)
  • 引证文献(8)
  • 二级引证文献(3)
2019(14)
  • 引证文献(6)
  • 二级引证文献(8)
2020(7)
  • 引证文献(1)
  • 二级引证文献(6)
研究主题发展历程
节点文献
计算机应用
中文信息处理
中文文本分类
n-gram语言模型
链状朴素贝叶斯分类器
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
中文信息学报
月刊
1003-0077
11-2325/N
16开
北京海淀区中关村南四街4号
1986
chi
出版文献量(篇)
2723
总下载数(次)
5
论文1v1指导