基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
提出使用TF-IDF算法与朴素贝叶斯算法相结合,实现图书的自动分类.首先需从互联网中爬取图书信息,主要包括图书基本信息、图书简介、图书目录等;其次,需要对爬取到的图书信息进行预处理,将同类图书的基本信息聚在一起,并进行分词去噪;然后使用TF-IDF算法对每一类图书进行特征提取,获得每一类图书的特征;最后使用朴素贝叶斯算法,并利用训练好的分类特征,计算某本新书的具体分类.实验结果表明,该方法可以简化复杂的图书自动分类过程,提高分类效率,也能保证图书分类的准确性.
推荐文章
图书自动分类系统非精确推理模型的研究与设计
专家系统
产生式系统
非精确推理
图书分类
云计算下的图书馆条码分类与查询技术研究
云计算
图书馆
条码
分类查询
文本自动分类关键技术研究
中文分词
向量空间模型
文本分类
支持向量机
自动文本分类技术研究
文本分类
支持向量机
最小二乘支持向量机
分类器
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 图书自动分类技术研究与实现
来源期刊 软件导刊 学科 工学
关键词 图书分类 TF-IDF 朴素贝叶斯
年,卷(期) 2016,(5) 所属期刊栏目 应用技术与研究
研究方向 页码范围 150-152
页数 3页 分类号 TP319
字数 4386字 语种 中文
DOI 10.11907/rjdk.161108
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 刘高军 北方工业大学计算机学院 41 237 7.0 15.0
2 陈东河 北方工业大学计算机学院 1 3 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (34)
共引文献  (158)
参考文献  (10)
节点文献
引证文献  (3)
同被引文献  (5)
二级引证文献  (0)
1997(3)
  • 参考文献(0)
  • 二级参考文献(3)
1998(2)
  • 参考文献(0)
  • 二级参考文献(2)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(5)
  • 参考文献(0)
  • 二级参考文献(5)
2001(3)
  • 参考文献(1)
  • 二级参考文献(2)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(3)
  • 参考文献(1)
  • 二级参考文献(2)
2004(2)
  • 参考文献(0)
  • 二级参考文献(2)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(2)
  • 参考文献(1)
  • 二级参考文献(1)
2007(4)
  • 参考文献(0)
  • 二级参考文献(4)
2008(3)
  • 参考文献(1)
  • 二级参考文献(2)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(3)
  • 参考文献(1)
  • 二级参考文献(2)
2011(3)
  • 参考文献(0)
  • 二级参考文献(3)
2013(3)
  • 参考文献(0)
  • 二级参考文献(3)
2015(4)
  • 参考文献(4)
  • 二级参考文献(0)
2016(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2017(1)
  • 引证文献(1)
  • 二级引证文献(0)
2019(2)
  • 引证文献(2)
  • 二级引证文献(0)
研究主题发展历程
节点文献
图书分类
TF-IDF
朴素贝叶斯
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
软件导刊
月刊
1672-7800
42-1671/TP
16开
湖北省武汉市
38-431
2002
chi
出版文献量(篇)
9809
总下载数(次)
57
总被引数(次)
30383
论文1v1指导