基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
随着互联网的网页数量呈现爆炸式增长, 传统的通用搜索引擎越来越遭人诟病, 查询不准、 深度不够等问题, 使用户倍感烦恼. 因此, 针对特定行业的垂直搜索引擎逐渐兴起, 与之相关的研究也日益受到重视. 网页分类是垂直搜索引擎的基础和难点, 分类器的好坏直接决定了一个垂直搜索引擎系统的性能. 基于朴素贝叶斯的垂直搜索引擎分类器通过CHI方法进行特征提取, 利用朴素贝叶斯模型对从互联网爬取的网页按内容类别进行分类. 实验结果表明, 该分类器对网页分类有着良好的表现, 为构建大型专业的垂直搜索引擎系统奠定了一定的理论基础.
推荐文章
基于Internet的农业信息垂直搜索引擎的设计
垂直搜索引擎
主题识别
向量空间模型
特征词
金融信息垂直搜索引擎的技术探讨
金融信息
垂直搜索引擎
本体
语义检索
W eb垂直搜索引擎实现过程的研究
Web搜索
搜索引擎实现
垂直搜索架构
爬虫
基于Intranet的搜索引擎
Intranet
搜索引擎
Robot
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于朴素贝叶斯的垂直搜索引擎分类器设计
来源期刊 无线电工程 学科 工学
关键词 朴素贝叶斯 垂直搜索引擎 特征提取 文档分类
年,卷(期) 2015,(11) 所属期刊栏目 信息系统与网络
研究方向 页码范围 13-16,25
页数 5页 分类号 TP391
字数 3910字 语种 中文
DOI 10.3969/j.issn.1003-3106.2015.11.04
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 齐幸辉 10 41 4.0 6.0
2 于秀丽 7 39 5.0 6.0
3 王阳 1 5 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (27)
共引文献  (113)
参考文献  (11)
节点文献
引证文献  (5)
同被引文献  (10)
二级引证文献  (4)
1988(1)
  • 参考文献(0)
  • 二级参考文献(1)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(4)
  • 参考文献(0)
  • 二级参考文献(4)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(1)
  • 参考文献(1)
  • 二级参考文献(0)
2004(4)
  • 参考文献(2)
  • 二级参考文献(2)
2005(3)
  • 参考文献(0)
  • 二级参考文献(3)
2006(2)
  • 参考文献(0)
  • 二级参考文献(2)
2007(5)
  • 参考文献(2)
  • 二级参考文献(3)
2008(4)
  • 参考文献(0)
  • 二级参考文献(4)
2009(4)
  • 参考文献(0)
  • 二级参考文献(4)
2010(3)
  • 参考文献(2)
  • 二级参考文献(1)
2011(2)
  • 参考文献(2)
  • 二级参考文献(0)
2013(2)
  • 参考文献(2)
  • 二级参考文献(0)
2015(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2016(2)
  • 引证文献(2)
  • 二级引证文献(0)
2017(2)
  • 引证文献(1)
  • 二级引证文献(1)
2018(2)
  • 引证文献(2)
  • 二级引证文献(0)
2019(3)
  • 引证文献(0)
  • 二级引证文献(3)
研究主题发展历程
节点文献
朴素贝叶斯
垂直搜索引擎
特征提取
文档分类
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
无线电工程
月刊
1003-3106
13-1097/TN
大16开
河北省石家庄市174信箱215分箱
18-150
1971
chi
出版文献量(篇)
5453
总下载数(次)
12
总被引数(次)
20875
论文1v1指导