基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
首先详细介绍了一种建构在PC Windows平台上的轻量级中文搜索引擎系统模型的总体设计,然后采用基于多线程技术的广度优先遍历法及最大匹配法和最小匹配法相结合的中文分词法等技术进行了各个主要功能模块的具体设计和实现,对模型进行了基于多线程的网络爬虫、用户接口等测试.测试实验结果表明:构建并实现的轻量级中文搜索引擎系统模型能较好地实现一个简单中文搜索引擎所具有的基本功能,系统界面简单实用,具有较高的资源检索率并能够保证检索结果的准确性.
推荐文章
中文搜索引擎的原理剖析及开发实现技术
中文搜索引擎
全文检索
中文分词
基于字表的中文搜索引擎分词系统的设计与实现
中文
搜索引擎
分词
宇表
查询
Web中文搜索引擎研究
搜索引擎
信息检索
互联网
网络信息量
中文搜索引擎缺陷之我见
中文搜索引擎
分词技术
蜘蛛程序
列表式查询
关键词查询
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种轻量级中文搜索引擎模型的设计与实现
来源期刊 计算机技术与发展 学科 工学
关键词 网络爬虫 URL库 中文分词 倒排文件索引 多线程
年,卷(期) 2012,(9) 所属期刊栏目 应用开发研究
研究方向 页码范围 201-204,209
页数 5页 分类号 TP31
字数 3106字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 魏霞 周口职业技术学院信息工程系 21 37 3.0 5.0
2 王迤冉 周口师范学院计算机科学与技术学院 82 248 8.0 12.0
3 黄宇达 西南科技大学计算机科学与技术学院 20 112 5.0 10.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (22)
共引文献  (29)
参考文献  (7)
节点文献
引证文献  (1)
同被引文献  (0)
二级引证文献  (0)
1998(2)
  • 参考文献(0)
  • 二级参考文献(2)
1999(4)
  • 参考文献(0)
  • 二级参考文献(4)
2000(3)
  • 参考文献(0)
  • 二级参考文献(3)
2001(3)
  • 参考文献(0)
  • 二级参考文献(3)
2002(2)
  • 参考文献(0)
  • 二级参考文献(2)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(3)
  • 参考文献(2)
  • 二级参考文献(1)
2006(4)
  • 参考文献(3)
  • 二级参考文献(1)
2007(3)
  • 参考文献(1)
  • 二级参考文献(2)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(2)
  • 参考文献(0)
  • 二级参考文献(2)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2014(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
网络爬虫
URL库
中文分词
倒排文件索引
多线程
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机技术与发展
月刊
1673-629X
61-1450/TP
大16开
西安市雁塔路南段99号
52-127
1991
chi
出版文献量(篇)
12927
总下载数(次)
40
总被引数(次)
111596
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导