基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
随着WWW的迅速发展,Web信息检索技术成为研究者广泛关注的话题,但缺少合适的测试评测机制制约了中文网页信息检索技术的发展.参考国外测试集的构建经验,我们构建了大规模中文网页信息检索测试集CWT,并组织了SEWM中文网页检索评测,希望在国内外各个研究小组的共同参与下建立并完善CWT,一起推动中文网页信息检索技术的发展.本文在调研和分析国内外现有研究进展的基础上,详细介绍了CWT的构建原则和方法,并对CWT进行了有效的统计分析和实验研究.本文提出的构建测试集的方法为以后的研究提供了参考.
推荐文章
基于内容的中文网页自动分类研究
自动分类
信息检索
全球网
基于CFS-GA特征选择算法的中文网页自动分类
中文网页分类
特征选择
基于关联的特征选择算法
遗传算法
面向不良文本信息的中文网页分类方法
信息安全
内容安全
文本分类
贝叶斯理论
中文网页分布式并行索引的设计与实现
分布式并行索引
倒排索引
正向最大匹配法
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 中文网页信息检索测试集的构建、分析及应用
来源期刊 中文信息学报 学科 工学
关键词 计算机应用 中文信息处理 CWT 信息检索 评测 测试集 文档集
年,卷(期) 2008,(1) 所属期刊栏目
研究方向 页码范围 30-36
页数 7页 分类号 TP391
字数 6498字 语种 中文
DOI 10.3969/j.issn.1003-0077.2008.01.005
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 闫宏飞 32 414 11.0 20.0
2 李静静 4 22 2.0 4.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (3)
共引文献  (15)
参考文献  (6)
节点文献
引证文献  (17)
同被引文献  (24)
二级引证文献  (102)
1967(1)
  • 参考文献(1)
  • 二级参考文献(0)
1968(1)
  • 参考文献(1)
  • 二级参考文献(0)
1993(1)
  • 参考文献(1)
  • 二级参考文献(0)
1999(2)
  • 参考文献(0)
  • 二级参考文献(2)
2000(2)
  • 参考文献(1)
  • 二级参考文献(1)
2002(1)
  • 参考文献(1)
  • 二级参考文献(0)
2003(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2008(1)
  • 引证文献(1)
  • 二级引证文献(0)
2009(3)
  • 引证文献(3)
  • 二级引证文献(0)
2010(8)
  • 引证文献(4)
  • 二级引证文献(4)
2011(2)
  • 引证文献(1)
  • 二级引证文献(1)
2012(2)
  • 引证文献(2)
  • 二级引证文献(0)
2013(1)
  • 引证文献(0)
  • 二级引证文献(1)
2014(2)
  • 引证文献(0)
  • 二级引证文献(2)
2015(6)
  • 引证文献(3)
  • 二级引证文献(3)
2016(13)
  • 引证文献(2)
  • 二级引证文献(11)
2017(29)
  • 引证文献(0)
  • 二级引证文献(29)
2018(26)
  • 引证文献(0)
  • 二级引证文献(26)
2019(16)
  • 引证文献(0)
  • 二级引证文献(16)
2020(10)
  • 引证文献(1)
  • 二级引证文献(9)
研究主题发展历程
节点文献
计算机应用
中文信息处理
CWT
信息检索
评测
测试集
文档集
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
中文信息学报
月刊
1003-0077
11-2325/N
16开
北京海淀区中关村南四街4号
1986
chi
出版文献量(篇)
2723
总下载数(次)
5
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
国家高技术研究发展计划(863计划)
英文译名:The National High Technology Research and Development Program of China
官方网址:http://www.863.org.cn
项目类型:重点项目
学科类型:信息技术
论文1v1指导