基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
利用词项依存关系来改进词袋模型,一直是文本检索中一个热门话题.已有的定义词项依存的方法中,有两类主要的方法:一类是词汇层次的依存关系,利用统计近邻信息来定义词项依存关系,另一类是句法层次的依存关系,由句法结构采定义词项依存关系.虽然已有的研究表明.相对于词袋模型,利用词项依存关系能够显著地提高检索性能,但这两类词项依存关系却缺乏系统的比较:在利用词项依存关系来改进文档和查询的表达上,如何有效地利用句法信息,哪些句法信息对文本检索比较有效,依然是个有待研究的问题.为此,在文档表达上,比较了利用近邻信息和句法信息定义的词项依存关系的性能;在查询表达上,对利用不同层次的句法信息所定义的词项依存关系的性能进行了比较,为了系统地比较这些词项依存关系对检索性能的影响,在语言模型基础上,以平滑为思路,提出了一个能方便融入这两类词项依存关系的检索模型.在TREC语料上的实验表明,对于文档表达来说.句法关系较统计近邻关系没有明显的差别.在查询表达上,基于名词/专有词短语的部分句法信息较其他的句法信息更加有效.
推荐文章
电子文档信息自动挖掘技术中的预处理研究
数据挖掘
Internet
电子文档
解析
预处理
基于本体的信息检索模型研究
本体
信息检索
语义标注
知识库
语义网文档
基于文档副本局部性的分布式检索算法研究
信息检索
搜索引擎
副本
局部性
分布式检索
基于语义网的电子政务文档检索技术的实现
电子政务文档
检索
语义网
资源描述框架
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 文档检索中句法信息的有效利用研究
来源期刊 中文信息学报 学科 工学
关键词 计算机应用 中文信息处理 信息检索 词项依存 句法分析 词项近邻
年,卷(期) 2008,(4) 所属期刊栏目
研究方向 页码范围 66-74
页数 9页 分类号 TP391
字数 7568字 语种 中文
DOI 10.3969/j.issn.1003-0077.2008.04.011
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 王斌 中国科学院计算技术研究所 325 6645 42.0 69.0
2 白硕 中国科学院计算技术研究所 50 2124 21.0 46.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (15)
共引文献  (48)
参考文献  (6)
节点文献
引证文献  (9)
同被引文献  (15)
二级引证文献  (6)
1988(1)
  • 参考文献(0)
  • 二级参考文献(1)
1990(2)
  • 参考文献(0)
  • 二级参考文献(2)
1994(1)
  • 参考文献(1)
  • 二级参考文献(0)
1995(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(3)
  • 参考文献(0)
  • 二级参考文献(3)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(7)
  • 参考文献(3)
  • 二级参考文献(4)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2009(3)
  • 引证文献(3)
  • 二级引证文献(0)
2010(1)
  • 引证文献(0)
  • 二级引证文献(1)
2012(1)
  • 引证文献(0)
  • 二级引证文献(1)
2013(1)
  • 引证文献(1)
  • 二级引证文献(0)
2014(5)
  • 引证文献(3)
  • 二级引证文献(2)
2015(2)
  • 引证文献(2)
  • 二级引证文献(0)
2016(2)
  • 引证文献(0)
  • 二级引证文献(2)
研究主题发展历程
节点文献
计算机应用
中文信息处理
信息检索
词项依存
句法分析
词项近邻
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
中文信息学报
月刊
1003-0077
11-2325/N
16开
北京海淀区中关村南四街4号
1986
chi
出版文献量(篇)
2723
总下载数(次)
5
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
国家重点基础研究发展计划(973计划)
英文译名:National Basic Research Program of China
官方网址:http://www.973.gov.cn/
项目类型:
学科类型:农业
论文1v1指导