基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
文档是有一定逻辑结构的,标题、章节、段落等这些概念是文档的内在逻辑.不同的用户对文档的检索,有不同的需求,检索系统如何提供有意义的信息,一直是研究的中心任务.结合文档的结构和内容,对结构化文件的检索,提出了一种新的计算相似度的方法.这种方法可以提供多粒度的文档内容的检索,包括从单词、短语到段落或者章节.基于这种方法实现了一个问题回答系统,测试集是微软的百科全书Encarta,通过与传统方法实验比较,证明通过这种方法检索的文章片断更合理、更有效.
推荐文章
一种基于组态王的简单实用的数据库查询方法
组态王
数据库
SQLServer2000
查询
控件
一种高效基于模式图的数据库关键字查询方法
关系数据库
关键字查询
信息检索
模式图
一种基于CORBA的异构数据库查询实现
通用对象请求代理架构
中间件
应用程序
文档数据库与关系数据库研究
数据库
数据格式
数据结构
数据存储
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种通过内容和结构查询文档数据库的方法
来源期刊 软件学报 学科 工学
关键词 文档数据库 信息检索 段落检索 结构化文档
年,卷(期) 2003,(5) 所属期刊栏目 数据库技术
研究方向 页码范围 976-983
页数 8页 分类号 TP311
字数 1175字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 董逸生 东南大学计算机科学与工程系 118 3003 29.0 49.0
2 王晓玲 东南大学计算机科学与工程系 6 76 5.0 6.0
3 文继荣 3 211 2.0 3.0
4 栾金锋 东南大学计算机科学与工程系 2 52 2.0 2.0
5 马维英 2 19 1.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (2)
节点文献
引证文献  (19)
同被引文献  (18)
二级引证文献  (38)
1999(1)
  • 参考文献(1)
  • 二级参考文献(0)
2000(1)
  • 参考文献(1)
  • 二级参考文献(0)
2003(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2005(3)
  • 引证文献(2)
  • 二级引证文献(1)
2007(7)
  • 引证文献(4)
  • 二级引证文献(3)
2008(8)
  • 引证文献(4)
  • 二级引证文献(4)
2009(9)
  • 引证文献(5)
  • 二级引证文献(4)
2010(4)
  • 引证文献(1)
  • 二级引证文献(3)
2011(5)
  • 引证文献(1)
  • 二级引证文献(4)
2012(1)
  • 引证文献(0)
  • 二级引证文献(1)
2013(4)
  • 引证文献(0)
  • 二级引证文献(4)
2014(6)
  • 引证文献(1)
  • 二级引证文献(5)
2015(5)
  • 引证文献(0)
  • 二级引证文献(5)
2016(1)
  • 引证文献(0)
  • 二级引证文献(1)
2017(2)
  • 引证文献(1)
  • 二级引证文献(1)
2018(1)
  • 引证文献(0)
  • 二级引证文献(1)
2020(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
文档数据库
信息检索
段落检索
结构化文档
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
软件学报
月刊
1000-9825
11-2560/TP
16开
北京8718信箱
82-367
1990
chi
出版文献量(篇)
5820
总下载数(次)
36
论文1v1指导