基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
为了比较各类模型的性能,研究进一步改进文本信息检索各类模型的可能方法,综合已有的试验和研究报告,概述了文本信息检索模型中一类模型--代数模型概念和研究现状,并分析了目前文本信息检索的相关性、相似度、召回率、准确率等概念.结果表明,这几个模型尽管来源于神经网络、向量空间等不同的思想,广义向量空间模型、潜在语义标引模型的计算复杂度比向量空间模型高,但此类模型依据评测在准确率和召回率上相近,经典向量空间模型相对而言,有简单、复杂度低和可作为检索框架,而不仅仅是检索模型的特点.为便于研究者研究、改进、评测信息检索的代数模型,评价了权威的TREC(The Text Retrieval Conference)和两个代表性的研究系统Smart和Lemur.
推荐文章
基于非结构化文本检索模型综述
相似度计算
检索模型
语义检索
概率相关性
数学理论
网格社区的进程代数模型(GCPAM)
网格社区
进程代数
网格理论模型
基于本体的企业文本检索模型研究
文本检索
文本分析
本体描述符
自然段
可信链的随机进程代数模型
可信链
可信计算
随机进程代数
软件行为
形式化方法
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 文本信息检索的代数模型综述
来源期刊 吉林大学学报(信息科学版) 学科 工学
关键词 文本信息检索 相关性 相似度 代数模型 召回率 准确率
年,卷(期) 2007,(5) 所属期刊栏目 计算机科学与技术
研究方向 页码范围 569-576
页数 8页 分类号 TF301
字数 8523字 语种 中文
DOI 10.3969/j.issn.1671-5896.2007.05.018
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 王修力 山东济南广播电视大学信息学院 2 10 1.0 2.0
2 马利平 5 16 2.0 4.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (21)
节点文献
引证文献  (10)
同被引文献  (25)
二级引证文献  (21)
1968(1)
  • 参考文献(1)
  • 二级参考文献(0)
1975(1)
  • 参考文献(1)
  • 二级参考文献(0)
1977(1)
  • 参考文献(1)
  • 二级参考文献(0)
1986(1)
  • 参考文献(1)
  • 二级参考文献(0)
2003(1)
  • 参考文献(1)
  • 二级参考文献(0)
2004(7)
  • 参考文献(7)
  • 二级参考文献(0)
2005(7)
  • 参考文献(7)
  • 二级参考文献(0)
2006(2)
  • 参考文献(2)
  • 二级参考文献(0)
2007(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2008(3)
  • 引证文献(3)
  • 二级引证文献(0)
2009(1)
  • 引证文献(1)
  • 二级引证文献(0)
2010(3)
  • 引证文献(3)
  • 二级引证文献(0)
2011(1)
  • 引证文献(1)
  • 二级引证文献(0)
2013(1)
  • 引证文献(0)
  • 二级引证文献(1)
2014(2)
  • 引证文献(1)
  • 二级引证文献(1)
2015(5)
  • 引证文献(0)
  • 二级引证文献(5)
2017(4)
  • 引证文献(0)
  • 二级引证文献(4)
2018(6)
  • 引证文献(0)
  • 二级引证文献(6)
2019(4)
  • 引证文献(0)
  • 二级引证文献(4)
2020(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
文本信息检索
相关性
相似度
代数模型
召回率
准确率
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
吉林大学学报(信息科学版)
双月刊
1671-5896
22-1344/TN
大16开
长春市南湖大路5372号
1983
chi
出版文献量(篇)
2333
总下载数(次)
2
总被引数(次)
16807
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导