原文服务方: 计算机应用研究       
摘要:
随办公信息化、生活网络化不断推进,诸如企业产品问题描述、Web用户评论、通信文本信息等新生的非结构化文本数据也伴随着快速的增长以及其不断积累.这对于如何能准确、高效地检索到用户真实需求的文本信息提出了新的要求和挑战.检索模型对检索准确度、效率等具有决定性影响.近年来,大量新兴方法融入到文本的检索模型中,使模型本身变得纷繁复杂,同时传统模型间的界限变得模糊.从非结构化文本数据的检索需求出发,归纳检索模型的定义和通用框架;进而基于检索词项相似性计算采用的数学理论,对检索模型进行分类,并详细阐述各类模型的发展脉络、分析其优缺点及适用场景.最后,讨论了新环境下海量文本检索模型面临的挑战及相关研究问题思考.
推荐文章
基于向量空间模型的文本检索系统
向量空间模型
VSM
文本检索
信息获取
基于本体的企业文本检索模型研究
文本检索
文本分析
本体描述符
自然段
结构化P2P网络文本检索研究
对等网络
小世界现象
文本检索
覆盖网
一种稳定的文本检索算法
信息检索
TREC
遗传算法
参数优化
向量空间模型
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于非结构化文本检索模型综述
来源期刊 计算机应用研究 学科
关键词 相似度计算 检索模型 语义检索 概率相关性 数学理论
年,卷(期) 2017,(6) 所属期刊栏目 综述评论
研究方向 页码范围 1601-1608,1612
页数 9页 分类号 TP391.3
字数 语种 中文
DOI 10.3969/j.issn.1001-3695.2017.06.001
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 杨青 桂林电子科技大学广西自动检测技术与仪器重点实验室 46 183 7.0 10.0
2 张会兵 桂林电子科技大学广西云计算与大数据协同创新中心 30 72 4.0 6.0
6 丁志均 桂林电子科技大学广西云计算与大数据协同创新中心 2 18 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (24)
节点文献
引证文献  (11)
同被引文献  (31)
二级引证文献  (11)
1976(1)
  • 参考文献(1)
  • 二级参考文献(0)
1979(1)
  • 参考文献(1)
  • 二级参考文献(0)
1983(1)
  • 参考文献(1)
  • 二级参考文献(0)
1985(1)
  • 参考文献(1)
  • 二级参考文献(0)
1988(1)
  • 参考文献(1)
  • 二级参考文献(0)
1989(1)
  • 参考文献(1)
  • 二级参考文献(0)
1990(2)
  • 参考文献(2)
  • 二级参考文献(0)
1991(2)
  • 参考文献(2)
  • 二级参考文献(0)
1998(1)
  • 参考文献(1)
  • 二级参考文献(0)
2003(2)
  • 参考文献(2)
  • 二级参考文献(0)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2009(2)
  • 参考文献(2)
  • 二级参考文献(0)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(3)
  • 参考文献(3)
  • 二级参考文献(0)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(1)
  • 参考文献(1)
  • 二级参考文献(0)
2017(2)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(1)
2017(2)
  • 引证文献(1)
  • 二级引证文献(1)
2018(7)
  • 引证文献(2)
  • 二级引证文献(5)
2019(10)
  • 引证文献(8)
  • 二级引证文献(2)
2020(3)
  • 引证文献(0)
  • 二级引证文献(3)
研究主题发展历程
节点文献
相似度计算
检索模型
语义检索
概率相关性
数学理论
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用研究
月刊
1001-3695
51-1196/TP
大16开
1984-01-01
chi
出版文献量(篇)
21004
总下载数(次)
0
论文1v1指导