基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
随着信息社会尤其是互联网的发展,人们对文本检索的要求越来越高.作为对传统进,智能检索研究已经成为热点,并将是支撑下一代互联网的核心技术之一.将语义计算技术应用于文本检索,是智能检索的重要方向.文中在文本检索的两个关键技术("标引"和"相似度计算")中引入语义计算技术,用浅层语义来指导检索过程,提高检索准确率.针对"标引"技术,提出了语义树模型;针对"相似度计算",基于语义张量的概念,结合自然语言处理的一些技术,提出三个可计算的窗口模型来近似语义张量的核心思想.以上工作在一定程度上实现了语义计算的功能.利用TREC数据集进行的评测表明,采用了语义计算技术后,文本检索的准确率可以提高10%左右.
推荐文章
基于本体的企业文本检索模型研究
文本检索
文本分析
本体描述符
自然段
基于向量空间模型的文本检索系统
向量空间模型
VSM
文本检索
信息获取
一种稳定的文本检索算法
信息检索
TREC
遗传算法
参数优化
向量空间模型
基于非结构化文本检索模型综述
相似度计算
检索模型
语义检索
概率相关性
数学理论
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 面向文本检索的语义计算
来源期刊 计算机学报 学科 工学
关键词 文本检索 自然语言处理 语义计算 语义树 语义张量 TREC评测
年,卷(期) 2005,(12) 所属期刊栏目 研究论文与技术报告
研究方向 页码范围 2068-2078
页数 11页 分类号 TP391
字数 11098字 语种 中文
DOI 10.3321/j.issn:0254-4164.2005.12.015
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 徐波 中国科学院自动化研究所模式识别国家重点实验室 92 929 15.0 27.0
2 赵军 中国科学院自动化研究所模式识别国家重点实验室 100 1883 24.0 40.0
3 金千里 中国科学院自动化研究所模式识别国家重点实验室 1 67 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (4)
节点文献
引证文献  (67)
同被引文献  (71)
二级引证文献  (231)
1988(1)
  • 参考文献(1)
  • 二级参考文献(0)
1990(2)
  • 参考文献(2)
  • 二级参考文献(0)
2003(1)
  • 参考文献(1)
  • 二级参考文献(0)
2005(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2006(2)
  • 引证文献(2)
  • 二级引证文献(0)
2007(10)
  • 引证文献(8)
  • 二级引证文献(2)
2008(20)
  • 引证文献(8)
  • 二级引证文献(12)
2009(27)
  • 引证文献(7)
  • 二级引证文献(20)
2010(36)
  • 引证文献(7)
  • 二级引证文献(29)
2011(30)
  • 引证文献(4)
  • 二级引证文献(26)
2012(27)
  • 引证文献(7)
  • 二级引证文献(20)
2013(27)
  • 引证文献(6)
  • 二级引证文献(21)
2014(37)
  • 引证文献(5)
  • 二级引证文献(32)
2015(25)
  • 引证文献(4)
  • 二级引证文献(21)
2016(22)
  • 引证文献(6)
  • 二级引证文献(16)
2017(14)
  • 引证文献(2)
  • 二级引证文献(12)
2018(9)
  • 引证文献(1)
  • 二级引证文献(8)
2019(8)
  • 引证文献(0)
  • 二级引证文献(8)
2020(4)
  • 引证文献(0)
  • 二级引证文献(4)
研究主题发展历程
节点文献
文本检索
自然语言处理
语义计算
语义树
语义张量
TREC评测
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机学报
月刊
0254-4164
11-1826/TP
大16开
中国科学院计算技术研究所(北京2704信箱)
2-833
1978
chi
出版文献量(篇)
5154
总下载数(次)
49
总被引数(次)
187004
相关基金
北京市自然科学基金
英文译名:Natural Science Foundation of Beijing Province
官方网址:http://210.76.125.39/zrjjh/zrjj/
项目类型:重大项目
学科类型:
论文1v1指导