基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
中文语音检索系统用于快速准确地在中文语音文档中定位用户查询.典型实现方案对语音文档进行识别后建立索引,对查询串进行分词并以分词结果检索.检索过程中出现的查询分词与识别结果不匹配将影响系统性能.为解决该问题,产生多种查询分词结果,并对其进行前后缀扩展后检索.为解决因扩展带来的检索内容过多,用时较长的问题,引入有穷自动机压缩扩展,在此基础上设计基于令牌的搜索算法高效检索.实验证明,对查询的多分词与前后缀扩展可以使检索EER相对提升50%-70%,引入FSA可压缩检索空间,使得检索速度提升近30倍.
推荐文章
一种基于概念的信息检索查询扩展
信息检索
查询扩展
概念
概念图
基于语义的查询扩展研究
查询扩展
本体
空间向量模型
基于查询词扩展的中文垃圾短信检索
垃圾短信
关键词
查询扩展词
检索
基于事件本体的查询扩展方法
事件本体
查询扩展
扩展项
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于查询扩展的中文语音高效检索
来源期刊 模式识别与人工智能 学科 工学
关键词 中文语音检索 分词 查询扩展 有穷自动机 基于令牌的搜索
年,卷(期) 2011,(4) 所属期刊栏目 研究与应用
研究方向 页码范围 561-566
页数 分类号 TP319
字数 4854字 语种 中文
DOI 10.3969/j.issn.1003-6059.2011.04.015
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 李伟 清华大学电子工程系 88 760 15.0 23.0
2 吕萍 清华大学电子工程系 24 320 9.0 17.0
3 吴及 清华大学电子工程系 26 130 7.0 10.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (58)
共引文献  (53)
参考文献  (5)
节点文献
引证文献  (2)
同被引文献  (1)
二级引证文献  (0)
1975(1)
  • 参考文献(0)
  • 二级参考文献(1)
1976(1)
  • 参考文献(0)
  • 二级参考文献(1)
1980(1)
  • 参考文献(0)
  • 二级参考文献(1)
1989(3)
  • 参考文献(0)
  • 二级参考文献(3)
1990(1)
  • 参考文献(0)
  • 二级参考文献(1)
1993(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(2)
  • 参考文献(0)
  • 二级参考文献(2)
1997(3)
  • 参考文献(0)
  • 二级参考文献(3)
1998(3)
  • 参考文献(0)
  • 二级参考文献(3)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(4)
  • 参考文献(0)
  • 二级参考文献(4)
2001(3)
  • 参考文献(0)
  • 二级参考文献(3)
2002(4)
  • 参考文献(0)
  • 二级参考文献(4)
2003(2)
  • 参考文献(1)
  • 二级参考文献(1)
2004(2)
  • 参考文献(0)
  • 二级参考文献(2)
2005(7)
  • 参考文献(0)
  • 二级参考文献(7)
2006(7)
  • 参考文献(0)
  • 二级参考文献(7)
2007(8)
  • 参考文献(0)
  • 二级参考文献(8)
2008(2)
  • 参考文献(0)
  • 二级参考文献(2)
2009(5)
  • 参考文献(3)
  • 二级参考文献(2)
2010(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2014(1)
  • 引证文献(1)
  • 二级引证文献(0)
2015(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
中文语音检索
分词
查询扩展
有穷自动机
基于令牌的搜索
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
模式识别与人工智能
月刊
1003-6059
34-1089/TP
16开
中国科学院合肥智能机械研究所安徽合肥董铺岛合肥1130信箱
26-69
1989
chi
出版文献量(篇)
2928
总下载数(次)
8
总被引数(次)
30919
论文1v1指导