基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
隐含语义索引(LSI)是一种解决信息检索中二义性问题和大规模文档分类的文档索引方法.为了提高LSI效率,应对大数据场景下文档量爆发式增长的问题,提出了一种通过归并奇异值分解来实现LSI快速更新的方法.该方法利用矿边宽单边对角矩阵和箭头矩阵分解技术来加快中间矩阵的奇异值分解过程,并通过将新增文档矩阵的薄奇异值分解(PSVD)归并进主文档矩阵的PSVD以避免重复计算,加快LSI更新速度.通过数学证明论证了该方法的有效性,并讨论了该算法扩展到词条更新场景中的情形.在多个测试数据集上的实验验证了该方法可以在保证检索准确率的前提下有效提高LSI的更新效率.
推荐文章
一种基于广义奇异值分解的语音增强算法
听觉掩蔽门限
广义奇异值分解
信号子空间
语音增强
一种新的基于奇异值分解的小波域盲水印
盲水印
奇异值分解
小波变换
Arnold变换
几何攻击
信号处理
一种结合奇异值分解的非下采样剪切波数字水印算法
奇异值分解
非下采样剪切波变换
数字水印
能量
奇异值分解及其简单应用
线性映射
奇异值分解
特征值
特征向量
几何意义
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 归并奇异值分解:一种快速更新隐含语义索引的方法
来源期刊 华东理工大学学报(自然科学版) 学科 工学
关键词 信息检索 隐含语义索引 奇异值分解 文档聚类 QR分解 箭头型矩阵
年,卷(期) 2018,(3) 所属期刊栏目 信息科学与工程
研究方向 页码范围 397-403
页数 7页 分类号 TP391
字数 5071字 语种 中文
DOI 10.14135/j.cnki.1006-3080.20170711001
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 林家骏 华东理工大学信息科学与工程学院 171 1083 15.0 26.0
2 黄明 华东理工大学信息科学与工程学院 3 2 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (8)
节点文献
引证文献  (1)
同被引文献  (0)
二级引证文献  (0)
1990(1)
  • 参考文献(1)
  • 二级参考文献(0)
1995(2)
  • 参考文献(2)
  • 二级参考文献(0)
1999(1)
  • 参考文献(1)
  • 二级参考文献(0)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(1)
  • 参考文献(1)
  • 二级参考文献(0)
2018(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2018(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
信息检索
隐含语义索引
奇异值分解
文档聚类
QR分解
箭头型矩阵
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
华东理工大学学报(自然科学版)
双月刊
1006-3080
31-1691/TQ
16开
上海市梅陇路130号
4-382
1957
chi
出版文献量(篇)
3399
总下载数(次)
2
总被引数(次)
27146
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导