基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
为了进一步提高搜索引擎的效率,实现对deep web中所蕴含的大量有用信息的检索、索引和定位,引入潜在语义分析理论是一种简单而有效的方法.通过对作为deep web站点入口的查询界面里的表单属性进行潜在语义分析,从表单属性中挖掘出潜在语义结构,并实现一定程度上的降维.利用这种潜在语义结构,推断对应站点的数据内容并改善不同站点的相似度计算.实验结果显示,潜在语义分析修正和改善了deep web站点的表单属性的语义理解,弥补了单纯的关键字匹配带来的一些不足.该方法可以被用来实现为某一站点查找网络上相似度高的站点及通过键入表单属性给出拥有相似表单的站点列表.
推荐文章
Deep web接口查询能力估计
查询接口
查询能力
基于最优查询的多领域deep Web爬虫
deep Web
deep Web爬虫
最优查询
页面聚类
面向旅游领域的Deep Web接口查询研究
Deep Web
接口查询
领域实例
Deep Web数据集成系统中的查询效率优化
Deep
Web
统一查询接口
查询效率
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 Deep web站点查询界面的潜在语义分析
来源期刊 东南大学学报(英文版) 学科 工学
关键词 deep web 信息检索 潜在语义分析 奇异值分解
年,卷(期) 2008,(3) 所属期刊栏目
研究方向 页码范围 312-314
页数 3页 分类号 TP311
字数 371字 语种 英文
DOI 10.3969/j.issn.1003-7985.2008.03.014
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 冯博琴 西安交通大学计算机科学与技术系 171 3268 30.0 50.0
2 茅琴娇 西安交通大学计算机科学与技术系 5 21 2.0 4.0
3 潘善亮 宁波大学信息科学与工程学院 32 126 7.0 10.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (9)
共引文献  (2)
参考文献  (2)
节点文献
引证文献  (3)
同被引文献  (3)
二级引证文献  (9)
1988(1)
  • 参考文献(0)
  • 二级参考文献(1)
1990(1)
  • 参考文献(0)
  • 二级参考文献(1)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(2)
  • 参考文献(1)
  • 二级参考文献(1)
2006(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2009(1)
  • 引证文献(1)
  • 二级引证文献(0)
2012(1)
  • 引证文献(1)
  • 二级引证文献(0)
2013(3)
  • 引证文献(1)
  • 二级引证文献(2)
2014(1)
  • 引证文献(0)
  • 二级引证文献(1)
2015(1)
  • 引证文献(0)
  • 二级引证文献(1)
2016(2)
  • 引证文献(0)
  • 二级引证文献(2)
2017(2)
  • 引证文献(0)
  • 二级引证文献(2)
2019(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
deep web
信息检索
潜在语义分析
奇异值分解
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
东南大学学报(英文版)
季刊
1003-7985
32-1325/N
大16开
南京四牌楼2号
1984
eng
出版文献量(篇)
2004
总下载数(次)
1
总被引数(次)
8843
论文1v1指导