基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
为了进一步提高搜索引擎的效率,实现对deep web中所蕴含的大量有用信息的检索、索引和定位,引入潜在语义分析理论是一种简单而有效的方法.通过对作为deep web站点入口的查询界面里的表单属性进行潜在语义分析,从表单属性中挖掘出潜在语义结构,并实现一定程度上的降维.利用这种潜在语义结构,推断对应站点的数据内容并改善不同站点的相似度计算.实验结果显示,潜在语义分析修正和改善了deep web站点的表单属性的语义理解,弥补了单纯的关键字匹配带来的一些不足.该方法可以被用来实现为某一站点查找网络上相似度高的站点及通过键入表单属性给出拥有相似表单的站点列表.
推荐文章
基于词性分析和领域知识的Deep Web语义标注
Deep Web
中文词性
领域知识
数据预处理
语义标注
基于本体的Deep Web语义分类研究
Deep Web分类
本体
语义
查询探测
Deep Web信息集成系统中查询转换
Deep Web
信息集成
表单抽取
查询转换
Deep Web中基于迭代的查询方式
Deep Web
查询接口
迭代算法
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 Deep web站点查询界面的潜在语义分析
来源期刊 东南大学学报(英文版) 学科 工学
关键词 deep web 信息检索 潜在语义分析 奇异值分解
年,卷(期) 2008,(3) 所属期刊栏目
研究方向 页码范围 312-314
页数 3页 分类号 TP311
字数 371字 语种 英文
DOI 10.3969/j.issn.1003-7985.2008.03.014
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 冯博琴 西安交通大学计算机科学与技术系 171 3268 30.0 50.0
2 茅琴娇 西安交通大学计算机科学与技术系 5 21 2.0 4.0
3 潘善亮 宁波大学信息科学与工程学院 32 126 7.0 10.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (9)
共引文献  (2)
参考文献  (2)
节点文献
引证文献  (3)
同被引文献  (3)
二级引证文献  (9)
1988(1)
  • 参考文献(0)
  • 二级参考文献(1)
1990(1)
  • 参考文献(0)
  • 二级参考文献(1)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(2)
  • 参考文献(1)
  • 二级参考文献(1)
2006(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2009(1)
  • 引证文献(1)
  • 二级引证文献(0)
2012(1)
  • 引证文献(1)
  • 二级引证文献(0)
2013(3)
  • 引证文献(1)
  • 二级引证文献(2)
2014(1)
  • 引证文献(0)
  • 二级引证文献(1)
2015(1)
  • 引证文献(0)
  • 二级引证文献(1)
2016(2)
  • 引证文献(0)
  • 二级引证文献(2)
2017(2)
  • 引证文献(0)
  • 二级引证文献(2)
2019(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
deep web
信息检索
潜在语义分析
奇异值分解
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
东南大学学报(英文版)
季刊
1003-7985
32-1325/N
大16开
南京四牌楼2号
1984
eng
出版文献量(篇)
2004
总下载数(次)
1
总被引数(次)
8843
论文1v1指导