基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
提出了一种新型主题爬取方法.采用概念树构造主题层次图,赋予待爬取URL对象以层次语义信息,按照语义相关性与重要性选择待爬取URL对象,搜索属于特定语义相关主题的重要Web文档的WWW子集.
推荐文章
基于语义树与VSM的主题爬取策略研究
主题爬虫
语义树
向量空间模型
内容相关度
链接排序
基于主题词表和 FCA的网页语义概念树构建研究
本体
语义概念树
形式概念分析
词语相似度
新浪微博数据爬取研究
新浪微博
数据爬取
微博爬虫
Python
基于主题本体树的文本流层次主题检测技术
文本流
层次主题检测
主题本体树
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于概念树的主题爬取技术研究
来源期刊 科学技术与工程 学科 工学
关键词 概念 概念树 主题爬取 主题层次
年,卷(期) 2005,(12) 所属期刊栏目 计算机技术
研究方向 页码范围 785-790,796
页数 7页 分类号 TP393.03
字数 5486字 语种 中文
DOI 10.3969/j.issn.1671-1815.2005.12.008
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 刘柯 湖南大学软件学院 7 25 3.0 5.0
2 杨贯中 湖南大学软件学院 114 703 14.0 19.0
3 曾义聪 湖南大学软件学院 1 8 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (2)
节点文献
引证文献  (8)
同被引文献  (0)
二级引证文献  (11)
1998(1)
  • 参考文献(1)
  • 二级参考文献(0)
1999(1)
  • 参考文献(1)
  • 二级参考文献(0)
2005(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2005(1)
  • 引证文献(1)
  • 二级引证文献(0)
2006(1)
  • 引证文献(1)
  • 二级引证文献(0)
2007(2)
  • 引证文献(1)
  • 二级引证文献(1)
2008(6)
  • 引证文献(3)
  • 二级引证文献(3)
2009(1)
  • 引证文献(0)
  • 二级引证文献(1)
2010(4)
  • 引证文献(1)
  • 二级引证文献(3)
2011(2)
  • 引证文献(0)
  • 二级引证文献(2)
2012(1)
  • 引证文献(0)
  • 二级引证文献(1)
2013(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
概念
概念树
主题爬取
主题层次
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
科学技术与工程
旬刊
1671-1815
11-4688/T
大16开
北京市海淀区学院南路86号
2-734
2001
chi
出版文献量(篇)
30642
总下载数(次)
83
总被引数(次)
113906
相关基金
教育部科学技术研究项目
英文译名:Key Project of Chinese Ministry of Education
官方网址:http://www.dost.moe.edu.cn
项目类型:教育部科学技术研究重点项目
学科类型:
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导