基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
本文围绕互联网中网页文本蕴含的丰富地理空间信息,抽取网页文本中蕴含的地名实体,提出了一种地名共现网络模型,该模型综合考虑网页中地名的频次信息,表达网页文本中地名的共现及联系传递特征.在此基础上,提出一种基于链接分析的网页文本核心地名的提取方法,通过PageRank算法计算每个地名在共现网络中的链接权重,对网页文本构建的共现地名网络进行核心地名的提取,从而在庞大的网络资源中发现具有显著的焦点特征或导航枢纽特征的重要地名.最后,采用人民日报与新浪新闻体育版2份语料进行实验验证,证明了该方法的有效性.
推荐文章
基于文本-链接模型和近邻传播算法的网页聚类
文本-链接模型
MS模型
相似度
近邻传播聚类算法
基于网页结构与链接关系的中文文本分类方法
中文文本分类
HTML结构
链接关系
向量空间模型
基于链接信息的网页分类算法
网页分类
类别
K近邻方法
链接信息分类
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于链接分析的网页文本核心地名提取方法
来源期刊 地球信息科学学报 学科
关键词 地名 地名共现 链接分析 复杂网络 地理信息检索
年,卷(期) 2016,(4) 所属期刊栏目 地球信息科学理论与方法
研究方向 页码范围 435-442
页数 8页 分类号
字数 语种 中文
DOI 10.3724/SP.J.1047.2016.00435
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 高勇 北京大学遥感与地理信息系统研究所 48 691 17.0 24.0
2 邬伦 北京大学遥感与地理信息系统研究所 88 2558 27.0 48.0
3 钟翔 北京大学遥感与地理信息系统研究所 3 16 3.0 3.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (79)
共引文献  (112)
参考文献  (10)
节点文献
引证文献  (7)
同被引文献  (22)
二级引证文献  (1)
1998(2)
  • 参考文献(1)
  • 二级参考文献(1)
2000(3)
  • 参考文献(0)
  • 二级参考文献(3)
2002(3)
  • 参考文献(0)
  • 二级参考文献(3)
2003(2)
  • 参考文献(0)
  • 二级参考文献(2)
2004(4)
  • 参考文献(0)
  • 二级参考文献(4)
2005(6)
  • 参考文献(0)
  • 二级参考文献(6)
2006(2)
  • 参考文献(0)
  • 二级参考文献(2)
2007(8)
  • 参考文献(1)
  • 二级参考文献(7)
2008(13)
  • 参考文献(0)
  • 二级参考文献(13)
2009(8)
  • 参考文献(0)
  • 二级参考文献(8)
2010(10)
  • 参考文献(1)
  • 二级参考文献(9)
2011(8)
  • 参考文献(1)
  • 二级参考文献(7)
2012(5)
  • 参考文献(1)
  • 二级参考文献(4)
2013(9)
  • 参考文献(1)
  • 二级参考文献(8)
2014(3)
  • 参考文献(1)
  • 二级参考文献(2)
2015(3)
  • 参考文献(3)
  • 二级参考文献(0)
2016(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2017(3)
  • 引证文献(3)
  • 二级引证文献(0)
2018(2)
  • 引证文献(2)
  • 二级引证文献(0)
2019(2)
  • 引证文献(2)
  • 二级引证文献(0)
2020(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
地名
地名共现
链接分析
复杂网络
地理信息检索
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
地球信息科学学报
月刊
1560-8999
11-5809/P
大16开
北京大屯路甲11号
82-919
1996
chi
出版文献量(篇)
3070
总下载数(次)
24
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导