基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
本文提出利用百度百科这个开放的中文知识百科全书来计算知识领域间关联度的方法.通过抽取百度百科中词条的解释和分类信息,并经过分词以后,我们可以用向量空间模型(VSM)量化分类中的词条,然后提出用领域内词条的关联矩阵迭代的方法来计算单个领域中各个词条的权重.要计算2个领域的相关度,首先要分别算出它们各自领域中每个词条的权重,而后通过扩展向量空间的方式把它们的概念空间扩展为一个公共的向量空间,并在此公共向量空间中用余弦夹角的方法计算2个领域的相关度.该研究成果可以辅助我们发现领域间的关联,加快不同领域间知识的融合.
推荐文章
百度百科合作网络的分形生长机制研究
百度百科
复杂网络
谱分析
多重分形
Hurst指数
面向百度百科的化学知识图谱构建方法研究
百度百科
知识图谱
网络爬虫
实体识别
基于维基百科的领域实体发现研究
领域实体
维基百科
隶属度
自动发现
百度百科合作网络的分形生长机制研究
百度百科
复杂网络
谱分析
多重分形
Hurst指数
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 从百度百科挖掘领域知识相关度
来源期刊 广西师范大学学报(自然科学版) 学科 工学
关键词 领域知识 相关度 Web挖掘 百度百科
年,卷(期) 2011,(4) 所属期刊栏目
研究方向 页码范围 28-34
页数 分类号 TP182
字数 5820字 语种 中文
DOI 10.3969/j.issn.1001-6600.2011.04.007
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 杨小平 中国人民大学信息学院 84 967 15.0 30.0
2 胡婕茹 中国人民大学信息学院 2 8 2.0 2.0
3 黄都培 中国政法大学科学技术教学部 8 177 4.0 8.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (5)
节点文献
引证文献  (4)
同被引文献  (11)
二级引证文献  (0)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(4)
  • 参考文献(4)
  • 二级参考文献(0)
2011(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2013(1)
  • 引证文献(1)
  • 二级引证文献(0)
2014(2)
  • 引证文献(2)
  • 二级引证文献(0)
2015(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
领域知识
相关度
Web挖掘
百度百科
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
广西师范大学学报(自然科学版)
双月刊
1001-6600
45-1067/N
大16开
桂林市育才路15号
48-54
1957
chi
出版文献量(篇)
3550
总下载数(次)
1
总被引数(次)
13610
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导