基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
词语相似度计算是自然语言处理的关键技术之一,是一个被广泛研究的基础课题.传统的词语相似度量方法大多是基于语义知识和基于语料库统计的方法,即这两类方法需要具有层次关系组织的语义词典和大规模的语料库.提出了一种新的基于百度百科的词语相似度量方法,通过分析百度百科词条信息,从表征词条的解释内容方面综合分析词条相似度,并定义了词条间的相似度计算公式,通过计算部分之间的相似度得到整体的相似度.实验结果表明,与已有的相似度计算方法对比,提出的算法更加有效合理.
推荐文章
百度百科合作网络的分形生长机制研究
百度百科
复杂网络
谱分析
多重分形
Hurst指数
基于维基百科的汉越词语相似度计算
汉语
越南语
词语相似度
维基百科
概念
共现关系
对应关系
词频
基于维基百科和网页相似度分析的主题爬行策略
维基百科
文本相关性
链接分析
相似度计算
从百度百科挖掘领域知识相关度
领域知识
相关度
Web挖掘
百度百科
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于百度百科的词语相似度计算
来源期刊 计算机科学 学科 工学
关键词 词语相似度 语言网络 百度百科 向量空间模型
年,卷(期) 2013,(6) 所属期刊栏目 人工智能
研究方向 页码范围 199-202
页数 4页 分类号 TP311
字数 4815字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 杨小平 中国人民大学信息学院 84 967 15.0 30.0
2 詹志建 中国人民大学信息学院 3 71 2.0 3.0
3 梁丽娜 中国人民大学信息学院 1 38 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (16)
共引文献  (223)
参考文献  (9)
节点文献
引证文献  (38)
同被引文献  (79)
二级引证文献  (94)
1968(1)
  • 参考文献(1)
  • 二级参考文献(0)
1980(1)
  • 参考文献(0)
  • 二级参考文献(1)
1988(1)
  • 参考文献(0)
  • 二级参考文献(1)
1989(1)
  • 参考文献(1)
  • 二级参考文献(0)
1993(1)
  • 参考文献(1)
  • 二级参考文献(0)
1999(3)
  • 参考文献(1)
  • 二级参考文献(2)
2000(3)
  • 参考文献(0)
  • 二级参考文献(3)
2001(2)
  • 参考文献(1)
  • 二级参考文献(1)
2002(2)
  • 参考文献(1)
  • 二级参考文献(1)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(5)
  • 参考文献(0)
  • 二级参考文献(5)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(1)
  • 参考文献(1)
  • 二级参考文献(0)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2013(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2014(5)
  • 引证文献(3)
  • 二级引证文献(2)
2015(20)
  • 引证文献(4)
  • 二级引证文献(16)
2016(18)
  • 引证文献(6)
  • 二级引证文献(12)
2017(36)
  • 引证文献(11)
  • 二级引证文献(25)
2018(29)
  • 引证文献(9)
  • 二级引证文献(20)
2019(17)
  • 引证文献(3)
  • 二级引证文献(14)
2020(7)
  • 引证文献(2)
  • 二级引证文献(5)
研究主题发展历程
节点文献
词语相似度
语言网络
百度百科
向量空间模型
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机科学
月刊
1002-137X
50-1075/TP
大16开
重庆市渝北区洪湖西路18号
78-68
1974
chi
出版文献量(篇)
18527
总下载数(次)
68
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导