原文服务方: 华侨大学学报(自然科学版)       
摘要:
将名词、形容词、动名词和命名实体作为文本特征,考虑词序与词频,结合特征项的语义,提出一种基于改进最长公共子序列的文本聚类(LCSC)方法.实验结果表明:相对于传统的余弦值聚类方法,LCSC 方法在人名消歧的 P-IP 指标上,F 平均值由74.2%提高到了84.9%;相对于最长公共子序列方法,总体性能也提高了3.7%.
推荐文章
基于聚类集成的人名消歧算法
聚类集成
人名消歧
凝聚层次聚类
相似度矩阵
异构机群系统上并行计算双序列的最长公共子序列
双序列的最长公共子序列
并行算法
异构机群系统
可分负载
分配策略
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 采用改进最长公共子序列的人名消歧
来源期刊 华侨大学学报(自然科学版) 学科
关键词 人名消歧 文本相似度 最长公共子序列 层次聚类
年,卷(期) 2016,(2) 所属期刊栏目
研究方向 页码范围 201-206
页数 6页 分类号 TP391
字数 语种 中文
DOI 10.11830/ISSN.1000-5013.2016.02.0201
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 吴扬扬 华侨大学计算机科学与技术学院 59 471 13.0 19.0
2 林翠萍 华侨大学计算机科学与技术学院 2 6 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (27)
共引文献  (162)
参考文献  (8)
节点文献
引证文献  (4)
同被引文献  (16)
二级引证文献  (1)
1972(1)
  • 参考文献(0)
  • 二级参考文献(1)
1974(1)
  • 参考文献(1)
  • 二级参考文献(0)
1975(3)
  • 参考文献(2)
  • 二级参考文献(1)
1976(1)
  • 参考文献(0)
  • 二级参考文献(1)
1977(1)
  • 参考文献(1)
  • 二级参考文献(0)
1983(1)
  • 参考文献(0)
  • 二级参考文献(1)
1988(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(2)
  • 参考文献(0)
  • 二级参考文献(2)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(4)
  • 参考文献(0)
  • 二级参考文献(4)
2007(3)
  • 参考文献(0)
  • 二级参考文献(3)
2008(6)
  • 参考文献(0)
  • 二级参考文献(6)
2009(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(2)
  • 参考文献(0)
  • 二级参考文献(2)
2011(2)
  • 参考文献(0)
  • 二级参考文献(2)
2012(2)
  • 参考文献(2)
  • 二级参考文献(0)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2017(1)
  • 引证文献(1)
  • 二级引证文献(0)
2018(1)
  • 引证文献(1)
  • 二级引证文献(0)
2019(1)
  • 引证文献(1)
  • 二级引证文献(0)
2020(2)
  • 引证文献(1)
  • 二级引证文献(1)
研究主题发展历程
节点文献
人名消歧
文本相似度
最长公共子序列
层次聚类
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
华侨大学学报(自然科学版)
双月刊
1000-5013
35-1079/N
大16开
1980-01-01
chi
出版文献量(篇)
2681
总下载数(次)
0
总被引数(次)
14643
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导