基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
在社交网络迅猛发展的今天,如何对有歧义的微博实体进行消歧和如何将微博实体连接到知识库已成为当今研究热点。对实体消歧和实体链接提出了多种策略方案。首先利用 ICTCLAS 对微博文本进行分词处理,利用百度百科、实体专家库对实体进行规范化处理。然后利用由爬虫爬取的百度百科信息、微博数据、网络词语构建了消歧文本数据库,再结合 TF-IDF 算法和 Fast-Newman 聚类算法对实体进行消歧和链接。使用第二届自然语言处理与中文计算会议(NLP&CC 2013)中的中文微博实体链接任务给的数据进行测试,测评中准确率为84.99%,继续改进模型后准确率达91.40%。
推荐文章
中文微博实体链接研究
微博实体链接
改进的拼音编辑距离
后缀词表匹配法
实体消歧
面向实体链接的多特征图模型实体消歧方法
中文实体链接
实体消歧
语义特征
图模型
面向实体链接的多特征图模型实体消歧方法
中文实体链接
实体消歧
语义特征
图模型
基于词向量的中文微博实体链接方法
实体链接
词向量
维基百科
同义词
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 多策略中文微博实体词消歧及实体链接
来源期刊 计算机应用与软件 学科 工学
关键词 中文微博 实体消歧 TF-IDF Fast-Newman 聚类
年,卷(期) 2016,(8) 所属期刊栏目 软件技术与研究
研究方向 页码范围 12-17,61
页数 7页 分类号 TP3
字数 7962字 语种 中文
DOI 10.3969/j.issn.1000-386x.2016.08.003
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 李莉 西南大学计算机与信息科学学院 34 245 9.0 15.0
2 郭云龙 西南大学计算机与信息科学学院 3 32 3.0 3.0
3 向宇 西南大学计算机与信息科学学院 2 3 1.0 1.0
4 徐潇 西南大学计算机与信息科学学院 1 3 1.0 1.0
5 曾维刚 西南大学计算机与信息科学学院 1 3 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (39)
共引文献  (182)
参考文献  (13)
节点文献
引证文献  (3)
同被引文献  (10)
二级引证文献  (0)
1997(5)
  • 参考文献(1)
  • 二级参考文献(4)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(3)
  • 参考文献(0)
  • 二级参考文献(3)
2002(4)
  • 参考文献(1)
  • 二级参考文献(3)
2003(2)
  • 参考文献(0)
  • 二级参考文献(2)
2004(5)
  • 参考文献(1)
  • 二级参考文献(4)
2005(2)
  • 参考文献(0)
  • 二级参考文献(2)
2006(9)
  • 参考文献(3)
  • 二级参考文献(6)
2007(3)
  • 参考文献(0)
  • 二级参考文献(3)
2008(4)
  • 参考文献(2)
  • 二级参考文献(2)
2009(2)
  • 参考文献(1)
  • 二级参考文献(1)
2010(4)
  • 参考文献(0)
  • 二级参考文献(4)
2011(2)
  • 参考文献(0)
  • 二级参考文献(2)
2012(1)
  • 参考文献(0)
  • 二级参考文献(1)
2013(3)
  • 参考文献(2)
  • 二级参考文献(1)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2017(1)
  • 引证文献(1)
  • 二级引证文献(0)
2019(1)
  • 引证文献(1)
  • 二级引证文献(0)
2020(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
中文微博
实体消歧
TF-IDF
Fast-Newman 聚类
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用与软件
月刊
1000-386X
31-1260/TP
大16开
上海市愚园路546号
4-379
1984
chi
出版文献量(篇)
16532
总下载数(次)
47
总被引数(次)
101489
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导