基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
相比规范新闻文本中命名实体识别(named entity recognition,NER),中文社交媒体中命名实体识别的性能偏低,这主要受限于文本的规范性和标注语料的规模.近年来中文社交媒体的命名实体识别研究主要针对标注语料规模小这一问题,倾向于使用外部知识或者借助联合训练来提升最终的识别性能,但对社交媒体文本不规范导致的对文本自身蕴含特征的挖掘不够这一问题的研究很少.该文着眼于文本自身,提出了一种结合双向长短时记忆和自注意力机制的命名实体识别方法.该方法通过在多个不同子空间捕获上下文相关信息来更好地理解和表示句子结构,充分挖掘文本自身蕴含的特征,并最终提升不规范文本的实体识别性能.在Weibo NER公开语料上进行了多组对比实验,实验结果验证了方法的有效性.结果 表明:在不使用外部资源和联合训练的情况下,命名实体识别的F1值达到了58.76%.
推荐文章
基于自注意力机制的军事命名实体识别
LSTM
命名实体识别
深度学习
自注意力
基于位置敏感Embedding的中文命名实体识别
命名实体识别
表示学习
Embedding
多尺度聚类
条件随机场
融合词位字向量的军事领域命名实体识别
军事
命名实体识别
词位字向量
BI-GRU-CRF
深度神经网络
序列标注
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 融入自注意力机制的社交媒体命名实体识别
来源期刊 清华大学学报(自然科学版) 学科 工学
关键词 命名实体识别 中文社交媒体 自注意力机制
年,卷(期) 2019,(6) 所属期刊栏目 计算机科学与技术
研究方向 页码范围 461-467
页数 7页 分类号 TP391.1
字数 语种 中文
DOI 10.16511/j.cnki.qhdxxb.2019.25.005
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 孔芳 66 350 11.0 15.0
2 李明扬 3 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (7)
共引文献  (69)
参考文献  (4)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1973(1)
  • 参考文献(1)
  • 二级参考文献(0)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(2)
  • 参考文献(0)
  • 二级参考文献(2)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2019(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
命名实体识别
中文社交媒体
自注意力机制
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
清华大学学报(自然科学版)
月刊
1000-0054
11-2223/N
大16开
北京市海淀区清华园清华大学
2-90
1915
chi
出版文献量(篇)
7846
总下载数(次)
26
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导