基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对传统中文地址分词工作中存在的准确率差,识别率低的问题,提出了一种基于BERT的中文地址分词方法.同时,将非行政级别的地址标签进行重新设计,并通过构建BERT-BiLSTM-CRF模型,将中文地址分词任务转换为命名实体识别任务.利用大量全国地址数据对BERT进行训练,获取文本抽象特征;利用双向长短时记忆网络将文本序列化并结合上下文进一步获取文本特征;通过条件随机场获取最优序列,提取出正确的地址级别.该方法在所使用训练数据集上取得了98.21%的精确率和98.23的F1值,证明了该方法的有效性.
推荐文章
基于LSTM网络的中文地址分词法的设计与实现
中文地址
分词
卡短时记忆
未标记数据集
基于词典和词频的中文分词方法
中文分词
歧义消除
词频
基于字簇的多模型中文分词方法研究
中文分词
构词规律
模型参数
聚类
中文分词算法研究与分析
中文分词
字符串匹配分词
统计分词
理解分词
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于BERT的中文地址分词方法
来源期刊 电子设计工程 学科
关键词 BERT 中文地址分词 长短时记忆网络 条件随机场 命名实体识别
年,卷(期) 2021,(9) 所属期刊栏目 通信与网络|Communication & Network
研究方向 页码范围 155-159
页数 5页 分类号 TP391.1
字数 语种 中文
DOI 10.14022/j.issn1674-6236.2021.09.033
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (88)
共引文献  (57)
参考文献  (8)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1967(1)
  • 参考文献(0)
  • 二级参考文献(1)
1989(1)
  • 参考文献(0)
  • 二级参考文献(1)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(4)
  • 参考文献(0)
  • 二级参考文献(4)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(3)
  • 参考文献(0)
  • 二级参考文献(3)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(2)
  • 参考文献(0)
  • 二级参考文献(2)
2004(3)
  • 参考文献(0)
  • 二级参考文献(3)
2005(3)
  • 参考文献(0)
  • 二级参考文献(3)
2006(3)
  • 参考文献(0)
  • 二级参考文献(3)
2007(7)
  • 参考文献(0)
  • 二级参考文献(7)
2008(3)
  • 参考文献(0)
  • 二级参考文献(3)
2009(2)
  • 参考文献(0)
  • 二级参考文献(2)
2010(9)
  • 参考文献(0)
  • 二级参考文献(9)
2011(9)
  • 参考文献(0)
  • 二级参考文献(9)
2012(4)
  • 参考文献(0)
  • 二级参考文献(4)
2013(6)
  • 参考文献(0)
  • 二级参考文献(6)
2014(7)
  • 参考文献(0)
  • 二级参考文献(7)
2015(8)
  • 参考文献(1)
  • 二级参考文献(7)
2016(6)
  • 参考文献(0)
  • 二级参考文献(6)
2017(7)
  • 参考文献(3)
  • 二级参考文献(4)
2018(3)
  • 参考文献(3)
  • 二级参考文献(0)
2020(1)
  • 参考文献(1)
  • 二级参考文献(0)
2021(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
BERT
中文地址分词
长短时记忆网络
条件随机场
命名实体识别
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
电子设计工程
半月刊
1674-6236
61-1477/TN
大16开
西安市高新区高新路25号瑞欣大厦10A室
52-142
1994
chi
出版文献量(篇)
14564
总下载数(次)
54
总被引数(次)
54366
论文1v1指导