基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
网络书写具有随意性、非正规性等特点。变体词就是网络语言作为一种不规范语言的显著特色,人们往往出于避免审查、表达情感、讽刺、娱乐等需求将相对严肃、规范、敏感的词用相对不规范、不敏感的词来代替,用来代替原来词的新词就叫做变体词(Morph)。变体词和其对应的原来的词(目标实体词)会分别在非规范文本和规范文本中共存,甚至变体词会渗透到规范文本中。变体词使行文更加生动活泼,相关事件、消息也传播得更加广泛。但是因为变体词通常是某种隐喻,已不再是其表面字词的意义了,从而使网络上文体与正式文本(如新闻等)具有巨大的差异。由此如何识别出这些变体词及其所对应的目标实体词对于下游的自然语言处理技术具有重要的意义。本文首先介绍了变体词的定义和特征,变体词的生成规律,总结了当前变体词的识别和规范化的主要技术进展和成果,最后是此领域发展方向的展望。
推荐文章
基于有效上下文信息的变体词还原方法
变体词
变体词还原
自编码器
有效上下文信息
词嵌入
神经网络
基于规则的中文时间表达式识别与规范化
规则
正则表达式
时间表达式识别
规范化
中文药品剂型信息的规范化
剂型
规范化
药品数据
数据标准化
药事管理
药学信息学
一种基于关联规则的中文变体词识别算法
关联规则
中文
变体词
识别
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 中文变体词的识别与规范化综述
来源期刊 信息安全学报 学科
关键词 社交网络 变体词识别 变体词规范化 深度学习 神经网络 表示学习
年,卷(期) 2016,(3) 所属期刊栏目
研究方向 页码范围 77-87
页数 11页 分类号
字数 12413字 语种 中文
DOI 10.19363/j.cnki.cn10-1380/tn.2016.03.006
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (9)
共引文献  (45)
参考文献  (9)
节点文献
引证文献  (3)
同被引文献  (1)
二级引证文献  (1)
1954(1)
  • 参考文献(1)
  • 二级参考文献(0)
1975(1)
  • 参考文献(0)
  • 二级参考文献(1)
1977(2)
  • 参考文献(0)
  • 二级参考文献(2)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(2)
  • 参考文献(0)
  • 二级参考文献(2)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(1)
  • 参考文献(1)
  • 二级参考文献(0)
2007(2)
  • 参考文献(2)
  • 二级参考文献(0)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(1)
  • 参考文献(1)
  • 二级参考文献(0)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2017(1)
  • 引证文献(1)
  • 二级引证文献(0)
2018(3)
  • 引证文献(2)
  • 二级引证文献(1)
研究主题发展历程
节点文献
社交网络
变体词识别
变体词规范化
深度学习
神经网络
表示学习
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
信息安全学报
双月刊
2096-1146
10-1380/TN
大16开
北京市海淀区闵庄路甲89号
2016
chi
出版文献量(篇)
252
总下载数(次)
7
相关基金
国家科技支撑计划
英文译名:
官方网址:http://kjzc.jhgl.org/
项目类型:重大项目
学科类型:能源
论文1v1指导