作者:
基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
在微博中,新词的构词规则多样且复杂多变.针对基于词内部结合度与边界自由度的新词发现方法对新词内部结合度不高的问题,改进一种融合多字互信息与左右邻接熵的新词合成算法.利用多字互信息提高新词的内部结合度,最终达到提高新词识别精度的目的.实验结果表明,改进的方法能有效提高微博新词识别的性能.
推荐文章
基于互信息和邻接熵的新词发现算法
新词发现
互信息
邻接熵
微博语料
基于互信息和邻接熵的新词发现算法
新词发现
互信息
邻接熵
微博语料
基于Trie树的词语左右熵和互信息新词发现算法
新词发现算法
左右熵
互信息
Trie树
算法设计
对比验证
中国英语新词语料库构建技术研究
中国英语
中国英语新词语料库
新词识别
点互信息(PMI)
双阈值
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种基于多字互信息与邻接熵的改进新词合成算法
来源期刊 现代计算机 学科
关键词 多字互信息 邻接熵 新词合成算法
年,卷(期) 2018,(11) 所属期刊栏目 研究与开发
研究方向 页码范围 7-11
页数 5页 分类号
字数 4143字 语种 中文
DOI 10.3969/j.issn.1007-1423.2018.11.002
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 王欣 重庆师范大学计算机与信息科学学院 8 20 3.0 4.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (83)
共引文献  (109)
参考文献  (15)
节点文献
引证文献  (3)
同被引文献  (26)
二级引证文献  (2)
1995(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(2)
  • 参考文献(0)
  • 二级参考文献(2)
2001(3)
  • 参考文献(0)
  • 二级参考文献(3)
2002(5)
  • 参考文献(1)
  • 二级参考文献(4)
2003(2)
  • 参考文献(0)
  • 二级参考文献(2)
2004(8)
  • 参考文献(2)
  • 二级参考文献(6)
2006(5)
  • 参考文献(0)
  • 二级参考文献(5)
2007(4)
  • 参考文献(0)
  • 二级参考文献(4)
2008(2)
  • 参考文献(0)
  • 二级参考文献(2)
2010(11)
  • 参考文献(0)
  • 二级参考文献(11)
2011(9)
  • 参考文献(0)
  • 二级参考文献(9)
2012(5)
  • 参考文献(0)
  • 二级参考文献(5)
2013(19)
  • 参考文献(2)
  • 二级参考文献(17)
2014(6)
  • 参考文献(1)
  • 二级参考文献(5)
2015(7)
  • 参考文献(4)
  • 二级参考文献(3)
2016(4)
  • 参考文献(2)
  • 二级参考文献(2)
2017(3)
  • 参考文献(3)
  • 二级参考文献(0)
2018(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2018(1)
  • 引证文献(1)
  • 二级引证文献(0)
2019(1)
  • 引证文献(1)
  • 二级引证文献(0)
2020(3)
  • 引证文献(1)
  • 二级引证文献(2)
研究主题发展历程
节点文献
多字互信息
邻接熵
新词合成算法
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
现代计算机
旬刊
1007-1423
44-1415/TP
16开
广东省广州市
46-121
1984
chi
出版文献量(篇)
11312
总下载数(次)
39
总被引数(次)
33178
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导