基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
为了解决自然语言处理领域中的一词多义问题,本文提出了一种利用多种语言学知识和词义消歧模型的半监督消歧方法.首先,以歧义词汇左、右邻接词单元的词形、词性和译文作为消歧特征,来构建贝叶斯(Bayes)词义分类器,并以歧义词汇左、右邻接词单元的词形和词性作为消歧特征,来构建最大熵(maximum entropy,ME)词义分类器;其次,采用Co-Training算法并结合大量无标注语料来优化词义消歧模型;再次,进行了优化实验,在实验中,使用SemEval-2007:Task#5的训练语料和哈尔滨工业大学的无标注语料来优化贝叶斯分类器和最大熵分类器;最后,对优化后的词义消歧模型进行测试.测试结果表明:与基于支持向量机(support vector machine,SVM)的词义消歧方法相比,本文所提出方法的消歧准确率提高了0.9%.词义消歧的性能有所提高.
推荐文章
一种基于语义搭配的汉语词义消歧方法
自然语言处理
词义消歧
搭配
同现
种子
基于条件随机场的古汉语词义消歧研究
中文信息处理
古汉语
词义消歧
条件随机场
基于句法分析的汉语词义消歧
词义消歧
句法信息
词性
消歧分类器
一种新的汉语词义消歧方法
词义消歧
优先组合关系
词关联
相似度
知网
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种半监督的汉语词义消歧方法
来源期刊 西南交通大学学报 学科 工学
关键词 自然语言处理 词义消歧 最大熵 贝叶斯分类器
年,卷(期) 2019,(2) 所属期刊栏目
研究方向 页码范围 408-414
页数 7页 分类号 TP391.2
字数 5219字 语种 中文
DOI 10.3969/j.issn.0258-2724.20170178
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 高雪瑶 哈尔滨理工大学计算机科学与技术学院 36 60 5.0 6.0
2 张春祥 哈尔滨理工大学软件与微电子学院 33 80 6.0 7.0
3 徐志峰 哈尔滨理工大学计算机科学与技术学院 1 6 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (35)
共引文献  (13)
参考文献  (7)
节点文献
引证文献  (6)
同被引文献  (19)
二级引证文献  (4)
1995(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(3)
  • 参考文献(0)
  • 二级参考文献(3)
2006(3)
  • 参考文献(0)
  • 二级参考文献(3)
2007(3)
  • 参考文献(0)
  • 二级参考文献(3)
2008(3)
  • 参考文献(0)
  • 二级参考文献(3)
2009(3)
  • 参考文献(0)
  • 二级参考文献(3)
2010(3)
  • 参考文献(1)
  • 二级参考文献(2)
2011(4)
  • 参考文献(0)
  • 二级参考文献(4)
2012(6)
  • 参考文献(0)
  • 二级参考文献(6)
2013(2)
  • 参考文献(1)
  • 二级参考文献(1)
2014(6)
  • 参考文献(2)
  • 二级参考文献(4)
2015(2)
  • 参考文献(2)
  • 二级参考文献(0)
2017(1)
  • 参考文献(1)
  • 二级参考文献(0)
2019(8)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(5)
  • 二级引证文献(3)
2019(8)
  • 引证文献(5)
  • 二级引证文献(3)
2020(2)
  • 引证文献(1)
  • 二级引证文献(1)
研究主题发展历程
节点文献
自然语言处理
词义消歧
最大熵
贝叶斯分类器
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
西南交通大学学报
双月刊
0258-2724
51-1277/U
大16开
四川省成都市二环路北一段
62-104
1954
chi
出版文献量(篇)
3811
总下载数(次)
4
总被引数(次)
51589
论文1v1指导