基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
为了构建一个简单易扩展的中文句法分析器,我们依据朱德熙和陆俭明先生的中文二分结构的层次分析句法理论,手工构建了一个3万句的二分结构的中文句法树库,并使用哈夫曼编码方式来简化表示完全二叉树的层次结构.该文将中文句法分析转换为迭代二分的序列标注问题,并根据该任务的特点,提出了在词的间隔上进行标记的序列标注模型(RNN-Interval,RNN-INT),与常用的循环神经网络模型(RNN,LSTM)和条件随机场模型(CRF)进行对比实验,使用mx2交叉验证序贯t-检验来比较模型.实验结果表明,RNN-INT模型在窗口为1的词特征就可达到最好的性能,并好于其他窗口大小和其他序列标注模型(RNN,LSTM,CRF).最后,在测试集上,在人工分词下,RN N-IN T在短语级别的F1值(块F1)达到71.25%,在句子级别的准确率达到约43%.
推荐文章
中文复杂名词短语依存句法分析
中文复杂名词短语
依存句法分析
决策式算法
支持向量机
特征
基于双向LSTM的图结构依存句法分析
图结构
依存句法分析
双向长短期神经网络模型
隐马尔科夫模型
Viterbi算法
基于句子跨度的哈萨克语句法分析研究
双向LSTM
句子跨度
动态规划
基于两种句法分析的语义角色标注比较研究
语义角色标注
依存句法分析
短语结构句法分析
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于RNN的中文二分结构句法分析
来源期刊 中文信息学报 学科 工学
关键词 层次句法分析 循环神经网络(RNN) m×2CV序贯t-检验
年,卷(期) 2019,(1) 所属期刊栏目 语言分析与计算
研究方向 页码范围 35-45
页数 11页 分类号 TP391
字数 10896字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 李济洪 山西大学软件学院 58 261 10.0 14.0
2 谷波 山西大学计算机与信息技术学院 4 62 4.0 4.0
3 李国臣 9 88 7.0 9.0
4 王瑞波 山西大学软件学院 23 179 7.0 13.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (13)
共引文献  (16)
参考文献  (8)
节点文献
引证文献  (5)
同被引文献  (9)
二级引证文献  (0)
1990(1)
  • 参考文献(1)
  • 二级参考文献(0)
1997(1)
  • 参考文献(1)
  • 二级参考文献(0)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(2)
  • 参考文献(1)
  • 二级参考文献(1)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(2)
  • 参考文献(0)
  • 二级参考文献(2)
2006(3)
  • 参考文献(0)
  • 二级参考文献(3)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(1)
  • 参考文献(0)
  • 二级参考文献(1)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2011(2)
  • 参考文献(1)
  • 二级参考文献(1)
2012(1)
  • 参考文献(0)
  • 二级参考文献(1)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(1)
  • 参考文献(1)
  • 二级参考文献(0)
2017(1)
  • 参考文献(1)
  • 二级参考文献(0)
2019(4)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(4)
  • 二级引证文献(0)
2019(4)
  • 引证文献(4)
  • 二级引证文献(0)
2020(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
层次句法分析
循环神经网络(RNN)
m×2CV序贯t-检验
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
中文信息学报
月刊
1003-0077
11-2325/N
16开
北京海淀区中关村南四街4号
1986
chi
出版文献量(篇)
2723
总下载数(次)
5
总被引数(次)
45413
相关基金
国家社会科学基金
英文译名:Philosophy and Social Science Foundation of China
官方网址:http://www.npopss-cn.gov.cn/
项目类型:重点项目
学科类型:马列·科社
论文1v1指导