基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
短语树库是自然语言处理的研究和实际应用的重要资源,就越南语而言目前也缺乏这类树库资源,不利于汉越双语信息处理工作.提出一种融合越南语语法特征与改进PCFG(概率上下文无关文法)的越南语短语树库构建方法,能够自动分析出越南语的短语结构树,从而可解决了越南语短语树库的自动构建问题.首先通过分析越南语的语言特征,制定出越南语的语言特征集;然后利用Inside-Outside算法从人工标注的少量越南语短语树获取PCFG模型中的语法规则集;最后将语法特征集作为语法规则集的补充融入PCFG模型,用得到的新模型最终完成越南语短语树库的构建.实验结果表明,新的PCFG模型针对越南语短语树库构建的准确率达到了81.14%,相比传统PCFG模型以及基于最大熵的树库构建方法准确率明显提高了2%~3%.
推荐文章
越南语短语树到依存树的转换研究
句法分析
中心子节点过滤表
短语结构
依存结构
树库
融合语言特性的越南语兼类词消歧
兼类词消歧
兼类词词典
兼类词语料库
语言特征
条件随机场模型
越南语
“三语习得”视阈下广西壮族地区高校越南语课堂多元文化教育研究
“三语习得”
广西壮族地区高校
越南语课堂
多元文化
融合边界信息的越南语名词短语深度学习识别方法
越南语
名词短语识别
边界信息
Bi-LSTM+CRF
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 融合越南语语言特征与改进PCFG的越南语短语树库构建
来源期刊 南京大学学报(自然科学版) 学科 工学
关键词 越南语 短语结构树 概率上下文无关文法 语法规则集 树库
年,卷(期) 2017,(2) 所属期刊栏目
研究方向 页码范围 357-367
页数 11页 分类号 TP391
字数 7225字 语种 中文
DOI 10.13232/j.cnki.jnju.2017.02.018
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 余正涛 昆明理工大学信息工程与自动化学院 122 877 17.0 24.0
5 郭剑毅 昆明理工大学信息工程与自动化学院 76 794 12.0 27.0
9 李英 昆明理工大学信息工程与自动化学院 9 50 4.0 7.0
13 线岩团 昆明理工大学信息工程与自动化学院 23 91 5.0 8.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (7)
共引文献  (19)
参考文献  (3)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1970(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(4)
  • 参考文献(0)
  • 二级参考文献(4)
2009(1)
  • 参考文献(1)
  • 二级参考文献(0)
2013(2)
  • 参考文献(2)
  • 二级参考文献(0)
2017(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
越南语
短语结构树
概率上下文无关文法
语法规则集
树库
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
南京大学学报(自然科学版)
双月刊
0469-5097
32-1169/N
江苏省南京市南京大学
chi
出版文献量(篇)
2526
总下载数(次)
6
总被引数(次)
23071
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导