基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
为了对汉语谓词进行系统的研究,提出一种融合词法和句法特征、结合C4.5机器学习和规则进行谓词识别的方法.该方法对句子的词法信息和句法信息分别进行特征提取,通过词法特征提取得到句子中可疑谓词及其个数,使用人工总结规则对词法特征进行规则过滤,对符合规则条件的样本直接给出结果,融合不符合规则样本的词法和句法特征,使用C4.5进行分类得到谓词识别结果.实验中,采用谓词总量达到20 000条以上的BFS-CTC标注语料库进行特征和参数选择、句法特征验证、训练数据量选择和算法准确性等一系列的实验,对谓词识别效果的影响进行研究.结果表明:句法特征能有效提升谓词识别效果,随着训练数据量的增加谓词识别准确率趋于平缓,达到了99%的高准确率.
推荐文章
基于特征融合的多节点调制识别方法
传感器网络
分布式结构
调制识别
似然比
特征融合
基于句法模式识别的雷达识别方法研究
雷达脉冲序列
雷达信号识别
句法模式识别
多位有限态自动机
汉语篇章主位推进模式自动识别方法
连贯性
主位推进模式
主位切分
主位
述位
模式匹配
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 融合词法和句法特征的汉语谓词高精度识别方法
来源期刊 浙江大学学报(工学版) 学科 工学
关键词 谓词识别 句法特征 句义结构 语义分析 自然语言处理
年,卷(期) 2014,(12) 所属期刊栏目 计算机技术
研究方向 页码范围 2107-2114,2195
页数 9页 分类号 TP391
字数 语种 中文
DOI 10.3785/j.issn.1008-973X.2014.12.002
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 罗森林 121 821 14.0 23.0
2 潘丽敏 66 402 10.0 17.0
3 魏超 51 521 13.0 21.0
4 韩磊 25 154 7.0 11.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (51)
共引文献  (121)
参考文献  (13)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1986(1)
  • 参考文献(1)
  • 二级参考文献(0)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(4)
  • 参考文献(1)
  • 二级参考文献(3)
1997(3)
  • 参考文献(0)
  • 二级参考文献(3)
1998(4)
  • 参考文献(0)
  • 二级参考文献(4)
2000(2)
  • 参考文献(0)
  • 二级参考文献(2)
2001(3)
  • 参考文献(0)
  • 二级参考文献(3)
2002(10)
  • 参考文献(2)
  • 二级参考文献(8)
2003(3)
  • 参考文献(1)
  • 二级参考文献(2)
2005(4)
  • 参考文献(1)
  • 二级参考文献(3)
2006(3)
  • 参考文献(0)
  • 二级参考文献(3)
2007(7)
  • 参考文献(0)
  • 二级参考文献(7)
2008(3)
  • 参考文献(1)
  • 二级参考文献(2)
2009(2)
  • 参考文献(1)
  • 二级参考文献(1)
2010(6)
  • 参考文献(1)
  • 二级参考文献(5)
2011(2)
  • 参考文献(0)
  • 二级参考文献(2)
2012(3)
  • 参考文献(2)
  • 二级参考文献(1)
2013(2)
  • 参考文献(2)
  • 二级参考文献(0)
2014(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
谓词识别
句法特征
句义结构
语义分析
自然语言处理
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
浙江大学学报(工学版)
月刊
1008-973X
33-1245/T
大16开
杭州市浙大路38号
32-40
1956
chi
出版文献量(篇)
6865
总下载数(次)
6
总被引数(次)
81907
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导