基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
句义结构分析是汉语语义分析中不可逾越的重要环节,为了满足汉语句义结构分析的需要,基于现代汉语语义学理论构建了一种层次化的汉语句义结构模型,定义了标注规范和标记形式,建设了一个汉语句义结构标注语料库BFS-CTC(Beijing Forest Studio-Chinese Tagged Corpus).标注内容方面,基于句义结构模型的定义标注了句义结构句型层、描述层、对象层和细节层中所包含的各个要素及其组合关系,包括句义类型、谓词及其时态、语义格类型等信息,并且提供了词法和短语结构句法信息,便于词法、句法、句义的对照分析研究;语料库组织结构方面,该语料库包括四个部分,即原始句子库、词法标注库、句法标注库和句义结构标注库,可根据研究的需要,在词法、句法、句义结构标注的基础上进行深加工,在核心标注库的基础上添加更多具有针对性的扩展标注库,利用句子的唯一ID号进行识别和使用;语料来源和规模方面,语料全部来自新闻语料,经过人工收集、整理,合理覆盖了主谓句、非主谓句、把字句等六种主要句式类型,规模已达到10000句.同其他语义标注库相比,BFS-CTC基于现代汉语语义学,提供了多层次的句义结构标注信息,兼容进行了词法和语法标注,各类标注既可以单独使用也可综合使用进行横向分析,可用于自然语言处理多方面的研究,进一步推动汉语语义分析的研究和发展.
推荐文章
古代汉语标注语料库的建设与应用
古代汉语
语料库
标注
选取
应用
基于现代汉语语料库报刊类的色彩词隐喻研究
色彩词
报刊类语料
隐喻喻义
海内外隐喻差异
面向事件的多语平行语料库构建研究
语料收集原则
标注规范
可控多语语料库
关于旅游英语语料库的运用
旅游英语
语料库
标示语翻译
运用
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 BFS-CTC汉语句义结构标注语料库
来源期刊 中文信息学报 学科 工学
关键词 自然语言处理 语义标注 句义结构 语料库
年,卷(期) 2013,(1) 所属期刊栏目
研究方向 页码范围 72-80
页数 9页 分类号 TP391
字数 6604字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 罗森林 北京理工大学信息与电子学院信息安全与对抗技术实验室 121 821 14.0 23.0
2 王倩 北京理工大学信息与电子学院信息安全与对抗技术实验室 30 59 5.0 6.0
3 韩磊 北京理工大学信息与电子学院信息安全与对抗技术实验室 25 154 7.0 11.0
4 刘盈盈 北京理工大学信息与电子学院信息安全与对抗技术实验室 3 33 3.0 3.0
5 冯扬 北京理工大学信息与电子学院信息安全与对抗技术实验室 6 59 5.0 6.0
6 陈功 北京理工大学信息与电子学院信息安全与对抗技术实验室 4 40 4.0 4.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (39)
共引文献  (172)
参考文献  (14)
节点文献
引证文献  (6)
同被引文献  (19)
二级引证文献  (9)
1976(2)
  • 参考文献(0)
  • 二级参考文献(2)
1985(2)
  • 参考文献(0)
  • 二级参考文献(2)
1986(3)
  • 参考文献(0)
  • 二级参考文献(3)
1992(1)
  • 参考文献(0)
  • 二级参考文献(1)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(2)
  • 参考文献(1)
  • 二级参考文献(1)
1997(2)
  • 参考文献(1)
  • 二级参考文献(1)
2000(2)
  • 参考文献(0)
  • 二级参考文献(2)
2001(3)
  • 参考文献(0)
  • 二级参考文献(3)
2002(6)
  • 参考文献(3)
  • 二级参考文献(3)
2003(4)
  • 参考文献(1)
  • 二级参考文献(3)
2005(6)
  • 参考文献(1)
  • 二级参考文献(5)
2006(3)
  • 参考文献(1)
  • 二级参考文献(2)
2007(4)
  • 参考文献(3)
  • 二级参考文献(1)
2008(1)
  • 参考文献(0)
  • 二级参考文献(1)
2009(2)
  • 参考文献(1)
  • 二级参考文献(1)
2010(3)
  • 参考文献(2)
  • 二级参考文献(1)
2011(2)
  • 参考文献(0)
  • 二级参考文献(2)
2014(2)
  • 参考文献(0)
  • 二级参考文献(2)
2015(1)
  • 参考文献(0)
  • 二级参考文献(1)
2013(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2014(1)
  • 引证文献(1)
  • 二级引证文献(0)
2015(3)
  • 引证文献(3)
  • 二级引证文献(0)
2016(4)
  • 引证文献(2)
  • 二级引证文献(2)
2017(2)
  • 引证文献(0)
  • 二级引证文献(2)
2018(2)
  • 引证文献(0)
  • 二级引证文献(2)
2019(1)
  • 引证文献(0)
  • 二级引证文献(1)
2020(2)
  • 引证文献(0)
  • 二级引证文献(2)
研究主题发展历程
节点文献
自然语言处理
语义标注
句义结构
语料库
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
中文信息学报
月刊
1003-0077
11-2325/N
16开
北京海淀区中关村南四街4号
1986
chi
出版文献量(篇)
2723
总下载数(次)
5
总被引数(次)
45413
论文1v1指导