基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
提出了一个基于统计的从未标注语料库中半自动获取语义语法算法.该算法对特定领域的语料库进行反复的时间聚类和空间聚类,通过时间聚类发现语言片段的语法结构;通过空间聚类发现语言片段的语义类别;循环迭代,可以生成一个粗糙的文法.最后,将这些抽取出来的粗糙文法经过人工校对,得到新领域的语义语法.实验结果表明了该算法是有效和切实可行的.
推荐文章
软件静态测试中C/C++抽象语法树的生成
抽象语法树
编译器前端
定义使用链
符号表
对编译器前端生成器Front的语法和语义扩展
编译器生成器
编译器前端生成器
Front
Elegant
语法
语义
基于术语长度和语法特征的统计领域术语抽取
自然语言处理
术语抽取
支持向量机
术语长度
语法特征
词长比
领域相关性
领域一致性
从日语格语法表示生成汉语的难点分析
机器翻译
日语
汉语
格语法
转换
生成
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 领域语义语法的统计生成
来源期刊 北京邮电大学学报 学科 工学
关键词 对话系统 语义语法 K-L距离 互信息
年,卷(期) 2006,(z2) 所属期刊栏目
研究方向 页码范围 75-78
页数 4页 分类号 TP929.53
字数 3669字 语种 中文
DOI 10.3969/j.issn.1007-5321.2006.z2.016
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 刘建毅 北京邮电大学信息工程学院 27 354 11.0 18.0
3 王枞 北京邮电大学信息工程学院 45 479 10.0 21.0
4 王菁华 北京邮电大学信息工程学院 5 68 3.0 5.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (1)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1999(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
对话系统
语义语法
K-L距离
互信息
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
北京邮电大学学报
双月刊
1007-5321
11-3570/TN
大16开
北京海淀区西土城路10号
2-648
1960
chi
出版文献量(篇)
3472
总下载数(次)
19
总被引数(次)
26644
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导