作者:
基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
压缩技术旨在模拟人类的文本概括和信息提取能力.句子压缩技术是自动生成能够保留原句核心内容的,合乎语法的,语义连贯的简短句子.文章分析了英文句子压缩技术中基于句法分析的Hedge Trimmer压缩技术,讨论了相关压缩理论,探索其压缩过程并用类C语言进行算法实现.提出了好的压缩句应该至少满足以下3个标准:第一是保留原句的核心内容,第二是具有正确的语法,第三是压缩长度合理.在算法的评估工作中,从DUC 2003语料库中选取了624个原始句子和对应的人工压缩句,与Hedge Trimmer压缩算法自动生成的压缩句进行对照分析.发现5种压缩效果不理想的情况,分析其原因并提出了改进策略.最后,通过实例对改进算法生成的压缩句和原来算法生成的压缩句进行对比评估,证明了改良算法能够获得更理想的压缩句.在英文句子压缩领域,改良的Hedge Trimmer句子压缩算法值得推广和应用.
推荐文章
LZW改进压缩算法的FPGA实现
数据处理
无损压缩
LZW
压缩算法
FPGA
基于概率和句法的句子压缩技术对比研究
句子压缩
概率
句法
语料库
基于预读及简单注意力机制的句子压缩方法
自然语言处理
句子压缩
预读
注意力机制
基于改进小波的图像压缩算法设计与实现
小波
图像压缩
向量量化
图像降噪
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 Hedge Trimmer句子压缩技术的算法实现及改进
来源期刊 沈阳师范大学学报(自然科学版) 学科 工学
关键词 句子压缩 Hedge Trimmer算法 评估 改进
年,卷(期) 2012,(4) 所属期刊栏目 计算机科学技术
研究方向 页码范围 519-524
页数 6页 分类号 TP391.1
字数 3939字 语种 中文
DOI 10.3969/j.issn.1673-5862.2012.04.018
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 景秀丽 东北财经大学研究生院 12 38 3.0 5.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (4)
节点文献
引证文献  (2)
同被引文献  (1)
二级引证文献  (0)
2002(1)
  • 参考文献(1)
  • 二级参考文献(0)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2019(2)
  • 引证文献(2)
  • 二级引证文献(0)
研究主题发展历程
节点文献
句子压缩
Hedge Trimmer算法
评估
改进
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
沈阳师范大学学报(自然科学版)
季刊
1673-5862
21-1534/N
大16开
沈阳市皇姑区黄河北大街253号
8-103
1983
chi
出版文献量(篇)
2465
总下载数(次)
4
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导