基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
传统的基于统计的自动文摘方法以词语作为文本信息的基本单位,没有考虑到词语在不同语言环境下的具体语义,导致文摘精度不高.为了克服传统方法的缺点,提出了一种基于文本组块的自动文摘方法.系统利用中科院的ICTCLAS软件对文档进行分词和词性标注,并根据一系列的规则,将相关的词语构造成组块.由句子中出现的组块作为衡量句子重要性的标准选出文摘句.文中给出了自动文摘的评价方法和实验结果,跟传统的基于词语的文摘相比较,实验结果表明基于文本组块的自动文摘系统生成的文摘句精度更高,更能全面反映原文的主要内容.
推荐文章
中文语义组块自动抽取方法
语义表述
深度信念网络
深度学习
中文语义组块
基于中文电子病历的跨科室组块分析
中文电子病历
词性标注
组块分析
领域适应
结构化支持向量机
基于SVM的快速中文组块分析方法
中文信息处理
组块识别
组块特征
支持向量机
基于条件随机场的中文自动文摘系统
条件随机场
自动文摘
关键词抽取
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于组块的中文自动文摘系统研究
来源期刊 计算机系统应用 学科 工学
关键词 自然语言处理 文本组块 自动文摘 统计方法 向量空间模型
年,卷(期) 2007,(3) 所属期刊栏目 实践经验
研究方向 页码范围 97-100
页数 4页 分类号 TP2
字数 3729字 语种 中文
DOI 10.3969/j.issn.1003-3254.2007.03.025
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (21)
共引文献  (107)
参考文献  (8)
节点文献
引证文献  (4)
同被引文献  (6)
二级引证文献  (25)
1957(1)
  • 参考文献(1)
  • 二级参考文献(0)
1972(1)
  • 参考文献(0)
  • 二级参考文献(1)
1990(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(2)
  • 参考文献(0)
  • 二级参考文献(2)
1997(3)
  • 参考文献(0)
  • 二级参考文献(3)
1999(5)
  • 参考文献(0)
  • 二级参考文献(5)
2000(5)
  • 参考文献(1)
  • 二级参考文献(4)
2001(1)
  • 参考文献(1)
  • 二级参考文献(0)
2002(3)
  • 参考文献(0)
  • 二级参考文献(3)
2003(2)
  • 参考文献(2)
  • 二级参考文献(0)
2004(3)
  • 参考文献(2)
  • 二级参考文献(1)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
2007(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2008(1)
  • 引证文献(1)
  • 二级引证文献(0)
2009(3)
  • 引证文献(3)
  • 二级引证文献(0)
2010(3)
  • 引证文献(0)
  • 二级引证文献(3)
2011(7)
  • 引证文献(0)
  • 二级引证文献(7)
2012(3)
  • 引证文献(0)
  • 二级引证文献(3)
2013(5)
  • 引证文献(0)
  • 二级引证文献(5)
2014(2)
  • 引证文献(0)
  • 二级引证文献(2)
2015(3)
  • 引证文献(0)
  • 二级引证文献(3)
2016(1)
  • 引证文献(0)
  • 二级引证文献(1)
2017(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
自然语言处理
文本组块
自动文摘
统计方法
向量空间模型
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机系统应用
月刊
1003-3254
11-2854/TP
大16开
北京中关村南四街4号
82-558
1991
chi
出版文献量(篇)
10349
总下载数(次)
20
总被引数(次)
57078
论文1v1指导