基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
文章基于“指代消解”、“文本外部特征”、“图排序”的混合方法实现多语言多文档新闻摘要系统.该系统由四大模块组成,分别为:原文预处理;基于文本外部特征的摘要计算;基于图排序的摘要计算与;摘要生成模块.首先对新闻文本进行预处理和指代消解,然后在第二模块使用文本外部特征(如:主题词、线索词语、关键词与其同义词、时间、地点、命名实体等)来计算原文中句子的重要程度,句子与新闻主题的相关度,并且对每个句子第一次打分.然后在第三模块采用图排序的算法再从原文中计算句子之间的连贯程度,并且第二次对每个句子打分.最后在第四模块通过两个不同算法的得分计算原文中句子的总得分并且按原文中句子出现的顺序摘出新闻文本的摘要.文章以汉语、英语、孟加拉语为例,实现该系统并进行摘要测试.实验表明系统能够从三个不同语种的多文档新闻文本中有效地摘出摘要.
推荐文章
多语言Web网站的结构与实现方法
多语言
本地化
国际化
全球化
一种基于索引结构的多语言界面实现方法
嵌入式
C51
索引
多语言
显示
基于多语言交互的英语翻译在线辅助系统设计
多语言交互
英语翻译
在线辅助系统
人工校正
知识数据库
流程设计
基于核心概念集的多语言Ontology
核心概念集
多语言Ontology
同义词集
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于混合方法的多语言多文档自动摘要系统构建及实现
来源期刊 图书馆学研究 学科
关键词 多语言自动摘要 多文档自动摘要 图排序算法 文本外部特征
年,卷(期) 2013,(2) 所属期刊栏目 信息组织
研究方向 页码范围 66-72
页数 7页 分类号
字数 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 王惠临 66 344 12.0 15.0
2 柯修 3 2 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (45)
共引文献  (16)
参考文献  (4)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1958(1)
  • 参考文献(0)
  • 二级参考文献(1)
1964(1)
  • 参考文献(0)
  • 二级参考文献(1)
1969(1)
  • 参考文献(0)
  • 二级参考文献(1)
1970(1)
  • 参考文献(0)
  • 二级参考文献(1)
1973(1)
  • 参考文献(0)
  • 二级参考文献(1)
1975(1)
  • 参考文献(0)
  • 二级参考文献(1)
1985(1)
  • 参考文献(0)
  • 二级参考文献(1)
1989(2)
  • 参考文献(0)
  • 二级参考文献(2)
1990(1)
  • 参考文献(0)
  • 二级参考文献(1)
1991(2)
  • 参考文献(0)
  • 二级参考文献(2)
1992(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(5)
  • 参考文献(0)
  • 二级参考文献(5)
1996(2)
  • 参考文献(0)
  • 二级参考文献(2)
1997(2)
  • 参考文献(0)
  • 二级参考文献(2)
1998(6)
  • 参考文献(2)
  • 二级参考文献(4)
1999(6)
  • 参考文献(0)
  • 二级参考文献(6)
2000(2)
  • 参考文献(0)
  • 二级参考文献(2)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(3)
  • 参考文献(0)
  • 二级参考文献(3)
2003(3)
  • 参考文献(0)
  • 二级参考文献(3)
2004(2)
  • 参考文献(0)
  • 二级参考文献(2)
2005(2)
  • 参考文献(1)
  • 二级参考文献(1)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2013(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
多语言自动摘要
多文档自动摘要
图排序算法
文本外部特征
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
图书馆学研究
半月刊
1001-0424
22-1052/G2
大16开
吉林省长春市新民大街1162号
12-205
1980
chi
出版文献量(篇)
7783
总下载数(次)
21
总被引数(次)
58723
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导