基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
本文提出了一种新的句子相似度度量的方法并应用于文本自动摘要中.其创新处在于相似度计算不仅考虑句子中的uni-gram,还考虑了bi-gram和tri-gram,通过回归方法将这几种相似度结果综合起来.实验证明这种相似度计算方法是有效的.同时本文还提出了一种新的,利用句子间相似度以及句子的权重的抽句式文摘算法,在抽取出句子的同时也去掉了冗余.DUC2003、DUC2004(Document Understanding Conference 2003,2004)的评测结果征明了方法的有效性.我们的系统在DUC2004的评测中列第二位.
推荐文章
一种基于权重矩阵的协同过滤算法的相似度度量方法
协同过滤算法
相似度度量
权重矩阵
参数融合
权重计算
仿真实验
融合句子情感和主题相似性的中文新闻文本情感摘要
情感摘要
句子情感
LexRank
句子特征
主题相似性
融合句子结构的抽象式文本摘要方法
文本摘要
监督模块
句子基本结构模块
摘要生成
文本自动摘要提取算法
信息抽取
自动摘要
特征词
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种新的句子相似度度量及其在文本自动摘要中的应用
来源期刊 中文信息学报 学科 工学
关键词 计算机应用 中文信息处理 文本自动摘要 向量模型 相似度计算
年,卷(期) 2005,(2) 所属期刊栏目
研究方向 页码范围 93-99
页数 7页 分类号 TP391
字数 4739字 语种 中文
DOI 10.3969/j.issn.1003-0077.2005.02.014
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 吴立德 复旦大学计算机科学与工程系 78 2759 24.0 52.0
2 黄萱菁 复旦大学计算机科学与工程系 49 2106 18.0 45.0
3 张奇 复旦大学计算机科学与工程系 13 311 7.0 13.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (2)
节点文献
引证文献  (87)
同被引文献  (97)
二级引证文献  (452)
1958(1)
  • 参考文献(1)
  • 二级参考文献(0)
2004(1)
  • 参考文献(1)
  • 二级参考文献(0)
2005(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2005(1)
  • 引证文献(1)
  • 二级引证文献(0)
2006(6)
  • 引证文献(6)
  • 二级引证文献(0)
2007(7)
  • 引证文献(7)
  • 二级引证文献(0)
2008(9)
  • 引证文献(6)
  • 二级引证文献(3)
2009(19)
  • 引证文献(5)
  • 二级引证文献(14)
2010(28)
  • 引证文献(12)
  • 二级引证文献(16)
2011(25)
  • 引证文献(9)
  • 二级引证文献(16)
2012(38)
  • 引证文献(4)
  • 二级引证文献(34)
2013(31)
  • 引证文献(4)
  • 二级引证文献(27)
2014(57)
  • 引证文献(7)
  • 二级引证文献(50)
2015(59)
  • 引证文献(5)
  • 二级引证文献(54)
2016(49)
  • 引证文献(6)
  • 二级引证文献(43)
2017(66)
  • 引证文献(6)
  • 二级引证文献(60)
2018(69)
  • 引证文献(4)
  • 二级引证文献(65)
2019(60)
  • 引证文献(5)
  • 二级引证文献(55)
2020(15)
  • 引证文献(0)
  • 二级引证文献(15)
研究主题发展历程
节点文献
计算机应用
中文信息处理
文本自动摘要
向量模型
相似度计算
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
中文信息学报
月刊
1003-0077
11-2325/N
16开
北京海淀区中关村南四街4号
1986
chi
出版文献量(篇)
2723
总下载数(次)
5
总被引数(次)
45413
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导