基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
问句相似度算法是问答系统的核心问题,直接影响着问答系统的准确性.针对公共词块算法(CCS)对于中文文本的不适用性,提出一种改进的问句相似度算法(CNS).该方法结合N-gram模型及公共词块来计算问句向量的相似度,其主要思路是把问句分解成一元模型和二元模型,然后再分析问句之间的公共词块并考虑其顺序结构.实验结果表明:新算法在Top-N条数据集的平均相似度和不同相似度阈值下的准确率均优于常用的问句相似度算法.
推荐文章
基于N-Gram和动态滑动窗口的改进余弦相似度算法研究
余弦相似度算法
N-Gram算法
数据清洗
动态滑动窗口
基于规则和N-Gram算法的新词识别研究
新词识别
N-Gram算法
构词规则
中文分词
碎片库
召回率
利用N-gram和语义分析的维吾尔语文本相似性检测方法
维吾尔语
文本相似性检测
N-gram统计模型
潜在语义分析
基于N-Gram的文本去重方法研究
文本去重
文本特征
特征映射
中文信息处理
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于公共词块及N-gram模型的问句相似度算法
来源期刊 重庆理工大学学报(自然科学版) 学科 工学
关键词 问句相似度 N-gram模型 一元模型 公共词块
年,卷(期) 2017,(10) 所属期刊栏目 计算机科学与工程专栏
研究方向 页码范围 175-179,197
页数 6页 分类号 TP391.1
字数 3018字 语种 中文
DOI 10.3969/j.issn.1674-8425(z).2017.10.028
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 黄贤英 重庆理工大学计算机科学与工程学院 95 349 9.0 14.0
2 龙姝言 重庆理工大学计算机科学与工程学院 4 18 3.0 4.0
3 谢晋 重庆理工大学计算机科学与工程学院 4 18 3.0 4.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (25)
共引文献  (16)
参考文献  (5)
节点文献
引证文献  (3)
同被引文献  (11)
二级引证文献  (2)
1991(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(2)
  • 参考文献(0)
  • 二级参考文献(2)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(2)
  • 参考文献(0)
  • 二级参考文献(2)
2008(1)
  • 参考文献(0)
  • 二级参考文献(1)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(1)
  • 参考文献(0)
  • 二级参考文献(1)
2011(3)
  • 参考文献(0)
  • 二级参考文献(3)
2012(9)
  • 参考文献(0)
  • 二级参考文献(9)
2013(2)
  • 参考文献(0)
  • 二级参考文献(2)
2014(3)
  • 参考文献(2)
  • 二级参考文献(1)
2015(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(1)
  • 参考文献(1)
  • 二级参考文献(0)
2017(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2018(2)
  • 引证文献(2)
  • 二级引证文献(0)
2020(3)
  • 引证文献(1)
  • 二级引证文献(2)
研究主题发展历程
节点文献
问句相似度
N-gram模型
一元模型
公共词块
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
重庆理工大学学报(自然科学版)
月刊
1674-8425
50-1205/T
重庆市九龙坡区杨家坪
chi
出版文献量(篇)
7998
总下载数(次)
17
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导