基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
问答对的规模和质量是影响基于常问问题集问答系统性能的重要因素,目前所使用的问答对库一般是人工构建的,往往需要耗费大量的时间和人力物力.针对此问题,提出一种基于改进贝叶斯的领域问答对自动获取方法.该方法将HTML页面解析成DOM树,选择DOM树的节点信息和结构信息作为问答对的分类特征,结合受限领域知识库,利用改进贝叶斯分类模型.从HTML页面中自动获取问答对并过滤出领域问答对.实验结果表明,该方法效果显著.
推荐文章
基于改进贝叶斯算法的垃圾短信过滤研究
垃圾短信
贝叶斯算法
KNN算法
向量空间
基于改进特征加权的朴素贝叶斯分类算法
文本分类
朴素贝叶斯
JS散度
词频
文本频率
类别频率
基于改进贝叶斯优化算法的CNN超参数优化方法
贝叶斯优化
卷积神经网络
高斯过程
超参数优化
基于贝叶斯网络模型的信息检索
贝叶斯网络模型
信息检索
关联规则发现
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于改进贝叶斯的领域问答对自动获取
来源期刊 广西师范大学学报(自然科学版) 学科 工学
关键词 问答系统 问答对获取 改进贝叶斯 受限领域
年,卷(期) 2009,(1) 所属期刊栏目
研究方向 页码范围 189-192
页数 4页 分类号 TP391.3
字数 3159字 语种 中文
DOI 10.3969/j.issn.1001-6600.2009.01.048
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 余正涛 昆明理工大学信息工程与自动化学院 122 877 17.0 24.0
5 孟祥燕 昆明理工大学信息工程与自动化学院 1 4 1.0 1.0
6 许洋波 昆明理工大学信息工程与自动化学院 1 4 1.0 1.0
7 毛煜 昆明理工大学信息工程与自动化学院 1 4 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (12)
共引文献  (217)
参考文献  (6)
节点文献
引证文献  (4)
同被引文献  (18)
二级引证文献  (7)
1950(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(2)
  • 参考文献(0)
  • 二级参考文献(2)
2002(2)
  • 参考文献(1)
  • 二级参考文献(1)
2003(8)
  • 参考文献(1)
  • 二级参考文献(7)
2004(1)
  • 参考文献(1)
  • 二级参考文献(0)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(1)
  • 参考文献(1)
  • 二级参考文献(0)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2009(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2009(1)
  • 引证文献(1)
  • 二级引证文献(0)
2010(1)
  • 引证文献(0)
  • 二级引证文献(1)
2014(2)
  • 引证文献(2)
  • 二级引证文献(0)
2016(3)
  • 引证文献(0)
  • 二级引证文献(3)
2017(1)
  • 引证文献(0)
  • 二级引证文献(1)
2018(1)
  • 引证文献(0)
  • 二级引证文献(1)
2019(2)
  • 引证文献(1)
  • 二级引证文献(1)
研究主题发展历程
节点文献
问答系统
问答对获取
改进贝叶斯
受限领域
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
广西师范大学学报(自然科学版)
双月刊
1001-6600
45-1067/N
大16开
桂林市育才路15号
48-54
1957
chi
出版文献量(篇)
3550
总下载数(次)
1
总被引数(次)
13610
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导