基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对问题分类的数据稀疏问题,提出了一种以疑问词和焦点词为关键线索的中文事实型问题分类方法.该方法首先自动识别用户提出的问题中的疑问词和焦点词,若疑问词和焦点词存在,则用最近邻模型进行分类,而对没有用最近邻方法分类的其他问题,则用支持向量机(SVM)模型进行分类.训练SVM模型时,从Web上自动获取新问题来对训练集进行扩展,最近邻方法只利用线索词词义距离进行类别判断.实验表明,这种按照问题结构的不同而选择不同分类器的方法,在性能上要优于单一分类方法;词义距离的应用和训练集自动扩展改善了训练数据的稀疏,提高了分类性能.
推荐文章
中文时间关键词识别研究
时间关键词
时间关键词识别
谱聚类
基于规则的情感本体和词向量的中文情感分类
句法规则
Word2vec
情感本体
情感词典
基于扩展规则与统计特征的未登录词识别
未登录词
扩展规则
词频
互信息
邻接熵
基于CRF和错误驱动的中心词识别
问题分类
中心词
条件随机场(CRF)
错误驱动学习(TBL)
上下文信息
有序规则
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于线索词识别和训练集扩展的中文问题分类
来源期刊 高技术通讯 学科 工学
关键词 问题分类 焦点词 词义距离 训练集扩展
年,卷(期) 2009,(2) 所属期刊栏目 计算机与通信技术
研究方向 页码范围 111-118
页数 8页 分类号 TP3
字数 7978字 语种 中文
DOI 10.3772/j.issn.1002-0470.2009.02.001
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 张宇 哈尔滨工业大学计算机学院信息检索研究室 197 1689 20.0 36.0
2 李生 哈尔滨工业大学计算机学院信息检索研究室 118 3318 28.0 56.0
3 刘挺 哈尔滨工业大学计算机学院信息检索研究室 142 4348 34.0 63.0
4 张志昌 哈尔滨工业大学计算机学院信息检索研究室 4 67 3.0 4.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (29)
共引文献  (369)
参考文献  (6)
节点文献
引证文献  (12)
同被引文献  (20)
二级引证文献  (61)
1972(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(1)
  • 二级参考文献(0)
2002(2)
  • 参考文献(0)
  • 二级参考文献(2)
2003(9)
  • 参考文献(1)
  • 二级参考文献(8)
2004(5)
  • 参考文献(0)
  • 二级参考文献(5)
2005(9)
  • 参考文献(0)
  • 二级参考文献(9)
2006(5)
  • 参考文献(3)
  • 二级参考文献(2)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2009(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2011(1)
  • 引证文献(1)
  • 二级引证文献(0)
2012(3)
  • 引证文献(2)
  • 二级引证文献(1)
2013(5)
  • 引证文献(4)
  • 二级引证文献(1)
2014(4)
  • 引证文献(0)
  • 二级引证文献(4)
2015(8)
  • 引证文献(2)
  • 二级引证文献(6)
2016(5)
  • 引证文献(1)
  • 二级引证文献(4)
2017(19)
  • 引证文献(1)
  • 二级引证文献(18)
2018(10)
  • 引证文献(1)
  • 二级引证文献(9)
2019(12)
  • 引证文献(0)
  • 二级引证文献(12)
2020(6)
  • 引证文献(0)
  • 二级引证文献(6)
研究主题发展历程
节点文献
问题分类
焦点词
词义距离
训练集扩展
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
高技术通讯
月刊
1002-0470
11-2770/N
大16开
北京市三里河路54号
82-516
1991
chi
出版文献量(篇)
5099
总下载数(次)
14
总被引数(次)
39217
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
国家高技术研究发展计划(863计划)
英文译名:The National High Technology Research and Development Program of China
官方网址:http://www.863.org.cn
项目类型:重点项目
学科类型:信息技术
论文1v1指导