原文服务方: 河北省科学院学报       
摘要:
文本标签作为一种文本关键词,能够简化科技政策中有效信息的挖掘.本文从科技政策类别角度,将标签类别分为科技投入、知识产权、农村科技和税收四类,针对传统SVM 算法的缺点和标签数据不平衡的缺点,结合欧式距离思想,提出一种带有惩罚因子的ESVM 科技政策文本标签分类方法.最后,对比SVM 和ESVM 两种分类方法,验证了本文方法在处理科技政策文本标签数据上的有效性.
推荐文章
面向跨语言文本分类与标签推荐的带标签双语主题模型的研究
主题模型
标签
跨语言文本分类
标签推荐
潜在主题
基于特征词匹配的政策文本分类算法研究与实现
字符串匹配算法
阈值计算
文本分类
结合旋转森林和AdaBoost分类器的多标签文本分类方法
多标签文本分类
文本—术语相关性
旋转森林
特征变换
AdaBoost分类器
基于标签相似度的不良信息多标签分类方法
多标签分类
标签之间的相关关系
不良信息
中心标签
标签相似度系数矩阵
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于ESVM的科技政策文本标签分类研究
来源期刊 河北省科学院学报 学科
关键词 文本标签分类 科技政策 SVM 不平衡数据
年,卷(期) 2018,(1) 所属期刊栏目
研究方向 页码范围 1-10
页数 10页 分类号 TP391.1
字数 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 范通让 石家庄铁道大学信息科学与技术学院 48 186 8.0 12.0
2 聂永川 河北省科学技术情报研究院河北省科技信息处理实验室 15 10 2.0 2.0
3 吴峰 河北省科学技术情报研究院河北省科技信息处理实验室 5 26 2.0 5.0
4 李银生 河北省科学技术情报研究院河北省科技信息处理实验室 8 18 1.0 4.0
5 赵文彬 石家庄铁道大学信息科学与技术学院 10 27 2.0 5.0
6 张博 石家庄铁道大学信息科学与技术学院 3 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (22)
共引文献  (143)
参考文献  (8)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1994(2)
  • 参考文献(0)
  • 二级参考文献(2)
1995(2)
  • 参考文献(0)
  • 二级参考文献(2)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(4)
  • 参考文献(1)
  • 二级参考文献(3)
2003(2)
  • 参考文献(1)
  • 二级参考文献(1)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(2)
  • 参考文献(0)
  • 二级参考文献(2)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(5)
  • 参考文献(1)
  • 二级参考文献(4)
2009(3)
  • 参考文献(1)
  • 二级参考文献(2)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(3)
  • 参考文献(3)
  • 二级参考文献(0)
2018(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
文本标签分类
科技政策
SVM
不平衡数据
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
河北省科学院学报
季刊
1001-9383
13-1081/N
大16开
1984-01-01
chi
出版文献量(篇)
1657
总下载数(次)
0
总被引数(次)
5900
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导