基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对现有的主题爬行方法存在收益率不高和不稳定的问题,融合本体和最小二乘支持向量机理论,提出一种主题爬行方法Ontology-LSSVM.该方法将本体作为抓取主题的背景知识表示,得到一组主题相关概念的集合,再将其在网页文本中出现的词频作为输入,构造一个主题相关度 LS-SVM 分类器,用于网页的分类.使用舆论热点的食品安全问题作为爬行主题领域,建立问题食品本体,进行实验.结果表明:在本实验条件下,本文方法相比基于 LS-SVM、基于本体和基于关键字的主题爬行,能够维持更高的收益率.
推荐文章
基于最小二乘支持向量机的测控数据融合
最小二乘支持向量机
测控
数据融合
基于最小二乘支持向量机的网页主题语义分类的研究
最小二乘支持向量机
语义建模
网页主题语义分类
基于边界近邻的最小二乘支持向量机实现
最小二乘支持向量机
一对多方法
边界近邻
回归型模糊最小二乘支持向量机
最小二乘支持向量机
模糊隶属度
数据域描述
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种融合本体和最小二乘支持向量机的主题爬行方法
来源期刊 天津科技大学学报 学科 工学
关键词 本体 支持向量机 主题爬行 收益率 食品安全
年,卷(期) 2015,(3) 所属期刊栏目 【信息科学与技术】
研究方向 页码范围 72-77
页数 6页 分类号 TP391.3
字数 5045字 语种 中文
DOI 10.13364/j.issn.1672-6510.20140135
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 马永军 天津科技大学计算机科学与信息工程学院 39 254 9.0 14.0
2 杨海波 天津科技大学计算机科学与信息工程学院 3 4 1.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (51)
共引文献  (125)
参考文献  (13)
节点文献
引证文献  (1)
同被引文献  (5)
二级引证文献  (1)
1993(1)
  • 参考文献(1)
  • 二级参考文献(0)
1999(1)
  • 参考文献(1)
  • 二级参考文献(0)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(2)
  • 参考文献(0)
  • 二级参考文献(2)
2004(3)
  • 参考文献(0)
  • 二级参考文献(3)
2005(5)
  • 参考文献(0)
  • 二级参考文献(5)
2006(6)
  • 参考文献(1)
  • 二级参考文献(5)
2007(13)
  • 参考文献(3)
  • 二级参考文献(10)
2008(7)
  • 参考文献(0)
  • 二级参考文献(7)
2009(3)
  • 参考文献(1)
  • 二级参考文献(2)
2010(6)
  • 参考文献(1)
  • 二级参考文献(5)
2011(7)
  • 参考文献(1)
  • 二级参考文献(6)
2012(3)
  • 参考文献(0)
  • 二级参考文献(3)
2013(2)
  • 参考文献(2)
  • 二级参考文献(0)
2014(2)
  • 参考文献(2)
  • 二级参考文献(0)
2015(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2018(1)
  • 引证文献(1)
  • 二级引证文献(0)
2019(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
本体
支持向量机
主题爬行
收益率
食品安全
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
天津科技大学学报
双月刊
1672-6510
12-1355/N
大16开
天津市河西区大沽南路1038号
1986
chi
出版文献量(篇)
2225
总下载数(次)
6
总被引数(次)
10811
论文1v1指导