基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
讨论若干Deep Web数据库分类准确性的前沿技术,建立基于词频和DOM树的文本特征提取方法模型,提出计算Deep Web数据库的基于权值的K-NN(K Nearest Neighbors)分类优化算法.利用UIUC提供的TEL-8数据集和WEKA平台的各类算法进行实验,并对分类精度、召回率和综合F-measure等测度上的分类结果进行比较.实验结果表明,该方法模型在3个指标上表现都较为突出.
推荐文章
基于查询接口特征的Deep Web数据源自动分类
Deep Web
自动分类
机器学习
数据集成
Deep Web入口探测与分类方法研究
Deep Web
网络爬虫
结构特征
维归约
双层分类模型
Deep Web数据源自动分类
Deep Web
查询接口
朴素贝叶斯分类
基于SVM的Web文本快速增量分类算法
支持向量机
支持向量
最优分类超平面
KKT条件
文本特征向量
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于文本特征的Deep Web分类研究
来源期刊 计算机与现代化 学科 工学
关键词 Deep Web 网页文本 词频 K-NN分类算法 DOM树
年,卷(期) 2012,(10) 所属期刊栏目 数据库与数据挖掘
研究方向 页码范围 58-61,64
页数 5页 分类号 TP393
字数 4561字 语种 中文
DOI 10.3969/j.issn.1006-2475.2012.10.016
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 罗国涛 四川托普信息技术职业学院计算机科学与技术系 8 42 2.0 6.0
2 马在强 四川托普信息技术职业学院计算机科学与技术系 4 1 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (11)
共引文献  (31)
参考文献  (5)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(1)
  • 二级参考文献(0)
2003(3)
  • 参考文献(0)
  • 二级参考文献(3)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(4)
  • 参考文献(1)
  • 二级参考文献(3)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(2)
  • 参考文献(1)
  • 二级参考文献(1)
2010(2)
  • 参考文献(1)
  • 二级参考文献(1)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
Deep Web
网页文本
词频
K-NN分类算法
DOM树
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机与现代化
月刊
1006-2475
36-1137/TP
大16开
南昌市井冈山大道1416号
44-121
1985
chi
出版文献量(篇)
9036
总下载数(次)
25
总被引数(次)
56782
论文1v1指导