基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对中文网页分类问题该文设计了一种新的基于代表样本动态生成的分类算法.算法通过对原始训练样本集的训练逐个生成代表样本,并充分利用被裁剪训练样本的有效信息,对已生成的代表样本进行多次调整,从而使代表样本更具有代表性.基于该算法的中文网页分类器的实验结果表明,算法有效地压缩了原始训练样本集,提高了分类效率,同时保持了分类的准确性;具有较好的分类性能.
推荐文章
基于内容的中文网页自动分类研究
自动分类
信息检索
全球网
基于CFS-GA特征选择算法的中文网页自动分类
中文网页分类
特征选择
基于关联的特征选择算法
遗传算法
基于结构和链接扩展的中文网页分类研究
分类
链接扩展
HTML标签
网络结构
面向不良文本信息的中文网页分类方法
信息安全
内容安全
文本分类
贝叶斯理论
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于代表样本动态生成的中文网页分类
来源期刊 计算机应用 学科 工学
关键词 k-近邻 代表样本 调整
年,卷(期) 2006,(10) 所属期刊栏目 软件技术与典型应用
研究方向 页码范围 2502-2504
页数 3页 分类号 TP391|TP18
字数 2905字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 曹先彬 11 263 7.0 11.0
2 华北 中国科学技术大学计算机科学技术系 2 4 1.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (8)
共引文献  (169)
参考文献  (3)
节点文献
引证文献  (4)
同被引文献  (2)
二级引证文献  (12)
1972(1)
  • 参考文献(0)
  • 二级参考文献(1)
1986(1)
  • 参考文献(0)
  • 二级参考文献(1)
1992(1)
  • 参考文献(0)
  • 二级参考文献(1)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(3)
  • 参考文献(1)
  • 二级参考文献(2)
2003(1)
  • 参考文献(1)
  • 二级参考文献(0)
2004(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2008(3)
  • 引证文献(2)
  • 二级引证文献(1)
2010(6)
  • 引证文献(2)
  • 二级引证文献(4)
2011(1)
  • 引证文献(0)
  • 二级引证文献(1)
2012(2)
  • 引证文献(0)
  • 二级引证文献(2)
2013(1)
  • 引证文献(0)
  • 二级引证文献(1)
2015(2)
  • 引证文献(0)
  • 二级引证文献(2)
2019(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
k-近邻
代表样本
调整
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用
月刊
1001-9081
51-1307/TP
大16开
成都237信箱
62-110
1981
chi
出版文献量(篇)
20189
总下载数(次)
40
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
国家重点基础研究发展计划(973计划)
英文译名:National Basic Research Program of China
官方网址:http://www.973.gov.cn/
项目类型:
学科类型:农业
论文1v1指导