作者:
基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
为了能够充分利用 WEB 上丰富的文献资源,设计了一个专业的 WEB 文献资料采集系统 WLES.该系统集成了网页抓取和网页清洗两方面技术,并且引入机器学习方法到网页清洗中,通过机器对训练语料的学习得到一个清洗模型,然后用该模型来实施网页清洗.实验证明该系统在网页抓取和网页清洗方面都具有优良的性能,能够满足使用者的文献采集需求
推荐文章
附盘图书文献资料的管理和利用
教育技术学
图书附盘
管理
利用
基于J2EE和工作流构建B/S文献资料管理系统
J2EE
B/S
工作流
组件技术
文献资料管理系统
浅谈文献资料在历史教学中的作用
文献知识
历史教学
作用
基于Lucene的文献资料全文检索系统的设计与实现
全文检索
搜索引擎
Lucene
J2EE
校内文献
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 WEB文献资料采集系统
来源期刊 计算机系统应用 学科
关键词 文献资料采集 机器学习 网页清洗 清洗模型
年,卷(期) 2012,(7) 所属期刊栏目
研究方向 页码范围 9-13
页数 分类号
字数 4461字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 马创新 南京师范大学文学院 8 87 6.0 8.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (12)
共引文献  (83)
参考文献  (4)
节点文献
引证文献  (3)
同被引文献  (3)
二级引证文献  (1)
1975(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(2)
  • 参考文献(0)
  • 二级参考文献(2)
2000(3)
  • 参考文献(0)
  • 二级参考文献(3)
2002(3)
  • 参考文献(0)
  • 二级参考文献(3)
2003(1)
  • 参考文献(1)
  • 二级参考文献(0)
2004(2)
  • 参考文献(0)
  • 二级参考文献(2)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2009(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2013(1)
  • 引证文献(1)
  • 二级引证文献(0)
2014(2)
  • 引证文献(1)
  • 二级引证文献(1)
2017(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
文献资料采集
机器学习
网页清洗
清洗模型
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机系统应用
月刊
1003-3254
11-2854/TP
大16开
北京中关村南四街4号
82-558
1991
chi
出版文献量(篇)
10349
总下载数(次)
20
总被引数(次)
57078
论文1v1指导