基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对目前网络家纺资源采集方式在处理海量网络资源尤其是深网资源时效率低下的问题,提出了一种自动化的网络家纺资源抽取方法.该方法首先根据查询接口属性有限性和收敛性的特征,构建领域模型对深网查询接口进行识别,然后利用家纺领域关键词自动填写查询接口,抽取深网家纺资源;对于返回的查询页面,为过滤与抽取与主题无关的噪声信息,对页面进行视觉分块,利用标记的分块样本数据训练分块重要度模型,并利用该模型过滤与主题无关的噪声信息.实验结果表明,领域模型识别深网查询接口的阳性预测值和准确率比基于规则的方法分别提高了8%和6%,分块重要度模型过滤噪声的准确率和召回率的调和平均数值在3个等级上比基于规则方法的正确率平均提高了12.90%.
推荐文章
家用纺织品的发展趋势分析
家用纺织品
现状
发展趋势
家用纺织品的功能性整理研究
家用纺织品
抗菌
吸湿排汗
功能性整理
家用纺织品配饰产业的发展
家纺配饰
装饰绳
装饰带
花边
大家纺
系列化
配套
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 网络家用纺织品资源抽取方法
来源期刊 纺织学报 学科 工学
关键词 家用纺织品 资源库 深网 信息抽取
年,卷(期) 2018,(10) 所属期刊栏目
研究方向 页码范围 156-161
页数 6页 分类号 TP311.11
字数 5601字 语种 中文
DOI 10.13475/j.fzxb.20171010106
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 吴志明 江南大学纺织服装学院 204 911 14.0 20.0
2 张远鹏 南通大学医学信息学系 31 56 5.0 5.0
4 杨娟 南通大学纺织服装学院 40 98 5.0 8.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (7)
共引文献  (1)
参考文献  (8)
节点文献
引证文献  (1)
同被引文献  (6)
二级引证文献  (0)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(2)
  • 参考文献(0)
  • 二级参考文献(2)
2006(2)
  • 参考文献(0)
  • 二级参考文献(2)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(1)
  • 参考文献(0)
  • 二级参考文献(1)
2009(2)
  • 参考文献(2)
  • 二级参考文献(0)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(2)
  • 参考文献(2)
  • 二级参考文献(0)
2017(1)
  • 参考文献(1)
  • 二级参考文献(0)
2018(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2020(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
家用纺织品
资源库
深网
信息抽取
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
纺织学报
月刊
0253-9721
11-5167/TS
大16开
北京市朝外延静里中街3号主楼6层
1979
chi
出版文献量(篇)
7125
总下载数(次)
11
论文1v1指导