原文服务方: 湖南大学学报(自然科学版)       
摘要:
使用深度神经网络处理计算机视觉问题时,在新任务数据量较少情况下,往往会采用已在大数据集上训练好的模型权值作为新任务的初始权值进行训练,这种训练方式最终得到的模型泛化能力更好.对此现象,传统解释大多只是基于直觉分析而缺少合理的数学推导.本文将深度神经网络这种网络结构不变下层间的学习转为深度神经网络内部的迁移能力,并将学习过程变化形式化到数学表达式.考虑数据集对训练过程带来的影响,利用信息几何分析方法,确定不同数据集流形之上的度量和联络,实现不同数据集之间的嵌入映射,同时将参数空间的变化也放入流形空间,探究其对学习过程的共同影响,最终实现对这种内部迁移现象的数学解释.经过分析和实验验证可得内部迁移过程其实是一种能使网络可以在更广空间进行最优搜索的变化,有利于模型可以在学习过程中获得相对的更优解.
推荐文章
一种基于融合深度卷积神经网络与度量学习的人脸识别方法
多Inception结构
深度卷积神经网络
度量学习方法
深度人脸识别
特征提取
损失函数融合
基于深度神经网络的少样本学习综述
少样本学习
数据增强
迁移学习
度量学习
元学习
深度神经网络的压缩研究
神经网络
压缩
网络删减
参数共享
基于BP神经网络的教学质量分析评估模型研究
BP神经网络
教学质量
分析评估模型
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 深度神经网络内部迁移的信息几何度量分析
来源期刊 湖南大学学报(自然科学版) 学科
关键词 深度学习 迁移学习 信息几何
年,卷(期) 2019,(2) 所属期刊栏目 计算机科学
研究方向 页码范围 97-104
页数 8页 分类号 TP183
字数 语种 中文
DOI 10.16339/j.cnki.hdxbzkb.2019.02.014
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 费洪晓 中南大学软件学院 105 1153 15.0 30.0
2 李海峰 中南大学地球科学与信息物理学院 10 48 5.0 6.0
3 陈力 中南大学地球科学与信息物理学院 4 20 2.0 4.0
7 何嘉宝 中南大学软件学院 1 0 0.0 0.0
8 谭风云 中南大学软件学院 1 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (8)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2003(1)
  • 参考文献(1)
  • 二级参考文献(0)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(1)
  • 参考文献(1)
  • 二级参考文献(0)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(2)
  • 参考文献(2)
  • 二级参考文献(0)
2016(2)
  • 参考文献(2)
  • 二级参考文献(0)
2019(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
深度学习
迁移学习
信息几何
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
湖南大学学报(自然科学版)
月刊
1674-2974
43-1061/N
16开
1956-01-01
chi
出版文献量(篇)
4768
总下载数(次)
0
总被引数(次)
41941
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导