博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
深度学习的杂碎
阅读量:6707 次
发布时间:2019-06-25

本文共 454 字,大约阅读时间需要 1 分钟。

步长:最优化问题中的叫法;

学习速率:神经网络中的叫法;

梯度更新的方式:

为步长(学习率)。

其中有必要说一点的是表示的是当前实际的输出,y表示的是其类标。

当输入为x时,目标函数表示为一个线性函数的形式为:。其中每一个x1,x2,...表示的是维度。

1. 梯度下降:对于的更新是所有样本都参与的,那么得到的梯度是一个比较标准的值,一次更新的幅度也会比较大,但是样本多的时候,并且样本的维度也是很大的,会降低运算的速度。此外,对电脑内存等也是一个巨大的考验。现在在实际中很少使用。当然,当样本比较少的时候,是可以用的。

2. 随机梯度下降:对是随机的选取一个样本,通过这个小的的梯度来更新整体的,当然是不太准确的,但是重在速度快,当训练的迭代次数比较多的时候,也会去的很好的效果。不过,注意陷入局部最优解。

3. 小批量梯度下降:对是随机的选取一个小的batch,这个方法在深度学习中使用的比较多。

转载于:https://www.cnblogs.com/Yu-FeiFei/p/6810690.html

你可能感兴趣的文章
How do I create a List in Scala?
查看>>
lintcode:移动零
查看>>
tomcat的webappclassloader中一个奇怪的异常信息
查看>>
Java语言与C++语言的差异总结
查看>>
Semaphore实现Andoird版源代码剖析
查看>>
使用gSoap规避和改动ONVIF标准类型结构的解析
查看>>
架构设计之策略模式
查看>>
hdu 5400 Arithmetic Sequence(模拟)
查看>>
求职(2015南京站获得百度、美的集团、趋势科技、华为offer)
查看>>
压测 apache ab 初探
查看>>
设计数据结构O1 insert delete和getRandom
查看>>
视图(View)与部分视图(Partial View)之间数据传递
查看>>
漫谈程序猿系列:群星闪耀的黄金时代
查看>>
使用Spring Session做分布式会话管理
查看>>
mongodb的NUMA问题
查看>>
js进阶 12-14 jquery的事件触发函数是哪两个
查看>>
MySQL MERGE存储引擎 简介
查看>>
atitit。自己定义uml MOF EMF体系eclipse emf 教程o7t
查看>>
atitit.taskService 任务管理器的设计 v1
查看>>
编写jquery插件的分享
查看>>