机器学习-7:MachineLN之激活函数

作者: MachineLP | 来源:发表于2018-01-10 09:39 被阅读30次

很长一段时间都在想,有些问题不去弄明白为什么,遇到瓶颈就傻逼了,一个bug整你一个月,原来只是一个细节问题,就好如:你不知道从哪里来? 又怎么知道往哪里去? 现在遗留的小问题,将来都会是大问题!

真的,有时候需要回过头来重新开始,整理总结再去前行,也许会走的更远。

那么我的问题是:

(1)什么是激活函数?

(2)激活函数的作用是什么?

(3)激活函数有哪些?

(4)各自的优缺点是什么?(解答完1、2、3,就有了答案了)

看到这里,你的答案是什么? 下面是我的答案:

(1)什么是激活函数?

激活函数就是加在在神经元后的函数,下图所示(例如我们前边提到的在cnn卷积候连接的函数relu,还有Sigmoid、tanh、prelu等等),那么它有什么用呢?不加会怎么样?(2)中回答;

image.png

当然你也最好了解下面概念,到提起梯度消失就容易理解了,正是因为这么饱和把梯度会传的时候越来越小,使得更新参数失败,整个网络瘫痪:

image.png

(2)激活函数的作用是什么?

简单说:为了解决非线性问题,不加激活函数只能处理线性问题。

下面图来自公众号忆臻笔记,一个用心在做的公众号。

先来看一个图:左侧的网络对应其下方的数学表达式,是一个线性方程(如果这里你还问为什么,那么see you),令其为0,可以画出一条直线,就是右侧的图了,右上方就是y>0的区域,左下方就是y<0的区域,对吧? 那么它是线性的。

image.png

那么你再看下面这个图:网络结构用右侧的表达式表示。

image

你可以将右侧的表达式整理一下,其实它是这样的,你会发现原来是它也是线性的。

image.png

对,你想的没错,没有激活函数的网络只能处理线性问题(佩服大牛!),在看下面的图,在神经元后加上激活函数,至少可以保证输出是非线性的,那么能解决非线性问题吗?再往下走。

image.png

然后看下图,多个神经元的情况:

image.png

在看一下大神的图:

image.png

是的通过加上激活函数就可以解决这种非线性问题;

image.png

(3)激活函数有哪些?

详细介绍一个sigmod的激活函数: image.png

左侧是sigmoid函数图,右侧是sigmoid导数的函数图,由DeepLN之CNN权重更新中的公式5,可知在梯度回传过程中激活函数的影响梯度的问题,当数据落在sigmoid导数的红色区域时就会造成梯度很小,甚至梯度消失;这个问题可以通过改善激活函数来改善,当然也可以通过改变激活函数的输入x来改善,怎么改善?把x重新拉回到0附近不就ok了吗!那么你想到了什么?BN啊!!!那么你还有什么方法?修改激活函数啊,说过了,还有什么?resdual啊!!!对吗?哦,那么还可以有什么?当然真实使用的时候都是一起使用的,例如resdual+bn+relu等(当然bn还有其他作用,这只是其一)。

image image

激活函数还有tanh函数、ReLU函数、ELU函数、PReLU函数等,为什么提取出来? 解决什么问题? 上面提到的左饱和、右饱和或者称为单侧抑制,对你理解这么激活函数有什么帮助?

展望,接下来更新:

DeepLN之BN;

MachineLN之过拟合;

MachineLN之数据归一化;

DeepLN之优化(sgd等):

...

感觉这些是在一起的,之后补习传统机器学习的理论知识 到 实践;

还有之前提到的;

推荐阅读:

  1. 机器学习-1:MachineLN之三要素

  2. 机器学习-2:MachineLN之模型评估

  3. 机器学习-3:MachineLN之dl

  4. 机器学习-4:DeepLN之CNN解析

  5. 机器学习-5:DeepLN之CNN权重更新(笔记)

  6. 机器学习-6:DeepLN之CNN源码

  7. 机器学习-7:MachineLN之激活函数

  8. 机器学习-8:DeepLN之BN

  9. 机器学习-9:MachineLN之数据归一化

  10. 机器学习-10:MachineLN之样本不均衡

  11. 机器学习-11:MachineLN之过拟合

  12. 机器学习-12:MachineLN之优化算法

  13. 机器学习-13:MachineLN之kNN

  14. 机器学习-14:MachineLN之kNN源码

  15. 机器学习-15:MachineLN之感知机

  16. 机器学习-16:MachineLN之感知机源码

  17. 机器学习-17:MachineLN之逻辑回归

  18. 机器学习-18:MachineLN之逻辑回归源码

image

版权声明:本文为博主原创文章,未经博主允许不得转载。有问题可以加微信:lp9628(注明CSDN)。

相关文章

  • 机器学习-7:MachineLN之激活函数

    很长一段时间都在想,有些问题不去弄明白为什么,遇到瓶颈就傻逼了,一个bug整你一个月,原来只是一个细节问题,就好如...

  • 激活函数softmax-P2分类任务

    激活函数种类激活函数作用 激活函数 深度学习常用激活函数之— Sigmoid & ReLU & Softmax 深...

  • ReLu 激活函数理解

    ReLU激活函数:简单之美深度学习中的激活函数与梯度消失

  • 机器学习-3:MachineLN之dl

    开篇废话: 嫌废话太多可以直接跳到正文哦。 对外人提起人工智能感觉很牛逼很了不起、高大上或者一些其他的吹捧、羡慕的...

  • 机器学习-22:MachineLN之RL

    我想说: 其实很多事情找对方法很重要,可以事半功倍,就好比学习; 原本打算将机器学习基础写完以后再写深度学习、强化...

  • 机器学习-13:MachineLN之kNN

    我想说: 其实训练模型是个力气活,有人说训练模型很简单,把数据塞进去,然后跑完就好了,哦,这样的话谁都会,关键的也...

  • 机器学习常见面试问题及答案汇总

    一些常见的机器学习面试题(不定时更新)。 激活函数的作用?激活函数为神经网络提供了非线性。如果不使用激活函数,每一...

  • 机器学习中常见函数

    1、激活函数 常用于神经网络,激活函数增加了神经网络模型的非线性特征 2、损失函数 机器学习过程中中,我们期望样本...

  • 机器学习-2:MachineLN之模型评估

    开篇废话: 很多文章其实都是将书中的东西、网上课程、或者别人的论文的东西总结一下,发出来,但是个人感觉还是加入个人...

  • 机器学习-12:MachineLN之优化算法

    我想说: 其实很多时候应该审视一下自己,知道自己的不足和长处,然后静下来去做一些事情,只有真正静下来才能深下去,只...

网友评论

    本文标题:机器学习-7:MachineLN之激活函数

    本文链接:https://www.haomeiwen.com/subject/nlinnxtx.html