博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Deeplearning.ai - 浅层神经网络
阅读量:4091 次
发布时间:2019-05-25

本文共 1345 字,大约阅读时间需要 4 分钟。

吴恩达 Andrew Ng

浅层神经网络

神经网络概览

这里写图片描述

神经网络表示

这里写图片描述

  • 输入层 a[0] a [ 0 ] 、隐藏层 a[1] a [ 1 ] 、输出层 a[2] a [ 2 ]
  • 多个逻辑回归的叠加
  • 计算神经网络的输出
    这里写图片描述
  • 将各个元素竖向叠加起来构成一个大矩阵
  • 向量化计算
    这里写图片描述
  • 各个矩阵的大小
    这里写图片描述

多个样本的向量化

  • 圆括号表示样本,方括号表示层数
  • Horizontal(横向), the matrix A goes over different training examples. Vertically(竖向), the different hidden unit.
  • 这里写图片描述 这里写图片描述 这里写图片描述

激活函数 (Activation Function)

  • σ(z) σ ( z ) 常用于二元分类问题
  • tanh(z)=ezezez+ez t a n h ( z ) = e z − e − z e z + e − z (效果常常比 σ(z) σ ( z ) 好)
  • z 很大或者很小时, tanh(z)σ(z) 、 t a n h ( z ) 、 σ ( z ) 的斜率接近于0,会拖慢梯度下降法(梯度弥散)
  • 不同层的激活函数可以不同
  • ReLU(z)=max(0,z) R e L U ( z ) = m a x ( 0 , z )
    • 在 0 处不可导,但在实验中 z 极少取到 0
    • 负数区域时神经元不会训练, Leaky ReLU() L e a k y   R e L U ( ) 可避免这一问题
    • 通常学习速度优于前两个激活函数
    • Leaky ReLU(z)=max(0.01z,z) L e a k y   R e L U ( z ) = m a x ( 0.01 z , z ) (系数可以自定义)
  • identity activation function 恒等激活函数 g(z)=z g ( z ) = z
  • If using linear activation functions, then the neural network is just outputting a linear function of the input.
  • No matter how many layers your neural network has, it is just computing a linear activation function. There is no need to have the hidden layers.
  • 两个线性函数的组合仍然是线性函数
  • 线性函数通常只在输出层使用,隐藏层几乎都使用非线性函数

梯度下降法 (Gradient Descent)

  • 给定随机的初始值而不是全零

  • 维度匹配

    这里写图片描述

  • 公式

    这里写图片描述

随机初始化 (Random Initialization)

  • symmetric, computing the same function
  • 如果初始化为0,隐藏单元做的是相同的计算,无论迭代多少次
  • initialize parameters(w) randomly w = np.random.randn((2,2))*0.01
  • 偏置量 b 可以初始化为0
  • 初值一般小一些,如果很大,可能落在激活函数斜率平缓的部分,会降低学
你可能感兴趣的文章
MouseEvent的e.stageX是Number型,可见as3作者的考虑
查看>>
移植Vim配色方案到Eclipse
查看>>
从超链接调用ActionScript
查看>>
谈谈加密和混淆吧[转]
查看>>
TCP的几个状态对于我们分析所起的作用SYN, FIN, ACK, PSH,
查看>>
网络游戏客户端的日志输出
查看>>
关于按钮的mouseOver和rollOver
查看>>
Netty框架
查看>>
Socket经验记录
查看>>
对RTMP视频流进行BitmapData.draw()出错的解决办法
查看>>
FMS 客户端带宽计算、带宽限制
查看>>
SecurityError Error 2148 SWF 不能访问本地资源
查看>>
Qt 静态编译后的exe太大, 可以这样压缩.
查看>>
3D游戏常用技巧Normal Mapping (法线贴图)原理解析——基础篇
查看>>
乘法逆元
查看>>
Linux中用st_mode判断文件类型
查看>>
Ubuntu修改host遇到unable to resolve host
查看>>
路由选择算法
查看>>
Objective-C 基础入门(一)
查看>>
Objective-C 基础入门(三) 读写文件与回调
查看>>