神经网络中层相关说明

作者: 一杭oneline | 来源:发表于2019-11-15 08:23 被阅读0次

神经网络中层相关说明
TF - 常用的模块
【机器学习实战（五）】手写数字识别：sklearn包中神经网络库
神经网络体系搭建（三）——卷积神经网络
机器学习 | 浅谈神经网络优化方式
如何看待神经网络的黑箱？
相关 API 说明
百度神人解析人工神经网络（ANN）及BP算法
人工神经网络（ANN）及BP算法
李宏毅机器学习入门学习笔记（七） Backpropagation

直接调用torch.nn 定义含有参数的自定义层

class MyDense(nn.Module):
    def __init__(self,**kwargs):
        super(MyDense,self).__init__(**kwargs)
        self.params = nn.ParameterList([nn.Parameter(torch.randn(4,4)) for i in range(3)])
        self.params.append(nn.Parameter(torch.randn(4,1)))
    def forward(self,x):
        for i in range(len(self.params)):
            x = torch.mm(x,self.params[i])
        return x
net = MyDense()
print(net)

上面的方法使用ParameterList函数，还能使用ParameterDict函数

class MyDictDense(nn.Module):
    def __init__(self,**kwargs):
        super(MyDictDense,self).__init__(**kwargs)
        self.params = nn.ParameterDict({
            'linear1':nn.Parameter(torch.randn(4,4)),
            'linear2':nn.Parameter(torch.randn(4,2)),
            'linear3':nn.Parameter(torch.randn(4,1))
        })
    def forward(self,x,choice ='linear1'):
        return torch.mm(x,self.params[choice])

net = MyDictDense()
print(net)

上面的函数可以用来检测每一层的输出

net(x,choice='linear2')
tensor([[-0.2905, -1.0128],
        [-0.6450,  0.2643],
        [ 1.7937,  0.4945],
        [-0.0725, -0.2533]], grad_fn=<MmBackward>)

平滑层

class FlattenLayer(nn.Module): #平滑层
    def __init__(self):
        super(FlattenLayer, self).__init__()
    def forward(self, x): # x shape: (batch, *, *, ...)
        return x.view(x.shape[0], -1)

线性层

class LinearNet(nn.Module): ##继承nn.module类
   def __init__(self, n_feature):
        super(LinearNet, self).__init__()
        self.linear = nn.Linear(n_feature, 1)
    def forward(self, x):
        y = self.linear(x)
        return y
net = LinearNet(num_inputs)
print(net) # 使用print可以打印出网络的结构

2019年11月15日更

卷积层

import torch 
from torch import nn

def corr2d(X, K):  # 用于二维卷积函数
    h, w = K.shape
    Y = torch.zeros((X.shape[0] - h + 1, X.shape[1] - w + 1))
    for i in range(Y.shape[0]):
        for j in range(Y.shape[1]):
            Y[i, j] = (X[i: i + h, j: j + w] * K).sum()
    return Y

class Conv2D(nn.Module):
    def __init__(self, kernel_size):
        super(Conv2D, self).__init__()
        self.weight = nn.Parameter(torch.randn(kernel_size))
        self.bias = nn.Parameter(torch.randn(1))

    def forward(self, x):
        return corr2d(x, self.weight) + self.bias