卷积神经网络(CNN)


  • 图像
    • 图像是由像素点组成
      • 像素点取值范围是[0,255]:越接近0越是白色,越接近255越是黑色
      • RGB
      • HWC:h:高,w:宽,c:通道数
    • 图像加载方法
      • plt.imread()
      • plt.show()
  • CNN定义
    • 就是含有卷积层的神经网络
    • 提取图像特征
  • CNN的网络结构
    • 卷积层
      • 提取图像中的局部特征
      • API
        • conv = nn.Conv2d(in_channels, out_channels, kernel_size, stride, padding)
          • in_channels:输入通道数
          • out_channels:输出通道数
    • 池化层
      • 大幅度降低图像的维度
      • 分类
        • 最大池化
          • API
            • MaxPool2d()
        • 平均池化
          • API
            • AvgPool2d()
    • 全连接层
      • 输出想要的结果
  • 经过卷积层计算后输出的特征图大小的计算方法
    • 输入图像大小: W x W
    • 卷积核大小: F x F
    • Stride: S
    • Padding: P
    • 输出图像大小: N x N