首页 最新 热门 推荐

  • 首页
  • 最新
  • 热门
  • 推荐

Spatial Transformer Networks 论文详解及代码

  • 25-03-03 21:22
  • 4579
  • 9003
blog.csdn.net

Spatial transformer networks

  • 背景
  • 论文解析
  • 代码

背景

卷积神经网络在多种图像类中的任务表现出色,但有些图像类的任务需要对图像进行几何变换,需要实现一种可微的网络,使能对卷积网络中的特征图或寻常的图像(都是矩阵,没有数学上的区别)进行几何变换。

论文解析

在这里插入图片描述

以U表示输入(特征图或寻常的图像),V表示输出(转换后的特征图或寻常的图像)。三步策略

  1. Localisation Newwork
    一个自定义的回归网络。其输入为U,输出为变换所需要的参数 θ \theta θ。如仿射变换的输出即为6维。

  2. Parameterised Sampling Grid
    在这里插入图片描述

    这一步进行几何变换,不过是对输出坐标进行几何变换,得到输入的坐标;
    以2D的仿射变换为例, x i s , y i s x_i^s, y_i^s xis​,yis​为输入的网格坐标, x i t , y i t x_i^t, y_i^t xit​,yit​为变换后的网格坐标;
    这是图像领域常用的方案,是为了避免输出出现空洞和重叠。

  3. Differentiable Image Sampling
    这一步的核心是为了采样(插值)。
    第二步生成的坐标可能不在网格顶点上,需要将这些坐标采样到网格顶点上。
    在这里插入图片描述
    V i c V_i^c Vic​为输出的网格中 i i i的幅值,H为网格的高,W为网格的宽, U n m c U_{nm}^c Unmc​为输入的幅值。
    这是利用核对网格进行卷积进行采样的同意数学表达,不同的采样方式对应不同的数学公式。且理论上任意的卷积核都可以使用。

代码

github质量较高的代码:实现了 2D的仿射变换,双线性插值。不包含参数回归网络。
https://github.com/kevinzakka/spatial-transformer-network.git

文章知识点与官方知识档案匹配,可进一步学习相关知识
Python入门技能树人工智能深度学习416654 人正在系统学习中
注:本文转载自blog.csdn.net的強云的文章"https://blog.csdn.net/weixin_42577742/article/details/110132612"。版权归原作者所有,此博客不拥有其著作权,亦不承担相应法律责任。如有侵权,请联系我们删除。
复制链接
复制链接
相关推荐
发表评论
登录后才能发表评论和回复 注册

/ 登录

评论记录:

未查询到任何数据!
回复评论:

分类栏目

后端 (14832) 前端 (14280) 移动开发 (3760) 编程语言 (3851) Java (3904) Python (3298) 人工智能 (10119) AIGC (2810) 大数据 (3499) 数据库 (3945) 数据结构与算法 (3757) 音视频 (2669) 云原生 (3145) 云平台 (2965) 前沿技术 (2993) 开源 (2160) 小程序 (2860) 运维 (2533) 服务器 (2698) 操作系统 (2325) 硬件开发 (2491) 嵌入式 (2955) 微软技术 (2769) 软件工程 (2056) 测试 (2865) 网络空间安全 (2948) 网络与通信 (2797) 用户体验设计 (2592) 学习和成长 (2593) 搜索 (2744) 开发工具 (7108) 游戏 (2829) HarmonyOS (2935) 区块链 (2782) 数学 (3112) 3C硬件 (2759) 资讯 (2909) Android (4709) iOS (1850) 代码人生 (3043) 阅读 (2841)

热门文章

101
推荐
关于我们 隐私政策 免责声明 联系我们
Copyright © 2020-2025 蚁人论坛 (iYenn.com) All Rights Reserved.
Scroll to Top