首页 最新 热门 推荐

  • 首页
  • 最新
  • 热门
  • 推荐

Non-local Neural Networks

  • 25-03-03 21:22
  • 3023
  • 8770
blog.csdn.net

论文链接:论文
一位大佬的博客:博客
一般深度学习的各种操作都是local的,比如CNN,conv都是局部感受野,但其实全局的信息对于图像的任务更有价值,比如短视频分类任务等等,目前全局信息的使用就是FC,但是这会带来大量的参数。这篇文章提出了一个nonlocal的操作,他把position当成了一个权重,这里的position可以指空间,时间,或者时空关系,计算全局的关联性。eg视频中第一帧的A1区域和第十帧中A3区域有关联性,或者静态图像中,有些区域有关系,如果找到这些关系,就可以更好的分析目标整体的动作。
在这里插入图片描述
这个nonlocal可以被封装成一个block,用于任何网络。
贴出它的公式:
在这里插入图片描述
它是一个类似attention的机制,根据各像素之间的相关性,对所有像素进行加权。权重越大,说明这个区域越重要。
x i x_{i} xi​代表输入图像的各像素点, f f f计算 x i x_{i} xi​和所有 x j x_{j} xj​之间的相关性。 g g g可以理解为对 x j x_{j} xj​的一种增强操作。(注意, x x x为向量。故 f f f的结果为一个数值, g ( x j ) g(x_{j}) g(xj​)仍为一个向量, C ( x ) C(x) C(x)是用于归一化的数值。相当于给输入图像每个像素点处的向量 x j x_{j} xj​,都乘以 x i x_{i} x

注:本文转载自blog.csdn.net的CV大白菜的文章"https://blog.csdn.net/qq_28778507/article/details/90482074"。版权归原作者所有,此博客不拥有其著作权,亦不承担相应法律责任。如有侵权,请联系我们删除。
复制链接
复制链接
相关推荐
发表评论
登录后才能发表评论和回复 注册

/ 登录

评论记录:

未查询到任何数据!
回复评论:

分类栏目

后端 (14832) 前端 (14280) 移动开发 (3760) 编程语言 (3851) Java (3904) Python (3298) 人工智能 (10119) AIGC (2810) 大数据 (3499) 数据库 (3945) 数据结构与算法 (3757) 音视频 (2669) 云原生 (3145) 云平台 (2965) 前沿技术 (2993) 开源 (2160) 小程序 (2860) 运维 (2533) 服务器 (2698) 操作系统 (2325) 硬件开发 (2491) 嵌入式 (2955) 微软技术 (2769) 软件工程 (2056) 测试 (2865) 网络空间安全 (2948) 网络与通信 (2797) 用户体验设计 (2592) 学习和成长 (2593) 搜索 (2744) 开发工具 (7108) 游戏 (2829) HarmonyOS (2935) 区块链 (2782) 数学 (3112) 3C硬件 (2759) 资讯 (2909) Android (4709) iOS (1850) 代码人生 (3043) 阅读 (2841)

热门文章

101
推荐
关于我们 隐私政策 免责声明 联系我们
Copyright © 2020-2025 蚁人论坛 (iYenn.com) All Rights Reserved.
Scroll to Top