SegNet: A Deep Convolutional Encoder-Decoder Architecture for Image Segmentation|电子爱好者

admin管理员组
文章数量:1663034

SegNet: A Deep Convolutional Encoder-Decoder Architecture for Image Segmentation

1. SegNet——《SegNet: A Deep Convolutional Encoder-Decoder Architecture for Image Segmentation》
2. DeconvNet——《Learning Deconvolution Network for Semantic Segmentation》（ICCV 2015）

1. SegNet——《SegNet: A Deep Convolutional Encoder-Decoder Architecture for Image Segmentation》

标题：SegNet:一种用于图像分割的深度卷积编码器-解码器结构
论文：https://arxiv/pdf/1807.10221v1.pdf
代码：
- https://github/CSAILVision/unifiedparsing（office）
- https://github/CSAILVision/semantic-segmentation-pytorch
研究成果及意义
- 在内存（参数）和准确率之间找到了很好的平衡点
- 将编码解码结构普适化
- 在多个场景数据集（道路、室内）中均取得了很好的结果
摘要：
- 算法结构：提出了SegNet网络，其核心的训练引擎包含一个Encoder网络（采用VGG16，移除全连接层，和FCN一样），和一个对称的Decoder网络，即编码器-解码器结构，并跟随一个用于pixel-wise的分类层
- 文章亮点：Decoder上采样的方式：与Encoder对称，通过Encoder在经过最大池化时保留的polling index 进行非线性上采样（反池化），反池化对保留边界信息有利
- 比较结果：通过比较SegNet 与FCN ，DeepLab-LargeFOV , DenconvNet结构，统筹内存与准确率，Segnet实现了良好的分割效果
- 模型评估：在Camvid （道路场景）和SUN RGB-D indoor （室内场景）数据集中均有评测，评价指标提出了在mIoU 上增加F1 的BF
引言（设计宗旨）
- 近期的许多语义分割研究采用DNN ，但是结果比较粗糙，主要原因是max-pooling 和sub-sampling降低了特征图的分辨率
- 道路场景理解需要算法具有appearance外形、shape形状和理解空间关系(上下文) 的能力。由于是道路场景，因此需要网络能够产生光滑的分割，网络也必须有能力勾画出小尺寸的物体。因此在提取图片特征过程中保留边界信息（boundary localization ）很重要
- 重用max-pooling indices 的优点：提高边界勾画；减少了进行端到端训练的参数；这种上采样形式可以被集成到任何encoder-decoder 架构的网络中
- 典型的道路场景，对小目标边缘信息保留多些，这样才可以刻画的准确点
- Pascal VOC 数据集中有少数Foreground 与Background 有明显区分，这让一些投机者可以使用类似于边缘检测来刷分数。因此本文使用了Camvid ，SunRGBD 这两个数据集，而不是用PascalVOC 数据集
- 场景理解希望模型能够自动识别背景，所以DCNNs （《 Semantic Image Segmentation with Deep Convolutional Nets and Fully Connected CRFS》）用CRF （Conditional random field）后处理方式不符合这个理念，场景理解要设计一个端到端的网络
FCN的缺点：
- 忽略了高分辨率的特征图，会导致边缘信息的丢失
- FCN编码器网络中有大量的参数（124M）,但解码器网络非常小（0.5M）(其实，大部分模型编码器都差不多，主要改进在解码器)；FCN32s 效果很差，所以SegNet采用阶段性的训练过程，即先得到32s ，效果不好，则32s 和上一层解码器结合得到16s ，再看效果，直到没有进一步的性能提升

SegNet是在DeconvNet基础上提出的，所以随便说一下DeconvNet

2. DeconvNet——《Learning Deconvolution Network for Semantic Segmentation》（ICCV 2015）

标题：学习反卷积网络的语义分割
论文：https://arxiv/abs/2103.09460
代码：https://github/megvii-model/YOLOF
文章结构布局很好，值得参考
摘要：
- 算法结构：提出了深度反卷积网络，编码部分使用VGG-16卷积层进行学习，解码器部分使用反卷积与反池化层进行上采样（SegNet只用了反池化层）
  
  图中，中间是两个全连接,在Decoder 部门用的反卷积（黑色方块，因为在做完Unpooling 之后，特征图虽然变大了，但是是比较稀疏的，需要通过卷积将特征密集化，而作者认为反卷积生成密集预测图比卷积能力更强，这也是和SegNet 的区别）
- 文章亮点：由反卷积（deconvolution）和上采样unpooling layers 组成上采样组件，逐像素分类完成预测
- 特殊方式：将object proposal（edge box）送入训练后的网络，整幅图像是这些proposal分割结果的组合，这样就可以解决物体太大（感受野不够大）或者太小（周围多余信息的干扰）所带来的分割问题，改进了现存的基于FCN的方法（也就加入了人工的后处理，所以不是很流行，SegNet的端到端方式更流行）
- 模型评估：算法能识别图像中的精细结构以及不同尺度大小的目标，在PASCAL VOC 2012 数据集中取得了72.5的准确率
引言
- FCN中Decoder对输入特征图，用双线性插值初始化，然后用反卷积做上采样，并将其与相应的编码器特征图组合，以产生下一个Encoder的输入
- FCN由于感受野大小固定，当感受野小于大物体，导致错分；小物体会被当成背景而被忽略；其他论文用跳跃连接（skip architecture ）来解决，有效果，但是融合特征的方式不是处理感受野的根本办法

本文标签： Convolutional Encoder SegNet Deep Image

版权声明：本文标题：SegNet: A Deep Convolutional Encoder-Decoder Architecture for Image Segmentation 内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/xitong/1729977981a1218255.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

Deep Learning Literature 常用词中英文总结（一）

10天前

RNN（循环神经网络） RNN（循环神经网络） 英文中文Recurrent循环Recursive递归weight权重bias偏置activation激

2020人体姿态估计综述（Part4：3D Human Pose Estimation from Image）

10天前

承接之前的博文： A 2020 Human Pose Estimation Review （Part1：2D Single Person） A 2020

python image.save(pdf)_python 三种方法提取pdf中的图片

10天前

有时我们需要将一份或者多份PDF文件中的图片提取出来，如果采取在线的网站实现的话又担心图片泄漏，手动操作又觉得麻烦，其实用Python也可以轻松搞定！今天就跟大家系统分享几种Python提取 PDF 图片的方法。其实没有非常完美的方法，每

论文笔记：Think-on-graph: Deep and responsible reasoning of large language model with knowledge graph

9天前

论文来源：ICLR 2024 论文地址：pdf (openreview) 论文代码：IDEA-FinAIToG: This is the official github

深度多视图信息瓶颈：Deep Multi-view Information Bottleneck

8天前

论文题目：Deep Multi-view Information Bottleneck Summary 单个视图的信息瓶颈模型已经发展较为成熟，但尚未有在多视图上的信息瓶颈理论&#xf

IDN-Fast and Accurate Single Image Super-Resolution via Information Distillation Network信息蒸馏网络

8天前

Fast and Accurate Single Image Super-Resolution via Information Distillation Network CVPR2018 github(caffe): https:gi

image deliver

7天前

!](https:i-blog.csdnimgdirect3dd5a9957f534f76b67ffbdf1e7618c3.png)

ImageIO.read 读取图片时报错 Unsupported Image Type

7天前

原因： ImageIO中读取文件的类为JPEGImageReader，这个类只能读取RGB color model，如果文件被PhotoShop或美图秀秀修改过&#x

论文笔记：DeepFuse: A Deep Unsupervised Approach for Exposure Fusion with Extreme Exposure Image Pairs

4天前

论文笔记：DeepFuse: A Deep Unsupervised Approach for Exposure Fusion with Extreme Exposure Image Pairs code&#

论文阅读 - A Deep Learning Approach for Robust Detection of Bots in Twitter Using Transformers

4天前

一种使用 Transformer 对 Twitter 中的机器人进行鲁棒检测的深度学习方法论文链接：https:ieeexplore.ieeeielx76287639931271009385071.pd

【时空序列预测第二篇】Convolutional LSTM Network: A Machine Learning Approach for Precipitation Nowcasting

4天前

个人公众号 AI蜗牛车作者是南京985AI硕士，CSDN博客专家，研究方向主要是时空序列预测和时间序列数据挖掘，获国家奖学金，校十佳大学生&

【KDD19】Deep Uncertainty Quantification: A Machine Learning Approach for Weather Forecasting

4天前

address http:urban-computingpdfkdd19-BinWang.pdf ABSTRACT propose a novel negative log-likelihood error loss func

Problem instances for “Multi-Agent Deep Reinforcement Learning based Real-time Planning Approach for

4天前

1. Description of the data: The data are the training, validation, and test instances of 3 CB-MRPPs studied in the abov

递归网络之Convolutional LSTM Network: A Machine LearningApproach for Precipitation Nowcasting

4天前

Convolutional LSTM Network: A Machine LearningApproach for Precipitation Nowcasting 文章目录 Convolutional LSTM Network: A M

大型数据集含损坏图OSError: image file is truncated和PIL.UnidentifiedImageError: cannot identify image file解决方案

3天前

大型数据集包含损坏图片，报错OSError: image file is truncated 和 PIL.UnidentifiedImageError: cannot identify image file的解决方案

python PIL库image.open()报错cannot identify image file ‘1.jpg‘WEBP

3天前

python PIL库image.open()报错cannot identify image file ‘1.jpg’WEBP 1.导入库时使用import Image 更改为from PIL import Image 2.pill

PIL.UnidentifiedImageError: cannot identify image file ‘E:\数据集\total\0101003-14_20201018082000_2.

3天前

读取图片时候出现问题： PIL.UnidentifiedImageError: cannot identify image file ‘E:数据集total101003-14_20201018082000_2.

IOError: cannot identify image file; Unresolved import: Image

3天前

1、IOError: cannot identify image file 解决方案： 将 import Image 改为 from PIL import Image 2、Unresolved import

pythonIOError: cannot identify image file

3天前

python 做图像处理，输出一副图片的大小。代码如下： import ImageimImage.open(D:\pythonword\tt.jpg)print im.size 运行报

Android 签名系统Image和签名OTA

4小时前

Android 操作系统映像在两个地方使用加密签名： 映像中的所有 .apk 文件都必须经过签名。Android 软件包管理器通过下列两种方式使用 .apk 签名： 更换应用时&#xff

电子爱好者 - 最新技术资讯及电子产品介绍！

SegNet: A Deep Convolutional Encoder-Decoder Architecture for Image Segmentation

SegNet: A Deep Convolutional Encoder-Decoder Architecture for Image Segmentation

1. SegNet——《SegNet: A Deep Convolutional Encoder-Decoder Architecture for Image Segmentation》

2. DeconvNet——《Learning Deconvolution Network for Semantic Segmentation》（ICCV 2015）

更多相关文章

Deep Learning Literature 常用词中英文总结（一）

2020人体姿态估计综述（Part4：3D Human Pose Estimation from Image）

python image.save(pdf)_python 三种方法提取pdf中的图片

论文笔记：Think-on-graph: Deep and responsible reasoning of large language model with knowledge graph

深度多视图信息瓶颈：Deep Multi-view Information Bottleneck

IDN-Fast and Accurate Single Image Super-Resolution via Information Distillation Network信息蒸馏网络

image deliver

ImageIO.read 读取图片时报错 Unsupported Image Type

论文笔记：DeepFuse: A Deep Unsupervised Approach for Exposure Fusion with Extreme Exposure Image Pairs

论文阅读 - A Deep Learning Approach for Robust Detection of Bots in Twitter Using Transformers

【时空序列预测第二篇】Convolutional LSTM Network: A Machine Learning Approach for Precipitation Nowcasting

【KDD19】Deep Uncertainty Quantification: A Machine Learning Approach for Weather Forecasting

Problem instances for “Multi-Agent Deep Reinforcement Learning based Real-time Planning Approach for

递归网络之Convolutional LSTM Network: A Machine LearningApproach for Precipitation Nowcasting

大型数据集含损坏图OSError: image file is truncated和PIL.UnidentifiedImageError: cannot identify image file解决方案

python PIL库image.open()报错cannot identify image file ‘1.jpg‘WEBP

PIL.UnidentifiedImageError: cannot identify image file ‘E:\数据集\total\0101003-14_20201018082000_2.

IOError: cannot identify image file; Unresolved import: Image

pythonIOError: cannot identify image file

Android 签名系统Image和签名OTA

发表评论

推荐文章

Android各个版本的功能特性

利用python删除指定目录下的文件和文件夹

点云凹凸性检验（12）

android路由器安装wifidog,Wifidog-刷OpenWRT标准版固件后安装LuCI的方法

VS2013 产品密钥 – 所有版本

热门文章

快速解决sncgss32.dll错误：从问题诊断到彻底修复的全面指南

Mysql安装以及使用

Python3从零开始爬取今日头条的新闻【五、解析头条视频真实播放地址并自动下载】

学习笔记-KMS服务器 - 部署配置

【Docker】讲一下最近的悲惨遭遇吧，总结一下惨痛经验

isf文件格式改为csv格式

关于Windows8.1应用商店恢复&amp;&amp;APP清理&amp;&amp;关闭开机自动连接go.microsoft.com问题

SM2算法第三篇：实现SM2秘钥交换协议的算法流程

口碑最好的麦克风品牌有哪些，无线领夹麦克风十大品牌推荐

校园小说男主是计算机系,十大完本校园小说排行榜 经典好看的青春校园小说...

最新文章

Ubuntu使用create_ap开启热点后无法连接WIFI和有线网络

关于windows，wifi图标显示不了的解决方法

如何在电脑上查看连接的WiFi密码？

中国十大IT论坛网站

soho

台式机通过笔记本上网

xp电脑如何链接无线网络连接服务器,台式xp电脑wifi受限怎么解决 xp系统台式机网络提示连接受限的解决办法...

催化剂，抑制剂和变压器：十大主导力量塑造技术

做技术的方向性讨论(论坛帖子整理)

程序员要注意健康一-避免罗京、李钰悲剧：改变我们的酸性体质

为电脑wifi配置固定的ip地址

好用的WIFI连接工具，替代Windows蠢笨的WIFI连接

Windows查看连接WiFi密码

[转]明朝出了个张居正 作者：秋风浩荡 -3

什么是soho

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

关于Windows8.1应用商店恢复&&APP清理&&关闭开机自动连接go.microsoft.com问题

校园小说男主是计算机系,十大完本校园小说排行榜经典好看的青春校园小说...

[转]明朝出了个张居正作者：秋风浩荡 -3

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载