股骨头坏死介绍

注册

 

发新话题 回复该主题

GitHub标星25K,U2Ne [复制链接]

1#

来源

JackCui

头图

CSDN下载自视觉中国

今年提出的U^2-Net显著性检测算法,刷爆了reddit和twitter,号称是年「地表最强」的静态背景分割算法,可以看下效果:

你以为今天要讲分割?错!

U^2-Net这两天又出新活,在U^2-Net网络架构基础上,实现了人物肖像画的生成,细节「完美」复刻。

我用自己的「歪脖子照」测试了下效果。

万年不变老规矩,继续手把手教学。

算法原理、环境搭建、效果实现,一条龙服务,尽在下文!

U^2-Net

受U-Net网络的启发,U^2-Net也是一种类似编码-解码(Encoder-Decoder)的网络结构。

研究者在此基础上,提出了新型残差U-block(ReSidualU-block,RSU),融合不同尺寸接受野的特征,以捕获更多不同尺度的上下文信息。

RSU网络与现有卷积块的结构对比如下:

最右边的结构,就是RSU-L,L表示编码器中的层数,C_in、C_out分别表示输入和输出通道,M表示RSU内层通道数。

具体而言,RSU主要有三个组成部件,分别是一个输入卷积层、一个高度为L的类U-Net对称编码器-解码器结构以及一个通过求和来融合局部和多尺度特征的残差连接。

为了更好地理解设计理念,研究者在下图中对RSU与原始残差块进行了比较。

结果显示,RSU与原始残差块的最大区别在于RSU通过一个类U-Net的结构替换普通单流卷积,并且通过一个由权重层转换的局部特征替换原始特征。

更值得注意的是,得益于U形结构,RSU的计算开销相对较少,因为大多数运算在下采样特征图中应用。下图展示了RSU与其他特征提取模块的计算成本曲线图:

U^2-Net的整体网络架构如下:

U^2-Net主要由三部分组成:

6阶段编码器;5阶段解码器;与解码器阶段和最后编码器阶段相连接的显著图融合模块。说完网络结构,再看下损失函数,研究者使用了类似于整体嵌套边缘检测(HED)的深度监督算法:

其中,M=6,为U^2-Net的Sup1,Sup2,...,Sup6stage。

为Sup1,Sup2,...,Sup6输出的显著图,

的损失函数;

为最终融合输出的显著图,

的损失函数;

为每个损失函数的权重。

对于每个l,采用标准的二值交叉熵损失函数:

其中,(r,c)为像素坐标;(H,W)为图像尺寸,height和width。

分别表示GT像素值和预测的显著概率图。

总的来说,U^2-Net的设计构建了具有丰富多尺度特征以及较低计算和内存成本的深度架构。

更详细的内容,可以直接看paper:

分享 转发
TOP
发新话题 回复该主题