PaddleSeg by PaddlePaddle - RepoMind Architecture & Analysis

简体中文 | English

飞桨高性能图像分割开发套件，端到端完成从训练到部署的全流程图像分割应用。

stars

</div> <div align="center"> <img src="https://github.com/shiyutang/files/blob/9590ea6bfc36139982ce75b00d3b9f26713934dd/teasor.gif" width = "800" /> </div>

<img src="./docs/images/seg_news_icon.png" width="20"/> 最新动态

🔥[2024-11-05] 添加语义分割领域低代码全流程开发能力:
- 飞桨低代码开发工具PaddleX，支持了图像分割领域的低代码全流程开发能力：
  - 🎨 模型丰富一键调用：将通用语义分割和图像异常检测涉及的19个模型整合为2条模型产线，通过极简的Python API一键调用，快速体验模型效果。此外，同一套API，也支持图像分类、目标检测、文本图像智能分析、通用OCR、时序预测等共计200+模型，形成20+单功能模块，方便开发者进行模型组合使用。
  - 🚀 提高效率降低门槛：提供基于统一命令和图形界面两种方式，实现模型简洁高效的使用、组合与定制。支持高性能部署、服务化部署和端侧部署等多种部署方式。此外，对于各种主流硬件如英伟达GPU、昆仑芯、昇腾、寒武纪和海光等，进行模型开发时，都可以无缝切换。
- 增加图像异常检测算法SFTPM

[2023-10-29] :fire: PaddleSeg 2.9版本发布！详细发版信息请参考Release Note。
- 增加对多标签分割Multi-label segmentation，提供数据转换代码及结果可视化，实现对一系列语义分割模型的多标签分割支持。
- 发布轻量视觉大模型MobileSAM，实现更快速的SAM推理。
- 支持量化蒸馏训练压缩功能Quant Aware Distillation Training Compression，对PP-LiteSeg、PP-MobileSeg、OCRNet、SegFormer-B0增加量化训练压缩功能，提升推理速度。

<img src="https://user-images.githubusercontent.com/48054808/157795569-9fc77c85-732f-4870-9be0-99a7fe2cff27.png" width="20"/> 简介

PaddleSeg是基于飞桨PaddlePaddle的端到端图像分割套件，内置45+模型算法及140+预训练模型，支持配置化驱动和API调用开发方式，打通数据标注、模型开发、训练、压缩、部署的全流程，提供语义分割、交互式分割、Matting、全景分割四大分割能力，助力算法在医疗、工业、遥感、娱乐等场景落地应用。

<img src="./docs/images/feature.png" width="20"/> 特性

高精度：跟踪学术界的前沿分割技术，结合高精度训练的骨干网络，提供45+主流分割网络、150+的高质量预训练模型，效果优于其他开源实现。
高性能：使用多进程异步I/O、多卡并行训练、评估等加速策略，结合飞桨核心框架的显存优化功能，大幅度减少分割模型的训练开销，让开发者更低成本、更高效地完成图像分割训练。
模块化：源于模块化设计思想，解耦数据准备、分割模型、骨干网络、损失函数等不同组件，开发者可以基于实际应用场景出发，组装多样化的配置，满足不同性能和精度的要求。
全流程：打通数据标注、模型开发、模型训练、模型压缩、模型部署全流程，经过业务落地的验证，让开发者完成一站式开发工作。

<img src="./docs/images/model.png" width="20"/> 产品矩阵

<table align="center"> <tbody> <tr align="center" valign="bottom"> <td> <b>模型</b> </td> <td colspan="2"> <b>组件</b> </td> <td> <b>特色案例</b> </td> </tr> <tr valign="top"> <td> <ul> <details><summary><b>语义分割模型</b></summary> <ul> <li><a href="./configs/pp_liteseg">PP-LiteSeg</a> </li> <li><a href="./configs/pp_mobileseg">PP-MobileSeg</a> </li> <li><a href="./configs/deeplabv3p">DeepLabV3P</a> </li> <li><a href="./configs/ocrnet">OCRNet</a> </li> <li><a href="./configs/mobileseg">MobileSeg</a> </li> <li><a href="./configs/ann">ANN</a></li> <li><a href="./configs/attention_unet">Att U-Net</a></li> <li><a href="./configs/bisenetv1">BiSeNetV1</a></li> <li><a href="./configs/bisenet">BiSeNetV2</a></li> <li><a href="./configs/ccnet">CCNet</a></li> <li><a href="./configs/danet">DANet</a></li> <li><a href="./configs/ddrnet">DDRNet</a></li> <li><a href="./configs/decoupled_segnet">DecoupledSeg</a></li> <li><a href="./configs/deeplabv3">DeepLabV3</a></li> <li><a href="./configs/dmnet">DMNet</a></li> <li><a href="./configs/dnlnet">DNLNet</a></li> <li><a href="./configs/emanet">EMANet</a></li> <li><a href="./configs/encnet">ENCNet</a></li> <li><a href="./configs/enet">ENet</a></li> <li><a href="./configs/espnetv1">ESPNetV1</a></li> <li><a href="./configs/espnet">ESPNetV2</a></li> <li><a href="./configs/fastfcn">FastFCN</a></li> <li><a href="./configs/fastscnn">Fast-SCNN</a></li> <li><a href="./configs/gcnet">GCNet</a></li> <li><a href="./configs/ginet">GINet</a></li> <li><a href="./configs/glore">GloRe</a></li> <li><a href="./configs/gscnn">GSCNN</a></li> <li><a href="./configs/hardnet">HarDNet</a></li> <li><a href="./configs/fcn">HRNet-FCN</a></li> <li><a href="./configs/hrnet_w48_contrast">HRNet-Contrast</a></li> <li><a href="./configs/isanet">ISANet</a></li> <li><a href="./configs/pfpn">PFPNNet</a></li> <li><a href="./configs/pointrend">PointRend</a></li> <li><a href="./configs/portraitnet">PotraitNet</a></li> <li><a href="./configs/pp_humanseg_lite">PP-HumanSeg-Lite</a></li> <li><a href="./configs/pspnet">PSPNet</a></li> <li><a href="./configs/pssl">PSSL</a></li> <li><a href="./configs/segformer">SegFormer</a></li> <li><a href="./configs/segmenter">SegMenter</a></li> <li><a href="./configs/segmne">SegNet</a></li> <li><a href="./configs/setr">SETR</a></li> <li><a href="./configs/sfnet">SFNet</a></li> <li><a href="./configs/stdcseg">STDCSeg</a></li> <li><a href="./configs/u2net">U<sup>2</sup>Net</a></li> <li><a href="./configs/unet">UNet</a></li> <li><a href="./configs/unet_plusplus">UNet++</a></li> <li><a href="./configs/unet_3plus">UNet3+</a></li> <li><a href="./configs/upernet">UperNet</a></li> <li><a href="./configs/rtformer">RTFormer</a></li> <li><a href="./configs/uhrnet">UHRNet</a></li> <li><a href="./configs/topformer">TopFormer</a></li> <li><a href="./configs/mscale_ocrnet">MscaleOCRNet-PSA</a></li> <li><a href="./configs/cae">CAE</a></li> <li><a href="./configs/maskformer">MaskFormer</a></li> <li><a href="./configs/vit_adapter">ViT-Adapter</a></li> <li><a href="./configs/hrformer">HRFormer</a></li> <li><a href="./configs/lpsnet">LPSNet</a></li> <li><a href="./configs/segnext">SegNeXt</a></li> <li><a href="./configs/knet">K-Net</a></li> </ul> </details> <details><summary><b>交互式分割模型</b></summary> <ul> <li><a href="./EISeg">EISeg</a></li> <li>RITM</li> <li>EdgeFlow</li> </ul> </details> <details><summary><b>图像抠图模型</b></summary> <ul> <li><a href="./Matting/configs/ppmattingv2">PP-MattingV2</a></li> <li><a href="./Matting/configs/ppmatting">PP-MattingV1</a></li> <li><a href="./Matting/configs/dim/dim-vgg16.yml">DIM</a></li> <li><a href="./Matting/configs/modnet/modnet-hrnet_w18.yml">MODNet</a></li> <li><a href="./Matting/configs/human_matting/human_matting-resnet34_vd.yml">PP-HumanMatting</a></li> <li><a href="./Matting/configs/rvm">RVM</a></li> </ul> </details> <details><summary><b>全景分割</b></summary> <ul> <li><a href="./contrib/PanopticSeg/configs/mask2former">Mask2Former</a></li> <li><a href="./contrib/PanopticSeg/configs/panoptic_deeplab">Panoptic-DeepLab</a></li> </ul> </details> </td> <td> <details><summary><b>骨干网络</b></summary> <ul> <li><a href="./paddleseg/models/backbones/hrnet.py">HRNet</a></li> <li><a href="./paddleseg/models/backbones/resnet_cd.py">ResNet</a></li> <li><a href="./paddleseg/models/backbones/stdcnet.py">STDCNet</a></li> <li><a href="./paddleseg/models/backbones/mobilenetv2.py">MobileNetV2</a></li> <li><a href="./paddleseg/models/backbones/mobilenetv3.py">MobileNetV3</a></li> <li><a href="./paddleseg/models/backbones/shufflenetv2.py">ShuffleNetV2</a></li> <li><a href="./paddleseg/models/backbones/ghostnet.py">GhostNet</a></li> <li><a href="./paddleseg/models/backbones/lite_hrnet.py">LiteHRNet</a></li> <li><a href="./paddleseg/models/backbones/xception_deeplab.py">XCeption</a></li> <li><a href="./paddleseg/models/backbones/vision_transformer.py">VIT</a></li> <li><a href="./paddleseg/models/backbones/mix_transformer.py">MixVIT</a></li> <li><a href="./paddleseg/models/backbones/swin_transformer.py">Swin Transformer</a></li> <li><a href="./paddleseg/models/backbones/top_transformer.py">TopTransformer</a></li> <li><a href="./paddleseg/models/backbones/hrformer.py">HRTransformer</a></li> <li><a href="./paddleseg/models/backbones/mscan.py">MSCAN</a></li> </ul> </details> <details><summary><b>损失函数</b></summary> <ul> <li><a href="./paddleseg/models/losses/binary_cross_entropy_loss.py">Binary CE Loss</a></li> <li><a href="./paddleseg/models/losses/bootstrapped_cross_entropy_loss.py">Bootstrapped CE Loss</a></li> <li><a href="./paddleseg/models/losses/cross_entropy_loss.py">Cross Entropy Loss</a></li> <li><a href="./paddleseg/models/losses/decoupledsegnet_relax_boundary_loss.py">Relax Boundary Loss</a></li> <li><a href="./paddleseg/models/losses/detail_aggregate_loss.py">Detail Aggregate Loss</a></li> <li><a href="./paddleseg/models/losses/dice_loss.py">Dice Loss</a></li> <li><a href="./paddleseg/models/losses/edge_attention_loss.py">Edge Attention Loss</a></li> <li><a href="./paddleseg/models/losses/focal_loss.py">Focal Loss</a></li> <li><a href="./paddleseg/models/losses/binary_cross_entropy_loss.py">MultiClassFocal Loss</a></li> <li><a href="./paddleseg/models/losses/gscnn_dual_task_loss.py">GSCNN Dual Task Loss</a></li> <li><a href="./paddleseg/models/losses/kl_loss.py">KL Loss</a></li> <li><a href="./paddleseg/models/losses/l1_loss.py">L1 Loss</a></li> <li><a href="./paddleseg/models/losses/lovasz_loss.py">Lovasz Loss</a></li> <li><a href="./paddleseg/models/losses/mean_square_error_loss.py">MSE Loss</a></li> <li><a href="./paddleseg/models/losses/ohem_cross_entropy_loss.py">OHEM CE Loss</a></li> <li><a href="./paddleseg/models/losses/pixel_contrast_cross_entropy_loss.py">Pixel Contrast CE Loss</a></li> <li><a href="./paddleseg/models/losses/point_cross_entropy_loss.py">Point CE Loss</a></li> <li><a href="./paddleseg/models/losses/rmi_loss.py">RMI Loss</a></li> <li><a href="./paddleseg/models/losses/semantic_connectivity_loss.py">Connectivity Loss</a></li> </ul> </details> <details><summary><b>评估指标</b></summary> <ul> <li>mIoU</li> <li>Accuracy</li> <li>Kappa</li> <li>Dice</li> <li>AUC_ROC</li> </ul> </details> </td> <td> <details><summary><b>支持数据集</b></summary> <ul> <li><a href="./paddleseg/datasets/ade.py">ADE20K</a></li> <li><a href="./paddleseg/datasets/cityscapes.py">Cityscapes</a></li> <li><a href="./paddleseg/datasets/cocostuff.py">COCO Stuff</a></li> <li><a href="./paddleseg/datasets/voc.py">Pascal VOC</a></li> <li><a href="./paddleseg/datasets/eg1800.py">EG1800</a></li> <li><a href="./paddleseg/datasets/pascal_context.py">Pascal Context</a></li> <li><a href="./paddleseg/datasets/supervisely.py">SUPERVISELY</a></li> <li><a href="./paddleseg/datasets/optic_disc_seg.py">OPTIC DISC SEG</a></li> <li><a href="./paddleseg/datasets/chase_db1.py">CHASE_DB1</a></li> <li><a href="./paddleseg/datasets/hrf.py">HRF</a></li> <li><a href="./paddleseg/datasets/drive.py">DRIVE</a></li> <li><a href="./paddleseg/datasets/stare.py">STARE</a></li> <li><a href="./paddleseg/datasets/pp_humanseg14k.py">PP-HumanSeg14K</a></li> <li><a href="./paddleseg/datasets/pssl.py">PSSL</a></li> </ul> </details> <details><summary><b>数据增强</b></summary> <ul> <li>Flipping</li> <li>Resize</li> <li>ResizeByLong</li> <li>ResizeByShort</li> <li>LimitLong</li> <li>ResizeRangeScaling</li> <li>ResizeStepScaling</li> <li>Normalize</li> <li>Padding</li> <li>PaddingByAspectRatio</li> <li>RandomPaddingCrop</li> <li>RandomCenterCrop</li> <li>ScalePadding</li> <li>RandomNoise</li> <li>RandomBlur</li> <li>RandomRotation</li> <li>RandomScaleAspect</li> <li>RandomDistort</li> <li>RandomAffine</li> </ul> </details> </td> <td> <details><summary><b>分割一切模型</b></summary> <ul> <li><a href="./contrib/SegmentAnything">SegmentAnything</a></li> </ul> </details> <details><summary><b>模型选型工具</b></summary> <ul> <li><a href="./configs/smrt">PaddleSMRT</a></li> </ul> </details> <details><summary><b>人像分割模型</b></summary> <ul> <li><a href="./contrib/PP-HumanSeg/README_cn.md">PP-HumanSegV1</a></li> <li><a href="./contrib/PP-HumanSeg/README_cn.md">PP-HumanSegV2</a></li> </ul> </details> <details><summary><b>3D医疗分割模型</b></summary> <ul> <li><a href="./contrib/MedicalSeg/configs/lung_coronavirus">VNet</a></li> <li><a href="./contrib/MedicalSeg/configs/msd_brain_seg">UNETR</a></li> <li><a href="./contrib/MedicalSeg/configs/acdc">nnFormer</a></li> <li><a href="./contrib/MedicalSeg/configs/nnunet/msd_lung">nnUNet-D</a></li> <li><a href="./contrib/MedicalSeg/configs/synapse">TransUNet</a></li> <li><a href="./contrib/MedicalSeg/configs/synapse">SwinUNet</a></li> </ul> </details> <details><summary><b>Cityscapes打榜模型</b></summary> <ul> <li><a href="./contrib/CityscapesSOTA">HMSA</a></li> </ul> </details> <details><summary><b>CVPR冠军模型</b></summary> <ul> <li><a href="./contrib/AutoNUE">MLA Transformer</a></li> </ul> </details> <details><summary><b>领域自适应</b></summary> <ul> <li><a href="./contrib/DomainAdaptation">PixMatch</a></li> </ul> </details> </td> </tr> </td> </tr> </tbody> </table>

<img src="https://user-images.githubusercontent.com/48054808/157801371-9a9a8c65-1690-4123-985a-e0559a7f9494.png" width="20"/> 产业级分割模型库

<details> <summary><b>高精度语义分割模型</b></summary>

高精度模型，分割mIoU高、推理算量大，适合部署在服务器端GPU和Jetson等设备。

模型名称	骨干网络	Cityscapes精度mIoU(%)	V100 TRT推理速度(FPS)	配置文件
FCN	HRNet_W18	78.97	24.43	yml
FCN	HRNet_W48	80.70	10.16	yml
DeepLabV3	ResNet50_OS8	79.90	4.56	yml
DeepLabV3	ResNet101_OS8	80.85	3.2	yml
DeepLabV3	ResNet50_OS8	80.36	6.58	yml
DeepLabV3	ResNet101_OS8	81.10	3.94	yml
OCRNet :star2:	HRNet_w18	80.67	13.26	yml
OCRNet	HRNet_w48	82.15	6.17	yml
CCNet	ResNet101_OS8	80.95	3.24	yml

测试条件：

V100上测速条件：针对Nvidia GPU V100，使用PaddleInference预测库的Python API，开启TensorRT加速，数据类型是FP32，输入图像维度是1x3x1024x2048。

</details> <details> <summary><b>轻量级语义分割模型</b></summary>

轻量级模型，分割mIoU中等、推理算量中等，可以部署在服务器端GPU、服务器端X86 CPU和移动端ARM CPU。

模型名称	骨干网络	Cityscapes精度mIoU(%)	V100 TRT推理速度(FPS)	骁龙855推理速度(FPS)	配置文件
PP-LiteSeg :star2:	STDC1	77.04	69.82	17.22	yml
PP-LiteSeg :star2:	STDC2	79.04	54.53	11.75	yml
BiSeNetV1	-	75.19	14.67	1.53	yml
BiSeNetV2	-	73.19	61.83	13.67	yml
STDCSeg	STDC1	74.74	62.24	14.51	yml
STDCSeg	STDC2	77.60	51.15	10.95	yml
DDRNet_23	-	79.85	42.64	7.68	yml
HarDNet	-	79.03	30.3	5.44	yml
SFNet	ResNet18_OS8	78.72	10.72	-	yml

测试条件：

V100上测速条件：针对Nvidia GPU V100，使用PaddleInference预测库的Python API，开启TensorRT加速，数据类型是FP32，输入图像维度是1x3x1024x2048。
骁龙855上测速条件：针对小米9手机，使用PaddleLite预测库的CPP API，ARMV8编译，单线程，输入图像维度是1x3x256x256。

</details> <details> <summary><b>超轻量级语义分割模型</b></summary>

超轻量级模型，分割mIoU一般、推理算量低，适合部署在服务器端X86 CPU和移动端ARM CPU。

模型名称	骨干网络	ADE20K精度mIoU(%)	骁龙855推理延时(ms)	参数量(M)	配置文件
TopFormer-Base	TopTransformer-Base	38.28	480.6	5.13	config
PP-MobileSeg-Base	StrideFormer-Base	41.57	265.5	5.62	config
TopFormer-Tiny	TopTransformer-Tiny	32.46	490.3	1.41	config
PP-MobileSeg-Tiny	StrideFormer-Tiny	36.39	215.3	1.61	config

测试条件:

针对小米9手机，使用PaddleLite预测库的CPP API，ARMV8编译，单线程，输入图像维度是1x3x512x512。测试模型在带有最后一个argmax算子的条件下进行测试。

模型名称	骨干网络	Cityscapes精度mIoU(%)	V100 TRT推理速度(FPS)	骁龙855推理速度(FPS)	配置文件
MobileSeg	MobileNetV2	73.94	67.57	27.01	yml
MobileSeg :star2:	MobileNetV3	73.47	67.39	32.90	yml
MobileSeg	Lite_HRNet_18	70.75	10.5	13.05	yml
MobileSeg	ShuffleNetV2_x1_0	69.46	37.09	39.61	yml
MobileSeg	GhostNet_x1_0	71.88	35.58	38.74	yml

测试条件：

V100上测速条件：针对Nvidia GPU V100，使用PaddleInference预测库的Python API，开启TensorRT加速，数据类型是FP32，输入图像维度是1x3x1024x2048。
骁龙855上测速条件：针对小米9手机，使用PaddleLite预测库的CPP API，ARMV8编译，单线程，输入图像维度是1x3x256x256。

</details>

<img src="./docs/images/teach.png" width="20"/> 使用教程

入门教程

基础教程

进阶教程

欢迎贡献

<img src="./docs/images/anli.png" width="20"/> 特色能力

<img src="https://user-images.githubusercontent.com/48054808/157801371-9a9a8c65-1690-4123-985a-e0559a7f9494.png" width="20"/> 产业实践范例

更多范例项目可参考：『图像分割经典项目集』用PaddleSeg能做什么？

许可证书

本项目的发布受Apache 2.0 license许可认证。

社区贡献

非常感谢jm12138贡献U<sup>2</sup>-Net模型。
非常感谢zjhellofss（傅莘莘）贡献Attention U-Net模型，和Dice loss损失函数。
非常感谢liuguoyu666贡献U-Net++模型。
非常感谢yazheng0307 (刘正)贡献快速开始教程文档。
非常感谢CuberrChen贡献STDC (rethink BiSeNet) PointRend，和 Detail Aggregate损失函数。
非常感谢stuartchen1949贡献 SegNet。
非常感谢justld(郎督)贡献 UPerNet, DDRNet, CCNet, ESPNetV2, DMNet, ENCNet, HRNet_W48_Contrast, BiSeNetV1, FastFCN, SECrossEntropyLoss 和PixelContrastCrossEntropyLoss。
非常感谢Herman-Hu-saber(胡慧明)参与贡献 ESPNetV2。
非常感谢zhangjin12138贡献数据增强方法 RandomCenterCrop。
非常感谢simuler 贡献 ESPNetV1。
非常感谢ETTR123(张恺) 贡献 ENet，PFPNNet。

<img src="./docs/images/yinyong.png" width="20"/> 学术引用

如果我们的项目在学术上帮助到你，请考虑以下引用：

@misc{liu2021paddleseg,
      title={PaddleSeg: A High-Efficient Development Toolkit for Image Segmentation},
      author={Yi Liu and Lutao Chu and Guowei Chen and Zewu Wu and Zeyu Chen and Baohua Lai and Yuying Hao},
      year={2021},
      eprint={2101.06175},
      archivePrefix={arXiv},
      primaryClass={cs.CV}
}

@misc{paddleseg2019,
    title={PaddleSeg, End-to-end image segmentation kit based on PaddlePaddle},
    author={PaddlePaddle Authors},
    howpublished = {\url{https://github.com/PaddlePaddle/PaddleSeg}},
    year={2019}
}

PaddlePaddle / PaddleSeg

AI Architecture Analysis

Embed this Badge

Repository Summary (README)

<img src="./docs/images/seg_news_icon.png" width="20"/> 最新动态

<img src="https://user-images.githubusercontent.com/48054808/157795569-9fc77c85-732f-4870-9be0-99a7fe2cff27.png" width="20"/> 简介

<img src="./docs/images/feature.png" width="20"/> 特性

⚡ 快速开始

🔥 低代码全流程开发

<img src="./docs/images/model.png" width="20"/> 产品矩阵

<img src="https://user-images.githubusercontent.com/48054808/157801371-9a9a8c65-1690-4123-985a-e0559a7f9494.png" width="20"/> 产业级分割模型库

高精度模型，分割mIoU高、推理算量大，适合部署在服务器端GPU和Jetson等设备。

轻量级模型，分割mIoU中等、推理算量中等，可以部署在服务器端GPU、服务器端X86 CPU和移动端ARM CPU。

超轻量级模型，分割mIoU一般、推理算量低，适合部署在服务器端X86 CPU和移动端ARM CPU。

<img src="./docs/images/teach.png" width="20"/> 使用教程

<img src="./docs/images/anli.png" width="20"/> 特色能力

<img src="https://user-images.githubusercontent.com/48054808/157801371-9a9a8c65-1690-4123-985a-e0559a7f9494.png" width="20"/> 产业实践范例

许可证书

社区贡献

<img src="./docs/images/yinyong.png" width="20"/> 学术引用