CUDA优化001. TensorRT加速SD的优化

给看到的TensorRT加速AI推理2023 Hackson视频做个笔记Video。 SD模型结构: Unet ControlNet VAE Schedule latent(未入图) 优化方法: 步骤 优化操作 时延效果 分析 1 Export unet and controlnet to trt engine 2600ms→634ms 使用GPU执行 2 Use ...

发布于 CUDA性能优化