CUDA优化001. TensorRT加速SD的优化给看到的TensorRT加速AI推理2023 Hackson视频做个笔记Video。 SD模型结构: Unet ControlNet VAE Schedule latent(未入图) 优化方法: 步骤 优化操作 时延效果 分析 1 Export unet and controlnet to trt engine 2600ms→634ms 使用GPU执行 2 Use ...发布于 2023-10-29CUDA性能优化