ComfyUI(舒适用户界面)深度评测:开源节点式AI图像生成工作流工具使用教程:从入门到精通
从选型到落地的可执行指南,适合个人与团队快速上手。
教程正文
从选型到落地的实战步骤。
一、ComfyUI是什么?为什么值得深度评测?
ComfyUI(全称Comfortable User Interface)是一款基于节点的开源AI图像生成工作流工具。与传统的Stable Diffusion WebUI(如Automatic1111)不同,ComfyUI采用可视化节点编辑器,允许用户像搭积木一样自由组合各种处理模块(如CLIP文本编码、VAE解码、采样器、ControlNet等)。这种架构带来了极高的灵活性和可扩展性,特别适合需要精细控制生成过程的进阶用户和研究开发者。

本教程将从零开始,逐步带你掌握ComfyUI的安装、界面布局、核心节点操作,并提供一个完整的文生图工作流示例。无论你是刚接触AI绘画的新手,还是想从WebUI迁移过来的老手,都能从中获得实用技巧。
二、安装与环境准备
2.1 系统要求
- 操作系统:Windows 10/11、macOS 12+、Linux(推荐Ubuntu 22.04)
- 显卡:NVIDIA显卡(VRAM ≥ 6GB,推荐8GB以上)或Apple Silicon Mac(M1/M2/M3)
- Python:3.10~3.11(不要用3.12,部分依赖尚未兼容)
- 额外空间:至少20GB用于模型存储
2.2 安装步骤(Windows为例)
- 访问ComfyUI GitHub仓库(
https://github.com/comfyanonymous/ComfyUI),点击“Code” → “Download ZIP”,或直接使用Git克隆:git clone https://github.com/comfyanonymous/ComfyUI.git - 进入文件夹,创建虚拟环境(推荐):
python -m venv venvvenv\Scripts\activate(Windows)或source venv/bin/activate(Linux/macOS) - 安装依赖:
pip install -r requirements.txt - 下载基础模型(如SDXL或SD1.5),放入
models/checkpoints/文件夹。示例:从Hugging Face下载sd_xl_base_1.0.safetensors。 - 启动ComfyUI:
python main.py
看到提示Starting server at http://127.0.0.1:8188后,在浏览器打开该地址。

三、界面与核心概念
3.1 界面布局
- 左侧面板:节点库(Nodes Menu),可按类别(如Loaders、Sampling、Latent)展开。
- 中央画布:拖拽节点、连线的工作区域。
- 右键菜单:快速添加节点、执行队列、保存/加载工作流。
- 工作流保存/加载按钮:顶部工具栏图标,支持
.json格式。
3.2 节点类型速览
| 节点名称 | 功能 |
|---|---|
| Load Checkpoint | 加载Stable Diffusion基础模型(checkpoint) |
| CLIP Text Encode | 将文字提示转换为CLIP向量 |
| KSampler | 执行采样步骤(步数、CFG、种子等控制) |
| VAE Decode | 将潜变量转换为像素图像 |
| Save Image | 保存生成的图片到本地 |

四、实战:搭建一个完整的文生图工作流
下面我们一步步构建一个从文本到图像的基线工作流。这里以SDXL模型为例。
步骤1:加载模型
在画布上右键 → 选择“Add Node” → 搜索“Load Checkpoint”,点击添加。之后双击节点,在下拉菜单中选择你下载的模型文件(如sd_xl_base_1.0.safetensors)。该节点会自动输出三个接口:MODEL、CLIP、VAE。
步骤2:添加提示词编码
添加两个“CLIP Text Encode”(一个用于正向提示,一个用于负向提示)。将“Load Checkpoint”的CLIP输出分别连接到两个CLIP Text Encode的clip输入。双击每个节点,在文本框中输入正向提示(例如:“a beautiful landscape, mountains, sunset, high quality, 4k”)和负向提示(例如:“lowres, ugly, blurry, bad anatomy”)。
步骤3:创建潜空间图像
添加“Empty Latent Image”节点:右键 → 搜索。设置宽度、高度(如1024×1024)和批次大小(batch size = 1)。
步骤4:采样器设置
添加“KSampler”节点(注意不是“KSampler Efficient”)。连接:
- 将
Empty Latent Image的latent输出 → KSampler的latent_image输入。 - 将正向CLIP Text Encode的
conditioning输出 → KSampler的positive输入。 - 将负向CLIP Text Encode的
conditioning输出 → KSampler的negative输入。 - 将
Load Checkpoint的MODEL输出 → KSampler的model输入。
在KSampler节点中设置参数:seed(可留空自动随机),steps(推荐20-30),cfg(7-8),sampler_name(如euler),scheduler(如normal)。
步骤5:解码并保存图像
添加“VAE Decode”节点,将KSampler的latent输出连接到VAE Decode的samples输入,并将Load Checkpoint的VAE输出连接到VAE Decode的vae输入。最后添加“Save Image”节点,连接VAE Decode的image输出。
步骤6:生成
点击画布右上角的“Queue Prompt”按钮(或按Ctrl+Enter),等待进度条完成。生成的图片会出现在ComfyUI/output/文件夹中,同时画布上会弹出一个预览窗口。
text_to_image.json,下次直接拖入浏览器即可复用。另外,在KSampler中勾选“ControlNet”后,可进一步扩展为带控制条件的生成。五、进阶技巧与常见问题
5.1 高效调试技巧
- 查看输出张量:右键任意节点的输出接口,选择“Add Display Node”,即可在画布上实时看到中间结果(如CLIP编码后的维度)。
- 批量生成对比:在KSampler中将
batch_size设为4,同时生成多张不同种子的图像,方便挑选。 - 使用节点模板:官方提供了数百个示例工作流(GitHub wiki页面),可以直接下载学习。
5.2 常见问题排查
- 生成报错“CUDA out of memory”:降低图像分辨率(如从1024×1024改为768×768),或在Empty Latent Image中启用
batch_size=1,减少显存占用。 - 节点间连线不匹配:注意输出/输入类型(如
MODEL只能连接到model接口),颜色不同的接口不能连接。 - 提示词不生效:检查CLIP Text Encode是否连接到KSampler的
conditioning,而非latent。
六、深度评测总结
ComfyUI以其独特的节点式工作流,在灵活性和可复现性上远超传统UI。它特别适合需要自定义管线、使用ControlNet/LoRA/IP-Adapter等扩展的创作场景。学习曲线较WebUI稍陡,但一旦掌握,效率提升显著。本教程覆盖了核心安装、界面操作和完整工作流搭建,接下来你可以尝试替换不同模型、增加ControlNet等高级节点,甚至编写自定义Python节点。
如果你觉得本文对你有帮助,欢迎收藏和分享。更多ComfyUI高级教程(如视频转动画、自定义节点开发)将陆续推出。
相关教程推荐
继续学习相关主题。
Sora(索拉)AI视频生成工具深度评测:OpenAI文生视频的革命性突破使用教程:从入门到精通
从零开始掌握Sora AI视频生成工具:申请访问、编写提示词、生成高质量视频,以及高级镜头控制技巧。包含实操案例和常见问题解决。
Khoj(科霍)AI搜索引擎深度评测:开源个人知识库智能搜索与问答平台使用教程:从入门到精通
全面教程教你使用开源AI搜索引擎Khoj部署个人知识库,支持自然语言搜索与问答。从Docker安装到配置索引、高级技巧,一步步上手。
秘塔AI搜索(Metaso)深度评测:无广告的智能搜索引擎与知识发现平台使用教程:从入门到精通
秘塔AI搜索(Metaso)是一款无广告、基于大模型的智能搜索引擎,本文从注册、基础搜索、深度模式、学术搜索、文件分析到知识库管理,提供完整可操作的入门与进阶教程。
通义千问(Tongyi Qianwen)深度评测:2025年国产多模态大语言模型的智能对话旗舰使用教程:从入门到精通
2025年通义千问升级了多模态、128K上下文和联网搜索。本文从注册到进阶,手把手教你用图片分析、文档解析、代码调试等功能,附实用模板与避坑指南。