«

StableDiffusion探索手记

liang 发布于 阅读:73


一、新手村生存指南:显存警告!
永远记得第一次输入“astronaut riding a horse”时,看着4G显存被瞬间榨干的绝望。这些血泪教训或许能救你:

硬件门槛:实测3060 12G比3080 10G更抗造(大显存比高算力更重要)

启动器必备:秋叶整合包里的“显存优化”选项救了我的笔记本

致命操作:批量生成时没勾选“低显存模式”直接黑屏重启

模型选择:新手建议从官方v1.5开始,别急着玩Anime模型(容易扭曲认知)

二、咒语修炼手册:超越“大师级细节”
曾经以为堆砌关键词就能出神图,直到发现“steampunk girl”+30个修饰词产出克苏鲁怪物...现在我的提示词库分三级:

骨骼层:构图指令(“medium shot, symmetrical composition”)

血肉层:风格锁定(“Studio Ghibli color palette, unreal engine 5 rendering”)

神经层:魔法词缀(“subsurface scattering, volumetric lighting, intricate filigree”)

反例警示:

“beautiful”会让AI困惑,“porcelain skin texture”更精准

慎用绝对否定词,用“minimal makeup”替代“no heavy makeup”

三、ControlNet掌控术:从抽卡到可控
装上ControlNet插件那天,我的出图成功率暴涨200%,但这些细节你可能不知道:

线稿控制:手绘草图上传前先用PS做高斯模糊(防止AI过度解读杂线)

姿势操控:用OpenPose编辑时保留关节热区(手指关键点不丢失)

色块约束:商品海报用segmentation控制主体占比,避免“背景喧宾夺主”

实战案例:
客户要“中国风赛博菩萨”,用Canny检测处理鎏金纹样线稿+Depth控制空间层次,3次迭代就过稿。

四、模型炼丹心得:别乱喂素材
尝试用公司产品图训练LoRA模型,结果生成的产品全带诡异微笑...现在我的训练原则:

素材质量>数量:20张精心去背的图比200张杂图有效

参数玄学:学习率0.0001时像毕加索,0.00001时像美图秀秀

触发词陷阱:别用“vase”这类常见词当专属触发词(会污染其他模型)

五、商用避雷清单
用SD赚到第一桶金后踩过的雷:

生成人脸被平台警告(解决方法:最后一步用PS改瞳孔高光)

金属材质出现诡异商标轮廓(开启highres fix后噪点拉满)

客户说“不够真实”时,在提示词里加“film grain, skin imperfections”