SDXL 0.9 模型泄漏
上周 Stable Diffusion 最新的大版本模型 SDXL 0.9 泄漏了,下面是收集到的一些信息,整体模型质量应该相当于 Midjourney V5 的版本比不上现在的 5.2,但是跟现有的 Lora 和模型混合之后就不好说了,而且这个是可以在消费设备上跑的,到时候人手一个 MJ V5 那有点强的。
模型效果如何
- 模型对色情内容做了限制,但没有那么离谱,通过提示词还是可以生成
- 3060显卡下,生成一张1024×1024图片需要22秒
- 从效果上来看,图像质量接近Midjourney V5刚发布的那个版本
- 下面是C 站的一些测试图可以看一下效果
为什么效果好
- 模型规模较大:SDXL使用了比之前版本的Stable Diffusion大三倍的UNet主干,具有更多的注意力块和更大的交叉注意力上下文,从而提高了视觉保真度。
- 引入新的条件策略:SDXL引入了多种新的条件策略,可以改善生成图像的质量,并能够在多种长宽比例的图像上进行训练。
- 引入改进模型提高样本质量:SDXL引入了一个改进模型,在SDXL生成的潜变量上应用去噪过程,从而提高样本的质量。这个改进模型能够通过后处理的图像技术改善生成样本的视觉质量。
配置需求
- 需要注意的是泄露的模型是不能在Web UI中直接使用的
- Automatic1111的适配工作正在进行,正式版发布的时候有可能能够使用
- 你现在可以通过ComfyUI运行泄露的版本
- 泄露版本需要的显存最低为7G,所以建议还是12G显存的显卡稳妥一些,貌似3060 6G也可以运行
如何使用
- 下载的时候只下载 sd_xl_base_0.9.safetensors 和可选的 sd_xl_refiner_0.9.safetensors 就行
- 之后需要将模型文件放进:ComfyUImodelscheckpoints
- 复制下面链接所有代码并粘贴到 ComfyUI 上https://github.com/comfyanonymous/ComfyUI/issues/817#issuecomment-1615162251…
关于 Langchain是否有效的讨论
Hacker News有一篇关于 LangChain 是否有效的帖子引起了广泛讨论,这个帖子的核心观点是“Langchain是无意义的原因在于它试图解决无法支持的技术基础之上的问题。目前的技术没有可重用性。Langchain试图建立抽象以实现一切的重用,但实际上只是得到了一个平庸的DAG框架,其中传递的指令和数据都是垃圾。随着链条越长,输出中的垃圾越多。因此,目前的Langchain或类似产品在实际生产规模中构建有价值的用户功能方面是无用的。”
多数的批评都集中在 LangChain 为了抽象而抽象,浪费的非常长的时间适配以后没有观察到更好的效果,还有就是过于复杂,文档写的很差学习和使用的时候得去看源码了解逻辑,很浪费时间。
未经允许不得转载:表盘吧 » SDXL 0.9 模型泄漏