流行的 AI 艺术生成器Stable Diffusion需要文字提示来制作图像。有时它会做得非常出色,并通过模糊的提示准确地生成您想要的内容。其他时候,你会得到次优的输出。以下是获得理想结果的一些提示和技巧。
如何编写稳定的扩散提示
如果您曾经使用过 AI 图像生成器,例如 Stable Diffusion、DALL-E 或MidJourney,您会注意到措辞恰当的提示至关重要。一个措辞得当的提示是把你的想法变成一个伟大的形象和得到一些不可思议的山谷怪物之间的区别,用太多的手指盯着你。
自 2022 年 8 月 Stable Diffusion 推出以来,人们一直在努力寻找获得理想结果的最佳方法,并且在未来几年内,它们将是“快速锻造”或“快速工程”。这尤其有可能是因为通知稳定扩散如何生成图像的检查点将收到定期更新。在可预见的未来,理想的提示将成为一个移动的目标。
尽可能具体
稳定扩散往往会在特定提示下茁壮成长,尤其是与 MidJourney 之类的东西相比时。你需要准确地告诉它 你 想要什么。这是一个使用互联网上最喜欢的动物的例子:可爱的猫。
好吧,他们很可爱,除了中上层的那个可怜的家伙,看起来他花了太多时间盯着深渊。但是如果你想要灰猫,而不是混合猫呢?好吧,您需要指定它。改为使用“可爱的灰猫”作为提示。
现在稳定扩散返回所有灰猫。你可以继续添加你想要的东西的描述,包括装饰图片中的猫。
这适用于您希望稳定扩散产生的任何东西,包括风景。具有描述性,当您尝试不同的关键字组合时,请记住图像的变化方式。某些单词和短语往往比其他单词更强烈地偏向图像,因此您可能需要相应地调整提示。
命名特定的艺术风格或媒介
当您完全描述所需图像的内容时,对特异性的需求并没有结束。您可以(也应该)指定您想要的样式。为此,我们将坚持使用“可爱的灰猫”提示。假设我们想要一些可爱的灰猫,但我们也希望它们看起来像是一幅丙烯画。您应该尝试的第一件事是在提示中添加“丙烯画”作为下一个关键字,因此它会显示为:“可爱的灰猫,丙烯画”。
通常最好从最少的关键字开始以接近您想要的内容,然后根据您正在寻找的美学添加更多内容。
稳定的扩散可以识别数十种不同的风格,从铅笔画到粘土模型再到虚幻引擎的 3d 渲染。
这些示例提示非常简单,但您可以使用数十个关键字来微调您的结果。如果你想在沃尔玛找到奇怪的、迷幻色的粘土鸡模型,你需要指定 所有 这些术语。
指定特定艺术家来指导稳定扩散
Stable Diffusion 不仅仅能够模仿特定的风格或媒介;如果您想这样做,它甚至可以模仿特定的艺术家。这个例子使用了毕加索。
如果您还没有的话,您绝对应该尝试在提示中输入“by (Artist Name)”。它往往会产生戏剧性的结果。也不要害怕将通常不会在一起的艺术家组合在一起。通常,Stable Diffusion 会以令人兴奋和不可预测的方式结合各自的风格。
提示:如果您使用我们推荐的用于 Windows 的稳定扩散的 GUI 版本,提示窗口右侧有一个“滚动”按钮,它将随机将艺术家扔到您的提示中。这是偶然发现新风格的好方法。
加权您的关键字
当然,仅仅在提示中加入关键词只会让你走得更远。如果你在提示中得到了所有正确的东西,但它们的比例不正确,会发生什么?
稳定扩散支持提示关键字的加权。换句话说,你可以告诉它,它确实需要关注一个特定的关键字(或多个关键字),而对其他人的关注较少。如果你得到的结果有点像你想要的,但并不完全在那里,这很方便。
在Stable Diffusion 的命令行版本中,您只需在要强调的单词中添加一个完整的冒号,后跟一个十进制数字。十进制数是百分比,因此它们必须加起来为 1。
回到我们的“Cute gray cat”提示,让我们想象它正确地生成了可爱的猫,但输出图像中没有很多以灰猫为特征。您可以将提示改为:“可爱,灰猫:0.7”,它会最关注灰猫,然后自动将差异应用于“可爱”。如果您想要更精细的控制,您还可以手动为提示中的每个单词分配权重,例如“可爱:0.10,灰猫:0.60,虚幻引擎渲染:0.30”。
大多数可用于稳定扩散的 GUI无需您输入明确的百分比即可处理权重。您通常可以在提示中的术语周围添加括号以强调它,并在括号中添加括号以降低术语的重要性。所以之前的“可爱的灰猫”可能看起来像“[可爱],((灰猫))”。
注意:您可以根据需要使用多个括号来叠加重点。
在别处寻找灵感
Stable Diffusion 和其他 AI 艺术生成器的人气激增。你可以在任何地方找到这种人工智能艺术。这意味着现在至少有几百万用户生成的图像在互联网上流传,而且大多数时候,人们包括他们用来获得结果的提示。
如果您不确定要创建什么,这里有一些资源可以帮助激发您的灵感:
警告:所有这些都可能是NSFW。
- Lexica — 使用 Stable Diffusion 和相应提示生成的图像存储库。可按关键字搜索。
- 稳定扩散艺术家风格研究 ——稳定扩散可能认可的艺术家的非详尽列表,以及对他们艺术风格的一般描述。有一个排名系统来描述作为提示的一部分,Stable Diffusion 对艺术家姓名的响应程度。
- Stable Diffusion Modifier Studies — 可与稳定扩散一起使用的修饰符列表,就像艺术家页面一样。
- AI 艺术修饰符列表——一个照片库,展示了您可以在提示中使用的一些最强大的修饰符,以及它们的作用。它们按修饰符类型排序。
- 稳定扩散中代表的前 500 位艺术家——我们确切地知道稳定扩散训练集中包含哪些图像,因此可以判断哪些艺术家对人工智能的训练贡献最大。一般来说,艺术家在训练数据中的表现越强,Stable Diffusion 对他们的名字作为关键词的响应就越好。
- The Stable Diffusion Subreddit — The Stable Diffusion subreddit 有源源不断的新提示和有趣的发现。如果您正在寻找灵感或洞察力,那么您就不会出错。
调整其他重要设置
一个好的提示是使用稳定扩散最难的部分,但还有一些其他设置会极大地改变结果。
- CFG:确定 Stable Diffusion 遵循提示的强度。数字越大,对提示的依从性越高,而数字越小,人工智能就越自由。先试着调整一下。
- 采样方法: 如何将图像从噪声中提炼成可识别的形状。尝试其中一些。Euler_a、k_LMS 和 PLMS 似乎是流行的选择。
- 采样步骤: 在您获得最终结果之前对图像进行采样的次数。有时你在 30 步就能得到好的结果,有时你需要达到 50 或 80 步。你通常不会在 150 步以上得到更好的结果。从更少的步骤开始,然后向上。
我们最喜欢的一些风格化提示
这些是我们最喜欢的一些提示,因为它们往往工作得如此可靠。只需放入您选择的主题和一些修饰符即可。所有其他稳定扩散设置与上面的提示保持相同。
注意:作为一项规则,Stable Diffusion 可以非常好地创建日落和落叶。
(主题), 35mm, 锋利
选择一个主题,此提示会可靠地返回人物、动物和风景的逼真结果。
注意:此示例提示还包括获取日落颜色的“黄金时段”。
(主题)、低多边形 3D 渲染、鲜艳柔和的色彩、倾斜移位、胶片颗粒
输入一个主题,您将获得“拉力赛艺术”美学。
(主题),(环境描述),电影,戏剧,构图,晴朗的天空,野兽派,超现实主义,史诗规模,敬畏感,超极端主义,疯狂的细节水平,艺术站总部
只需输入主题和环境描述,此提示就会提供具有您选择的环境效果的出色城市概念艺术图像。这是一个以纽约市为主题,沙尘暴为环境描述的示例:
克米特任何东西
使用 Kermit,Stable Diffusion 会产生很好的效果。在任何地方尝试一下。
为什么 Stable Diffusion 会这样解释“Kermit in Mordor”,而站在我们坚定英雄背后的红色邪恶 Kermit 又是谁?不知道。
请记住,不要害怕从提示中删除您认为可能是关键术语的内容。某些词,例如“华丽”,将严重影响图像的外观,即使它没有精确的含义。随着您在 Stable Diffusion 上花费更多时间,您将了解它如何响应某些单词,并且您很快会发现编写一个好的提示本身就是一门艺术。
未经允许不得转载:表盘吧 » 如何写出令人敬畏的稳定扩散提示