创建自定义模型的最佳实践 (beta)

上次更新日期: 2025年11月19日

了解有效准备和创建自定义模型的最佳实践。

注意:

Firefly 自定义模型目前正处于非公开 beta 阶段。如果您尚未获得访问权限,请加入等候名单

选择富有代表性的用例

使用场景

很好

避免

摄影风格

  • 清晰、对焦准确的人物
  • 自然光线和真实表情
  • 多样化的姿势和构图
  • 简单或柔和模糊的背景
  • 模糊或像素化的图像
  • 过度使用滤镜或极端颜色分级
  • 场景过于拥挤或背景杂乱
  • 集体照中人脸过小而难以辨识

插图风格

  • 准确的解剖结构和比例
  • 统一的风格和渲染质量
  • 多样化的姿势和表情
  • 清晰的细节,无视觉杂乱
  • 低质量或不完整的插图
  • 不一致的风格或渲染
  • 姿势或透视角度变化有限
  • 分散注意力的背景或不相关元素

角色

  • 准确的解剖结构和比例
  • 统一的风格和渲染质量
  • 多样化的姿势和表情
  • 清晰的细节,无视觉杂乱
  • 低质量或不完整的插图
  • 不一致的风格或渲染
  • 姿势或透视角度变化有限
  • 分散注意力的背景或不相关元素

使用优质图像训练您的模型

  • 使用 JPG 或 PNG 文件。
  • 选择至少 10-30 张高质量图像,展示您想要实现的品牌专属风格和概念主体。
  • 捕获一组代表风格或主体的不同图像。
  • 确保每个图像文件大小不超过 50 MB。
  • 确保图像的分辨率高于 1024x1024 像素,横向图像的最大纵横比为 16:9,纵向图像的最大纵横比为 9:16。 
  • 保持纵横比与训练数据集一致。 如果训练集由纵向图像构成,那么在生成方形图像时,画面会出现被裁切的问题。
  • 裁切样本图像以聚焦于最重要的视觉元素。 例如,排除显示远处人物或角色且面部或身体很小的图像。
  • 在保持一致审美的同时,纳入显示不同的视觉和背景的图像。
  • 确保您的图像中不包含您不想要的非预期图案,比如每张图像都有白色背景。
  • 移除您不希望模型学习的干扰元素,比如人物肖像背景中的拼贴画或角色头上戴的帽子。

审阅模型标签

  • 包含您要训练的模型主体或风格的永久属性,例如,为棕发角色指定棕色头发。
  • 不要在标签中包含可变属性,比如角色手持的物品。
  • 至少包含三个模型标签

审阅说明文字

  • 使用题注来增强细节,并针对您希望模型生成的概念来训练自定义模型。 
  • 确保图像说明具体且富于描述,并使用您在提示模型时会用到的语言。
  • 在所有图像说明中使用不同的句子结构。
  • 根据需要修改自动题注,以指明模型概念的详细信息。
  • Firefly 基础模型不了解著名人物或名胜古迹,因此题注应包含对这些名胜古迹的描述,以改善潜在效果。

使用与训练数据相符的清晰提示

  • 在提示中包含您在标题中使用的类似词语和短语。
  • 在编写提示时,使用与用于训练模型的数据密切相关的概念。使用不相关或新概念进行提示可能会导致不理想的图像输出。例如,要求一个经多彩生活摄影数据训练的模型生成一幅黑白插图风格的火箭飞船。

使用高级生成设置进一步优化您的图像

您可以在 Firefly 的左侧面板中控制高级生成设置,也可以通过在灵感板的提示栏中选择生成设置

对于自定义模型:

  • 视觉强度滑块默认设置为最低值,以最佳保留原有特征。但是,对于样式参考等创意用例,增加视觉强度可以产生更生动的效果。
  • 当为主体使用构图参考时,请选择采用白色背景的图像或能描绘出主体所需姿势的草图。