创建自定义模型的最佳实践

上次更新日期: 2025年11月2日

了解有效准备和创建自定义模型的最佳实践。

选择富有代表性的用例

使用场景

很好

避免

生活方式摄影

  • 清晰、对焦明确的人物
  • 自然光线和真实表情
  • 多样化的姿势和构图
  • 简单或柔和模糊的背景
  • 模糊或像素化的图像
  • 过度使用滤镜或极端颜色分级
  • 场景过于拥挤或背景杂乱
  • 集体照中人脸过小而难以辨识

人物摄影

  • 光线匀净、画质锐利的特写及中景镜头
  • 多样化的姿势、表情和服装
  • 一致的光线和环境
  • 干净或柔和模糊的背景
  • 人脸太小或部分遮挡
  • 阴影沉重或光线刺眼
  • 过多相似的照片
  • 模糊或低质量图像

静物摄影

  • 均匀、平衡的光线与阴影
  • 统一的风格和色彩搭配
  • 多样化的构图和布局
  • 主要主体清晰对焦
  • 低质量或模糊的图像
  • 带有徽标或包装的产品照片
  • 分散注意力的道具或背景
  • 不相关或偏离主题的对象

插画人物

  • 准确的解剖结构和比例
  • 统一的风格和渲染质量
  • 多样化的姿势和表情
  • 清晰的细节,无视觉杂乱
  • 低质量或不完整的插图
  • 不一致的风格或渲染
  • 姿势或透视角度变化有限
  • 分散注意力的背景或不相关元素

图标设计

  • 清晰、统一的图标风格
  • 中高复杂度设计
  • 统一的光线和色彩搭配
  • 干净、以物体为中心的构图
  • 低质量或模糊的图标
  • 不相关或偏离主题的概念
  • 不一致的风格或渲染方法
  • 过于具体的颜色和设计元素

品牌插图

  • 准确的解剖结构和比例
  • 统一的风格和渲染质量
  • 多样化的姿势和表情
  • 清晰的细节,无视觉杂乱
  • 低质量或不完整的插图
  • 不一致的风格或渲染
  • 姿势或透视角度变化有限
  • 分散注意力的背景或不相关元素

3D 图形

  • 一致的透视和比例
  • 协调的风格、光照和渲染质量
  • 多样化的构图和角度
  • 清晰、简洁的设计
  • 低质量或不完整的渲染
  • 不一致的风格或透视
  • 角度或构图变化有限
  • 分散注意力的元素或无关物体

新品牌表现插图

  • 品牌风格鲜明且保持一致
  • 构图清晰,留白舒适
  • 人物和场景富有表现力且符合品牌形象
  • 渲染干净,光线均衡
  • 混合风格或不一致的视角
  • 场景拥挤,焦点不明确
  • 道具与品牌不符或视觉元素不相关
  • 插画不完整或质量低下

新概念

  • 视觉独特且执行良好的概念
  • 结构、光影与细节处理一致
  • 强烈的形态和清晰的轮廓
  • 具有清晰渲染效果的高质量图像
  • 重复的形状或细微变化
  • 分散注意力的背景或细节
  • 不完整或低质量的渲染
  • 混合渲染风格或效果

使用优质图像

  • 使用 JPG 或 PNG 文件。
  • 选择至少 10-30 张高质量图像,展示您想要实现的品牌专属风格和概念主体。
  • 捕获一组代表风格或主体的不同图像。
  • 确保每个图像文件大小不超过 50 MB。
  • 确保图像的分辨率高于 1024x1024 像素,横向图像的最大纵横比为 16:9,纵向图像的最大纵横比为 9:16。 
  • 保持纵横比与训练数据集一致。 如果训练集是纵向的,并且您生成方形图像,则它们在生成时会出现截断问题。 
  • 裁切样本图像以聚焦于最重要的视觉元素。 例如,排除显示远处人物或角色且面部或身体很小的图像。
  • 在保持一致审美的同时,纳入显示不同的视觉和背景的图像。
  • 确保您的图像中不包含您不想要的非预期图案,比如每张图像都有白色背景。
  • 移除您不希望模型学习的干扰元素,比如人物肖像背景中的拼贴画或角色头上戴的帽子。

审阅模型标签

  • 包含您所训练模型的主体或风格的永久性特征,例如,棕发人物的棕色头发。
  • 不要在标签中包含可变属性,比如角色手持的物品。
  • 至少包含三个模型标签。

审阅说明文字

  • 使用题注来增强细节,并针对您希望模型生成的概念来训练自定义模型。 
  • 确保图像说明具体且具描述性,并采用您未来提示模型时会使用的语言。
  • 在所有图像题注中使用不同的句子结构。
  • 根据需要修改自动题注,以指明模型概念的详细信息。
  • Firefly 基础模型不了解著名人物或名胜古迹,因此题注应包含对这些名胜古迹的描述,以改善潜在效果。

使用与您的训练数据一致的清晰提示

  • 在提示中包含您在标题中使用的类似词语和短语。
  • 使用与自定义模型训练时相关的概念进行提示,会比使用不相关的概念更能保留模型的原有特征(例如,要求一个经由彩色生活摄影训练的模型,去生成一艘黑白插画风格的火箭飞船)。

使用高级风格功能进一步完善您的图像

  • 视觉强度滑块默认设置为最低值,以最佳保留原有特征。但是,对于样式参考等创意用例,增加视觉强度可以产生更生动的效果。  
  • 使用构图参考作为主体时,应选择白色背景的图像或描绘主体所需姿势的草图。