Stable Diffusion 3.5 正式发布:更强大、更快速、更易用的 AI 图像生成利器!

in #cn2 months ago

image.png

Stability AI 宣布推出 Stable Diffusion 3.5,新版本带来更强大的功能、更快的生成速度和更友好的用户体验,并继续秉持开源精神,赋能更多创作者。

新功能速览:

  • Stable Diffusion 3.5 Large: 拥有 80 亿参数,提供卓越的图像质量和提示词遵循度,是 Stable Diffusion 家族中最强大的模型,适用于专业级 100 万像素图像生成。
  • Stable Diffusion 3.5 Large Turbo: Stable Diffusion 3.5 Large 的精简版本,仅需 4 步即可生成高质量图像,速度显著提升。
  • Stable Diffusion 3.5 Medium (10 月 29 日发布): 拥有 25 亿参数,采用改进的 MMDiT-X 架构和训练方法,专为消费级硬件设计,在质量和易用性之间取得平衡,可生成 0.25 到 200 万像素分辨率的图像。

重要性:

Stable Diffusion 3.5 的发布标志着 AI 图像生成领域的一次重大进步。其强大的性能、高度的自定义性和开放的生态系统将为艺术家、设计师和开发者提供更强大的创作工具,并进一步推动 AI 图像生成技术的普及和应用。

幕后故事:

Stability AI 始终致力于推动 AI 技术的民主化,并将开源理念贯彻到 Stable Diffusion 的发展中。在 Stable Diffusion 3 Medium 发布后,团队认真听取了社区的反馈,并投入大量时间进行改进,最终推出了功能更强大、体验更友好的 Stable Diffusion 3.5。

功能解读:

Stable Diffusion 3.5 引入了查询键归一化 (Query-Key Normalization) 技术,提高了模型训练的稳定性,并简化了微调和开发流程,使其更易于定制。此外,新版本在图像质量、风格多样性、提示词遵循度等方面均有显著提升,并针对不同硬件平台进行了优化。

Stable Diffusion 3.5 的优势:

  • 高度可定制性: 轻松微调模型以满足特定需求,或构建基于自定义工作流程的应用程序。
  • 高效的性能: 针对标准消费级硬件进行优化,尤其体现在 Stable Diffusion 3.5 Medium 和 Stable Diffusion 3.5 Large Turbo 模型上。
  • 多样化的输出: 能够生成更具代表性的图像,涵盖不同的肤色和特征,而无需复杂的提示词。
  • 多功能的风格: 能够生成各种风格和美学效果,包括 3D、摄影、绘画、线条艺术等。

Stability AI 社区许可证:

Stable Diffusion 3.5 采用 Stability AI 社区许可证发布,这意味着:

  • 非商业用途免费: 个人和组织可以免费将模型用于非商业用途,包括科学研究。
  • 年收入低于 100 万美元的商业用途免费: 初创公司、中小企业和创作者可以免费将模型用于商业用途,只要其年收入低于 100 万美元。
  • 输出内容所有权归用户所有: 用户保留对生成内容的所有权,不受限制性许可的影响。

访问模型的方式:

除了 Hugging Face 平台,用户还可以通过以下平台访问 Stable Diffusion 3.5 模型:

  • Stability AI API
  • Replicate
  • ComfyUI
  • DeepInfra

我们在想:

Stable Diffusion 3.5 的发布将进一步推动 AI 图像生成技术的普及和应用,激发更多创意和创新。未来,我们有望看到 AI 图像生成技术在游戏开发、影视制作、广告设计等更多领域发挥更大的作用。同时,开源社区的力量也将推动 Stable Diffusion 不断进化,为我们带来更多惊喜。

链接:https://stability.ai/news/introducing-stable-diffusion-3-5

Sort:  

Upvoted! Thank you for supporting witness @jswit.