首页 科技周边 人工智能 与Dreambooth和Lora进行微调稳定的扩散XL

与Dreambooth和Lora进行微调稳定的扩散XL

Mar 09, 2025 am 09:55 AM

>本教程探索稳定的扩散XL(SDXL)和Dreambooth,演示了如何利用图像生成和模型微调的diffusers库。 我们将使用个人照片微调SDXL并评估结果。 鼓励AI新移民从AI基础课程开始。>

理解稳定的扩散xl >

稳定性AI的SDXL 1.0代表了AI文本对图像生成的显着飞跃。 在仅研究的SDXL 0.9的基础上,它是最强大的公开图像创建模型。 与其他开源替代方案相比,广泛的测试证实了其优越的图像质量。

>

Fine-tuning Stable Diffusion XL with DreamBooth and LoRA 来自arxiv.org

> >的图像 这种提高的质量源于两个模型的合奏:35亿个参数基础发生器和66亿个参数炼油厂。这种双重方法优化了图像质量,同时保持消费者GPU的效率。 SDXL 1.0简化了图像的生成,从简明提示产生复杂的结果。 自定义数据集还精简,提供了对图像结构,样式和构图的颗粒状控制。

> Dreambooth:个性化图像生成

Google的Dreambooth(2022)是生成AI的突破,特别是对于稳定扩散等文本到图像模型。 正如Google的研究人员所描述的那样:“这就像一个照相亭,但以使其能够在您的梦想带到您的任何地方合成的方式捕获主题。”

来自Dreambooth

>的图像

Fine-tuning Stable Diffusion XL with DreamBooth and LoRA

> Dreambooth将自定义主题注入模型,为特定人员,对象或场景创建专门的发电机。 培训仅需要几张(3-5)张图像。 然后,受过训练的模型将主题置于不同的环境和摆姿势,仅受想象中的限制。

> Dreambooth应用程序

> Dreambooth的可自定义图像生成受益于各个领域:

创意产业:

图形设计,广告和娱乐活动从其独特的视觉内容创建功能中受益。

    个性化:
  1. 在现实或纯粹的虚构设置中创建难以复制或不可能的场景。
  2. 教育与研究:
  3. 生成个性化的教育内容和艾滋病研究,需要视觉代表。
  4. 访问稳定的扩散xl
  5. > 可以通过拥抱的面部空间演示访问SDXL(从提示符生成四个图像)或python库,用于自定义提示图。

    >设置和图像生成diffusers

    >

    确保可用的GPU可用:

    !nvidia-smi
    登录后复制

    Fine-tuning Stable Diffusion XL with DreamBooth and LoRA

    > install

    diffusers

    %pip install --upgrade diffusers[torch] -q
    登录后复制
    >加载模型(使用FP16用于GPU存储器效率):>

    生成图像:
    from diffusers import DiffusionPipeline, AutoencoderKL
    import torch
    
    vae = AutoencoderKL.from_pretrained("madebyollin/sdxl-vae-fp16-fix", torch_dtype=torch.float16)
    pipe = DiffusionPipeline.from_pretrained("stabilityai/stable-diffusion-xl-base-1.0", vae=vae, torch_dtype=torch.float16, variant="fp16", use_safetensors=True)
    pipe.to("cuda");
    登录后复制

    >使用辅助功能显示图像(在原始功能中提供):>
    prompt = "A man in a spacesuit is running a marathon in the jungle."
    image = pipe(prompt=prompt, num_inference_steps=25, num_images_per_prompt=4)
    登录后复制

    # ... (image_grid function from original code) ...
    image_grid(image.images, 2, 2)
    登录后复制

    Fine-tuning Stable Diffusion XL with DreamBooth and LoRA 改善炼油厂的结果

    以提高质量,使用SDXL炼油厂:

    # ... (refiner loading and processing code from original) ...
    登录后复制

    > autotrain Advanced Fine-tuning Stable Diffusion XL with DreamBooth and LoRA

    微调SDXL Autotrain Advanced简化了SDXL微调。 使用:

    安装它 (注意:原始教程使用现已过时的Colab笔记本作为替代方法;这是为了简洁而省略的。)

    Dreambooth微调(删节)
    %pip install -U autotrain-advanced
    登录后复制

    然后,该教程在图像的个人数据集上使用Autotrain Advance的Dreambooth脚本进行了微调SDXL的详细示例。本节涉及设置变量,创建Kaggle数据集并运行自动辅助脚本。 输出显示了训练过程以及由此产生的洛拉(Lora)举重上传到拥抱的脸。 然后演示使用微调模型的推断,在各种情况下展示了指定主题的生成图像。 最后,探索了炼油厂与微调模型的使用。 由于长度的限制,此详细的部分在此处显着凝结。 请参阅原始代码和解释。

    结论

    本教程提供了SDXL和Dreambooth的全面概述,展示了它们的功能,并易于使用>

以上是与Dreambooth和Lora进行微调稳定的扩散XL的详细内容。更多信息请关注PHP中文网其他相关文章!

本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

Video Face Swap

Video Face Swap

使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

<🎜>:泡泡胶模拟器无穷大 - 如何获取和使用皇家钥匙
3 周前 By 尊渡假赌尊渡假赌尊渡假赌
Mandragora:巫婆树的耳语 - 如何解锁抓钩
3 周前 By 尊渡假赌尊渡假赌尊渡假赌
北端:融合系统,解释
3 周前 By 尊渡假赌尊渡假赌尊渡假赌

热工具

记事本++7.3.1

记事本++7.3.1

好用且免费的代码编辑器

SublimeText3汉化版

SublimeText3汉化版

中文版,非常好用

禅工作室 13.0.1

禅工作室 13.0.1

功能强大的PHP集成开发环境

Dreamweaver CS6

Dreamweaver CS6

视觉化网页开发工具

SublimeText3 Mac版

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

热门话题

Java教程
1668
14
CakePHP 教程
1426
52
Laravel 教程
1329
25
PHP教程
1273
29
C# 教程
1256
24
10个生成AI编码扩展,在VS代码中,您必须探索 10个生成AI编码扩展,在VS代码中,您必须探索 Apr 13, 2025 am 01:14 AM

嘿,编码忍者!您当天计划哪些与编码有关的任务?在您进一步研究此博客之前,我希望您考虑所有与编码相关的困境,这是将其列出的。 完毕? - 让&#8217

GPT-4O vs OpenAI O1:新的Openai模型值得炒作吗? GPT-4O vs OpenAI O1:新的Openai模型值得炒作吗? Apr 13, 2025 am 10:18 AM

介绍 Openai已根据备受期待的“草莓”建筑发布了其新模型。这种称为O1的创新模型增强了推理能力,使其可以通过问题进行思考

pixtral -12b:Mistral AI&#039;第一个多模型模型 - 分析Vidhya pixtral -12b:Mistral AI&#039;第一个多模型模型 - 分析Vidhya Apr 13, 2025 am 11:20 AM

介绍 Mistral发布了其第一个多模式模型,即Pixtral-12b-2409。该模型建立在Mistral的120亿参数Nemo 12B之上。是什么设置了该模型?现在可以拍摄图像和Tex

如何在SQL中添加列? - 分析Vidhya 如何在SQL中添加列? - 分析Vidhya Apr 17, 2025 am 11:43 AM

SQL的Alter表语句:动态地将列添加到数据库 在数据管理中,SQL的适应性至关重要。 需要即时调整数据库结构吗? Alter表语句是您的解决方案。本指南的详细信息添加了Colu

如何使用AGNO框架构建多模式AI代理? 如何使用AGNO框架构建多模式AI代理? Apr 23, 2025 am 11:30 AM

在从事代理AI时,开发人员经常发现自己在速度,灵活性和资源效率之间进行权衡。我一直在探索代理AI框架,并遇到了Agno(以前是Phi-

超越骆驼戏:大型语言模型的4个新基准 超越骆驼戏:大型语言模型的4个新基准 Apr 14, 2025 am 11:09 AM

陷入困境的基准:骆驼案例研究 2025年4月上旬,梅塔(Meta)揭开了Llama 4套件的模特套件,具有令人印象深刻的性能指标,使他们对GPT-4O和Claude 3.5 Sonnet等竞争对手有利地定位。伦斯的中心

OpenAI以GPT-4.1的重点转移,将编码和成本效率优先考虑 OpenAI以GPT-4.1的重点转移,将编码和成本效率优先考虑 Apr 16, 2025 am 11:37 AM

该版本包括三种不同的型号,GPT-4.1,GPT-4.1 MINI和GPT-4.1 NANO,标志着向大语言模型景观内的特定任务优化迈进。这些模型并未立即替换诸如

多动症游戏,健康工具和AI聊天机器人如何改变全球健康 多动症游戏,健康工具和AI聊天机器人如何改变全球健康 Apr 14, 2025 am 11:27 AM

视频游戏可以缓解焦虑,建立焦点或支持多动症的孩子吗? 随着医疗保健在全球范围内挑战,尤其是在青年中的挑战,创新者正在转向一种不太可能的工具:视频游戏。现在是世界上最大的娱乐印度河之一

See all articles