在本地跑一个AI模型(5) - Stable Diffusion|电子爱好者

admin管理员组
文章数量:1542016

我们使用的工具是huggingface提供的diffusers，一个在纯python环境下运行的库。废话不多说，我们进入今天的教程。

安装

diffusers目前不支持python 3.12，因此我们使用虚拟环境来安装。

# 使用3.10版本的python创建venv
/opt/homebrew/opt/python@3.10/libexec/bin/python3 -m venv .venv
# 激活venv
source .venv/bin/activate

安装diffusers及其依赖：

pip install diffusers accelerate transformers

下载模型

和之前文章里介绍的一样，模型我们还是选择自己下载。你可以到huggingface网站下载已经训练好的模型，比如[runwayml/stable-diffusion-v1-5]。

Tips：你可以使用如下命令下载huggingface上的模型：

git lfs install
git clone git@hf.co:<MODEL ID> # example: git clone git@hf.co:bigscience/bloom

此外，diffusers支持AUTOMATIC1111的模型，因此你可以去[Civitai]下载各种CheckPoint和LoRA。本文使用的模型就是Civitai的[dreamshaper]。选择模型时要注意以下几点：

根据自己的喜好选择模型的风格，比如“写实”、“动漫”或者“魔幻”
模型有一个属性是“基础模型”，如下图。对应的诸如SD 1.5、SDXL 1.0、SDXL Turbo等等。SD系列只能生成512x512的图片，SDXL系列可以生成1024x1024及以上的图片。而Turbo系列可以将生成所需的时间缩短。根据自己的电脑配置选择合适的模型吧。

选择好模型后，就点击Download下载吧。

加载模型

如果你的模型是单个safetensors格式的，使用from_single_file加载，如果是从huggingface下载的预训练模型，使用from_pretrained加载。此外如果你的模型是SDXL，使用StableDiffusionXLPipeline，因此dreamshaperXL模型加载的代码如下：

from diffusers import StableDiffusionXLPipeline

pipe = StableDiffusionXLPipeline.from_single_file("your/path/dreamshaperXL_v21TurboDPMSDE.safetensors")

使用GPU运行

windows用户可以根据如下代码判断自己的电脑能否进行GPU推理：

device = "cuda" if torch.cuda.is_available() else "cpu"

MAC的M1和M2芯片可以使用如下代码：

device = 'mps'

然后：

pipe = pipe.to(device)

调度器

diffusers的调度器对应的是AUTOMATIC1111中的Sampling method，它对获得高质量的图像至关重要。Sampling method和diffusers的调度器的对应关系可以参照[此处]。

至于如何选择调度器，在模型的详情页可以找到作者给出的建议，比如：

这里作者建议的是DPM++ SDE Karras，可以参照上面的对应表找到对应的调度器为DPMSolverSinglestepScheduler，初始化参数为use_karras_sigmas=True。

调度器代码如下：

pipe.scheduler = DPMSolverSinglestepScheduler.from_config(pipe.scheduler.config, use_karras_sigmas=True)

提示词

提示词的质量对最终生成的图像质量有很大的影响。提示词的写法这里不做展开，提示词的例子：

prompt = "masterpiece, cat wizard, gandalf, lord of the rings, detailed, fantasy, cute, adorable, Pixar, Disney"

negative_prompt = "worst quality, low quality, normal quality, lowres, low details, oversaturated, undersaturated, overexposed, underexposed"

提示词目前有77个长度的限制，要突破这个限制，可以将提示词向量化，以下是代码例子：

pip install compel

compel = Compel(
    tokenizer=[pipe.tokenizer, pipe.tokenizer_2] ,
    text_encoder=[pipe.text_encoder, pipe.text_encoder_2],
    returned_embeddings_type=ReturnedEmbeddingsType.PENULTIMATE_HIDDEN_STATES_NON_NORMALIZED,
    requires_pooled=[False, True]
)

conditioning, pooled = compel(prompt)
negative_prompt_embeds, negative_pooled = compel(negative_prompt)

图片生成

image = pipe(
            prompt_embeds = conditioning,
            pooled_prompt_embeds=pooled,
            negative_prompt_embeds = negative_prompt_embeds,
            negative_pooled_prompt_embeds=negative_pooled,
            # height=800,
            # width=512,
            num_inference_steps=6,
            guidance_scale=2,
            strength=0.5
        ).images[0]

image.save("data/out.jpg")

这里对图片生成质量有影响的几个参数是guidance_scale和num_inference_steps，这两个参数分别对应AUTOMATIC1111里的CFG Scale和Sampling steps。你也可以在模型的详情页找到作者给出的建议：

至此，运行代码，你应该可以获得模型生成的图片了。

总结

本文介绍了使用diffusers在本地运行Stable Diffusion的方法，并进行了一次基本的Text to Image的实践。下篇文章将继续介绍diffusers使用LoRA，ControlNet和Adapter生成高级图片的实践。

如何学习AI大模型？

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

第一阶段：从大模型系统设计入手，讲解大模型的主要方法；

第二阶段：在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用；

第三阶段：大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统；

第四阶段：大模型知识库应用开发以LangChain框架为例，构建物流行业咨询智能问答系统；

第五阶段：大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型；

第六阶段：以SD多模态大模型为主，搭建了文生图小程序案例；

第七阶段：以大模型平台应用与开发为主，通过星火大模型，文心大模型等成熟大模型构建大模型行业应用。

👉学会后的收获：👈
• 基于大模型全栈工程实现（前端、后端、产品经理、设计、数据分析等），通过这门课可获得不同能力；

• 能够利用大模型解决相关实际项目需求：大数据时代，越来越多的企业和机构需要处理海量数据，利用大模型技术可以更好地处理这些数据，提高数据分析和决策的准确性。因此，掌握大模型应用开发技能，可以让程序员更好地应对实际项目需求；

• 基于大模型和企业数据AI应用开发，实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能，学会Fine-tuning垂直训练大模型（数据准备、数据蒸馏、大模型部署）一站式掌握；

• 能够完成时下热门大模型垂直领域模型训练能力，提高程序员的编码能力：大模型应用开发需要掌握机器学习算法、深度学习框架等技术，这些技术的掌握可以提高程序员的编码能力和分析能力，让程序员更加熟练地编写高质量的代码。

1.AI大模型学习路线图
2.100套AI大模型商业化落地方案
3.100集大模型视频教程
4.200本大模型PDF书籍
5.LLM面试题合集
6.AI产品经理资源合集

👉获取方式：
😝有需要的小伙伴，可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

本文标签：模型 AI Diffusion stable

版权声明：本文标题：在本地跑一个AI模型(5) - Stable Diffusion 内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/dianzi/1727069998a1096053.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

在本地跑一个AI模型(5) - Stable Diffusion

安装

下载模型

加载模型

使用GPU运行

调度器

提示词

图片生成

总结

如何学习AI大模型？

更多相关文章

【如何训练一个中英翻译模型】LSTM机器翻译seq2seq字符编码（一）

适合小白入门的AI扩图（创成式填充）工具

【自我提升】Yolov5使用云端GPU训练模型（谷歌免费版和AutoDL收费版对比）

【模型检测学习笔记】8：无限字上ω正则LT性质的验证

【自然语言处理】【ChatGPT系列】Chain of Thought：从大模型中引导出推理能力

大语言模型三种训练技术：Prompt-Tuning、Instruction-Tuning、Chain-of-Thought

探秘 Skeleton-of-Thought：提升大型语言模型并行解码的新纪元

了解大型语言模型中的思维链（Thought Chain）

大语言模型提示词方式 CoT（Chain of Thought）

探秘Tree of Thought LLM：普林斯顿NLP团队的新型语言模型

Skip-Thought词向量模型实现Sent2Vec

NLP中 大语言模型LLM中的思维链 Chain-of-Thought(CoT) GoT

AI加持的360浏览器逆天了：体验超乎想象的AI应用

鲁大师 AIMARK 性能评测与 OpenVINO - 酷睿11代 i7 AI 性能

原创：旗舰游戏显卡(980Ti,1080Ti,TiTan V,2080Ti,3090,4090)，AI画图stable diffusion)和大模型(chatglm2-6b)推理性能横评

AIO-3399C-AI industry 打开adb root权限

人工智能ai发展前景_人工智能促进可持续发展的社会

用AI轻松修图！教你下载并使用Adobe Photoshop (Beta)智能化软件

突破界限：LangChain 引领 AI 应用构建的新时代

AI时代的办公新趋势：Python自动化办公解决方案

发表评论

推荐文章

“固态硬盘避坑：个人如何挑选适合的品牌和型号，数据能恢复吗？”

从哪里给计算机设开机密码,计算机设置开机密码_计算机开机密码

红米note5系统Android11,红米Note5-MIUI11 开发版|超多功能|Xposed|ROOT|桌面布局-刷机之家...

小米9卡刷Android 11开发版并安装系统证书抓包

miui 10 android 9.0,小米基于安卓9.0的MIUI10稳定版来了，你的手机可以更新吗？

热门文章

新能源汽车手机智能控制无钥匙进入一键启动系统总体设计方案

C盘中的六个“隐藏炸弹”文件夹，一键清理，轻松释放几十G空间！

弹窗万能居中办法

UFT如何在谷歌浏览器上实现录制

史上最全电脑硬盘修复方法

小米Max 2如何刷成开发版获取Root权限

[免费的win7 娘]WES7SP1 测试心得

探索创意无限可能：在Linux上轻松安装Photoshop CC v21.2.4

关于深度学习和大模型的基础认知

2024最新Python安装与环境配置，超详细保姆级入门教程，python入门必备

最新文章

弱网测试(延迟计算过程）和QNET配置

无线测速方法：

微信红包测试的测试关注点

【笔记】什么是网络:如何通过网络实现多台主机之间的通讯、测试网络是否可达与测试网速

进行APP测试？需要考虑什么？

WiFi解析

手机有显示3g无法理解服务器,3G手机根本不需升级4G，一个技巧提高3倍网速！...

H5API：检测网络连接

购买的随身WiFi没有卡槽怎么办，介绍焊接卡槽的教程

python编写的adb 脚本 （一）监控系统网速

网络技巧：WiFi越用越慢的原因以及解决方法

APP功能测试要点

全球网速变慢，运营商：WiFi 和微波炉不要放在一起！

有什么软件可以测试游戏延迟,网络延迟怎么测试 玩游戏延迟高怎么解决！

android wifi智能硬件4g,轻便又安全的4G路由 华为随行WiFi评测

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

NLP中大语言模型LLM中的思维链 Chain-of-Thought(CoT) GoT

python编写的adb 脚本（一）监控系统网速

有什么软件可以测试游戏延迟,网络延迟怎么测试玩游戏延迟高怎么解决！

android wifi智能硬件4g,轻便又安全的4G路由华为随行WiFi评测

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载