Datawhale X 魔搭 AI夏令营第四期魔搭 Task3：进阶上分-实战优化|电子爱好者

admin管理员组
文章数量:1531705

Datawhale X 魔搭 AI夏令营第四期魔搭 Task3：进阶上分-实战优化

ComfyUI应用场景探索

Stable Diffusion的基本原理是通过降噪的方式（如完全的噪声图像），将一个原本的噪声信号变为无噪声的信号（如人可以理解的图像）。其中的降噪过程涉及到多次的采样。采样的系数在KSampler中配置：

seed：控制噪声产生的随机种子
control_after_generate：控制seed在每次生成后的变化
steps：降噪的迭代步数，越多则信号越精准，相对的生成时间也越长
cfg：classifier free guidance决定了prompt对于最终生成图像的影响有多大。更高的值代表更多地展现prompt中的描述。
denoise: 多少内容会被噪声覆盖 sampler_name、scheduler：降噪参数

ComfyUI 则是将 webUI的流程分解为小模块，让你可以手动魔改

运行的ComfyUI：

Lora微调

Lora微调原理和优势

LoRA通过在预训练模型的关键层中添加低秩矩阵来实现。这些低秩矩阵通常被设计成具有较低维度的参数空间，这样它们就可以在不改变模型整体结构的情况下进行微调。本质就是将大型矩阵拆成，两个小矩阵相乘，从而降低计算复杂度。
M R × C = A R × k ⋅ B k × C M_{R \times C} = A_{R \times k} \cdot B_{k \times C} MR×C=AR×k⋅Bk×C
在特定领域有少量标注数据的情况下，也可以有效地对模型进行个性化调整，可以迅速适应新的领域或特定任务。有助于保持模型在未见过的数据上的泛化能力，同时还能学习到特定任务的知识。LoRA旨在通过仅微调模型的部分权重，而不是整个模型，从而减少所需的计算资源和存储空间。

Lora详解

import os
cmd = """
python DiffSynth-Studio/examples/train/kolors/train_kolors_lora.py \ # 选择使用可图的Lora训练脚本DiffSynth-Studio/examples/train/kolors/train_kolors_lora.py
  --pretrained_unet_path models/kolors/Kolors/unet/diffusion_pytorch_model.safetensors \ # 选择unet模型
  --pretrained_text_encoder_path models/kolors/Kolors/text_encoder \ # 选择text_encoder
  --pretrained_fp16_vae_path models/sdxl-vae-fp16-fix/diffusion_pytorch_model.safetensors \ # 选择vae模型
  --lora_rank 16 \ # lora_rank 16 表示在权衡模型表达能力和训练效率时，选择了使用 16 作为秩，适合在不显著降低模型性能的前提下，通过 LoRA 减少计算和内存的需求
  --lora_alpha 4.0 \ # 设置 LoRA 的 alpha 值，影响调整的强度
  --dataset_path data/lora_dataset_processed \ # 指定数据集路径，用于训练模型
  --output_path ./models \ # 指定输出路径，用于保存模型
  --max_epochs 1 \ # 设置最大训练轮数为 1
  --center_crop \ # 启用中心裁剪，这通常用于图像预处理
  --use_gradient_checkpointing \ # 启用梯度检查点技术，以节省内存
  --precision "16-mixed" # 指定训练时的精度为混合 16 位精度（half precision），这可以加速训练并减少显存使用
""".strip()
os.system(cmd) # 执行可图Lora训练

参数列表

参数id	脚本中的数值	解释
pretrained_unet_path	models/kolors/Kolors/unet/diffusion_pytorch_model.safetensors	指定预训练UNet模型的路径
pretrained_text_encoder_path	models/kolors/Kolors/text_encoder	指定预训练文本编码器的路径
pretrained_fp16_vae_path	models/sdxl-vae-fp16-fix/diffusion_pytorch_model.safetensors	指定预训练VAE模型的路径
lora_rank	16	设置LoRA的秩（rank），影响模型的复杂度和性能
lora_alpha	4	设置LoRA的alpha值，控制微调的强度
dataset_path	data/lora_dataset_processed	指定用于训练的数据集路径
output_path	./models	指定训练完成后保存模型的路径
max_epochs	1	设置最大训练轮数为1
center_crop		启用中心裁剪，用于图像预处理
use_gradient_checkpointing		启用梯度检查点，节省显存
precision	“16-mixed”	设置训练时的精度为混合16位精度（half precision）

LoRA训练

接下来是我自己训练LoRA的流程：

创建自己的数据集

使用魔搭帮助自己创见数据集，csv等可以自己生成：

下载自己的数据集，并继续用baseline训练

#数据集下载
from modelscope.msdatasets import MsDataset

ds =  MsDataset.load(
    'ThereAreBearsComing/ZzzLoRAData', 	# 自己的数据集
                     subset_name='default', 
                     split='train',
                    cache_dir="/mnt/workspace/kolors/data" # 添加baseline中的原定路径，让路径对应
)
#您可按需配置 subset_name、split，参照“快速使用”示例代码

Run baseline进行训练，之后发布LoRA：
https://modelscope/models/ThereAreBearsComing/Thekingofwolfkids-KolorsTrained-ZZZ-LoRA
获得自己的LoRA，需要更换comfyUI的LoRA路径，并设置LoRA权重

用ComfyUI开始生成：

提示词	反向提示词	结果
16岁的女孩在雪地里醒来，四周覆盖着厚厚的积雪，天空灰暗，远处有极光。女孩穿着厚实的蓝色羽绒服，内搭羊毛衫，下身是保暖裤，脚穿雪靴，戴着蓝色针织帽和手套，脖子围着一条围巾。深棕色长发绑成马尾辫，明亮的蓝色眼睛，二次元	丑陋、变形、嘈杂、模糊、低对比度，扭曲的手指，多余的手指、色情擦边、热带气候、阳光明媚、温暖环境

女孩在雪地中艰难前行，背景中有雪松和冰冻的河流。女孩穿着厚实的蓝色羽绒服，内搭羊毛衫，下身是保暖裤，脚穿雪靴，戴着蓝色针织帽和手套，脖子围着一条围巾。深棕色长发绑成马尾辫，明亮的蓝色眼睛，二次元	丑陋、变形、嘈杂、模糊、低对比度，扭曲的手指，多余的手指、色情擦边、沙漠、炎热天气、干旱地区

女孩与一只驯鹿相遇，两者相互观察，背景中有雪地和树木。女孩穿着厚实的蓝色羽绒服，内搭羊毛衫，下身是保暖裤，脚穿雪靴，戴着蓝色针织帽和手套，脖子围着一条围巾。深棕色长发绑成马尾辫，明亮的蓝色眼睛，二次元	丑陋、变形、嘈杂、模糊、低对比度，扭曲的手指，多余的手指、色情擦边、热带雨林、城市街道、家养宠物

女孩正在建造一个简易的小屋，背景中有木材堆和雪墙。女孩穿着厚实的蓝色羽绒服，内搭羊毛衫，下身是保暖裤，脚穿雪靴，戴着蓝色针织帽和手套，脖子围着一条围巾。深棕色长发绑成马尾辫，明亮的蓝色眼，二次元	丑陋、变形、嘈杂、模糊、低对比度，色情擦边、色情擦边、高楼大厦、现代建筑、豪华别墅

女孩和其他几个幸存者围坐在篝火旁，背景中有简易小屋。女孩穿着厚实的蓝色羽绒服，内搭羊毛衫，下身是保暖裤，脚穿雪靴，戴着蓝色针织帽和手套，脖子围着一条围巾。深棕色长发绑成马尾辫，明亮的蓝色眼睛，二次元	丑陋、变形、嘈杂、模糊、低对比度，扭曲的手指，多余的手指、色情擦边、孤独、荒岛、无人区

女孩手拿弓箭和同伴们在雪地中追踪足迹，准备狩猎。背景中有雪地和冰川，环境中有大雾。女孩穿着厚实的蓝色羽绒服，内搭羊毛衫，下身是保暖裤，脚穿雪靴，戴着蓝色针织帽和手套，脖子围着一条围巾。深棕色长发绑成马尾辫，明亮的蓝色眼睛，二次元	丑陋、变形、嘈杂、模糊、低对比度，扭曲的手指，多余的手指、色情擦边、都市生活、超市购物、快餐店

女孩和同伴们庆祝狩猎成功，背景中有篝火和烤肉。女孩穿着厚实的蓝色羽绒服，内搭羊毛衫，下身是保暖裤，脚穿雪靴，戴着蓝色针织帽和手套，脖子围着一条围巾。深棕色长发绑成马尾辫，明亮的蓝色眼睛，二次元	丑陋、变形、嘈杂、模糊、低对比度，扭曲的手指，多余的手指、色情擦边、饥饿、贫困、缺乏食物

女孩和同伴们踏上了前往未知目的地的旅程，背景中有山脉和雪原。女孩穿着厚实的蓝色羽绒服，内搭羊毛衫，下身是保暖裤，脚穿雪靴，戴着蓝色针织帽和手套，脖子围着一条围巾。深棕色长发绑成马尾辫，明亮的蓝色眼睛，二次元	丑陋、变形、嘈杂、模糊、低对比度，扭曲的手指，多余的手指、色情擦边、停滞不前、放弃希望、独自一人

最后提交作品：

本文标签：进阶夏令营实战第四期魔搭

版权声明：本文标题：Datawhale X 魔搭 AI夏令营第四期魔搭 Task3：进阶上分-实战优化内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/xitong/1725575482a1030415.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

Datawhale X 魔搭 AI夏令营第四期魔搭 Task3：进阶上分-实战优化

Datawhale X 魔搭 AI夏令营第四期魔搭 Task3：进阶上分-实战优化

ComfyUI应用场景探索

Lora微调

Lora微调原理和优势

Lora详解

LoRA训练

创建自己的数据集

下载自己的数据集，并继续用baseline训练

更多相关文章

shell脚本入门到实战（二）--shell输入和格式化输出

Python爬虫实现抓取腾讯视频所有电影-源码【实战必学】

实战：用Python抓取腾讯视频电影

【爬虫实战】9应用Python网络爬虫——利用Post定向爬取下载慕课MOOC视频

ElasticSearch搜索引擎入门与实战

DBMS 数据库管理系统的三级模式架构《ClickHouse 实战：企业级大数据分析引擎》...

LLaMA Factory单机微调的实战教程

【计算机网络】 0、各网络命令 + tcpdump + Wireshark、抓包实战、TCP 握手挥手、防火墙、保活、MTU

Jenkins + Django 完整实战，细化到每一步操作

超详细【入门精讲】数据仓库原理&amp;实战 一步一步搭建数据仓库 内附相应实验代码和镜像数据和脚本

【操作系统】Centos7操作系统零基础入门，多案例实战

【书生大模型实战营（暑假场）】基础任务三 浦语提示词工程实践

B端产品--用户体验实战

QQ邮箱登录PC布局实战笔记四

Flask项目实战——4—(邮箱的验证码发送、Redis数据库存储验证码、邮箱修改功能、权限管理)

巧用小程序·云开发实现邮件发送功能丨实战

两万字长文总结，梳理 Java 入门进阶那些事（推荐收藏）

amd显卡安装linux,告诉你完美安装Ubuntu 12.10最新AMD显卡驱动实战的方法及命令

FT2004(D2000)开发实战之AMD HD8570显卡驱动适配

5.5 ControllerAdvice注解 -《SSM深入解析与项目实战》

发表评论

推荐文章

使用chrome浏览器修改当前网页内容

win7快捷键汇总

win10安装Tensorflow-cpu（AMD显卡） &amp;&amp; keras

计算机常年开机,电脑长时间开机的危害

android wifi智能硬件4g,智能硬件 篇五：把WiFi带在身上，告别宽带！华为随行WiFi2畅享版真实体验...

热门文章

论文Learning to Solve Large-Scale Security-Constrained Unit Commitment Problems阅读笔记

SD卡格式化重建分区

Win10安装Linux子系统并访问Win10文件

计算机开机后黑屏 只有鼠标,开机黑屏只有鼠标

关于笔记本电脑装系统的时候不能进入pe的问题

breadweb控制台下载_路由器刷breed web控制台助手通用版下载

Windows设置NTP同步时间服务器

kali安装搜狗拼音输入法

中南大学青年志愿者协会电脑维修部

wd移动硬盘插电脑没反应_WD MY BOOK 桌面移动硬盘 插电脑不识别的解决办法。

最新文章

win7卡在正在启动windows界面_分享一下WIN7系统下运行红警2的方法

世界上最简单系统安装方法(适合XP升级win7系统)

如何从xp升级到WIN7

VMware虚拟机安装windows server 2012 R2教程（图文版 超详细！）

docker选择安装位置_详解docker pull 下来的镜像文件存放的位置

Win7 XP双系统安装

python打包xp系统_python打包的exe为啥在XP上提示“不是有效的WIN32程序”

win7变成xp风格了怎么改回_win7

xp的服务器系统怎么安装win7系统教程,教你xp系统下安装win7双系统的教程

如何打开iso文件

win7装sql2000找不到服务器,WIN7 64位系统 SQL2000服务无法启动

win7 程序无响应 服务器,Win7系统下点击程序运行无响应怎么办？

xpvista系统升级为win7

linux命令之主机与虚拟机之间挂载iso镜像文件

vs2015镜像文件安装

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

超详细【入门精讲】数据仓库原理&实战一步一步搭建数据仓库内附相应实验代码和镜像数据和脚本

【书生大模型实战营（暑假场）】基础任务三浦语提示词工程实践

win10安装Tensorflow-cpu（AMD显卡） && keras

android wifi智能硬件4g,智能硬件篇五：把WiFi带在身上，告别宽带！华为随行WiFi2畅享版真实体验...

计算机开机后黑屏只有鼠标,开机黑屏只有鼠标

wd移动硬盘插电脑没反应_WD MY BOOK 桌面移动硬盘插电脑不识别的解决办法。

VMware虚拟机安装windows server 2012 R2教程（图文版超详细！）

win7 程序无响应服务器,Win7系统下点击程序运行无响应怎么办？

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载