一种平价的chatgpt实现方案，基于清华的 ChatGLM-6B + LoRA 进行finetune.（aigc大模型风口，校招找工作必备）|电子爱好者

admin管理员组
文章数量:1530018

** 清华大学的chatglm-6b开源模型对话能力虽然能基本满足对话需求，但是针对专业领域和垂直领域回答显得智商捉急，这个时候就需要进行微调来提升效果，但是但是同学们显卡的显存更捉急，这时候一种新的微调方式诞生了，现在大火的ai作画里面的lora训练方式直接应用到微调里面，chatglm-lora方式进行微调** 下面是是教程和注意事项

第一步下载代码

git clone https://github/mymusise/ChatGLM-Tuning.git
cd ChatGLM-Tuning

第二步
下载数据
英文数据链接
需要更多的中文数据，私信我

第三步配置环境

使用conda创建虚拟环境
python版本3.10.6

我是3090显卡，大家根据自己的卡自行调整配置

pip install -r requirements.txt

第四步数据预处理

转化alpaca数据集为jsonl

python cover_alpaca2jsonl.py \
    --data_path data/alpaca_data.json \
    --save_path data/alpaca_data.jsonl \

生成tokenization

python tokenize_dataset_rows.py \
    --jsonl_path data/alpaca_data.jsonl \
    --save_path data/alpaca \
    --max_seq_length 200 \ 
    --skip_overlength

–jsonl_path 微调的数据路径, 格式jsonl, 对每行的[‘context’]和[‘target’]字段进行encode
–save_path 输出路径
–max_seq_length 样本的最大长度

第五步训练模型

python finetune.py \
    --dataset_path data/alpaca \
    --lora_rank 8 \
    --per_device_train_batch_size 6 \
    --gradient_accumulation_steps 1 \
    --max_steps 52000 \
    --save_steps 1000 \
    --save_total_limit 2 \
    --learning_rate 1e-4 \
    --fp16 \
    --remove_unused_columns false \
    --logging_steps 50 \
    --output_dir output

–per_device_train_batch_size 6 为6时候，显存大约是22g多，要是显存不够可以把这个参数调小
–max_steps 52000 \ 控制训练步数，loss没下来，此数值可以改大一点

3090大约使用7个小时就微调完了

上面两个训练产生的结果

加我微信：Lh1141755859 获取chatgpt类对话大模型交流群
关注微信公众号：CV算法小屋获取更多最新大语言模型论文和代码

本文标签：清华风口平价找工作模型

版权声明：本文标题：一种平价的chatgpt实现方案，基于清华的 ChatGLM-6B + LoRA 进行finetune.（aigc大模型风口，校招找工作必备）内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/dongtai/1725413705a1022375.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

一种平价的chatgpt实现方案，基于清华的 ChatGLM-6B + LoRA 进行finetune.（aigc大模型风口，校招找工作必备）

更多相关文章

django修改模型后迁移报错

将AI大模型装进你的手机，你愿意么？

RT-Thread智能车目标识别系统连载教程——手写体识别模型 （1）

【大模型 向量库】从向量搜索到向量数据库

AI大模型低成本快速定制秘诀：RAG和向量数据库

使用大型语言模型进行文本摘要

【时序】时间序列领域的 GAN 模型综述论文笔记

华为云云耀云服务器L实例评测｜在服务器上训练手写数字识别模型并部署到服务器上实现远程调用

数学模型预测模型_改进著名的nfl预测模型

手机快速访问AI语言模型

ChatGPT会颠覆哪些行业，普通人在这个风口上有什么机会？

chatGPT有没有开源模型？

中科院发布多模态 ChatGPT，图片、语言、视频都可以 Chat ？中文多模态大模型力作...

大模型时代，程序员如何实现自我成长？——一名普通开发者的 ChatGPT 2周年记

什么是chatgpt？国内有哪些类gpt模型？

生成模型之VAE与VQ-VAE

【AMD GPU】使用A卡进行ai模型训练

羊驼2:开放的基础和微调聊天模型--Llama 2论文阅读

多模态大模型总结

一口气了解大模型相关通识，基础笔记！_大模型数据

发表评论

推荐文章

新网主机php函数设置不见了,win10wifi选项不见了怎么办

QQ邮箱初始容量不够用扩容方法

小技巧——如何对win10上的某个软件单独静音

Chrome浏览器 125 版本以上 关闭左上角 搜索标签页的解决办法

Fiddler手机抓包【iOS+Android】

热门文章

oracle crs 4639,解决CRS-4639: Could not contact Oracle High Availability Services-Oracle

m.2固态硬盘怎么选择？

最好用的 Android 模拟器推荐（附下载）

linux给文件夹添加查看密码是什么,Linux如何给文件夹设置密码

Coursera, How to win a competition 课程笔记

ubuntu20.04安装chrome浏览器

Win10搜索要点怎么关闭？（就是搜索框右侧出现了小图标）

Chrome浏览器设置跨域—Windows

chrome浏览器关闭更新弹窗

win10系统bios设置超频图文教程

最新文章

IDEA 下载、安装、配置和案例

2024年会声会影哪个版本最新版

【杂谈】当当最新购书优惠来了，满300-60，AI好书推荐

2024最新版IntelliJ IDEA安装教程（非常详细）从零基础入门到精通，看完这一篇就够了

Windows下自制程序捕获6GHzWiFi7无线报文（mt7921au网卡WiFi6E）

会声会影哪个版本最新

IDEA2021.2安装与配置（持续更新）

dbeaver-ultimate23.3安装注册免费试用

会声会影2023旗舰版V26.0.0.136完整版2024免费下载最新中文旗舰版新功能讲解

视频编辑软件会声会影2025旗舰版即将来临

eset nod32 v11无限试用补丁

会声会影哪个版本最好用?

Ubuntu安装 IDEA

【IntelliJ IDEA 2024 激活及安装教程，亲测可以使用】

会声会影Corel VideoStudio2025旗舰版最新中文旗舰版新功能讲解及使用会声会影使用教程

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

RT-Thread智能车目标识别系统连载教程——手写体识别模型（1）

【大模型向量库】从向量搜索到向量数据库

Chrome浏览器 125 版本以上关闭左上角搜索标签页的解决办法

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载