无GPU无网络“本地部署chatGPT”(更新gemma)|电子爱好者

admin管理员组
文章数量:1530517

想当初图像生成从DELL到stable diffusion再到苹果的移动部署过了两三年吧
聊天bot才发展几个月就可以边缘部署了，如果苹果更新silicon，npu和运存翻倍，争取apple watch也能本地内置，最快ios18 mac、ipad、iPhone能内置吧
又是一个平民百姓都高兴的开源项目，chatGPT这种级别的模型甚至能部署到树莓派上运行，然后在操作的过程中也遇到一些问题，这篇就是记录步数的这个过程。
已经为最新版的github更新了（2024.02.23），可以放心食用，实测运行速度快了很多。
哈工大的chinese llama效果不如vicuna7b，所以我把这一块的内容给删掉了。
vicuna7b的合成需要高运行内存的电脑，如果你的电脑不足30个G，可以直接私信我要合成好的模型，只有vicuna-7b的q4.0版本。
最近很多人反应老的vicuna-7b已经没办法在新的llama.cpp上使用了（主要是q4版本），可以问我要新的。
都已经放在下面的链接里了

大佬的网址：https://github/ggerganov/llama.cpp

下载及生成

打开命令行输入下面的指令。
mac和linux使用123行。
win使用1278910行。

git clone https://github/ggerganov/llama.cpp
cd llama.cpp
make

#对于Windows和CMake，使用下面的方法构建:
cd <path_to_llama_folder>
mkdir build
cd build
cmake ..
cmake --build . --config Release

模型下载

这里演示的是Mistral-7B模型。

链接: https://pan.baidu/s/1i2pE12BxuSo0DdKRn4NJFg?pwd=5dy8 提取码: 5dy8
–来自百度网盘超级会员v7的分享

然后安装python依赖，然后转换模型到FP16格式。然后第一个小bug会出现。

python3 -m pip install -r requirements.txt
python3 -m pip install torch numpy sentencepiece #如果第一个网络不够好，试试这一行

# convert the 7B model to ggml FP16 format
python3 convert.py models/mymodel/

会多出一个ggml-model-f16.gguf的文件。

推理

# run the inference
./main -m ./models/mymodel/ggml-model-f16.gguf -n 128

内存不多的再降模型质量

# quantize the model to 4-bits (using Q4_K_M method)
./quantize ./models/mymodel/ggml-model-f16.gguf ./models/mymodel/ggml-model-Q4_K_M.gguf Q4_K_M
./main -m ./models/mymodel/ggml-model-Q4_K_M.gguf -n 128

想和chatGPT一样对话的话用下面这个指令,-n 控制回复生成的最大长度, --color是区分ai和人类的颜色，-i 作为参数在交互模式下运行， -r 是一种反向提示，-f 是一整段提示, --repeat_penalty 控制生成回复中对重复文本的惩罚力度,–temp 温度系数，值越低回复的随机性越小，反之越大。
更新了之后速度快了很多。

./main -m ./mymodels/ggml-model-f16.gguf -n 256 --repeat_penalty 1.0 --color -i -r "User:" -f prompts/chat-with-bob.txt

让我们打开prompts/chat-with-bob.txt来看一下。

我们可以看到这相当于给了ai模型一个场景话题，然后你和ai之间就可以接着这个话题聊天。

我英文名叫zale，然后我把这个机器人叫作kangaroo，这样的身份和他聊天，你可以按自己的喜欢自己修改下面的代码。

./main -m ./mymodels/ggml-model-f16.gguf -n 256 --repeat_penalty 1.0 --color -i -r "Zale:" \

写一个txt文件

"Transcript of a dialog, where the Zale interacts with an Assistant named Kangaroo. Kangaroo is helpful, kind, honest, good at writing, and never fails to answer the Zale's requests immediately and with precision.

Zale: Hello, Kangaroo.
Kangaroo: Hello. How may I help you today?
Zale: Please tell me the largest city in Europe.
Kangaroo: Sure. The largest city in Europe is Moscow, the capital of Russia.
Zale:"

有点呆呆的，不过也算边缘部署的巨大进步了！
一个蛮有意思的发现，明明看得懂中文却跟我说不懂中文。。。。。

分享一段有意思的对话

Vicuna-7B

把原始的llama模型转换成huggleface的格式,融合icuna模型需要llama 1的模型。

python3 ~/anaconda3/envs/pytorch2/lib/python3.10/site-packages/transformers/models/llama/convert_llama_weights_to_hf.py \
	--input_dir ./llama-7b \
	--model_size 7B \
	--output_dir ./llama-7b-hf

这样生成的文件放在llama-7b-hf之中。

下载vicuna7b的权重文件，也可以理解为补丁。
注意融合vicuna7b模型需要30个G的内存，我特意买128G内存和4090的电脑，
如果有需要，可以私信我我看到的话直接把生成的模型发给你。
还有就是现在的模型是v1.1的版本，必须搭配使用transformers>=4.28.0 and fschat >= 0.2.0

python3 -m fastchat.model.apply_delta \
	--base-model-path ./llama-7b-hf/ \
	--target-model-path ./vicuna-7b/ \
	--delta-path ./vicuna-7b-delta-v1.1/

这样融合的模型就在vicuna-7b的文件夹下。

可以直接用fastchat用测试一下，速度好快哦！！！确实fast

python3 -m fastchat.serve.cli --model-path ./vicuna-7b

回到llama.cpp之中，老三样

python3 convert-pth-to-ggml.py models/vicuna-7b/ 1

./quantize ./models/vicuna-7b/ggml-model-f16.bin ./models/vicuna-7b/ggml-model-q4_0.bin 2

./main -m ./models/vicuna-7b/ggml-model-q4_0.bin -n 256 --repeat_penalty 1.0 --color -i -r "User:" -f prompts/chat-with-bob.txt

实测理解能力和中文水平我认为都是目前最佳的边缘部署的模型，我觉得我可以把哈工大的中文模型部分给删了。目前使用下来不错，很有chatGPT那味。
我又试了一下i9-13900KF，速度是快了一些。

来点好玩的例子。

多模态部署

这个需要12g的显存，没有的朋友就图个乐。
用到的是miniGPT这个库。

1.准备环境

git clone https://github/Vision-CAIR/MiniGPT-4.git
cd MiniGPT-4
conda env create -f environment.yml
conda activate minigpt4

2.修改文件指向电脑里的vicuna-7b路径

3.下载pretrained MiniGPT-4 checkpoint

4.修改文件指向电脑里的pretrained MiniGPT-4 checkpoint路径

5.运行demo

python demo.py --cfg-path eval_configs/minigpt4_eval.yaml  --gpu-id 0

gemma

部署

git clone https://github/google/gemma.cpp
cd gemma.cpp/build
cmake ..
make -j 4 gemma #使用四个核构建

下载模型文件，在build文件夹下运行

./gemma --tokenizer your_tokenizer.spm_path --model 2b-it --compressed_weights your_2b-it-sfp.sbs_path

gemma训练

本文标签：网络 GPU gemma chatGPT

版权声明：本文标题：无GPU无网络“本地部署chatGPT”(更新gemma) 内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/dongtai/1725314103a1018854.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

无GPU无网络“本地部署chatGPT”(更新gemma)

下载及生成

模型下载

推理

Vicuna-7B

多模态部署

gemma

部署

gemma训练

更多相关文章

AI音乐，8大变现方式——Suno：音乐版的ChatGPT - 第505篇

chatweb和ChatGPT的区别

“我哭死！用ChatGPT完成的硕士论文被评不及格……”

不输ChatGPT！盘点国产功能强大且免费的大语言模型Top6！_路线1路线2路线3国产

学习笔记：吴恩达ChatGPT提示工程

【2024最新】3分钟速成：结合ChatGPT 4.0与MindShow高效制作PPT

【舒一笑赠书活动-第1期】-《AIGC辅助软件开发：ChatGPT 10倍效率编程实战》

和OpenAI ChatGPT不相上下的AI聊天机器人

吐血整理 ChatGPT 3.54.0 新手使用手册~ 【2024.09.04 更新】

Chrome浏览器本地调试：阻止不安全、本地网络请求

chrome浏览器Network重放重新发送网络请求方法

路由器登陆wlan网络连接服务器无响应,无线路由器服务器无响应

无线网如何访问服务器公共盘,如何访问双频无线路由器网络共享服务器

esp8266 micropython 网页配网_ESP8266 连接 WIFI 路由器启用网络

常见网络排查，教你玩转路由器

Linux一句话精彩问答-网络无关篇

对比Nvidia，AMD, Intel 的GPU的计算单元

AMD EPYC 77637T8377137H127742 双路 8卡GPU服务器aleo

linux设置开机自启动网络,linux设置开机自启动

Windows 10连接网络打印机报错“0x0000011b”的解决方法

发表评论

推荐文章

DICOM医学图像处理：DCMTK的wiki资料学习之PACS调试（转）

金士顿u盘写保护解决

JavaSE基础

笔记本电脑安装Ubuntu16.04双系统系列教程（四）完全卸载双系统中的Ubuntu系统

win11浏览器默认主页如何设置

热门文章

你知道ChatGPT吗，你真的了解ChatGPT吗

基于ChatGPT上线《你说我猜》小游戏

win10计算机的数字小键盘,如何设置Win10开机默认开启数字小键盘？

win10桌面管理文件收纳_win10系统关闭桌面文件收纳盒的详细方法介绍

Chrome浏览器如何设置中文翻译

EasyRecovery软件最新版安装包2024最新激活码序列号

xmind 8update 9 升级

小米路由器mini实现锐捷认证.

Centos7-Linux

查看Windows凭据和普通凭据的密码（查看Windows中存储的密码）——mimikatz

最新文章

win11浏览器默认主页如何设置

Win11 Excel文件变成白板图标怎么解决？

减少win11核显占用的内存怎么操作

win2012 r2 php mysql,在Windows Server2012 R2上安装WordPress PHP和MYSQL

Win11录屏数据保存在哪里？Win11录屏数据保存的位置

原版win7系统怎么安装,原版Win7系统的安装步骤

Win11显示麦克风未插上怎么办？Win11显示麦克风未插上的解决方法

Win11更改声音输出设备有什么方法？

Win11鼠标动不了如何恢复？Win11鼠标动不了恢复的方法

Win11磁盘清理在哪打开？

Win11隐藏输入法状态栏方法

Win10一键修复所有dll缺失的方法

Win11怎么把桌面文件路径改到D盘

Win11图标变暗怎么办？Win11图标变暗的解决方法

Win11小组件怎么添加待办事项？Win11添加待办事项小组件的方法

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载