window 安装大模型 chatglm.cpp|电子爱好者

admin管理员组
文章数量:1645532

了解大厂经验
拥有和大厂相匹配的技术等

希望看什么，评论或者私信告诉我！

一、前言

在上一篇文章中[window 安装大模型 chatglm-6b]，可以运行效率很低，所以这一次我们安装 chatglm.cpp，github 上说这个是 C++实现的，可以在笔记本上实时回复用户问题，我们一起看一下能不能实时回复

二、准备工作

2.1 电脑

这是我工作使用的电脑配置，16G内存，Intel® 集成显卡。这里要吐槽一下，程序员千万不要使用 window，随便装点什么东西就很麻烦，用不了 mac 就用 linux，我这是公司电脑，后悔没早点装 unbantu 系统。

2.2 组件安装

[VS studio 2022]![在这里插入图片描述](https://img-
三、安装

3.1 下载源码

git clone --recursive [github/li-plus/cha…]

3.2 下载模型

目前支持的模型:

ChatGLM-6B: THUDM/chatglm-6b, THUDM/chatglm-6b-int8, THUDM/chatglm-6b-int4
ChatGLM2-6B: THUDM/chatglm2-6b, THUDM/chatglm2-6b-int4
ChatGLM3-6B: THUDM/chatglm3-6b
CodeGeeX2: THUDM/codegeex2-6b, THUDM/codegeex2-6b-int4
Baichuan & Baichuan2: baichuan-inc/Baichuan-13B-Chat, baichuan-inc/Baichuan2-7B-Chat, baichuan-inc/Baichuan2-13B-Chat

这里以 THUDM/chatglm2-6b-int4 为例( 模型的量化版本，电脑配置比较高的可以试试 chatglm2-6b 或者 chatglm3-6b，毕竟在量化模型的基础上再次量化，效果会差很多)， chatglm2-6b-int4 清华源下载模型，从huggingface下载配置文件。如果网速比较好的话，可以忽略清华源直接从 huggingface中下载，下载结束后，统一保存到

D:\LLM\chatglm2-6b-int4

3.3 python 依赖安装

python3 -m pip install -U pip
python3 -m pip install torch tabulate tqdm transformers accelerate sentencepiece

3.4 将下载好的大模型转为量化GGML 格式

python3 chatglm_cpp/convert.py -i D:\LLM\chatglm2-6b-int4 -t q4_0 -o chatglm2-6b-int4-ggml.bin

不同的量化格式，结果精度损失不一样，-t的可选项有

q4_0: 4-bit integer quantization with fp16 scales.

q4_1: 4-bit integer quantization with fp16 scales and minimum values.
q5_0: 5-bit integer quantization with fp16 scales.
q5_1: 5-bit integer quantization with fp16 scales and minimum values.
q8_0: 8-bit integer quantization with fp16 scales.
f16: half precision floating point weights without quantization.
f32: single precision floating point weights without quantization.

3.5 编译项目通过 exe 文件运行大模型

cmake -B build
cmake --build build -j --config Release

3.6 运行

3.6.1 普通的方式运行

D:\LLM\chatglm.cpp\build\bin\Release\main -m chatglm2-int4-ggml.bin -p 你好

注意编译后 main.exe 的位置在

D:\LLM\chatglm.cpp\build\bin\Release

我的模型 chatglm2-int4-ggml.bin 位置在

D:\LLM\chatglm.cpp

3.6.2 交互方式运行

D:\LLM\chatglm.cpp\build\bin\Release\main -m chatglm2-int4-ggml.bin -i

3.7 python 绑定

3.7.1 python 环境安装

pip install -U chatglm-cpp

3.7.2 pyton 访问

import chatglm_cpp

pipeline = chatglm_cpp.Pipeline("D:\LLM\chatglm.cpp\chatglm2-int4-ggml.bin")
print(pipeline.chat([chatglm_cpp.ChatMessage(role="user", content="你好")]))

至此就可以在本地愉快的玩耍啦

3.7 总结

chatglm.cpp 的效率比 chatglm效率要高很多，可以试试

四、其他

4.1 模型量化

模型量化是通过将模型的各项参数和结构等信息进行数字化处理，将复杂的模型转换为数学形式，以便计算机能够更快速、准确地处理和分析。这样可以使模型更易于实施、验证和优化，从而提高模型的有效性和可靠性。

好处：

提高计算效率：量化后的模型更容易实施和计算，能够更快速、准确地进行预测和分析。
方便验证和改进：通过量化可以更清晰地了解模型的结构和参数，方便验证模型的有效性和进行优化改进。
便于应用：量化后的模型可以更容易地应用于实际问题中，提供更为实用的解决方案。

坏处：

信息损失：在量化的过程中，可能会损失一些模型精细的特征和信息，导致模型的准确性和可靠性受到影响。
可解释性下降：量化后的模型可能会变得更为复杂和抽象，对模型的解释和理解可能会变得更加困难。
难度增加：如果模型本身就很复杂，那么对其进行量化的难度也会增加，可能需要更多的技术和资源来实现。

如何学习AI大模型？

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

第一阶段：从大模型系统设计入手，讲解大模型的主要方法；

第二阶段：在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用；

第三阶段：大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统；

第四阶段：大模型知识库应用开发以LangChain框架为例，构建物流行业咨询智能问答系统；

第五阶段：大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型；

第六阶段：以SD多模态大模型为主，搭建了文生图小程序案例；

第七阶段：以大模型平台应用与开发为主，通过星火大模型，文心大模型等成熟大模型构建大模型行业应用。

👉学会后的收获：👈
• 基于大模型全栈工程实现（前端、后端、产品经理、设计、数据分析等），通过这门课可获得不同能力；

• 能够利用大模型解决相关实际项目需求：大数据时代，越来越多的企业和机构需要处理海量数据，利用大模型技术可以更好地处理这些数据，提高数据分析和决策的准确性。因此，掌握大模型应用开发技能，可以让程序员更好地应对实际项目需求；

• 基于大模型和企业数据AI应用开发，实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能，学会Fine-tuning垂直训练大模型（数据准备、数据蒸馏、大模型部署）一站式掌握；

• 能够完成时下热门大模型垂直领域模型训练能力，提高程序员的编码能力：大模型应用开发需要掌握机器学习算法、深度学习框架等技术，这些技术的掌握可以提高程序员的编码能力和分析能力，让程序员更加熟练地编写高质量的代码。

1.AI大模型学习路线图
2.100套AI大模型商业化落地方案
3.100集大模型视频教程
4.200本大模型PDF书籍
5.LLM面试题合集
6.AI产品经理资源合集

👉获取方式：
😝有需要的小伙伴，可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

本文标签：模型 window cpp ChatGLM

版权声明：本文标题：window 安装大模型 chatglm.cpp 内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/dongtai/1729412181a1199991.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

window 安装大模型 chatglm.cpp

一、 前言

二、准备工作

2.1 电脑

2.2 组件安装

[VS studio 2022]![在这里插入图片描述](https://img- 三、 安装

3.1 下载源码

3.2 下载模型

3.3 python 依赖安装

3.4 将下载好的大模型转为量化GGML 格式

3.5 编译项目通过 exe 文件运行大模型

3.6 运行

3.6.1 普通的方式运行

3.6.2 交互方式运行

3.7 python 绑定

3.7.1 python 环境安装

3.7.2 pyton 访问

3.7 总结

四、其他

4.1 模型量化

如何学习AI大模型？

更多相关文章

从理论到落地，大模型评测体系综合指南

如何构建企业级的AI大模型？

大模型高考数学测评结果，国内AI大模型成绩超GPT-4o！

如何部署私有化大模型+知识库+问答+客服

【AIGC调研系列】InternVL开源多模态模型与GPT-4V的性能对比

Talk2BEV：大模型+自动驾驶，最热门的两大方向会碰撞出什么火花？

AI Agent发展面临哪些挑战？端侧大模型将如何提升其可用性？

大模型与程序员，究竟是谁吃了谁？

全网最详细中英文ChatGPT接口文档（四）30分钟快速入门ChatGPT——Models模型

ChatGPT开源模型3.5 API调用示例

GPT-4o 模型日期更新到 2024-09-03

【话题】ChatGPT等大语言模型为什么没有智能2

window环境软件安装配置指南

XCode11中The app delegate must implement the window property if it wants to use 如何解决

window or linux 开机黑屏，只有光标在闪

“Failed to dispatch window animation state change”错误解决

system_process EWindowManager: Starting window AppWindowToken

运营模型—渠道分析体系

语言大模型推理加速指南

window下mysql表的修复

发表评论

推荐文章

bluetoothscanner-library

RabbitMQ操作命令响应慢问题解决

Linux 操作系统防火墙配置（centos）

优质网站分享

AI智能聊天问答系统源码+AI绘画系统+图文搭建部署教程，文生图图生图，TTS语音识别输入，AI智能体，文档分析

热门文章

linux修复win10启动失败,win10自动修复失败开不了机解决方法

20.VRRP协议原理与配置

photoshop cs6 Mac版本

Windows和Linux忘记密码时的重置方法

服务器server2012重置开机密码

人脸识别常用开源数据集大全

Nginx的下载安装及其配置指令

苹果手机误删照片怎么恢复？这些方法太好用了

杀毒国外手机有哪些用Termux给手机杀毒_0基础网安入门教程

TowardsDataScience 博客中文翻译 2022（一百九十四）

最新文章

GNU Bison 中文手册

Windows下使用软引导安装Linux系统

SQL Server出现错误的代码大全（好用）

Visual Studio 2017 Enterprise （15.3）

(Dos)BAT命令入门与高级技巧详解（转）

C#开发常见的异常

Windows下使用EasyBCD和LiLi USB Creator安装Linux系统

Spring Security参考手册

WIN2003服务器配置指南!

windows Bat 批处理脚本 教程

u盘魔术师给服务器装系统,U盘魔术师v5(USMv5)(带ISO独立版)

GetLastError 函数返回值大全

Visual Studio 2017 发布

ZeroMQ指南：第4章：可靠的请求-应答

C++ :用GetLastError()查找错误原因;

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

一、前言

[VS studio 2022]![在这里插入图片描述](https://img-
三、安装

windows Bat 批处理脚本教程

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载