如何系统的入门AI大模型？|电子爱好者

admin管理员组
文章数量:1631214

前段时间有一个号称是「Llama3-120b」的神秘大模型火了起来，原因在于它表现太过出色了，可以轻松击败GPT-4、gpt2-chatbot。但实际上Llama 3首发阵容里并没有120B的模型。

经过网友的深扒，发现其竟然是使用MergeKit制作，将Meta官方LIama3 70B模型合并（Self-Merge）。

MergeKit是专门用来合并预训练模型的工具包，合并可以完全在 CPU 上运行，也可以使用低至8GB的VRAM进行加速。在GitHub上已经收获3.6k星。

目前支持Llama、Mistral、GPT-NeoX、StableLM 等模型。

Llama3-12B

基于这个缝合大模型的思路，网友又陆续发布了Llama3-12B，其中还包括了中文微调的12B模型。

信息显示，wwe180/Llama3-12B-Chinese-lingyang是使用mergekit创建的预训练语言模型的合并得到。该模型以hfl/llama-3-chinese-8b-instruct-v2为基础，采用直通合并方法进行合并。

合并的YAML配置如下：

slices:  
  - sources:  
      - model: "hfl/llama-3-chinese-8b-instruct-v2"  
        layer_range: [0, 10]  
  - sources:  
      - model: "hfl/llama-3-chinese-8b-instruct-v2"  
        layer_range: [7, 17]  
  - sources:  
      - model: "hfl/llama-3-chinese-8b-instruct-v2"  
        layer_range: [13, 23]  
  - sources:  
      - model: "hfl/llama-3-chinese-8b-instruct-v2"  
        layer_range: [18, 28]  
  - sources:  
      - model: "hfl/llama-3-chinese-8b-instruct-v2"  
        layer_range: [22, 32]  
  
merge_method: passthrough  
base_model: "hfl/llama-3-chinese-8b-instruct-v2"  
dtype: bfloat16

此外，网友还开源了GGUF模型，这样我们就可以使用ollama进行部署了。

使用ollama部署

1、下载llama3-13b-chinese-lingyang.Q6_K.gguf模型。

下载地址:  
https://huggingface.co/wwe180/Llama3-12B-Chinese-lingyang-Q6_K-GGUF

2、创建一个名为 Modelfile 的文件，并使用 FROM 指令，填写的模型的本地文件路径和必要的配置。

FROM ./llama3-13b-chinese-lingyang.Q6_K.gguf  
  
TEMPLATE """  
{{ if .System }}<|start_header_id|>system<|end_header_id|>  
{{ .System }}<|eot_id|>{{ end }}{{ if .Prompt }}<|start_header_id|>user<|end_header_id|>  
{{ .Prompt }}<|eot_id|>{{ end }}<|start_header_id|>assistant<|end_header_id|>  
{{ .Response }}<|eot_id|>  
"""  
  
PARAMETER stop "<|start_header_id|>"  
PARAMETER stop "<|end_header_id|>"  
PARAMETER stop "<|eot_id|>"

3、执行ollama create llama3:12b -f Modelfile，在Ollama中创建模型

4、执行ollama list验证是否创建成功

大家可以自己实际去试一下效果。

如何学习大模型 AI ？

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

第一阶段（10天）：初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识，对大模型 AI 的理解超过 95% 的人，可以在相关讨论时发表高级、不跟风、又接地气的见解，别人只会和 AI 聊天，而你能调教 AI，并能用代码将大模型和业务衔接。

大模型 AI 能干什么？
大模型是怎样获得「智能」的？
用好 AI 的核心心法
大模型应用业务架构
大模型应用技术架构
代码示例：向 GPT-3.5 灌入新知识
提示工程的意义和核心思想
Prompt 典型构成
指令调优方法论
思维链和思维树
Prompt 攻击和防范
…

第二阶段（30天）：高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习，学会构造私有知识库，扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架，抓住最新的技术进展，适合 Python 和 JavaScript 程序员。

为什么要做 RAG
搭建一个简单的 ChatPDF
检索的基础概念
什么是向量表示（Embeddings）
向量数据库与向量检索
基于向量检索的 RAG
搭建 RAG 系统的扩展知识
混合检索与 RAG-Fusion 简介
向量模型本地部署
…

第三阶段（30天）：模型训练

恭喜你，如果学到这里，你基本可以找到一份大模型 AI相关的工作，自己也能训练 GPT 了！通过微调，训练自己的垂直大模型，能独立训练开源多模态大模型，掌握更多技术方案。

到此为止，大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗？

为什么要做 RAG
什么是模型
什么是模型训练
求解器 & 损失函数简介
小实验2：手写一个简单的神经网络并训练它
什么是训练/预训练/微调/轻量化微调
Transformer结构简介
轻量化微调
实验数据集的构建
…

第四阶段（20天）：商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知，可以在云端和本地等多种环境下部署大模型，找到适合自己的项目/创业方向，做一名被 AI 武装的产品经理。

硬件选型
带你了解全球大模型
使用国产大模型服务
搭建 OpenAI 代理
热身：基于阿里云 PAI 部署 Stable Diffusion
在本地计算机运行大模型
大模型的私有化部署
基于 vLLM 部署大模型
案例：如何优雅地在阿里云私有部署开源大模型
部署一套开源 LLM 项目
内容安全
互联网信息服务算法备案
…

学习是一个过程，只要学习就会有挑战。天道酬勤，你越努力，就会成为越优秀的自己。

如果你能在15天内完成所有的任务，那你堪称天才。然而，如果你能完成 60-70% 的内容，你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【`保证100%免费`】

本文标签：入门模型系统 AI

版权声明：本文标题：如何系统的入门AI大模型？内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/dianzi/1729091211a1186144.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

如何系统的入门AI大模型？

Llama3-12B

使用ollama部署

如何学习大模型 AI ？

第一阶段（10天）：初阶应用

第二阶段（30天）：高阶应用

第三阶段（30天）：模型训练

第四阶段（20天）：商业闭环

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

更多相关文章

【20201023期AI简报】OpenCV 4.5 发布、NVIDIA开源NeMo，更多精彩点我！

华为matepad pro 鸿蒙,华为MatePad Pro 2预装鸿蒙OS-华为MatePad Pro 2系统界面曝光

华为鸿蒙vogtloop30pro价格,华为Mate30Pro已经确认，鸿蒙系统+巴龙5000，支持5G，价格感人...

Day01-postgresql数据库基础入门培训

国内外 AI 大模型公司的现状和前景如何？

2024年国内人工智能大模型汇总

数字化转型之基础设施篇 | 超融合系统的选型与实践

《深入浅出LLM基础篇》（一）：大模型概念与发展

从CaLM评测体系看上海AI实验室如何提升大模型的人类认知水平

各种Linux系统 （一句话介绍

通义千问更聪明了，阿里云要让大模型更好用

AI大模型：国内外大模型发展情况梳理

AI“法官助理”在深圳上岗，审判大模型真的“靠谱”吗？

如何部署私有化大模型+知识库+问答+客服

软件工程——瀑布模型、快速原型模型、增量模型、螺旋模型

AI Agent发展面临哪些挑战？端侧大模型将如何提升其可用性？

事实-风险安全信息包括-入门信息安全知识点

计算机的限制而被取消win7,win7系统本次操作由于这台计算机限制而被取消的解决方法...

计算机无法启动print,Win7系统无法启动print spooler服务怎么办

UEFI安装win7过程的另类引导系统

发表评论

推荐文章

EasyConnect服务器启动失败，建议关闭浏览器后重新登录

[迫真保姆级教程]在Windows上编译可用的Tesseract OCR in C++ 并部署在Visual Studio与Qt6上

c++ 工厂模式

windows 远程桌面 账号密码不正确

休闲娱乐的计算机配置,入门APU主机配置 1199元双核APU家用娱乐电脑配置推荐

热门文章

ibmt41 安装linux系统,哥我决意为IBM T41 装WIN7的决心已经到了全人类都无法阻止的地步！...

为什么win7计算机没有d盘,win7系统没有d盘如何解决？没有d盘的解决方法

Cisco Prime infrastructure(PI) 3.4_(二)_设置园区和无线热图

logstash在windows系统下的安装与使用

关于调试解调器与路由器配置

鸿蒙4.0（HarmonyOS 4.0）与鸿蒙Next（HarmonyOS Next）区别

虚拟机的安装及Liunx系统中命令行的使用技巧

FPGA现状

华为CANN要替代英伟达CUDA，比鸿蒙替代安卓还难么？

计算机主机箱内的主要硬件有,电脑的基本硬件包括哪些

最新文章

配置虚拟主机

（十六）Alian 的 Spring Cloud Eureka 集群配置（主机名方式）

交换机配置基本ACL限制某台主机访问服务器

linux主机配置成供多人使用的服务器

2022双十一7950x主机配置即简单测试

深度学习主机配置推荐

WAMPSERVER配置虚拟主机，单IP多端口

IPV4详解以及在华为中给主机配置IP地址

vlan配置实验——实现不同主机之间的网络连接，实现网络可达

主机 IPv6 地址自动配置过程

计算机网络知识总结：ip地址、分类及什么样的ip主机地址可以分配给主机使用

戴尔微型计算机主机怎么拆,简单拆解内部探秘_戴尔台式电脑_台式电脑评测-中关村在线...

台式计算机主要有哪些硬件组成,构成台式电脑主机的基本硬件有什么

电脑主机灯一直闪烁怎么办

搭建个人深度学习环境（一）—— 单GPU主机配置

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【`保证100%免费`】

各种Linux系统（一句话介绍

windows 远程桌面账号密码不正确

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载