基于huggingface和langchain快速开发大模型应用|电子爱好者

admin管理员组
文章数量:1579404

一、HuggingFace. 2

1.1定义... 2

1.2活跃度... 2

1.3 工具集... 2

二、HuggingFace工具介绍... 3

2.1 Pipelines. 3

2.1.1定义... 3

2.1.2常见参数... 3

2.2、AutoClass. 4

2.2.1定义... 4

2.2.2 支持模型架构列表... 4

三、HuggingFace案例介绍... 4

3.1基于Piplelines的语音识别案例... 4

3.2基于AutoClass的大模型对话交互案例... 5

3.3基于Langchain的大模型RAG检索增强案例... 5

3.3.1 流程介绍... 5

3.3.1 案例分享... 6

3.4基于Langchain的大模型智能体Action Agent案例... 8

3.4.1 Action Agent参数... 8

3.4.2 Action Agent类型... 8

3.4.3 Rect框架... 9

3.4.4 PromptTemplate类型... 9

3.4.5 案例分享... 10

3.4.6 常见问题... 11

3.5基于Langchain的大模型智能体PlanAndExecute Agent案例... 12

3.5.1 Action Agent对比PlanAndExecute Agent 12

3.5.2 案例分享... 12

3.6基于ChatGLM-6B进行LORA微调案例... 14

3.6.1 LORA定义... 14

3.6.2 案例分享... 14

四、参考链接... 15

附录... 15

1如何自定义加载本地大模型... 15

一、HuggingFace

1.1定义

一家专注于自然语言处理（NLP）、人工智能和分布式系统的创业公司，创立于2016年。最早是主营业务是做闲聊机器人，2018年 Bert 发布之后，他们贡献了一个基于 Pytorch 的 Bert 预训练模型，即 pytorch-pretrained-bert，大受欢迎，进而将重心转向维护 NLP开源社区。

HuggingFace整合了他们的贡献的NLP领域的预训练模型，发布了Transformers库。Transformers 提供了数以千计的预训练模型（包括我们熟知的Bert、GPT、GPT-2、XLM等），支持 100 多种语言的文本分类、信息抽取、问答、摘要、翻译、文本生成。它的宗旨让最先进的 NLP 技术人人易用。

1.2活跃度

HuggingFace的模型仓库已经共享了超过60000个模型，数据集仓库已经共享了超过8000个数据集，基于开源共享的精神，这些资源的使用都是完全免费的。HuggingFace代码库也在快速更新中，HuggingFace开始时以自然语言处理任务为重点，所以HuggingFace大多数的模型和数据集也是自然语言处理方向的，但图像和语音的功能模型正在快速更新中，相信未来逐渐会把图像和语音的功能完善并标准化，如同自然语言处理一样。

1.3 工具集

HuggingFace把AI项目的研发大致分为以下几部分，如图1-1所示。

图1-1

针对流程中的各个节点，HuggingFace都提供了很多工具类，能够帮助研发人员快速地实施。HuggingFace提供的工具集如图1-2所示。

图1-2

二、HuggingFace工具介绍

2.1 Pipelines

2.1.1定义

pipeline是一个设计用来封装Transformer库中大部分复杂代码的对象，它提供了一个简单的API接口，用于执行各种任务，如命名实体识别（NER）、情感分析等。使用pipeline，用户可以轻松地将文本输入传递给模型，并获得相应的输出结果。这个过程包括三个主要步骤：

文本预处理：将文本转换成模型可以理解的格式。
模型预测：预处理后的输入被送入模型进行推理。
后处理：模型的预测结果经过后处理，以便赋予具体的业务含义。

2.1.2常见参数

参数名称	参数含义	示例列表
task	The task defining which pipeline will be returned.
model	The model that will be used by the pipeline to make predictions. This can be a model identifier or an actual instance of a pretrained model inheriting from PreTrainedModel (for PyTorch) or TFPreTrainedModel (for TensorFlow).
tokenizer (分词器)	The tokenizer that will be used by the pipeline to encode data for the model. This can be a model identifier or an actual pretrained tokenizer inheriting from PreTrainedTokenizer.
feature_extractor (特征提取器)	The feature extractor that will be used by the pipeline to encode data for the model. This can be a model identifier or an actual pretrained feature extractor inheriting from PreTrainedFeatureExtractor.

2.2、AutoClass

2.2.1定义

由于存在许多不同的Transformer架构，因此为您的checkpoint创建一个可用架构可能会具有挑战性。通过AutoClass可以自动推断并从给定的checkpoint加载正确的架构, 这也是Transformers易于使用、简单且灵活核心规则的重要一部分。

2.2.2 支持模型架构列表

模型类型	AutoClass名称
NLP任务	AutoTokenizer
视觉任务	AutoImageProcessor
音频任务

本文标签：模型快速 Huggingface LangChain

版权声明：本文标题：基于huggingface和langchain快速开发大模型应用内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/xitong/1727854384a1133866.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

基于huggingface和langchain快速开发大模型应用

一、HuggingFace

1.1定义

1.2活跃度

1.3 工具集

二、HuggingFace工具介绍

2.1 Pipelines

2.1.1定义

2.1.2常见参数

2.2、AutoClass

2.2.1定义

2.2.2 支持模型架构列表

更多相关文章

计算机里怎样打字,电脑知识：如何电脑快速打字

[QT编程系列-2]：C++图形用户界面编程，QT框架快速入门培训 - 1- 预备知识

【可能是全网最丝滑的LangChain教程】十九、LangChain进阶之Agents

手把手教你将AI模型做成一个手机APP并成功运行

电脑蓝屏怎么办？3个方法教你快速修复

电脑如何剪辑音频？5个方法教你快速剪辑音频

NeurIPS 2022 | CATER：针对模型窃取的版权保护之选择性水印

快速安装之前版本的pytorch（以1.8.0为例）

Qt 快速入门指南

戴尔电脑如何设置快速开机

怎样快速了解 Kubernetes 集群的健康状况并提出优化建议？ Efficiently Manage Kubernetes Clusters with Kubectl Advisor

快速UDP网络连接之QUIC协议介绍

基于MLC LLM将Llama2-7B模型部署至Android手机运行

【Picgo指南】图床神器之Picgo工具的安装与快速上手详细教程

ChatGPT等大模型可以代替搜索引擎吗？

如何在浏览器中快速切换搜索引擎

广告引擎检索技术快速学习

关于新电脑快速安装开发环境

为什么说国产大模型的野心，都藏在 MaaS 的生态中

快速拿下CKA认证考试，这些要求和tips你得知道

发表评论

推荐文章

ubuntu安装微信、QQ、企业QQ、阿里旺旺等

QUESTION 13 Emergency Monitoring特性

linux磁盘挂载出错（Welcome to emergency model）

GreedyReluctantPossessive 正则表达式

谷歌浏览器开发者工具鼠标箭头变成小圆点了

热门文章

Native wifi API使用

win10下查看pyttorch实际使用的cuda版本，安装多个cuda(cuda9.0和10.0)，并切换cuda版本

解决19位Long型id传递到web前端丢失精度问题的方法

amr文件怎么转换成mp3？

Linux开机出现welcome to emergency mode! 解决方法after logging in ，type “journalctl -xb” to view system logs

介绍一些免费的学术电子资源搜索引擎

分布式搜索引擎的架构原理！

谷歌浏览器chrome如何允许或禁止JavaScript运行？添加黑白名单？

没有整理选项,新版谷歌浏览器如何导出书签

史上最强的GPS基础知识集合

最新文章

解决Edge及Chrome等浏览器主页被篡改2345导航页

关于Google浏览器添加QQ电脑管家广告过滤插件出现2345主页拦截问题

判断浏览器中是否安装了某插件

chrome浏览器被2345网页劫持，杀毒、删注册表等各种方法都解决不了

2345等浏览器主页劫持的解决办法

浏览器被恶意设置主页http:www.2345.com?kunown的解决方法

2345 网址导航劫持 解决办法

谷歌浏览器打开后同时弹出百度搜索和2345问题解决

PC端浏览器自动填充账号密码输入框问题该如何解决？

google浏览器被2345强制绑定

浏览器无法找到css或者js文件

WebSocket

浏览器提示：正在下载代理脚本

vue开发之不同浏览器的类型判断

tinymce.init()浏览器兼容问题

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

2345 网址导航劫持解决办法

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载