[开源项目学习]langchain-chatchat学习笔记3|电子爱好者

admin管理员组
文章数量:1531715

文章目录

fastchat
- 去看看源代码
- 如何终止服务
- fastchat的封装解析
vllm

fastchat

来看看fastchat是怎么部署成api的呀

参考教程：

用通俗易懂的方式讲解大模型：使用 FastChat 部署 LLM 的体验太爽了
使用 FastChat 在 CUDA 上部署 LLM

我按照第二个教程链接，一次运行controller，openai api server，还有model worker，然后报错了

[Errno 99] error while attempting to bind on address ('::1', 21001, 0, 0)

按照这篇说的解决了
我给三个命令都加上了host 0.0.0.0

python3 -m fastchat.serve.controller --host 0.0.0.0

python -m fastchat.serve.openai_api_server --host 0.0.0.0

python -m fastchat.serve.model_worker \
   --model-path /root/model/chatglm3-6b --port 21003 \
   --worker-address http://localhost:21003 \
   --host 0.0.0.0

我是分别在三个终端运行的

然后就可以调用端口啦（参考）

下面注释掉的也能用

# import requests
# import json

# response = requests.get('http://localhost:8000/v1/models')
# data = response.json()

# # 使用json.dumps函数美化JSON数据
# pretty_data = json.dumps(data, indent=4)
# print(pretty_data)

import requests
import json

url = "http://localhost:8000/v1/chat/completions"
headers = {
    'accept': 'application/json',
    'Content-Type': 'application/json',
}
data = {
    "model": "chatglm3-6b",
    "max_tokens": 2048,
    # "prompt": "写一篇1000字的作文：《2024回家过年》"
    "messages": [ 
      { "role": "system", "content": "你是一名二次元助手，回答要精简。" },
      { "role": "user", "content": "最近有什么好看的番剧？" }
    ]
}

response = requests.post(url, headers=headers, data=json.dumps(data))

# 打印响应内容
print(response.json())

或者用curl

 curl http://localhost:8000/v1/chat/completions   -H "Content-Type: application/json"   -d '{
     "model": "chatglm3-6b",
     "messages": [{"role": "user", "content": "北京景点"}],
     "temperature": 0.7
   }'

去看看源代码

可以看到是使用了fastapi

可以看看对应的接口文档，

http://localhost:21002/docs

可以去这些url后面加个/docs
然后try it out
就都能测试，这些接口

和那些代码里面@的地方是相对应的

如何终止服务

fastchat的封装解析

这篇写的挺好：FastChat工作原理解析

vllm

没写完，遇到bug没解决

参考：
- 【chatglm】（9）：使用fastchat和vllm部署chatlgm3-6b模型，并简单的进行速度测试对比
- https://github/lm-sys/FastChat/blob/main/docs/vllm_integration.md

python -m vllm.entrypoints.api_server --trust-remote-code --model /root/model/chatglm3-6b
INFO 05-18 15:38:07 llm_engine.py:70] Initializing an LLM engine with config: model='/root/model/chatglm3-6b', tokenizer='/root/model/chatglm3-6b', tokenizer_mode=auto, revision=None, tokenizer_revision=None, trust_remote_code=True, dtype=torch.float16, max_seq_len=8192, download_dir=None, load_format=auto, tensor_parallel_size=1, quantization=None, enforce_eager=False, seed=0)
WARNING 05-18 15:38:07 tokenizer.py:62] Using a slow tokenizer. This might cause a significant slowdown. Consider using a fast tokenizer instead.
INFO 05-18 15:38:19 llm_engine.py:275] # GPU blocks: 18773, # CPU blocks: 9362
INFO 05-18 15:38:22 model_runner.py:501] Capturing the model for CUDA graphs. This may lead to unexpected consequences if the model is not static. To run the model in eager mode, set 'enforce_eager=True' or use '--enforce-eager' in the CLI.
INFO 05-18 15:38:22 model_runner.py:505] CUDA graphs can take additional 1~3 GiB memory per GPU. If you are running out of memory, consider decreasing `gpu_memory_utilization` or enforcing eager mode.
INFO 05-18 15:38:26 model_runner.py:547] Graph capturing finished in 4 secs.
INFO:     Started server process [99226]
INFO:     Waiting for application startup.
INFO:     Application startup complete.
INFO:     Uvicorn running on http://0.0.0.0:8000 (Press CTRL+C to quit)
INFO:     127.0.0.1:40436 - "GET / HTTP/1.1" 404 Not Found
INFO:     127.0.0.1:40436 - "GET /favicon.ico HTTP/1.1" 404 Not Found

本文标签：开源学习笔记项目 LangChain chatchat

版权声明：本文标题：[开源项目学习]langchain-chatchat学习笔记3 内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/xitong/1726826127a1086099.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

号称世界上第一个开源实时翻译的 App，微软开源GraphRAG：极大增强大模型问答、摘要、推理，以及开源基于ChatGPT的超级文本代码智能体（附代码地址）

1天前

号称世界上第一个开源实时翻译的 App，微软开源GraphRAG：极大增强大模型问答、摘要、推理，以及开源基于ChatGPT的超级文本代码智能体（附代码

8.7k Star！Khoj：你的AI第二大脑、开源RAG Copilot、平替 MS Copilot与ChatGPT

1天前

原文链接：（更好排版、视频播放、社群交流、最新AI开源项目、AI工具分享都在这个公众号！） 8.7k Star！Khoj&

chatgpt最强平替国内可用免费开源llama2模型下载使用

1天前

1，github下载llama2项目打开下面的项目地址： GitHub - facebookresearchllama: Inference code for LLaMA models 下载项目代码: GitHub - face

Efficient polynomial commitment schemes for multiple points and polynomials学习笔记

1天前

1. 引言 Boneh等人2020年论文《Efficient polynomial commitment schemes for multiple points and polynomials》，暂无收录信息。要点

声音生成项目（4）——从VariantAutoencoder（VAE）到VQ-VAE矢量量化变分编码器

1天前

文章目录论文介绍步骤具体讲解自定义矢量量化层获取最近距离的码字的索引计算推导损失函数相关参考矢量量化层的代码实现完整代码实现论文介绍不同于变分编码器和自动编码器，vq-vae中的latent space是离散

Supersonic Transparent SNARKs from DARK Compilers学习笔记

1天前

1. 引言 Bünz 等人2020年论文《Transparent SNARKs from DARK Compilers》，首次发表于IACR-EUROCRYPT-2020。代码实现可参见：

Concise Mercurial Vector Commitments and Independent Zero-Knowledge Sets with Short Proofs 学习笔记

1天前

1. 背景知识 1）2003年，[MRK] S. Micali，M.-O. Rabin和J. Kilian的论文《Zero-Knowledge Sets》中首次提出了zer

闲人闲谈PS之三十三——项目承诺成本管理

1天前

惯例闲话：学习很苦，坚持很酷——最近看到这句话，苦和酷放在一起，总有一种感觉，吃苦是为了耍酷。这恰恰是这句话的问题之处&#

Efficient Protocols for Set Membership and Range Proof 学习笔记

1天前

1. 引言 Camenisch等人2008年发表在AsiaCrypto的论文《Efficient Protocols for Set Membership and Range Proof》。相关代码见： htt

在项目中用node实现邮箱验证码的发送和验证

1天前

基础配置我的项目是reactnodeMongoDB ，首先邮箱验证码的发送需要开启SMTP服务，这里我就不做过多赘述了，挺简单的，给大家一个

Vue Chrome浏览器调试vue项目源代码

1天前

Vue项目在Chrome浏览器的源代码混乱，无法调试问题解决方法： 在文件 vue.config.js 的 configureWebpack 对象加一个元素 devtool: ‘source-

电商项目相关面试问题及答案

19小时前

请描述一下这个系统？【回答技巧】从3个方面来回答这个问题： |–系统背景及系统概述 |–系统包括的业务模块及主业务流程 |–责任模块【回答示例】第一个方面：系统背景及系统概述优购时尚商城是香港上市公司百丽国际公司为拓宽旗下运

狂神学 Java 零基础学习笔记

19小时前

特别感谢狂神在Java全栈之路上的陪伴视频地址：https:www.bilibilivideoBV12J41137hu?p1 Java 安装 HelloWorld 安装好 JDK 11 版本后&#x

JavaSE基础阶段学习笔记

18小时前

MarkDown学习标题三级标题四级标题字体 hello，word! hello，word! hello，word! hello&#xff0c

学习笔记：UOS服务器开机恢复root密码

18小时前

1、重启电脑，在出现操作系统启动菜单时按“E”键，进入GRUB引导菜单界面。 2、找到“linux vmlinuz-” 开头的行，在末尾添加 “ rw single in

C++打造暴风影音视频播放器项目，手把手教你打造个人播放器

13小时前

众所周知，RTMP是以flash为客户端播放器的直播协议，主要应用在BS形式的场景中。本人研究并用C开发实现了RTMP直播流协议的播放器，结合之前做的RTMP直播采集端&a

宝妈的需求“一仔播放器” WPF 的开源项目（四唤起播放器，关闭应用、打开应用）

13小时前

目录篇章前言打开文件夹运行可执行文件关闭应用打开应用功能完毕开源地址篇章前言上一篇我们已经实现了视频列表的展示（效果还不错呢！）&#xf

宝妈的需求“一仔播放器” WPF 的开源项目（一项目背景）

13小时前

人生感慨从事互联网软件开发多年，平时没少逛技术平台，自己却没怎么分享过相关的技术，转而就加入了奶爸的行列（成天围着孩子转）&am

开源编解码项目FFmpeg迎来20周年生日凭一己之力养活全球无数播放器！(1)

13小时前

FFmpeg会将发现的那些不遵守开源协议的软件公诸于世，虽然没有物质上的惩罚，但是耻辱柱更多的是一种精神层面的降维打击，提醒着大家要奉公守法！ 很不幸

前后端分离项目

12小时前

目录前言一、对前后端分离项目的理解 1.前后端分离项目：SmartAdmin2.X 2.为什么要分离 3.前后端分离制作项目的好处二、软件的下载以及配置环境变量 1.需要下载如下几个软件 2.JD

电子爱好者 - 最新技术资讯及电子产品介绍！

[开源项目学习]langchain-chatchat学习笔记3

文章目录

fastchat

去看看源代码

如何终止服务

fastchat的封装解析

vllm

更多相关文章

号称世界上第一个开源实时翻译的 App，微软开源GraphRAG：极大增强大模型问答、摘要、推理，以及开源基于ChatGPT的超级文本代码智能体（附代码地址）

8.7k Star！Khoj：你的AI第二大脑、开源RAG Cop​​ilot、平替 MS Copilot与ChatGPT

chatgpt最强平替国内可用免费开源llama2模型下载使用

Efficient polynomial commitment schemes for multiple points and polynomials学习笔记

声音生成项目（4）——从VariantAutoencoder（VAE）到VQ-VAE矢量量化变分编码器

Supersonic Transparent SNARKs from DARK Compilers学习笔记

Concise Mercurial Vector Commitments and Independent Zero-Knowledge Sets with Short Proofs 学习笔记

闲人闲谈PS之三十三——项目承诺成本管理

Efficient Protocols for Set Membership and Range Proof 学习笔记

在项目中用node实现邮箱验证码的发送和验证

Vue Chrome浏览器调试vue项目源代码

电商项目相关面试问题及答案

狂神学 Java 零基础学习笔记

JavaSE基础阶段学习笔记

学习笔记：UOS服务器开机恢复root密码

C++打造暴风影音视频播放器项目，手把手教你打造个人播放器

宝妈的需求“一仔播放器” WPF 的开源项目（四 唤起播放器，关闭应用、打开应用）

宝妈的需求“一仔播放器” WPF 的开源项目（一 项目背景）

开源编解码项目FFmpeg迎来20周年生日 凭一己之力养活全球无数播放器！(1)

前后端分离项目

发表评论

推荐文章

AMD3070运行torch中的cuda报错

搜狗拼音输入法怎么打出特殊符号

dell笔记本c语言系统,戴尔Latitude 5280笔记本如何将自带win10改成win7

win11使用移动硬盘(固态&amp;非固态)卡顿问题解决

win10读取linux硬盘,win10怎么读取lxext4格式硬盘

热门文章

Android10 U盘支持EXFAT和NTFS

手机控制树莓派linux,使用安卓手机控制树莓派

电脑遇到“偶尔黑屏、程序崩溃、系统卡顿”的小伙伴看过来~

linux安装五笔输入法centos,CentOS 7系统怎么安装极点五笔输入法?

电脑html文件存到手机,怎样把电脑上的文件传到手机上【技巧详情】

Windows 10英文系统解决中文乱码问题

如何解决Windows 10中的LogonUI.exe错误

网络安全--解除认证攻击wifi(详细教程)

移动硬盘安装系统无法读取电脑其他硬盘的解决方法

ExFAT格式的移动硬盘为什么还是无法在MacPro成功挂载识别

最新文章

Oracle数据库从Window XP迁移到Win7的诡异问题

电脑安装win7系统后没有声音怎么办

【win10专业版】win7xp双系统的启动顺序如何设置

win7卡在正在启动windows界面_分享一下WIN7系统下运行红警2的方法

世界上最简单系统安装方法(适合XP升级win7系统)

xp新电脑win7重装硬盘SATA模式AHCI及ACPI电源管理zz150118

Notepad2 在Win7 64位下替换系统notepad

计算机学win7画图,Win7系统自带画图工具如何打开？win7打开画图工具教程

Win7 XP双系统安装

python打包xp系统_python打包的exe为啥在XP上提示“不是有效的WIN32程序”

win7蓝屏_win7电脑蓝屏自动重启怎么办，卸载程序，电脑瞬间复活

win7添加一个计算机图标,Win7系统任务栏处添加“计算机”图标的方法

64位系统魔兽服务器不兼容,魔兽世界Win7下出现不兼容问题的解决办法

win7 兼容 因特尔十代_Window XP的不再更新：从第7代开始，Intel的CPU可能全面进入Win10时代...

win7装sql2000找不到服务器,WIN7 64位系统 SQL2000服务无法启动

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

8.7k Star！Khoj：你的AI第二大脑、开源RAG Copilot、平替 MS Copilot与ChatGPT

宝妈的需求“一仔播放器” WPF 的开源项目（四唤起播放器，关闭应用、打开应用）

宝妈的需求“一仔播放器” WPF 的开源项目（一项目背景）

开源编解码项目FFmpeg迎来20周年生日凭一己之力养活全球无数播放器！(1)

win11使用移动硬盘(固态&非固态)卡顿问题解决

win7 兼容因特尔十代_Window XP的不再更新：从第7代开始，Intel的CPU可能全面进入Win10时代...

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载