triton-inference-server启动报Internal - failed to load all models|电子爱好者

admin管理员组
文章数量:1532270

错误信息

启动tritonserver

docker run --gpus=1 --rm -p 8000:8000 -p 8001:8001 -p 8002:8002 -v /full_path/deploy/models/:/models nvcr.io/nvidia/tritonserver:21.03-py3 tritonserver --model-repository=/models

在启动tritonserver的时候报Internal - failed to load all models错误，错误信息如下

+-----------+---------+----------------------------------------------------------------------------------------------------+
| Model     | Version | Status                                                                                             |
+-----------+---------+----------------------------------------------------------------------------------------------------+
| resnet152 | 1       | UNAVAILABLE: Internal - failed to load all models features |
+-----------+---------+----------------------------------------------------------------------------------------------------+
I0420 16:14:07.481496 1 server:280] Waiting for in-flight requests to complete.
I0420 16:14:07.481506 1 model_repository_manager:435] LiveBackendStates()
I0420 16:14:07.481512 1 server:295] Timeout 30: Found 0 live models and 0 in-flight non-inference requests
error: creating server: Internal - failed to load all models

错误原因分析

导致这种错误的原因通常都是由于TensorRT的版本不一致导致的，这里的版本不一致指的是我们再将模型由(onnx)转换为tensorrt的模型时TensorRT的版本与docker镜像tritonserver里面的TensorRT版本不一致导致的，所以解决这个问题也很简单，我们只需要使用与tritonserver里面版本一致的TensorRT将模型重新做一个转换即可解决问题

解决办法

进入到镜像中

docker run --gpus all -it --rm -v /full_path/deploy/models/:/models nvcr.io/nvidia/tensorrt:21.03-py3
#进入到tensorrt的安装目录，里面有一个trtexec的可执行文件
#trition-server就是依赖这个来加载模型的
cd /workspace/tensorrt/bin
#将onnx模型转换为plan
trtexec --onnx=resnet152.onnx --saveEngine=model.plan --explicitBatch --minShapes=input:1x3x224x224 --optShapes=input:8x3x224x224 --maxShapes=input:8x3x224x224

-v参数的目的是做一个目录的映射，这样我们就不想要去拷贝模型文件

测试TensorRT是否能够成功加载模型

trtexec --loadEngine=resnet152.engine
#输出信息
[06/25/2021-22:28:38] [I] Host Latency
[06/25/2021-22:28:38] [I] min: 3.96118 ms (end to end 3.97363 ms)
[06/25/2021-22:28:38] [I] max: 4.36243 ms (end to end 8.4928 ms)
[06/25/2021-22:28:38] [I] mean: 4.05112 ms (end to end 7.76932 ms)
[06/25/2021-22:28:38] [I] median: 4.02783 ms (end to end 7.79443 ms)
[06/25/2021-22:28:38] [I] percentile: 4.35217 ms at 99% (end to end 8.46191 ms at 99%)
[06/25/2021-22:28:38] [I] throughput: 250.151 qps
[06/25/2021-22:28:38] [I] walltime: 1.75494 s
[06/25/2021-22:28:38] [I] Enqueue Time
[06/25/2021-22:28:38] [I] min: 2.37549 ms
[06/25/2021-22:28:38] [I] max: 3.47607 ms
[06/25/2021-22:28:38] [I] median: 2.49707 ms
[06/25/2021-22:28:38] [I] GPU Compute
[06/25/2021-22:28:38] [I] min: 3.90149 ms
[06/25/2021-22:28:38] [I] max: 4.29773 ms
[06/25/2021-22:28:38] [I] mean: 3.98691 ms
[06/25/2021-22:28:38] [I] median: 3.96387 ms
[06/25/2021-22:28:38] [I] percentile: 4.28748 ms at 99%
[06/25/2021-22:28:38] [I] total compute time: 1.75025 s
&&&& PASSED TensorRT.trtexec

如果最后输出了PASSED说明模型加载成功，下面来看一个加载失败的案例

[06/26/2021-22:09:27] [I] === Device Information ===
[06/26/2021-22:09:27] [I] Selected Device: GeForce RTX 3090
[06/26/2021-22:09:27] [I] Compute Capability: 8.6
[06/26/2021-22:09:27] [I] SMs: 82
[06/26/2021-22:09:27] [I] Compute Clock Rate: 1.725 GHz
[06/26/2021-22:09:27] [I] Device Global Memory: 24265 MiB
[06/26/2021-22:09:27] [I] Shared Memory per SM: 100 KiB
[06/26/2021-22:09:27] [I] Memory Bus Width: 384 bits (ECC disabled)
[06/26/2021-22:09:27] [I] Memory Clock Rate: 9.751 GHz
[06/26/2021-22:09:27] [I] 
[06/26/2021-22:09:27] [I] TensorRT version: 8000
[06/26/2021-22:09:28] [I] [TRT] [MemUsageChange] Init CUDA: CPU +443, GPU +0, now: CPU 449, GPU 551 (MiB)
[06/26/2021-22:09:28] [I] [TRT] Loaded engine size: 222 MB
[06/26/2021-22:09:28] [I] [TRT] [MemUsageSnapshot] deserializeCudaEngine begin: CPU 449 MiB, GPU 551 MiB
[06/26/2021-22:09:28] [E] Error[1]: [stdArchiveReader.cpp::StdArchiveReader::34] Error Code 1: Serialization (Version tag does not match. Note: Current Version: 43, Serialized Engine Version: 96)
[06/26/2021-22:09:28] [E] Error[4]: [runtime.cpp::deserializeCudaEngine::74] Error Code 4: Internal Error (Engine deserialization failed.)
[06/26/2021-22:09:28] [E] Engine creation failed
[06/26/2021-22:09:28] [E] Engine set up failed
&&&& FAILED TensorRT.trtexec [TensorRT v8000]
#或者出现这种
[06/25/2021-19:08:23] [I] Memory Clock Rate: 9.751 GHz
[06/25/2021-19:08:23] [I] 
[06/25/2021-19:08:25] [E] [TRT] INVALID_CONFIG: The engine plan file is not compatible with this version of TensorRT, expecting library version 7.2.3 got 7.2.2, please rebuild.
[06/25/2021-19:08:25] [E] [TRT] engine.cpp (1646) - Serialization Error in deserialize: 0 (Core engine deserialization failure)
[06/25/2021-19:08:25] [E] [TRT] INVALID_STATE: std::exception
[06/25/2021-19:08:25] [E] [TRT] INVALID_CONFIG: Deserialize the cuda engine failed.
[06/25/2021-19:08:25] [E] Engine creation failed
[06/25/2021-19:08:25] [E] Engine set up failed
&&&& FAILED TensorRT.trtexec

上面的错误信息就是一个典型的TensorRT版本不匹配导致的问题，解决这种问题的方法一共有两种，第一种就是使用匹配的TensorRT版本重新导出模型的engine文件，第二种就是修改tritonserver的版本以匹配engine模型文件中使用的TensorRT的版本

第一种方法

去pull与tritonserver版本一致的tensorrt版本，例如

#pull tritonserver镜像
docker pull nvcr.io/nvidia/tritonserver:21.03-py3
#pull tensorrt镜像
docker pull nvcr.io/nvidia/tensorrt:21.03-py3

pull完成之后，通过对应版本的tensorrt镜像来对模型重新进行转换即可

第二种方法

可以去NVIDIA镜像网站上去pull与TensorRT版本一致的tritonserver即可，tritonserver各个版本：tritonserver镜像列表

本文标签： Server Inference triton Internal Models

版权声明：本文标题：triton-inference-server启动报Internal - failed to load all models 内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/xitong/1725429549a1022743.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

triton-inference-server启动报Internal - failed to load all models

错误信息

错误原因分析

解决办法

第一种方法

第二种方法

更多相关文章

Windows Server 20122016 桌面显示我的电脑图标

2016 server win 假死_win10程序假死无响应的两种解决办法

Windows Server 2016 自建DNS服务器 但是 ”DNS服务器未响应“ 错误

基于Windows Server 2008的DNS服务器配置

Windows Server 2012R2 DNS服务介绍及搭建

2008 server sql 数据库引擎安装失败；安装2008sql server时，提示sql server 复制、数据库引擎服务、Reporting Services、全文搜索等失败。W10

最全使用SQL Server创建、配置数据库的各种方法和注意细节

初次登录Ubuntu20.04 server如何连接WIFI

Your port 80 is actually used by :Server: Microsoft-HTTPAPI2.0

your port 80 is actually used by server:kangle解决办法

your port 80 is actually used by server IIS织梦模板安装问

server error 500 及 Object of type ‘ObjectID‘ is not JSON serializable 总结

WAMP Server 无法启动的解决方法

SQL Server数据库快照

An error occurred on the server when processing the URL. Please contact the system administrator.报错

roscore时候报错：Unable to contact my own server at...

Python3 A server error occurred.Please contact the administrator.

Windows server 镜像文件

Windows Server 2003升级Win Ser 2008R2之域架构扩展报错

论文阅读：Visual ChatGPT: Talking, Drawing and Editing with Visual Foundation Models

发表评论

推荐文章

ajax默认超时时间多久,请问chrome浏览器的默认超时时间是多久？

戴尔服务器修改光驱盘符,DELL电脑重装系统不读盘解决步骤方法

室内定位技术方案---Wifi、RFID、bluetooth、Zigbee

移动硬盘无法在ubuntu显示

大学英语四级翻译技巧讲解

热门文章

Spring-Boot整合微信登陆、微信支付、邮箱发送、支付宝支付和阿里云短信

虚拟机安装Win7时提示“缺少所需的CDDVD驱动器设备驱动程序”

Linux——常见问题大全

amd建议超频吗_Amd 超频简单说明书——CPU篇

【教程】在UEFI启动方式下，通过GRUB2引导，直接从硬盘ISO文件安装Windows10和Ubuntu双系统

彻底去除暴风影音的stormliv.exe

我为博客园打造的全新版windows phone Pre-Beta[有图]

解决win7 vs2008没有升级按钮导致无法升级

chatgpt 接口使用（一）

【ChatGPT自动生成系列】SpringBoot集成Mybatis

最新文章

手摸手教你用php的post方法接入百度翻译API（免费版）

Python+openpyxl+selenium实现自动翻译中英文脚本！

Python 免费翻译API

免费好用的英语单词统计软件（带翻译功能）

java 翻译_java实现简单的英汉翻译功能

论文中译英英译汉真的能降重吗

使用python做一个翻译工具

C++实现英语词典

英语翻译太难？我一怒之下用爬虫写了两个翻译脚本

2010-2019考研英语二 翻译真题+参考译文

英语6级翻译笔记

计算机英语读音在线,computer是什么意思_computer翻译_读音_用法_翻译

SAP 常见英语 对应中文翻译

AI人工智能代替人工翻译后，我们还需要学习英语吗？

新时代研究生学术英语综合教程2unit1课文中英文翻译

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

Windows Server 2016 自建DNS服务器但是 ”DNS服务器未响应“ 错误

2010-2019考研英语二翻译真题+参考译文

SAP 常见英语对应中文翻译

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载