毫末智行DriveGPT、SAM 模型及华为智驾方案|电子爱好者

admin管理员组
文章数量:1535067

2024年3月27日发(作者：)

内容目录

1. DriveGPT：毫末智行 DriveGPT 上车在即，视觉方案重塑智驾路线 .............................. 4

2. SAM 模型：CV 领域 GPT-3 时刻，分割技术走向通用化 ............................................... 6

3. 华为全新智驾方案：问界 M5 高阶智驾版粉墨登场，华为智驾迈向下一站 .................... 8

图表目录

图 1：ChatGPT 的原理类似词语接龙 .................................................................................. 4

图 2：DriveGPT 的“Drive Language” .................................................................................. 4

图 3：特斯拉的 BEV 视觉示意图 ......................................................................................... 4

图 4：DriveGPT 场景识别成本大幅降低 ............................................................................. 4

图 5：特斯拉 Model 3 ADAS 传感器主要为摄像头 .............................................................. 5

图 6：毫末智行 MANA（雪湖）感知能力 vs 激光雷达 ........................................................ 5

图 7：毫末智行 Drive GPT 的算力支持 MANA OASIS ........................................................ 5

图 8：毫末智行 Drive GPT 合作伙伴 ................................................................................... 5

图 9：计算机视觉包括对卷积神经网络进行特定训练 .......................................................... 6

图 10：使用卷积神经网络计算机视觉分析图像 ................................................................... 6

图 11：SAM 模型官方功能示例 ........................................................................................... 7

图 12：SAM 模型官方功能示例 ........................................................................................... 7

图 13：Meta AI 官网 demo 原图（示例） ........................................................................... 7

图 14：SAM 模型可以通过鼠标点击选中目标，实现图像分割 ............................................ 7

图 15：SAM 与之前的大规模分割数据收集工作相比速度大幅提升 .................................... 7

图 16：SA-1B 的掩码比任何现有的分割数据集多 400 倍 ................................................... 7

图 17：SAM 应用于农业场景 .............................................................................................. 8

图 18：SAM 应用于生物学研究场景 ................................................................................... 8

图 19：问界 M5 智驾版申报图 ........................................................................................... 8

图 20：华为 ADS 2.0 高阶辅助驾驶四大亮点 ...................................................................... 9

表 1：卷积神经网络 (CNN) 能够针对多种应用场合执行分割、分类和检测 ...................... 6

表 2：华为 ADS 2.0 配置情况 ............................................................................................. 9

表 3：持续进化的 HarmonyOS 车机系统 .......................................................................... 10

表 4：HarmonyOS 3.0 核心功能点 ................................................................................... 10

1. DriveGPT：毫末智行 DriveGPT 上车在即，视觉方案重

塑智驾路线

4 月 11 日，毫末智行 AI DAY 发布 DriveGPT“雪湖·海若”，GPT+自动驾

驶赋能自动驾驶视觉路线，或重新配置自动驾驶硬件。

用语言描述与想象自动驾驶，DriveGPT 打开智驾方案新思路。ChatGPT 的

原理类似词语接龙，其生成自然语言的逻辑可以描述为“鉴于到目前为止的文本，基

于对接龙词语的概率的判断，下一个词应该是什么”。DriveGPT 创造性地将视觉感

知到的自动驾驶场景 Token 化，形成属于自动驾驶的“Drive Language”，从而

运用GPT 算法，将自动驾驶决策进行预测与推演。

图 1：ChatGPT 的原理类似词语接龙图 2：DriveGPT 的“Drive Language”

DriveGPT 赋能自动驾驶纯视觉方案，大幅降低视觉场景识别成本。DriveGPT

的“Drive Language”基于的是视觉数据，使用 BEV（Bird's Eye View，鸟瞰视

图）视场框架进行自动驾驶计算。由于相机感知使用 BEV 方案的视角全面、辨识度

高等诸多益处，偏爱视觉方案的 Tesla 也在自动驾驶算法中使用了 BEV 方案。纯

视觉方案训练需要对视频画面进行大量标注，目前自动驾驶的视觉路线驾驶场景

识别单帧图片场景识别需要约 5 元，DriveGPT 加持下，场景识别的价格将下降到单

帧图片 0.5 元，仅相当于行业的 1/10。毫末智行即将向行业开放图像帧及 4D

Clips 自场景识别服务，这将大幅降低自动驾驶视觉信号的使用成本。

图 3：特斯拉的 BEV 视觉示意图图 4：DriveGPT 场景识别成本大幅降低

DriveGPT 视觉方案重新配置自动驾驶硬件，自动驾驶有望降本下沉。毫末

将鱼眼相机引入视觉 BEV 的感知框架当中，在泊车场景可做到在 15 米范围内达

测量精度 30cm，2 米内精度高于 10cm。毫末智行不依赖激光雷达，就能将收集

的回传视频转化为可用于 BEV 模型训练的带 3D 标注的真值数据，并且重建误差

小于 10cm。目前激光雷达的价格仍然高居不下，相比之下摄像头价格更为低廉，

低端价位车型受制于硬件成本往往无法搭载需要使用激光雷达的高级别自动驾驶功

能，纯视觉方案的实现将有望使自动驾驶下沉至中低价位车型。

图 5：特斯拉 Model 3 ADAS 传感器主要为摄像头图 6：毫末智行 MANA（雪湖）感知能力 vs 激光雷达

底层大算力支持+多伙伴生态共建，即将上车魏牌新摩卡。DriveGPT 背后离

不开算力支持，毫末与火山引擎已共建智算中心 MANA OASIS（雪湖·绿洲），其

算力高达 67 亿亿次/秒，存储带宽 2T/秒，通信带宽达到 800G/秒。目前毫末智行

DriveGPT 已正式对外开放，开启对北京交通大学计算机与信息技术学院、高通、

火山引擎、华为云、京东科技、四维图新、魏牌新能源、英特尔等首批限量客户

的开放。毫末智行 DriveGPT 即将首发落地新摩卡 DHT-PHEV，后续将上车魏牌

蓝山，同时 DriveGPT 也会逐步应用到城市 NOH、捷途推荐、智能陪练以及脱困

等场景中。

图 7：毫末智行 Drive GPT 的算力支持 MANA OASIS 图 8：毫末智行 Drive GPT 合作伙伴

本文标签：驾驶视觉自动场景方案

版权声明：本文标题：毫末智行DriveGPT、SAM 模型及华为智驾方案内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/xitong/1711485217a312088.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

毫末智行DriveGPT、SAM 模型及华为智驾方案

更多相关文章

雷军不再主讲小米手机发布会；苹果明确：Vision Pro 头显电池某些场景会降低其性能丨 RTE 开发者日报 Vol.142

android 禁止其他应用开机启动项,禁止各种APP开机后自动运行的方案

Centos7系统安全漏洞及修复方案

六种常见WIFI部署场景

mysql 数据库常用引擎及其差异，索引类型、索引使用场景

[晓理紫]每日论文分享(有中文摘要，源码或项目地址)--大模型、扩散模型、视觉导航

实测办公场景下，国产远程控制软件的表现力如何？（技术解析）

imac外接硬盘方案对比-纠结的选择记录

详述存算分离场景下的统一数据Catalog

浏览器上使用原生ES模块方案

chatgpt 1020 错误码成功解决（三种方案）

Shamir 秘密共享方案和Feldman可验证的秘密共享方案

关于Chrome浏览器升级到80版本后受影响的场景以及解决方案

chrome浏览器解决跨域请求SameSite方案，ChromeEdge 91版本SameSite by default cookies被移除后的解决方案

开机黑屏只有鼠标指针无法进入桌面的方案

2021电赛F题（智能送药小车）参赛总结【视觉部分】

终极文件文件夹隐藏方案大全

智能视频分析边缘AI盒子及应用场景介绍 -- sora and ChatGPT

Milvus 核心设计（1） ---- 数据一致性的等级及使用场景

前端文件下载兼容方案（兼容主流浏览器，包括IE与Safari）

发表评论

推荐文章

PS3 内置硬盘 Linux 读取,PS3用移动硬盘的根目录结构详细解析

LLMs之Lamini-1：《Banishing LLM Hallucinations Requires Rethinking Generalization消除大型语言模型幻觉需要重新思考》翻译与解读

统考英语和计算机作弊,统考英语-大学英语b网络统考作弊?

JS 判断Chrome内核的360浏览器，并禁用

手机系统更新后无法连接服务器失败,御剑情缘更新后登不上怎么办？1月11日更新后无法连接服务器解决方法介绍...

热门文章

dd命令做u盘启动方法

linux fedora 39一键安装拼音输入法脚本

ubuntu20.04搜狗输入法安装后未显示

电脑已连接wifi的密码查询

cpu是什么

什么是Microsoft（Office）365？

在Windows系统上安装Jenkins.war

回归经典：Win7 SP1 原版32位，你的稳定之选

计算机在线给手机杀毒,如何用电脑给手机杀毒

谷歌账号--手机号无法验证的问题

最新文章

手机刷机的起起落落---落落落

忘记密码-小米机型 其他安卓机型账号锁 设备锁的分析与刷写某第三方解锁包输入“注册码”

祭十大已经逝去的软件

Android应用自启动保活手段与安全现状分析

好用的外贸企业邮箱哪个好？

多张图片合成一张jpg工具_比较好的拼图软件,多张图片合并工具

root关闭后安全吗，root不安全状态怎么取消

在Android平台上发现新的恶意程序伪装成杀毒软件挟持设备

【无标题】手机电脑被木马病毒感染，私生活被全面监控

苹果换卡后显示无服务器,苹果手机插上sim卡无服务怎么办

关注手机病毒：重点手机安全事件盘点

智能手机应用安全现状及前瞻

手机系统更新后无法连接服务器失败,御剑情缘更新后登不上怎么办？1月11日更新后无法连接服务器解决方法介绍...

2008中国手机客户端软件Top50评选结果

苹果7显示无法接通激活服务器,打电话时，显示对方手机暂时无法接通是什么原因？答案其实很简单...

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

忘记密码-小米机型其他安卓机型账号锁设备锁的分析与刷写某第三方解锁包输入“注册码”

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载