一个提问高下立见？国产AI大模型冲上扣子广场PK|电子爱好者

admin管理员组
文章数量:1631202

以“国产GPTs”出名的扣子，做出了GPT没有的功能。

6月12日，字节跳动旗下的AI应用开发平台“扣子”（Coze国内版）悄悄上线了新功能“模型广场”。

扣子是AI应用开发平台，无论用户是否有编程基础，都可以在扣子上快速搭建基于大模型的各种聊天机器人（AI Bot），并一键发布到飞书、微信等各个社交平台。

而新上线的模型广场，可以让两个大语言模型实时PK，一决胜负，帮助用户挑选出最适合自己的大语言模型。

据了解，扣子目前已经接入了包括豆包、通义千问、MiniMax、Moonshot、百川智能、智谱等多个国内大语言模型。换言之，这是国内多家知名大模型厂商与字节的强强联动。

哪款大模型最适合自己的AI应用？创作者们在打造AI Bot时该选哪个模型？自定义主题Bot的魅力在哪？“头号AI玩家”第一时间上手进行了一番实测。

超低门槛搭建Bot，让大模型匿名PK

国内大模型到底哪家更厉害，遇到问题时该选择哪个AI解决，扣子模型广场提供的就是快速测试的方法。

具体来说，模型广场采用了指定Bot对战、随机Bot对战以及纯模型对战模式，任一模式下，系统都会先匹配两款匿名大模型，随后用户进行提问，模型实时生成答案进行PK。

根据模型的回答质量，我们可以投票选出表现较好的模型，孰强孰弱一目了然。

任意模型完成回答后，用户可以参与投票

先从最基础的模型能力评测入手，如果我需要搭建一个“友好语气转换器（阴阳版）”，哪个大语言模型的回复既礼貌但不冒犯？

现在直接让模型“打一架”，就可以评估大模型在面对细分需求时的表现差异。

我们在扣子模型广场点击“纯模型对战”，进入对决页面，两款匿名模型已经在后台准备就绪了。

随后，我输入了需要创建的AI Bot角色设定，并一键发送给两个身份未知的大语言模型，内容如下：

“你是一个能将各种情绪状态演绎得淋漓尽致，令人又爱又恨的阴阳怪气大师，可以通过极其生动且夸张的方式展现出丰富多样的不同网络聊天语气，给用户带来独特的、充满明嘲暗讽的体验…”

两款匿名大模型实时响应提问，其中，最先给出回答的大模型B只花了4.9秒。

任意一个模型回答完后，就可以基于内容质量、回复时间等要素，来判断哪个模型表现更好。

实际测试中，综合响应时长以及内容“阴阳怪气”的程度，我把这一票投给了大模型A。投票完成后，模型广场会显示刚才参与竞赛的两位模型选手，比如被我选中获胜的模型A实际上是豆包。点击展开，还能获得更多模型参数。

投票完成页面

当然，也可以选择重开一轮。比如由于我还想了解其他模型会如何“阴阳怪气”，就点了“重开一轮”，很快，系统重新匹配了两个新模型进行对战。

通过多轮评估对比，我们发现在“友好语气转换器”这一机器人创建需求中，豆包和Moonshot给出的结果不相上下，豆包回答简单毒舌，Moonshot配合表情之后，把“暗讽”拿捏到位。

那么，考虑到我希望聊天机器人在对话时带上emoji，所以会更青睐活泼一点的Moonshot。

需要说明的是，这里的投票完全是依据个人主观喜好，所以与其说哪家模型更强，不如说哪家更适合。

目前，市面上也有较权威的评测，像LMSYS的模型竞技场，也是让全球用户可以自由评测大模型的能力，选出优胜模型。扣子的模型广场也有相同的功能。

对于开发者来说，如何选择更优的底层模型打造AI Bot是十分值得关心的问题。毕竟在大模型行业，基础模型的能力几乎决定着AI Bot能多大程度发挥作用。

但很多人在创建AI Bot时，其实无法看懂复杂的榜单数据，甚至不夸张地说，国产AI大模型各个当过第一。现在，“纯模型”之间可以进行对战，以文本生成的硬实力PK，这样的优势在于方便小白用户自行选择模型。

除此之外，**也可以在模型竞技场中选择感兴趣的Bot开启模型对战。**和GPTs商店类似，入围模型广场的AI Bot是官方精选推荐的。

比如，我选择了“奇遇旅行家”Bot来制定一个出行计划，同样能将“我要从上海出发到阿勒泰，请帮我找到便宜的机票，并制定一份出行规划”这个问题，一键发给两个模型。

不到15秒的时间，匿名模型先后给出了两个完全不同的方案，对于出行需要Plan B的我来说，的确大大缩短了规划时间。

换言之，对于普通用户而言，同一个问题可以同时投喂给两个大语言模型，短时间内可以获得更多回复，一定程度上可以提高获取信息的效率。此外，也可以在一个平台掌握各大模型的最新能力，扣子实现了模型Bot的聚合。

验证模型再叠技能，AI还能怎么玩

需要说明的是，模型广场评估的只是大模型本身在文本生成等方面的能力，不受编排、工作流等配置的影响和限制。

所以，如果想要打造出一个能力出众的Bot，还需要进一步给AI附加一些额外能力。

比如，让Genmoji Bot调用表情包插件，或是创作完整的工作流，和大语言模型结合完成更多复杂功能。

在扣子Bot商店，有不少网友通过AI Bot实现自己的创意。AI最大的魅力，大概就在于你压根没想到这些东西能这么用。

6月12日，扣子还和Intel联合推出了“Coze AI Factory”主题Bot征集活动，包括图文创作、实用工具、互动创意等不同赛道。

https://www.coze/docs/guides/coze_ai_factory

网友们靠调用插件、增加工作流，调教了形形色色的角色，整了不少花活，比如“单人剧本杀”“本命粽子”“Emoji翻译器”等等。

这些有意思的Bot也会吸引更多开发者上手一试，从中寻找创建灵感。

比如可以在Bot商店选择感兴趣的Bot，查看相应的提示词，甚至在个人空间里复刻一个相似的，替换成更心仪的大语言模型。

我们体验下来也发现，如此一来，零基础就可以开发一款契合自己的AI Bot。借助模型广场，还能在创建AI Bot时选择更偏好的大模型。这样一来，人人都可以灵活地配置生成不同的Bot，还能低成本实现突如其来的创意。

字节AI新王牌，想做大模型风向标？

随着大模型技术不断发展，国内大厂几乎都瞄准了构建AI原生应用平台，类GPTs的产品远不止扣子。此前百度上线了文心一言智能体平台，阿里云布局推出百炼大模型平台。前不久，腾讯一站式智能体制作平台“元器”也公开灰度测试。

不少观点认为，具有专业能力的智能体，能够撬动大模型商业化。但如何在其中脱颖而出，做出差异化竞争是大模型厂商们共同面对的问题。

目前看来，挖掘大模型技术上的潜力，汇聚开发者甚至非开发者，扣子靠模型竞技场已经迈出了第一步。

模型竞技场，意味着字节联动阿里、百川智能和月之暗面等，让用户能够快速基于多种大模型创建应用。扣子的底层也不再局限于自研的豆包大模型，逐渐走向开放，吸引更多开发者。

图片来源：扣子微信公众平台

对于大厂来说，开发者生态就像是“蓄水池”，繁荣的生态和稳固的底层技术向来相辅相成，规模化的开发者聚合效应能进一步提升大模型能力。

继此前推出9个豆包大模型全家桶，打响大模型价格战后，字节正在围绕AI寻找应用落地场景，以触达更多用户。

以扣子、豆包等为基础，字节似乎正尝试搭建起一个能够吸引开发者与用户、覆盖各领域的AI应用生态，进一步对B端业务发起攻势。

火山引擎总裁谭待此前接受采访时表示，应用生态的构建不是一天两天就能形成的，反而是一堆人的群体智慧。扣子必须要构建低代码生态，能够让很多人用低门槛做更多事情，才能形成AI时代的创新。

这或许也在暗示，扣子选择上线模型广场的原因，是鼓励更多大模型进行合作，收集真实的应用场景数据，为优化模型提供参考。

正如很多业内人士提到的，AI的价值应该体现在它如何帮助人们解决问题、提高效率上，而不仅仅是技术层面的“最强”。

如何学习大模型 AI ？

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

第一阶段（10天）：初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识，对大模型 AI 的理解超过 95% 的人，可以在相关讨论时发表高级、不跟风、又接地气的见解，别人只会和 AI 聊天，而你能调教 AI，并能用代码将大模型和业务衔接。

大模型 AI 能干什么？
大模型是怎样获得「智能」的？
用好 AI 的核心心法
大模型应用业务架构
大模型应用技术架构
代码示例：向 GPT-3.5 灌入新知识
提示工程的意义和核心思想
Prompt 典型构成
指令调优方法论
思维链和思维树
Prompt 攻击和防范
…

第二阶段（30天）：高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习，学会构造私有知识库，扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架，抓住最新的技术进展，适合 Python 和 JavaScript 程序员。

为什么要做 RAG
搭建一个简单的 ChatPDF
检索的基础概念
什么是向量表示（Embeddings）
向量数据库与向量检索
基于向量检索的 RAG
搭建 RAG 系统的扩展知识
混合检索与 RAG-Fusion 简介
向量模型本地部署
…

第三阶段（30天）：模型训练

恭喜你，如果学到这里，你基本可以找到一份大模型 AI相关的工作，自己也能训练 GPT 了！通过微调，训练自己的垂直大模型，能独立训练开源多模态大模型，掌握更多技术方案。

到此为止，大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗？

为什么要做 RAG
什么是模型
什么是模型训练
求解器 & 损失函数简介
小实验2：手写一个简单的神经网络并训练它
什么是训练/预训练/微调/轻量化微调
Transformer结构简介
轻量化微调
实验数据集的构建
…

第四阶段（20天）：商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知，可以在云端和本地等多种环境下部署大模型，找到适合自己的项目/创业方向，做一名被 AI 武装的产品经理。

硬件选型
带你了解全球大模型
使用国产大模型服务
搭建 OpenAI 代理
热身：基于阿里云 PAI 部署 Stable Diffusion
在本地计算机运行大模型
大模型的私有化部署
基于 vLLM 部署大模型
案例：如何优雅地在阿里云私有部署开源大模型
部署一套开源 LLM 项目
内容安全
互联网信息服务算法备案
…

学习是一个过程，只要学习就会有挑战。天道酬勤，你越努力，就会成为越优秀的自己。

如果你能在15天内完成所有的任务，那你堪称天才。然而，如果你能完成 60-70% 的内容，你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【`保证100%免费`】

本文标签：扣子高下冲上模型广场

版权声明：本文标题：一个提问高下立见？国产AI大模型冲上扣子广场PK 内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/dongtai/1729090100a1186026.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

电子爱好者 - 最新技术资讯及电子产品介绍！

一个提问高下立见？国产AI大模型冲上扣子广场PK

超低门槛搭建Bot，让大模型匿名PK

验证模型再叠技能，AI还能怎么玩

字节AI新王牌，想做大模型风向标？

如何学习大模型 AI ？

第一阶段（10天）：初阶应用

第二阶段（30天）：高阶应用

第三阶段（30天）：模型训练

第四阶段（20天）：商业闭环

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

更多相关文章

【大模型】国产大模型混战，什么样的最受用户欢迎？

大模型争锋：左手“世界最强” 右手“高性价比”

AI最新资讯｜OpenAI或转为营利性企业，英伟达开源最强通用模型

国产大模型市场遇冷：挑战与机遇并存，一般人学大模型，我劝你算了吧

聊一聊大模型六小虎生存现状！

国内AI大模型已近80个，哪个最有前途？

专补大模型短板的RAG有哪些新进展？这篇综述讲明白了

AI多模态模型架构之LLM主干(1)：ChatGLM系列

2024年8月——大模型更新汇总

华为盘古大模型，让中医走向世界_2024年4月华为公司宣布推出什么大模型？_华为医学大模型

10几个国内AI大模型，让你的工作学习效率翻倍！_大模型 编程能力

大模型高考数学测评结果，国内AI大模型成绩超GPT-4o！

【大模型】大模型相关动态

讯飞星火：整体超越ChatGPT，医疗超越GPT4！一手实测在此_讯飞星火 医疗 大模型

“百模大战”打响，AI大模型彻底引爆应用新浪潮？

2024北京智源大会开幕，智源推出大模型全家桶及全栈开源技术基座新版图，大模型先锋集结共探AGI之路

开源模型越来越落后？Llama 3 说李总你真幽默

万亿赛道！多模态大模型典型应用及潜在应用场景 2024

大模型与程序员，究竟是谁吃了谁？

OpenAI 大神亲授，人人都能看懂的大模型入门教程（三）

发表评论

推荐文章

IDEA如何内嵌ChatGPT攻略（简单教程2分钟可配置！）

《Win10——常用快捷键》

鸿蒙系统源码获取,鸿蒙系统真机调试证书 和 设备ID获取

【CC++】vscode配置CC++环境

windows基于linux吗,为什么基于Linux的操作系统被认为比Windows更安全？

热门文章

打造一个实用的Ubuntu Linux

qlv转mp4格式工厂失败 解决方法

C++知识梳理

Literature Books

卢曼卡片盒笔记法的新观察视角

PS Tray Factory win7 系统托盘 软件用法

桌面刷新出现【MicrosoftOneNoteNamespaceExtensionforWindowsDesktopSearch】文件夹

国产大模型市场遇冷：挑战与机遇并存，一般人学大模型，我劝你算了吧

英伟达收购，ARM也要变美国公司，国产芯出路几何？

1 -《本地部署开源大模型》如何选择合适的硬件配置

最新文章

2022双十一7950x主机配置即简单测试

完美电脑主机一拖二，让你夫妻不再抢电脑，一台主机两人独立玩

电脑组装配置单及组装电脑图文详细教程

适合平面设计的无盘服务器配置,适合平面设计的电脑配置

桥接模式下EPICS与电脑主机建立TCP连接

主机 IPv6 地址自动配置过程

2w左右配置一台深度学习主机

常用装机天梯图汇总+均衡主机配置单

Nginx多个主机配置文件指南

DHCP（动态主机配置协议）

搭建个人深度学习环境（一）—— 单GPU主机配置

桌面显示电脑配置的PE_桌面好物之智能USB插线板，带分控和远控的就这一款

VirtualBox安装CentOs7【配置宿主机与虚拟机之间网络互通】

【mini主机】2024年两款高性能迷你主机推荐

主机内灯效细节：AMD锐龙75800X装机配置清单

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【`保证100%免费`】

10几个国内AI大模型，让你的工作学习效率翻倍！_大模型编程能力

讯飞星火：整体超越ChatGPT，医疗超越GPT4！一手实测在此_讯飞星火医疗大模型

鸿蒙系统源码获取,鸿蒙系统真机调试证书和设备ID获取

qlv转mp4格式工厂失败解决方法

PS Tray Factory win7 系统托盘软件用法

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载