Meta KDD Cup 2024 CRAG: Comphrehensive RAG Benchmark参赛指南（写了一半跑去改大论文了所以没正式参赛）|电子爱好者

admin管理员组
文章数量:1530034

诸神缄默不语-个人CSDN博文目录

因为比赛过程正好和我毕业答辩的时间段高度重合，所以我……最后其实还是相当于没有成功参赛。
呃反正现在已经咕咕咕了，就把当时写了一半（一小半）的参赛指南发一下吧。

官网：AIcrowd | Meta Comprehensive RAG Benchmark: KDD Cup 2024 | Challenges

注册一个AIcrowd账号就可以参赛，参赛后可以组队。现在（2024.5.21）已经进入Round 1b阶段了，在Round 1阶段有有效提交的队伍就可以进入Round 2阶段。

每周限制提交10次（每个任务）。

一共是3个任务，任务一是提供5个离线网站做RAG，任务二在任务一的基础上增加了一个KG API，任务三在任务二的基础上将离线网站提升为50个。
数据奇难无比。

官方baseline：https://gitlab.aicrowd/aicrowd/challenges/meta-comprehensive-rag-benchmark-kdd-cup-2024/meta-comphrehensive-rag-benchmark-starter-kit/-/blob/master/docs/baselines.md

如何开始提交：

fork https://gitlab.aicrowd/aicrowd/challenges/meta-comprehensive-rag-benchmark-kdd-cup-2024/meta-comphrehensive-rag-benchmark-starter-kit

将forked repo克隆到本地，开始开发

添加SSH key到AIcrowd GitLab：https://gitlab.aicrowd/-/profile/keys

克隆：

git clone git@gitlab.aicrowd:<YOUR-AICROWD-USERNAME>/meta-comphrehensive-rag-benchmark-starter-kit.git
cd meta-comphrehensive-rag-benchmark-starter-kit

我的策略基本上就是用LLaMA3-7B了，主要因为80B那个版本没法微调，其次也因为我队友已经下好了8B的weights所以我直接用就行。

1. 任务一

https://www.aicrowd/challenges/meta-comprehensive-rag-benchmark-kdd-cup-2024/problems/meta-kdd-cup-24-crag-retrieval-summarization

baseline：DummyModel 全部输出“我不知道”

得分：{‘score’: 0.0, ‘exact_accuracy’: 0.0, ‘accuracy’: 0.0, ‘hallucination’: 0.0, ‘missing’: 1.0, ‘n_miss’: 10, ‘n_correct’: 0, ‘n_correct_exact’: 0, ‘total’: 10}

baseline：vanilla LLaMA3直接输出问题的答案

得分：{‘score’: -0.4, ‘exact_accuracy’: 0.0, ‘accuracy’: 0.2, ‘hallucination’: 0.6, ‘missing’: 0.2, ‘n_miss’: 2, ‘n_correct’: 2, ‘n_correct_exact’: 0, ‘total’: 10}

本文标签：写了跑去正式指南论文

版权声明：本文标题：Meta KDD Cup 2024 CRAG: Comphrehensive RAG Benchmark参赛指南（写了一半跑去改大论文了所以没正式参赛）内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/xitong/1725898007a1047884.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

Meta KDD Cup 2024 CRAG: Comphrehensive RAG Benchmark参赛指南（写了一半跑去改大论文了所以没正式参赛）

1. 任务一

baseline：DummyModel 全部输出“我不知道”

baseline：vanilla LLaMA3直接输出问题的答案

更多相关文章

AIGC专栏-1.Stable Diffusion 图片生成AI模型 Windows Mac部署指南

Consensus-AI论文搜索引擎 直接从论文中找答案

全面对比与选择指南：Milvus、PGVector、Zilliz及其他向量数据库

Thinkpad T400 安装Windows 7 指南

用好 AI 编程，运维早下班：Baidu Comate 智能代码助手下的 Linux 运维指南

今日arXiv精选 | 23篇顶会论文：ICASSPICCVCIKMICMEAAAI

selenium实战指南:如何防止被浏览器检测?

企业IT管理员IE11升级指南【7】—— Win7和Win8.1上的IE11功能对比

xp升级win7_重装经典的Win7系统指南

艾永亮：如何打造超级产品，建立难忘的用户体验，这里有一份指南

linux系统路由器地址查询,查找路由器登录IP地址指南

还儿童一个健康上网环境，正式开启我的路由器URL网址白名单之旅

2050 Programming Competition(正式赛题解 持续更新中 及检讨)

不用再找了，吐血整理 ChatGPT 论文润色、降重、写作指令手册~ 【2024年 更新】

不用再找了，吐血整理ChatGPT 新手使用手册~ (论文润色、降重指令)

Nature：两位科学家在不到一个小时的时间用ChatGPT生成了一篇研究论文

不用再找了，吐血整理ChatGPT 论文新手使用手册~ (含论文润色指令~)

不用再找了，吐血整理ChatGPT 3.54.0新手使用手册~ (含论文润色指令~)

GEE注册详细指南，第二次注册，亲测成功.

超详细的免费下载论文方法

发表评论

推荐文章

Mac M1版电脑安装ps、pr

chrome浏览器无法编辑cookie解决办法

默认浏览器中无chrome浏览器下如何设置

pycharm 激活、永久 Mac，Win，Windows，Lunix

电脑开机突然变得很慢？是机器老化么？你该了解了解这些了

热门文章

mysql使用group_contact有个很坑的

计算机蓝屏代码0x0000007b,电脑开机出现蓝屏代码0x0000007b怎么办?

AutoCAD2024下载，CAD2024简体中文版软件安装视频

怎样把U盘格式化成NTFS格式

解决方案：h5网页外部浏览器唤起微信分享，唤起微信面板，分享朋友圈方案，兼容大部分浏览器

Chrome浏览器开发者工具（F12）设置为中文

泰坦之路手机版怎么登陆服务器未响应,泰坦之旅一直登入不进去怎么办

Win10怎么进入安全模式修复系统

报错：Can‘t load IA 32-bit .dll on a AMD 64-bit platform

win10系统，mysql-installer-community-5.7.19.0.msi安装

最新文章

2021年山东省职业院校技能大赛 高职组 “信息安全管理与评估”赛项样题

JetBrains IntelliJ IDEA 优化教程

Parallels对Mac的损害大吗 pd虚拟机怎么设置内存和CPU 运行Parallels发热

Linux基本使用-vmware及centos安装-day01

云上武功秘籍（四）金蝶最新产品KIS全版本华为云部署

IDEA简介及使用

2023.5.15老男孩网络安全集训营第一节

c#物联网_C# 开发工具比较

IDEA使用技巧

Diffblue Cover AI Java：Difflane如何利用Diffblue Cover AI实现Java自动化的单元测试

2021最新IDEA初级入门详细教程流出，开发组小伙伴怒赞

1-1 IDEA的下载安装

r5处理器_【玩码】RedmiBook 三款齐发，标配最新锐龙 4000 系列处理器

idea部署tomcat并实现简单的web项目

JAVA之开发神器——IntelliJ IDEA的下载与安装

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

Consensus-AI论文搜索引擎直接从论文中找答案

2050 Programming Competition(正式赛题解持续更新中及检讨)

不用再找了，吐血整理 ChatGPT 论文润色、降重、写作指令手册~ 【2024年更新】

2021年山东省职业院校技能大赛高职组 “信息安全管理与评估”赛项样题

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载