Continual Learning of Large Language Models: A Comprehensive Survey|电子爱好者

admin管理员组
文章数量:1530255

本文是LLM系列文章，针对《Continual Learning of Large Language Models: A Comprehensive Survey》的翻译。

大型语言模型的持续学习：综合调查

摘要
1 引言
2 前言
3 持续学习与大型语言模型：概述
4 连续大型语言模型的学习阶段
5 评估协议和数据集
6 讨论
7 结论

摘要

有效和高效地将静态预训练的大型语言模型（LLM）适应不断发展的数据分布的挑战仍然是主要的。当为特定需求量身定制时，经过预训练的LLM在先前的知识领域中经常会出现明显的性能下降，这种现象被称为“灾难性遗忘”。尽管在持续学习（CL）领域进行了广泛的研究，但这个问题在LLMs领域呈现出新的表现形式。在本次调查中，我们全面概述并详细讨论了CL背景下LLMs的当前研究进展。除了介绍初步知识外，本次调查还分为四个主要部分：我们首先描述了持续学习LLMs的概述，包括两个方向的连续性：垂直连续性（或垂直持续学习），即从一般能力到特定能力的持续适应，以及水平连续性（或称水平持续学习）（即跨时间和领域的持续适应）（第3节）。遵循垂直连续性，我们总结了现代CL背景下学习LLM的三个阶段：连续预训练（CPT）、领域自适应预训练（DAP）和连续微调（CFT）（第4节）。然后，我们概述了LLM持续学习的评估协议，以及当前可用的数据源&#x

本文标签： Large Learning Continual language Survey

版权声明：本文标题：Continual Learning of Large Language Models: A Comprehensive Survey 内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/dianzi/1725896606a1047716.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

Continual Learning of Large Language Models: A Comprehensive Survey

大型语言模型的持续学习：综合调查

摘要

更多相关文章

Graph Structure Learning（图结构学习综述）

Machine Learning-A Probabilistic Perspective笔记——第一章 INTRODUCTION

Differentially Private Federated Learning: A Client Level Perspective

【资源】Machine Learning A Bayesian_and Optimization Perspective(MLBOP)

Machine Learning: A Probabilistic Perspective on Neur

【Real-Time Detection survey】实时目标检测网络综述论文 A Comprehensive Study of Real-Time Object Detection Network

《A Comprehensive Survey on Transfer Learning》论文解读

Comprehensive Privacy Analysis of Deep Learning

Deep Learning for Visual Tracking: A Comprehensive Survey(单目标跟踪目前最好的综述类文章)

A Comprehensive Survey on Graph Anomaly Detection with Deep Learning——前言

论文阅读 【CVPR-2022】 A Large-scale Comprehensive Dataset and Copy-overlap Aware Evaluation Protocol for

【图神经网络综述】A Comprehensive Survey on Graph Neural Networks（V4）

【阅读笔记】PPFL全面综述文章: A Comprehensive Survey of Privacy-preserving Federated Learning

多智能体强化学习经典综述A Comprehensive Survey of Multi-Agent Reinforcement Learning翻译

综述笔记：A comprehensive survey on Graph Neural Networks

[SAM]A Comprehensive Survey on Segment Anything Model for Vision and Beyond

MME: A Comprehensive Evaluation Benchmark for Multimodal Large Language Models

深度学习编译器对比：The Deep Learning Compiler A Comprehensive Survey

GOT-10k: A Large High-Diversity Benchmark forGeneric Object Tracking in the Wild（论文翻译）

about foreign language,especially english

发表评论

推荐文章

LeetCode 2383. Minimum Hours of Training to Win a Competition

ChatGPT高效提问—prompt实践（白领助手）

安装window7系统

Gitee的使用

硬盘安装Win7

热门文章

容器部署的nextcloud配置onlyoffice时开启密钥

二阶段提交协议（Two Phase Commitment Protocol）

硬盘格式化为EXT4扩展分区方法

推荐一款好用的浏览器Yandex

Chrome浏览器数据迁移

谷歌浏览器（Chrome 浏览器）如何关闭“阅读清单”

确定MacLinux系统的架构类型是 x86-64（amd64），还是 arm64 架构

电脑开机运行内存占用过高的解决办法

虚拟机打不开文件“D:*****.vmdk“问题解决

【教程】在UEFI启动方式下，通过GRUB2引导，直接从硬盘ISO文件安装Windows10和Ubuntu双系统

最新文章

Win10查看屏保的存储位置

windows10 任务管理器被管理员禁用解决办法

解决 windows10 的 代理频繁被自动篡改为windows10.microdone.cn的解决办法亲测有效

如何清理Win10旧系统更新文件和恶意广告插件

Windows10 安装kali linux子系统

windows系统引导配置命令

Win10系统如何永久关闭Windows defender？

新手必需知道的查看Windows系统是否被重启的方法

windows10中linux子系统目录大小写敏感的设置

Windows系统删除大量文件导致系统卡顿解决方案

windows下如何查看linux分区文件,查找Windows和Linux中磁盘分区使用的文件系统，就用这几招...

安装Windows 10时出现 Windows无法打开所需的文件 E:Sourcesinstall.wim 错误代码0x8007000D的解决办法

win10和ubuntu双系统安装，没有win10引导（快速修复）

Windows10创建工作组、加入工作组、查看工作组包含的所有电脑

如何解决Windows系统下的QT中文乱码

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

论文阅读【CVPR-2022】 A Large-scale Comprehensive Dataset and Copy-overlap Aware Evaluation Protocol for

解决 windows10 的代理频繁被自动篡改为windows10.microdone.cn的解决办法亲测有效

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载