首页
系统
动态
电子资讯
硬件
数码
软件介绍
网络软件
系统工具
应用软件
图形图像
多媒体
编程开发
字体下载
登录
标签
CLARE
Offline : CLARE: Conservative Model-Based Reward Learning for Offline Inverse Reinforcement Learning
ICLR 2023 paper code Intro 离线逆强化学习由于 协变量偏移 textbf{协变量偏移} 协变量偏移问题容易导致所学的 奖励函数外推误差 textbf{奖励函数外推误差} 奖励函数外推误差。这种误差可能使得学
Conservative
Model
offline
CLARE
Based
admin
6小时前
8
0