标签:优化视角

ICML 2024:AI对齐与可变和可影响奖励函数

在当前的AI对齐技术中,一个关键问题被忽视了:人类的偏好和价值观可能会随着时间和与AI系统的交互而发生变化。为了解决这一问题,研究人员引入了动态奖励马...