标签:细粒度控制

OpenAI发布最新大模型安全对齐奖励方法——RBR

随着AIGC领域的发展,大语言模型(LLM)如ChatGPT在应用落地中,安全性成为关键问题。传统RLHF方法存在数据更新成本高和标注者偏见等问题。为此,OpenAI提出...