标签:模型安全

北大对齐团队独家解读:OpenAI o1开启「后训练」时代强化学习新范式

OpenAI o1的发布标志着Post-Training Scaling Laws的强力体现,它在数学、代码、长程规划等问题上取得了显著进步。这一进步部分归因于构建了庞大的逻辑数据集...

中国发布《生成式AI安全基本要求》,涵盖训练数据、生成内容等

全国网络安全标准化技术委员会发布了《网络安全技术 生成式人工智能服务安全基本要求》征求意见稿,旨在加强生成式人工智能(AI)的安全性。意见稿分为三部分...