标签:OpenAI o1

北大对齐团队独家解读:OpenAI o1开启「后训练」时代强化学习新范式

OpenAI o1的发布标志着Post-Training Scaling Laws的强力体现,它在数学、代码、长程规划等问题上取得了显著进步。这一进步部分归因于构建了庞大的逻辑数据集...