标签:DIAMOND

世界模型也扩散!训练出的智能体竟然不错

日内瓦大学、爱丁堡大学和微软研究院的研究者联合提出了一种名为DIAMOND的强化学习智能体,该智能体在扩散世界模型中接受训练。DIAMOND在Atari 100k基准测试...