标签:SAFE

Jason Wei点赞!Google DeepMind推出新的大模型幻觉评估方案,模型越大越事实精准

发现1:LLMs可以生成大规模的提示集。使用GPT-4生成LongFact,包含38个主题的2,000多个提示。发现2:LLMs可以用作事实性的自动评级器。提出了SAFE,将回答分...