还在人工炼丹?自动提示工程指南来了,还带从头实现

今日应用


今日话题


还在人工炼丹?自动提示工程指南来了,还带从头实现
还在人工炼丹?自动提示工程指南来了,还带从头实现
 

重点标签 自动提示词工程APELLM提示词优化代码实现

文章摘要


谷歌研究者Heiko Hotz近期发布了一篇关于自动提示词工程APE)的详细介绍,这是一种自动生成和优化LLM提示词的技术,旨在提升模型在特定任务上的性能。APE的核心思想是将提示词视为超参数,通过自动化的方式进行优化,类似于传统机器学习中的自动超参数优化。APE的工作流程包括提供有标注数据集、初始提示词和评估指标,然后通过迭代生成响应、评估响应和优化提示词,最终选择最佳提示词。

文章还介绍了两种优化提示词的策略:随机提示词优化和通过提示操作进行优化(OPRO)。随机提示词优化采用暴力搜索方法,而OPRO则利用之前迭代的结果,有意识地提升在评估指标上的表现。此外,文章还提到了少样本提示技术(few-shot prompting)和样本选择(exemplar selection)在APE中的应用。

为了实现APE,作者使用Python、Vertex AI和Gemini 1.5模型从头开始实现了OPRO算法。首先准备了geometric_shapes数据集作为训练和测试数据,然后创建了基线评估,并尝试了思路链(CoT)推理作为提示技术。接下来,实现了OPRO优化器,包括设置模型和配置、构建元提示词、OPRO循环以及将结果组织起来。最终,在测试数据上验证了经过优化的提示词,准确度达到了85%,相比CoT提示词提升了31个百分点。

总之,APE通过自动化的方式优化提示词,可以显著提升LLM的性能,释放其全部潜力。

文章来源


原文地址: 点我阅读全文
原文作者: 机器之心

© 版权声明

相关文章

暂无评论

暂无评论...