Scaling Law瓶颈,Cursor编程为什么这么强?团队参与新研究掏出秘密武器

今日应用


今日话题


Scaling Law瓶颈,Cursor编程为什么这么强?团队参与新研究掏出秘密武器
Scaling Law瓶颈,Cursor编程为什么这么强?团队参与新研究掏出秘密武器
 

重点标签 CursorAI编程PlanSearch代码生成多样性

文章摘要


极市导读AI编程工具Cursor的研究者们发表了一篇论文,提出了一种名为PlanSearch的方法,通过搜索自然语言的规划来提升大型语言模型(LLM)的代码生成能力。

方法介绍PlanSearch是一种新的搜索方法,它不同于以往的搜索单个token或代码行的方法,而是搜索解决当前问题的可能规划。规划定义为有助于解决特定问题的高层级观察和草案的集合。PlanSearch通过生成大量有关问题的观察,并将这些观察组合成候选规划,以最大化地鼓励在思路空间中进行探索。

实验结果:实验采用了MBPP+、HumanEval+和LiveCodeBench三个评估基准。结果显示,PlanSearch在所有实验方法和模型上都取得了最佳分数,特别是在Claude 3.5 Sonnet上使用规划搜索方法时,在LiveCodeBench基准上得到了当前最佳的pass@200性能:77.0%。

总结:PlanSearch方法通过在自然语言的概念或想法的空间内进行搜索,成功提升了LLM的代码搜索能力。这一方法不仅提高了代码生成的准确性,还增加了生成代码的多样性,对于AI编程工具的发展具有重要意义。

文章来源


原文地址: 点我阅读全文
原文作者: 极市平台

© 版权声明

相关文章

暂无评论

暂无评论...