(相关资料图)
7月5日,麻省理工学院和微软的研究学者们发现,人工智能(AI)模型GPT-4具有卓越的代码自我纠错能力,而GPT-3.5不具备这种特性。目前相关论文已经在相关学术平台进行发布。 当前市场上涌现了一批为编写代码而研发的AI模型,但更多的仅作为辅助开发者编写代码的工具,如微软的Copilot助理等。这些AI模型目前只能生成代码片段,还不能完全替代人工开发者。 然而,通过研究GPT-4,研究人员表示,当前实际上可以通过模型的自我纠错方式令模型“反思”自身存在的不足,在提升代码片段长度的同时,也能改善输出结果的准确度。 来自爱丁堡大学的研究者符尧表示,只有GPT-4具备自我改进的能力,而较弱的GPT-3.5没有这种特性。这一发现表明大型模型可能具有一种新型能力,即通过用户反馈令AI自我纠错,获取令用户满意的结果。这种自我纠错的能力可能只存在于足够成熟的AI模型中。 经过自我纠错后,GPT-4模型产生的代码中有71%满足了研究人员的要求。在GPT-4对GPT-3.5生成的代码进行纠错后,批准的代码比例也达到了54%。 研究人员指出,目前可以在工商业中应用GPT-4的自我纠错方式,即使扣除一系列纠错冗余成本后,仍可获得一定收益。鉴于论文能在一定程度上反映未来行业趋势,预计未来将出现一批基于GPT-4的代码生成器。