PinnedPinnedPrivate
blog.normalcomputing.ai在中,我们介绍了Branches,这是我们用于原型设计和可视化高级LLM推理和规划算法的工具。然而,一旦任务需要长期规划或最新的世界知识,LLM代理的表现就会急剧下降。要看到目标驱动的推理在行动中,可以看看这个演示,我们在其中展示了基于树的推理如何帮助模型解释和纠正错误的代码,同时解决HumanEval 3 基准测试。在中,我们关注一个特定的目标驱动AI示例,它使用基于树的方法,并通过Python解释器的反馈进行增强。分支:基于图形的目标驱动AI原型设计 在Normal Computing,我们相信让人类参与其中对于AI的长期成功和实用性至关重要。我们使用ToT范式来解决HumanEval数据集上的编码问题,用于Python代码生成。你可以在我们的交互式演示中探索应用于HumanEval的思维树推理过程。在这里,我们已经使得开发和评估LLM规划和推理算法的新方法变得可行。