推理与代理

输入“/”快速插入内容

推理与代理

用户5190

2024年7月30日修改

建议阅读：

1.

Orca：从 GPT-4 的复杂解释痕迹中进行渐进式学习

2.

从最少到最多的提示使大型语言模型能够进行复杂的推理

3.

ReAct：语言模型中的推理与行动协同

4.

BAGEL：通过语言引导探索来引导代理

5.

WebArena：用于构建自主代理的现实 Web 环境

附加阅读材料：

1.

推理还是背诵？通过反事实任务探索语言模型的能力和局限性

2.

回应：大型语言模型中出现的类比推理

3.

WebLINX：具有多轮对话的真实世界网站导航