分享
推理与代理
输入“/”快速插入内容
推理与代理
用户5190
2024年7月30日修改
[
幻灯片
]
建议阅读:
1.
Orca:从 GPT-4 的复杂解释痕迹中进行渐进式学习
2.
从最少到最多的提示使大型语言模型能够进行复杂的推理
3.
ReAct:语言模型中的推理与行动协同
4.
BAGEL:通过语言引导探索来引导代理
5.
WebArena:用于构建自主代理的现实 Web 环境
附加阅读材料:
1.
推理还是背诵?通过反事实任务探索语言模型的能力和局限性
2.
回应:大型语言模型中出现的类比推理
3.
WebLINX:具有多轮对话的真实世界网站导航