AI Agents 的七大启示：研究与应用

Bitget App

交易“智”变

Bitget

资讯中心

ChainFeeds2024/11/23 18:26

作者:Rituals

Chainfeeds 导读：

近年来，基于大型语言模型（LLM）的自主代理在架构、记忆、感知、推理与行动等方面不断发展，在多个领域展现出重新定义可能性的潜力。

文章来源：

https://www.hellobtc.com/kp/du/11/5549.html

文章作者：

Rituals

观点：

Rituals：近年来，基于大型语言模型（LLM）的自主代理在感知、记忆、推理与行动等方面的能力显著增强，推动了智能体在多个领域的应用。现代代理的架构通常包括档案模块、记忆模块、感知能力、推理与规划，以及行动模块。其中，记忆模块是核心，决定了代理是否能够有效适应动态环境并进行长期规划。代理的记忆分为统一记忆和混合记忆。统一记忆处理短期信息，利用上下文窗口存储当前交互数据；混合记忆则结合短期与长期记忆，通过外部数据库保存关键信息，便于高效回忆。例如，统一记忆可通过文本截取和注意力机制优化处理效率，而混合记忆则通过嵌入向量和数据库存储，提升信息检索的广度和深度。此外，代理可以通过「记忆反思」总结经验，增强推理能力。推理与规划是智能代理完成复杂任务的关键能力，允许代理通过任务分解制定计划并实时调整策略。这一模块按反馈类型分为两类：无反馈的规划与有反馈的规划。无反馈规划适合较为稳定的环境，通过「思维链」（Chain of Thought, CoT）技术将复杂任务分解为简单步骤，逐步执行。相比之下，有反馈规划适合动态环境，代理能够根据实时变化调整计划，确保任务完成。无反馈规划中的单路径推理和多路径推理各有优势。单路径推理适合线性任务，能通过思维链逐步引导模型完成复杂问题。而多路径推理允许代理同时探索多个解决方案，从中选择最佳路径，如「自一致性思维链」（CoT-SC）通过评估多个路径输出，选取最优解。多智能体系统通过协调多个智能体协作完成复杂任务，在规划、执行与决策方面表现出色。其架构通常分为水平结构与垂直结构。水平结构允许智能体共享信息，通过集体决策优化任务效率，适用于工具使用或咨询场景；而垂直结构则通过管理者角色监督任务分解与执行，适合需要精炼解决方案的复杂任务。混合架构（DyLAN）结合了水平与垂直结构，允许智能体在同层协作的同时动态调整层级。DyLAN 通过引入代理排名模型和重要性评分系统，在协作过程中选择最相关的代理，避免资源浪费。此外，多智能体系统中的协作类型分为无序合作和有序合作：无序合作类似头脑风暴，适合探索性任务；有序合作按流程互动，适用于高效完成结构化任务。值得注意的是，对抗性多智能体框架通过竞争和反馈机制提升代理能力。例如，AlphaGo Zero 通过自我对弈优化策略，而语言模型系统通过辩论与「以牙还牙」机制提升推理质量。然而，这种方法带来了计算开销增加与潜在错误风险。研究还显示，多智能体系统可能会出现志愿行为、一致性行为以及破坏性行为，需通过基准测试评估整体效能，确保协作安全与稳定。

内容来源