#0091 AI agent

🗒️#0091 AI agent

type

status

date

slug

summary

tags

category

icon

password

核心概念：

代理（Agent）：代理是一个应用程序，它通过观察世界并使用其可用的工具来尝试实现目标。代理是自主的，可以独立于人类干预行动，尤其是在被赋予了明确的目标或目的时。代理可以主动地实现其目标，即使没有明确的人工指令，也可以推理出下一步该做什么。 代理的核心在于将推理、逻辑和对外部信息的访问连接到生成式 AI 模型。

认知架构：代理的认知架构描述了代理如何获取信息、进行内部推理以及使用推理来指导其下一步行动或决策的循环过程。认知架构由三个基本组件构成：模型、工具和编排层。

模型：在代理的范围内，模型指的是用作代理流程的中心决策者的语言模型 (LM)。模型可以是通用模型、多模态模型，也可以根据特定代理架构的需求进行微调。
工具：工具弥合了语言模型与外部世界之间的差距，使代理能够与外部数据和服务进行交互。工具的形式多种多样，但通常与常见的 Web API 方法（如 GET、POST、PATCH 和 DELETE）一致。
编排层：编排层管理代理如何接收信息，进行内部推理，并利用推理来决定下一步行动或决策。这个循环会一直持续，直到代理达到其目标或停止点。编排层的复杂性可以根据代理和执行的任务而变化。

代理与模型：

模型的知识仅限于其训练数据，而代理可以通过工具连接到外部系统来扩展其知识。
模型基于用户查询进行单次推理或预测，没有会话历史记录或连续上下文的管理。代理管理会话历史记录，以允许多轮推理和基于用户查询和编排层中做出的决策进行预测。
模型没有本地工具实现，而代理在其架构中原生实现工具。
模型没有原生逻辑层，用户可以使用推理框架（如 CoT、ReAct）来形成复杂的提示以指导模型进行预测。代理具有使用推理框架的本地认知架构，例如 CoT、ReAct 或其他预构建的代理框架，如 LangChain。

工具类型：

扩展 (Extensions)：扩展以标准化的方式弥合了 API 和代理之间的差距，允许代理无缝执行 API，而无需考虑其底层实现。扩展通过示例来教导代理如何使用 API 端点，以及调用 API 端点所需的参数。

函数 (Functions)：函数是完成特定任务的自包含代码模块，可以根据需要重复使用。模型可以采用一组已知的函数，并根据其规范决定何时使用每个函数以及该函数需要哪些参数。与扩展不同的是，函数在客户端执行，而扩展在代理端执行。函数调用使开发人员可以更精细地控制应用程序中的数据流。

数据存储 (Data Stores)：数据存储允许开发人员以其原始格式向代理提供额外的数据，无需进行耗时的数据转换、模型再训练或微调。数据存储通常以向量数据库的形式实现，代理可以使用它来提取信息。数据存储使代理能够访问各种格式的数据，例如网站内容、结构化数据（PDF、Word 文档、CSV、电子表格等）和非结构化数据（HTML、PDF、TXT 等）。

认知架构和推理框架：

ReAct：一种提示工程框架，为语言模型提供了一种思考过程策略，以便对用户查询进行推理和采取行动。

Chain-of-Thought (CoT)：一种提示工程框架，可以通过中间步骤实现推理能力。

Tree-of-Thoughts (ToT)：一种提示工程框架，非常适合探索或战略前瞻性任务，允许模型探索各种思维链。

编排层 使用提示工程和相关框架来指导推理和规划。

工具的使用和选择：

扩展：当开发人员希望代理控制与 API 端点的交互时使用。当利用预构建的扩展时，例如 Vertex Search 或 Code Interpreter，非常有用。也适用于多跳规划和 API 调用。

函数调用：当安全或身份验证限制阻止代理直接调用 API 时使用。当时间限制阻止代理实时调用 API 时也使用，例如批量操作。

数据存储：当开发人员想要使用各种数据类型（例如网站内容、结构化或非结构化数据）实现检索增强生成 (RAG) 时使用。

增强模型性能的定向学习方法：

上下文学习：在推理时，为通用模型提供提示、工具和少量的示例，使其能够“动态”学习如何以及何时针对特定任务使用这些工具。

基于检索的上下文学习：通过从外部存储器中检索最相关的信息、工具和相关示例，动态填充模型提示。

基于微调的学习：在推理之前，使用更大的特定示例数据集训练模型。

其他要点：

LangChain 和 LangGraph：这些开源库允许用户通过“链接”逻辑、推理和工具调用序列来构建自定义代理。

Vertex AI 代理：Google 的 Vertex AI 平台提供了一个完全托管的环境，其中包含构建生产级应用程序所需的所有基本要素。它简化了代理的定义和部署，并提供了测试、评估和调试工具。

迭代方法：构建复杂的代理架构需要迭代方法。实验和改进是找到特定业务案例和组织需求的解决方案的关键。

代理扩展了语言模型的能力，使其能够访问实时信息、建议实际操作并自主规划和执行复杂的任务。通过结合不同的工具和推理框架，可以构建强大的应用程序来解决各种问题。

Loading...