🗒️#0091 AI agent

type
status
date
slug
summary
tags
category
icon
password
 
核心概念:
  • 代理(Agent):代理是一个应用程序,它通过观察世界并使用其可用的工具来尝试实现目标。 代理是自主的,可以独立于人类干预行动,尤其是在被赋予了明确的目标或目的时。 代理可以主动地实现其目标,即使没有明确的人工指令,也可以推理出下一步该做什么。 代理的核心在于将推理、逻辑和对外部信息的访问连接到生成式 AI 模型
  • 认知架构:代理的认知架构描述了代理如何获取信息、进行内部推理以及使用推理来指导其下一步行动或决策的循环过程。 认知架构由三个基本组件构成:模型、工具和编排层
    • 模型:在代理的范围内,模型指的是用作代理流程的中心决策者的语言模型 (LM)。 模型可以是通用模型、多模态模型,也可以根据特定代理架构的需求进行微调。
    • 工具:工具弥合了语言模型与外部世界之间的差距,使代理能够与外部数据和服务进行交互。 工具的形式多种多样,但通常与常见的 Web API 方法(如 GET、POST、PATCH 和 DELETE)一致。
    • 编排层:编排层管理代理如何接收信息,进行内部推理,并利用推理来决定下一步行动或决策。 这个循环会一直持续,直到代理达到其目标或停止点。 编排层的复杂性可以根据代理和执行的任务而变化。
  • 代理与模型
    • 模型的知识仅限于其训练数据,而代理可以通过工具连接到外部系统来扩展其知识。
    • 模型基于用户查询进行单次推理或预测,没有会话历史记录或连续上下文的管理。代理管理会话历史记录,以允许多轮推理和基于用户查询和编排层中做出的决策进行预测。
    • 模型没有本地工具实现,而代理在其架构中原生实现工具。
    • 模型没有原生逻辑层,用户可以使用推理框架(如 CoT、ReAct)来形成复杂的提示以指导模型进行预测。代理具有使用推理框架的本地认知架构,例如 CoT、ReAct 或其他预构建的代理框架,如 LangChain。
工具类型:
  • 扩展 (Extensions):扩展以标准化的方式弥合了 API 和代理之间的差距,允许代理无缝执行 API,而无需考虑其底层实现。 扩展通过示例来教导代理如何使用 API 端点,以及调用 API 端点所需的参数。
  • 函数 (Functions):函数是完成特定任务的自包含代码模块,可以根据需要重复使用。 模型可以采用一组已知的函数,并根据其规范决定何时使用每个函数以及该函数需要哪些参数。 与扩展不同的是,函数在客户端执行,而扩展在代理端执行。 函数调用使开发人员可以更精细地控制应用程序中的数据流。
  • 数据存储 (Data Stores):数据存储允许开发人员以其原始格式向代理提供额外的数据,无需进行耗时的数据转换、模型再训练或微调。 数据存储通常以向量数据库的形式实现,代理可以使用它来提取信息。数据存储使代理能够访问各种格式的数据,例如网站内容、结构化数据(PDF、Word 文档、CSV、电子表格等)和非结构化数据(HTML、PDF、TXT 等)。
认知架构和推理框架:
  • ReAct:一种提示工程框架,为语言模型提供了一种思考过程策略,以便对用户查询进行推理和采取行动。
  • Chain-of-Thought (CoT):一种提示工程框架,可以通过中间步骤实现推理能力。
  • Tree-of-Thoughts (ToT):一种提示工程框架,非常适合探索或战略前瞻性任务,允许模型探索各种思维链。
  • 编排层 使用提示工程和相关框架来指导推理和规划。
工具的使用和选择:
  • 扩展:当开发人员希望代理控制与 API 端点的交互时使用。 当利用预构建的扩展时,例如 Vertex Search 或 Code Interpreter,非常有用。 也适用于多跳规划和 API 调用。
  • 函数调用:当安全或身份验证限制阻止代理直接调用 API 时使用。当时间限制阻止代理实时调用 API 时也使用,例如批量操作。
  • 数据存储:当开发人员想要使用各种数据类型(例如网站内容、结构化或非结构化数据)实现检索增强生成 (RAG) 时使用。
增强模型性能的定向学习方法:
  • 上下文学习:在推理时,为通用模型提供提示、工具和少量的示例,使其能够“动态”学习如何以及何时针对特定任务使用这些工具。
  • 基于检索的上下文学习:通过从外部存储器中检索最相关的信息、工具和相关示例,动态填充模型提示。
  • 基于微调的学习:在推理之前,使用更大的特定示例数据集训练模型。
其他要点:
  • LangChain 和 LangGraph:这些开源库允许用户通过“链接”逻辑、推理和工具调用序列来构建自定义代理。
  • Vertex AI 代理:Google 的 Vertex AI 平台提供了一个完全托管的环境,其中包含构建生产级应用程序所需的所有基本要素。 它简化了代理的定义和部署,并提供了测试、评估和调试工具。
  • 迭代方法:构建复杂的代理架构需要迭代方法。 实验和改进是找到特定业务案例和组织需求的解决方案的关键。
代理扩展了语言模型的能力,使其能够访问实时信息、建议实际操作并自主规划和执行复杂的任务。 通过结合不同的工具和推理框架,可以构建强大的应用程序来解决各种问题。
 
Loading...

© xiyu 2022-2025