Deep Agents v0.5

📌 一句话摘要

LangChain 的 Deep Agents v0.5 引入了用于处理长时间运行任务的非阻塞异步子智能体，并扩展了多模态支持，涵盖了 PDF、音频和视频。

📝 详细摘要

Deep Agents v0.5 版本专注于通过异步执行和更广泛的多模态能力来增强智能体工作流。主要更新是引入了异步子智能体，允许监督智能体将复杂、耗时的任务委托给远程服务器，而不会阻塞其自身的执行循环。这实现了并行任务管理、跨线程的有状态交互，以及异构模型架构的使用。该版本还采用了 Agent Protocol 以实现标准化通信，并扩展了虚拟文件系统，以支持对 PDF、音频和视频文件的原生处理。

💡 主要观点

- 异步子智能体实现了针对长时间运行任务的非阻塞委托。 与阻塞监督者的内联子智能体不同，异步子智能体在远程服务器上独立执行，允许主智能体保持用户交互并管理多个并行任务。

通过 Agent Protocol 实现标准化，确保了互操作性。 通过实现 Agent Protocol，Deep Agents 可以与任何兼容的远程服务器通信，支持在任务更新期间保留对话上下文的有状态线程。

扩展了对多种文件类型的多模态支持。 该框架现在可以通过 read_file 工具自动检测并处理 PDF、音频和视频文件，并将它们作为原生内容块传递给兼容的模型。

支持异构和分布式智能体部署。 此更新允许轻量级编排器将工作委托给运行在不同硬件上或使用不同模型配置文件的专用智能体，从而优化资源使用。

💬 文章金句

- 异步子智能体消除了这一限制。监督者可以并行启动多个子智能体，继续与用户进行对话，并在结果可用时进行收集。

任何实现了 Agent Protocol 的远程智能体都是异步子智能体的有效目标。
交互模型是“即发即忘”（fire-and-forget）的：主智能体启动任务，继续工作或与用户交谈，并在需要时检查结果。
此版本将多模态支持扩展到了 PDF、音频、视频和其他文件类型。智能体使用相同的 read_file 工具；无需进行 API 更改。

📊 文章信息

AI 评分：91

来源：LangChain Blog

作者：Chester Curme

分类：人工智能

语言：英文

阅读时间：4 分钟

字数：954

标签： LangChain, AI 智能体, 异步编程, 多模态 LLM, Agent Protocol

阅读完整文章

Deep Agents v0.5

🤖 問 AI