微软开源通用多Agent系统：Magentic-One

人工智能

发布日期: 2024-11-10

文章字数: 1k

阅读时长: 3 分

阅读次数:

微软近日宣布开源其最新的多Agent系统——Magentic-One，它能够轻松应对法律、医疗、金融、教育等多个行业的日常工作任务。

例如，Magentic-One能够在线浏览，自动发现论文中未被引用的新研究，并对其进行总结，最后将这些信息写入txt文件中。此外，它还能对大量金融数据进行深度分析，为金融机构制定风险管理策略，包括市场波动和企业财务数据，同时预测潜在的安全风险。

Magentic-One的核心功能

Magentic-One基于多智能体架构，由5个层级组成，各层级协同工作，以提高任务的自动解析和执行效率：

Orchestrator：负责任务分解、规划、指导其他智能体执行子任务、跟踪整体进度，并在必要时采取纠正措施。
WebSurfer：利用AI大模型操作和解析网页浏览器内容，执行特定任务。
FileSurfer：基于大模型，读取多种本地文件并执行预定任务，如整合和重写。
Coder：基于大模型，主要负责编写、分析信息和创建代码。
ComputerTerminal：主程序控制台，执行Coder编写的程序，并安装新的编程库。

当Magentic-One接收到一个自动化任务时，Orchestrator会将任务分解为多个子任务，并明确各子任务的目标和流程。例如，在分析网站数据并编写报告的任务中，Orchestrator会指派WebSurfer获取网站数据，FileSurfer读取本地文档，Coder编写报告，而ComputerTerminal则运行数据处理程序。

WebSurfer会根据Orchestrator的要求，执行搜索、点击链接、与在线元素交互等操作，收集相关数据。FileSurfer则读取本地文件，提取有用信息。这些数据汇总到Coder智能体后，Coder会编写代码进行数据处理，并根据任务要求创建新内容。

ComputerTerminal提供控制台功能，执行Coder编写的程序，并在需要时安装新的编程库。