谷歌最新推出了一款名为Code Broker的多智能体系统,该系统基于谷歌的Agent开发套件(ADK)构建。Code Broker旨在分析Python源代码,无论是单个文件、本地目录树还是远程GitHub仓库,都能生成结构化且可操作的代码质量评估报告。
Code Broker采用分层式五智能体架构。其中,一个根协调器(root orchestrator)负责统筹全局,它协调一个顺序执行的管道智能体(sequential pipeline agent)。该管道智能体随后并行调度三个专业智能体:正确性评估器(Correctness Assessor)、风格评估器(Style Assessor)和描述生成器(Description Generator)。在这些智能体完成各自任务后,其发现会被整合到改进推荐器(Improvement Recommender)中进行最终的综合。
评估报告量化了四个关键质量维度:正确性、安全性、代码风格和可维护性,并将结果以标准化分数呈现。报告同时支持Markdown和HTML两种格式输出,方便开发者集成到不同的工作流程中。
在技术实现上,Code Broker巧妙地融合了大语言模型(LLM)的语义推理能力与Pylint等工具提供的确定性静态分析信号。为了增强系统在面对瞬时API故障时的健壮性,它采用了带有指数退避重试逻辑的异步执行机制。此外,系统还探索并应用了轻量级会话内存,以便在多次运行中保留和查询之前的评估上下文。
该项目以技术报告的形式呈现,重点介绍了系统设计、提示工程(prompt engineering)和工具编排(tool orchestration)等方面的经验。团队对不同规模的代表性Python代码库进行了初步的定性评估。
评估结果表明,并行运行的专业智能体能够生成可读性强、面向开发者的反馈,有效补充了传统代码检查(linting)的不足。但报告也坦诚指出了当前系统的局限性,包括评估深度、安全工具集成、大型仓库处理能力以及仅依赖内存持久化等方面的不足。该系统的所有代码和复现材料均已公开。