MetaGPT 发布 RealDevWorld：92% 精准度碾压 Claude-IT业界-PHP中文网

MetaGPT 发布 RealDevWorld：92% 精准度碾压 Claude

霞舞

发布： 2025-09-03 18:18:14

原创

199人浏览过

metagpt团队近日发布了一款端到端的自动化测试解决方案——realdevworld，在ai赋能的软件开发圈内引发广泛关注。这款工具凭借卓越的性能和高效的测试能力，在realdevbench基准测试中斩获92%的准确率，评估一致性甚至超越了claude等领先大模型。

RealDevWorld基于MetaGPT先进的多智能体架构打造，致力于实现从代码生成到质量验证的全流程自动化。其核心模块AppEvalPilot可模拟专业测试工程师的工作流，依据产品需求和使用场景边界执行系统性验收测试，并支持全天候持续运行，全面覆盖各类测试任务。

MetaGPT 发布 RealDevWorld：92% 精准度碾压 Claude

与传统测试工具不同，RealDevWorld引入动态评估机制，摆脱了静态测试基准的束缚，能够灵活应对复杂多变的开发环境。其测试效率极为突出：平均仅需8至9分钟即可完成对一个应用内15到20个功能模块的完整检测，单次测试成本低至约0.26美元，显著降低了团队的测试开销。

在RealDevBench基准评测中，RealDevWorld展现出惊人实力，不仅实现了92%的高精准度，更在评估结果的一致性方面优于Anthropic推出的Claude模型。这一成就得益于MetaGPT多智能体协同框架的深度优化，并融合了GPT-4o与Claude3.5-Sonnet的强大推理能力。

借助智能化的任务拆解与多代理协作机制，RealDevWorld能精准捕捉代码中的潜在缺陷，并输出高质量、可读性强的测试报告。

该工具的一大优势在于其统一的代码基础架构，全面支持Web、移动及桌面三大平台。开发者无需为不同平台重复编写测试脚本，极大简化了跨平台测试流程。无论是网页端的UI校验、移动端的交互行为测试，还是桌面程序的功能验证，RealDevWorld均可提供一致且可靠的测试体验。