第一印象与上手体验
访问Alumnium网站后,我立即被其简洁、面向开发者的设计所吸引。首页毫不浪费时间地展示了一个使用三个直观命令(do、check、get)的代码片段。标语“弥合人工测试与自动化测试之间的鸿沟”明确了期望。我点击了“开始”,并被引导到一个包含Python和TypeScript示例的GitHub仓库。设置过程非常简单——通过pip或npm安装,配置你的AI提供商(Anthropic、OpenAI、Gemini等),然后开始用自然语言编写测试。仪表盘不是一个独立的UI;相反,Alumnium作为一个库运行,你可以将其导入到现有的测试框架(例如pytest)中。我很欣赏我可以在保持通常工作流程的同时注入AI驱动的命令。
Alumnium的工作原理(技术深度剖析)
Alumnium利用大型语言模型将自然语言指令转换为浏览器交互。你可以编写类似 al.do(“创建任务‘买牛奶’”) 的代码,它会处理元素选择、点击和输入。该系统使用应用程序的无障碍树,如果需要,还会使用页面截图来确定正确的操作。在底层,你可以选择Anthropic、Google Gemini、OpenAI、Meta Llama、DeepSeek或Mistral的模型——甚至包括推理模型以提高准确性。在我的测试中,我使用do和check编写了一个简单的登录流程。AI正确识别了用户名和密码字段,并验证了成功消息。Alumnium还提供了一个MCP(模型上下文协议)服务器,允许通用AI代理如Claude Code自动化Web和移动应用。这是专用测试自动化和更广泛AI工作流之间的巧妙桥梁。该工具目前支持Python测试框架(pytest、unittest),并承诺支持JavaScript和Ruby。它与Playwright、Selenium和Appium紧密集成,因此你可以在不更改测试逻辑的情况下切换驱动程序。
市场定位与定价
Alumnium将自己定位为以工程师为中心的替代方案,区别于Testim或Katalon等低代码或记录回放工具。与那些不同,它不会为你生成完整的脚本;相反,它处理微交互,而你保留对测试结构和断言的控制。这吸引了那些希望获得AI速度而不牺牲精度的资深QA工程师。Alumnium声称在WebVoyager基准测试上达到98.5%,这是衡量Web代理性能的领先指标——尽管我无法独立验证。定价未在网站上公开列出;唯一的行动号召是“当Alumnium Pro发布时通知我”。开源核心是免费的,Pro层可能增加团队协作、高级分析或优先模型访问等功能。目前,任何人都可以免费使用该库,仅受其选择的AI提供商API费用限制。这种免费增值模式对于采用来说是明智的,但让企业无法猜测未来的成本。
结论:谁应该使用它?
Alumnium对于熟悉Python或TypeScript并希望加快浏览器测试创建的软件和QA工程师来说是一个强大的工具。它的自然语言命令减少了样板代码,使测试更易读。与多种AI提供商的集成以及对Web和移动的支持使其具有灵活性。然而,该工具仍处于早期阶段——JavaScript和其他语言“正在开发中”,Pro定价未定义。如果你需要一个成熟、一体化且带有GUI的测试自动化套件,可以考虑Testim或Mabl等替代品。但如果你更喜欢一种开放的、代码优先的方法来增强现有框架,Alumnium今天值得一试。我发现MCP服务器在将AI代理连接到真实浏览器自动化方面特别创新。Alumnium不是万能的——它仍然需要清晰的指令和对浏览器无障碍模型的一定理解——但它确实减少了编写自动化测试的摩擦。
访问Alumnium官网 https://alumnium.ai/ 亲自探索。
评论