AI可直接操作桌面:新工具实现跨平台自动化控制
3月25日,开源开发者Tommaso De Rossi发布名为usecomputer的桌面自动化命令行工具,该工具基于Zig语言构建原生二进制文件,无需依赖Node.js运行时环境,使AI编程助手如Claude Code、Codex及OpenCode等能够直接调用系统级交互功能。
跨系统支持与核心指令集全面覆盖
工具兼容macOS与Linux(X11及通过XWayland支持Wayland),提供包括屏幕截图、鼠标移动、点击、拖拽、滚动以及键盘输入与快捷键组合在内的完整命令行接口,满足高精度自动化需求。
智能坐标转换与模型上下文优化
usecomputer内置坐标映射系统(coord-map),可将图像中的像素位置自动映射至实际屏幕坐标;截图输出默认将最长边缩放至1568像素,以适配主流大模型的上下文窗口限制。
集成能力强化:支持内联图像输入
通过启用Kitty Graphics Protocol,设置相应环境变量后,截图可直接嵌入模型输入流中,实现视觉反馈与指令执行的无缝衔接,提升人机协作效率。
