OMG-Agent:Android自动化利器,自然语言轻松操控

OMG-Agent是一款开源的Android自动化助手,支持自然语言指令,适用于开发者、AI爱好者及效率控,具备丰富的模型支持和跨平台部署能力。

5AI工具Android自动化自然语言指令开源工具GUI模型

OMG-Agent简介

OMG-Agent是一款基于自然语言指令的开源移动端自动化助手,专为Android手机操作设计,支持多种GUI模型和跨平台部署,适合开发者、AI爱好者及效率控使用。

68747470733a2f2f692e6d6565652e636f6d2e74772f54574b796f54652e676966 | OMG-Agent:开源安卓自动化助手,通过自然语言操控手机任务

项目亮点

  • 开源透明:完全开源,托管于GitHub,支持二次开发与社区共建
  • 自然语言驱动:输入如“打开微信发消息给张三”的指令,即可完成手机自动化任务
  • 模型支持丰富:内置支持AutoGLM和GELab-Zero等知名手机GUI模型
  • ADB实时操控:通过ADB接口与Android设备交互,支持截图、操作执行等功能
  • 双语界面 + 主题切换:中英文界面自由切换,支持暗色/亮色模式
  • 兼容性强:支持真实Android手机和模拟器,兼容OpenAI接口调用

使用流程概览

  1. 安装ADB环境
    • Windows: scoop install adb
    • macOS: brew install android-platform-tools
    • Linux: apt install adb
  2. 克隆并运行
    git clone https://github.com/safphere/OMG-Agent.git cd OMG-Agent pip install -r requirements.txt python run.py 
  3. 手机配置
    • 开启开发者选项 + USB调试
    • 安装ADBKeyboard输入法
    • 使用USB连接手机并授权
  4. 开始使用
    • 点击「刷新」识别设备
    • 点击「开始投屏」预览界面
    • 输入自然语言任务并点击「执行」

支持模型介绍

模型名称来源特点
AutoGLM-Phone-9B智谱AI针对手机GUI操作优化的大模型
GELab-Zero-4B-preview阶跃星辰适用于通用手机Agent任务的轻量模型

这些模型均为专门训练的手机图形界面大模型,可高效处理复杂操作任务。

适合谁使用?

  • 想用自然语言远程操控手机的极客玩家
  • 研究自动化UI测试或Agent技术的开发者
  • 从事AI Agent产品研发、验证与测试的团队
  • 有多设备协同需求的自动化工作者

OMG-Agent获取项目

安装地址:网盘

68747470733a2f2f692e6d6565652e636f6d2e74772f54574b796f54652e676966 | OMG-Agent:开源安卓自动化助手,通过自然语言操控手机任务

GitHub开源地址:https://github.com/safphere/OMG-Agent/