OMG-Agent:Android自动化利器,自然语言轻松操控
OMG-Agent是一款开源的Android自动化助手,支持自然语言指令,适用于开发者、AI爱好者及效率控,具备丰富的模型支持和跨平台部署能力。
OMG-Agent简介
OMG-Agent是一款基于自然语言指令的开源移动端自动化助手,专为Android手机操作设计,支持多种GUI模型和跨平台部署,适合开发者、AI爱好者及效率控使用。

项目亮点
- 开源透明:完全开源,托管于GitHub,支持二次开发与社区共建
- 自然语言驱动:输入如“打开微信发消息给张三”的指令,即可完成手机自动化任务
- 模型支持丰富:内置支持AutoGLM和GELab-Zero等知名手机GUI模型
- ADB实时操控:通过ADB接口与Android设备交互,支持截图、操作执行等功能
- 双语界面 + 主题切换:中英文界面自由切换,支持暗色/亮色模式
- 兼容性强:支持真实Android手机和模拟器,兼容OpenAI接口调用
使用流程概览
- 安装ADB环境
- Windows:
scoop install adb - macOS:
brew install android-platform-tools - Linux:
apt install adb
- Windows:
- 克隆并运行
git clone https://github.com/safphere/OMG-Agent.git cd OMG-Agent pip install -r requirements.txt python run.py - 手机配置
- 开启开发者选项 + USB调试
- 安装ADBKeyboard输入法
- 使用USB连接手机并授权
- 开始使用
- 点击「刷新」识别设备
- 点击「开始投屏」预览界面
- 输入自然语言任务并点击「执行」
支持模型介绍
| 模型名称 | 来源 | 特点 |
|---|---|---|
| AutoGLM-Phone-9B | 智谱AI | 针对手机GUI操作优化的大模型 |
| GELab-Zero-4B-preview | 阶跃星辰 | 适用于通用手机Agent任务的轻量模型 |
这些模型均为专门训练的手机图形界面大模型,可高效处理复杂操作任务。
适合谁使用?
- 想用自然语言远程操控手机的极客玩家
- 研究自动化UI测试或Agent技术的开发者
- 从事AI Agent产品研发、验证与测试的团队
- 有多设备协同需求的自动化工作者
OMG-Agent获取项目
安装地址:网盘

GitHub开源地址:https://github.com/safphere/OMG-Agent/