Gemini Balance:智能化的Google Gemini API代理与负载均衡解决方案
Gemini Balance是一款基于Python和FastAPI的智能代理工具,提供多Key轮询、负载均衡、权限过滤和健康监控等功能,兼容OpenAI接口格式,助力开发者高效构建高可用的Gemini服务栈。
Gemini Balance采用Python和FastAPI技术,集成了多Key轮询、负载均衡、权限过滤和健康监控等功能,向下兼容OpenAI接口格式,旨在帮助开发者构建高效、稳定的Gemini服务。









核心功能介绍
Gemini Balance支持在同一实例中管理多组Gemini API Key,并通过轮询算法分摊流量,降低单Key触发速率限制的风险。同时,它还提供了丰富的文档和配置选项,方便用户进行定制化设置。



关键特性
多Key轮询与负载均衡
- 自动按顺序轮询多个Gemini API Key,均衡请求负载并提升并发能力。
- 可配置最大重试次数与失败自动禁用策略,定时检测恢复失效Key。
实时状态监控
- 提供认证访问的/keys_status页面,实时展示各Key的使用情况与健康指标。
- 详细日志记录帮助快速排查错误与性能瓶颈。
灵活的协议与模型支持
- 同时兼容Gemini和OpenAI格式的CHAT、画图及embeddings接口。
- 支持IMAGE_MODELS、SEARCH_MODELS等配置,分别用于图文对话、联网搜索和修图功能。
- 可过滤不常用模型,自动从API获取最新模型列表。
新增与优化功能
- countTokens API支持:在发送前预估token数量。
- 智能thinkingConfig处理:当thinkingBudget为0时自动省略该配置。
- 反向代理与本地开发指南:包含nginx、SSL证书、hosts配置等。
- 管理脚本:支持一键切换代理、更新端口与完整移除。
技术实现与兼容性
栈与架构
- Python + FastAPI:利用异步特性高效处理并发请求,性能优于传统同步框架。
- Nginx + SSL/mkcert:官方示例脚本一键生成本地证书,快速配置HTTPS反向代理。
容器化部署
- 官方镜像适配AMD与ARM架构,
docker pull ghcr.io/snailyp/gemini-balance:latest即可落地生产环境;也可自行构建镜像定制插件。
网络与代理支持
- 可为每个请求单独指定HTTP/SOCKS5代理;亦支持将Gemini官方或自建Cloudflare Worker代理作为上游端点,灵活适配不同网络场景。
快速上手
- 配置环境变量:在.env中写入API_KEYS=