Gemini Balance:智能化的Google Gemini API代理与负载均衡解决方案

Gemini Balance是一款基于Python和FastAPI的智能代理工具,提供多Key轮询、负载均衡、权限过滤和健康监控等功能,兼容OpenAI接口格式,助力开发者高效构建高可用的Gemini服务栈。

6AI工具智能代理负载均衡多Key管理Gemini API

Gemini Balance采用Python和FastAPI技术,集成了多Key轮询、负载均衡、权限过滤和健康监控等功能,向下兼容OpenAI接口格式,旨在帮助开发者构建高效、稳定的Gemini服务。

Gemini Balance:高效管理多Key的Google Gemini API代理与负载均衡

Gemini Balance:高效管理多Key的Google Gemini API代理与负载均衡

Gemini Balance:高效管理多Key的Google Gemini API代理与负载均衡

Gemini Balance:高效管理多Key的Google Gemini API代理与负载均衡

Gemini Balance:高效管理多Key的Google Gemini API代理与负载均衡

Gemini Balance:高效管理多Key的Google Gemini API代理与负载均衡

Gemini Balance:高效管理多Key的Google Gemini API代理与负载均衡

Gemini Balance:高效管理多Key的Google Gemini API代理与负载均衡

Gemini Balance:高效管理多Key的Google Gemini API代理与负载均衡

核心功能介绍

Gemini Balance支持在同一实例中管理多组Gemini API Key,并通过轮询算法分摊流量,降低单Key触发速率限制的风险。同时,它还提供了丰富的文档和配置选项,方便用户进行定制化设置。

Gemini Balance:高效管理多Key的Google Gemini API代理与负载均衡

Gemini Balance:高效管理多Key的Google Gemini API代理与负载均衡

Gemini Balance:高效管理多Key的Google Gemini API代理与负载均衡

关键特性

多Key轮询与负载均衡

  • 自动按顺序轮询多个Gemini API Key,均衡请求负载并提升并发能力。
  • 可配置最大重试次数与失败自动禁用策略,定时检测恢复失效Key。

实时状态监控

  • 提供认证访问的/keys_status页面,实时展示各Key的使用情况与健康指标。
  • 详细日志记录帮助快速排查错误与性能瓶颈。

灵活的协议与模型支持

  • 同时兼容Gemini和OpenAI格式的CHAT、画图及embeddings接口。
  • 支持IMAGE_MODELS、SEARCH_MODELS等配置,分别用于图文对话、联网搜索和修图功能。
  • 可过滤不常用模型,自动从API获取最新模型列表。

新增与优化功能

  • countTokens API支持:在发送前预估token数量。
  • 智能thinkingConfig处理:当thinkingBudget为0时自动省略该配置。
  • 反向代理与本地开发指南:包含nginx、SSL证书、hosts配置等。
  • 管理脚本:支持一键切换代理、更新端口与完整移除。

技术实现与兼容性

栈与架构

  • Python + FastAPI:利用异步特性高效处理并发请求,性能优于传统同步框架。
  • Nginx + SSL/mkcert:官方示例脚本一键生成本地证书,快速配置HTTPS反向代理。

容器化部署

  • 官方镜像适配AMD与ARM架构,docker pull ghcr.io/snailyp/gemini-balance:latest即可落地生产环境;也可自行构建镜像定制插件。

网络与代理支持

  • 可为每个请求单独指定HTTP/SOCKS5代理;亦支持将Gemini官方或自建Cloudflare Worker代理作为上游端点,灵活适配不同网络场景。

快速上手

  1. 配置环境变量:在.env中写入API_KEYS=