Gemini Balance 以 Python + FastAPI 为核心,整合多 Key 轮询、负载均衡、权限过滤与健康监控,并向下兼容 OpenAI 接口格式。最新版在性能、文档与安全性上全面升级,引入 countTokens 端点、自动思考配置优化、本地与云端双向代理指南,以及 ARM/AMD Docker 镜像,帮助开发者快速构建高可用的 Gemini 服务栈。

Gemini Balance介绍

Gemini Balance 是一个开源 Gemini API 代理与负载均衡器,支持在同一实例中管理多组 Gemini API Key,并通过轮询算法分摊流量,显著降低单 Key 触发速率限制的风险。相比上游版本,当前 Fork 进一步修复配置缺陷、强化安全策略,并补全繁体中文与英文文档,方便跨地区团队协作。

Gemini Balance:高效管理多Key的Google Gemini API代理与负载均衡

Gemini Balance关键功能

多 Key 轮询与负载均衡

  • 自动按顺序轮询多个 Gemini API Key,均衡请求负载并提升并发能力

Gemini Balance:高效管理多Key的Google Gemini API代理与负载均衡

  • 可配置最大重试次数与失败自动禁用策略,定时检测恢复失效 Key

Gemini Balance:高效管理多Key的Google Gemini API代理与负载均衡

实时状态监控

  • 提供认证访问的 /keys_status 页面,实时展示各 Key 的使用情况与健康指标

  • 详细日志记录帮助快速排查错误与性能瓶颈

Gemini Balance:高效管理多Key的Google Gemini API代理与负载均衡 Gemini Balance:高效管理多Key的Google Gemini API代理与负载均衡

灵活的协议与模型支持

  • 同时兼容 Gemini 和 OpenAI 格式的 CHAT、画图及 embeddings 接口

  • 支持 IMAGE_MODELS、SEARCH_MODELS 等配置,分别用于图文对话、联网搜索和修图功能

Gemini Balance:高效管理多Key的Google Gemini API代理与负载均衡

  • 可过滤不常用模型,自动从 API 获取最新模型列表

新增与优化功能

  • countTokens API 支持:在发送前预估 token 数量

  • 智能 thinkingConfig 处理:当 thinkingBudget 为 0 时自动省略该配置

  • 反向代理与本地开发指南:包含 nginx、SSL 证书、hosts 配置等

  • 管理脚本:支持一键切换代理、更新端口与完整移除

技术实现与兼容性

栈与架构

  • Python + FastAPI:利用异步特性高效处理并发请求,性能优于传统同步框架。
  • Nginx + SSL/mkcert:官方示例脚本一键生成本地证书,快速配置 HTTPS 反向代理。

容器化部署

  • 官方镜像适配 AMD 与 ARM 架构,docker pull ghcr.io/snailyp/gemini-balance:latest 即可落地生产环境;也可自行构建镜像定制插件。

网络与代理支持

  • 可为每个请求单独指定 HTTP/SOCKS5 代理;亦支持将 Gemini 官方或自建 Cloudflare Worker 代理作为上游端点,灵活适配不同网络场景。

快速上手

  1. 配置环境变量:在 .env 中写入 API_KEYS="key1,key2",按需填写 PROXIESFILTERED_MODELS
  2. 启动服务:本地执行 python main.py 或使用 docker compose up -d
  3. 调用接口
    # OpenAI 格式
    curl http://localhost:8000/v1/chat/completions -H "Authorization: Bearer sk-..."  
    # Gemini 格式
    curl http://localhost:8000/gemini/v1beta/models/gemini-pro:generateContent  
    

    两种协议均支持图文对话、联网搜索与自定义模型过滤。

Gemini Balance适用场景

  • 个人或团队需要统一管理多把 Gemini Key,提升调用上限。
  • AI 应用希望无缝迁移自 OpenAI,兼顾 Gemini 最新多模态能力。
  • 对安全合规、可观测性与高可用性有硬性要求的生产部署。

借助 Gemini Balance,你可以在最短时间内获得稳定、易扩展且对开发者友好的 Gemini 代理服务,为应用接入最新多模态模型扫清障碍。

Gemini Balance 项目地址

官网地址:https://gb-docs.snaily.top/

GitHub:https://github.com/yulin0629/gemini-balance

  1. 转载或引用本文内容,请保留原文链接并注明来源。
  2. 本站内容主要用于信息整理、技术研究与经验分享,不对第三方产品或服务的可用性、完整性作出任何明示或暗示的保证。
  3. 部分内容可能来源于公开网络或开源社区,如涉及版权或其他合法权益问题,请通过下方联系方式与我们联系,我们将在核实后及时处理。
  4. 本文所提及的工具、项目或解决方案仅供学习与研究参考。如涉及商业使用,请自行确认并遵守相关软件、平台或服务的授权条款。
  5. 反馈与联系(# 替换为 @):feedback#abskoop.com