摘要

GPT-Load 是一个基于 Go 的多模型 AI 接口透明代理平台,面向高并发与企业化场景,提供多通道接入、密钥管理、负载均衡、热重载配置与可视化运维能力。

核心价值在于尽量保持上游 API 兼容的接入体验,同时通过分组、权重、故障恢复与双重认证机制提升可用性与管控能力。单机可从轻量配置起步,集群场景可扩展到共享数据库与 Redis 的高可用部署。

功能与定位

gpt-load 是一个面向 OpenAI、Gemini、Anthropic 等上游服务的透明代理平台,目标是为团队提供统一的 AI 接入层与治理层。

项目重点不在“替代上游模型能力”,而在“保持原生调用习惯的同时增强可运维性”,例如密钥池管理、分组隔离、加权分发、请求日志与系统级配置管理。

典型使用场景

  • 团队需要同时接入多个 AI 服务商,并希望统一鉴权与调用入口。
  • 业务侧需要按项目或租户分组管理密钥、分配流量权重并做故障隔离。
  • 系统在高并发场景下需要更可控的可用性策略与运维可观测性。
  • 希望在不大幅改造客户端调用模式的前提下迁移到统一代理层。

核心功能

  • 透明代理与多通道支持:覆盖 OpenAI 兼容格式、OpenAI Responses、Gemini、Anthropic。
  • 密钥治理:支持分组管理、自动轮换、失败重试、黑名单与恢复。
  • 流量治理:支持多上游加权负载与故障转移。
  • 配置体系:静态环境变量与动态热重载配置并存,支持系统级与分组级策略。
  • 管理界面:提供仪表盘、密钥管理、请求日志、系统设置等 Web 控制台能力。
  • 认证隔离:管理端认证与代理端认证分离,支持全局与分组作用域的代理密钥。

特色与差异点

  • 兼容迁移路径清晰:围绕“端点替换 + 代理密钥”降低接入改造成本。
  • 兼顾轻量与扩展:可从单机方案起步,再演进到数据库与缓存协同的集群部署。
  • 运维导向的工程设计:在代理层内置配置热更新、可观测与故障处理机制。

使用方式概览

  • 部署层:可使用容器镜像快速启动,也可按源码方式部署。
  • 配置层:通过环境变量完成基础配置,再在管理界面进行系统级与分组级策略配置。
  • 接入层:客户端以分组路由方式访问代理入口,并使用代理密钥进行认证。

限制与注意事项

  • 集群模式依赖共享数据库与 Redis,部署前需先确认基础设施条件。
  • AUTH_KEYENCRYPTION_KEY 属于关键安全参数,必须使用强密钥并做好保管。
  • 启用加密后若密钥管理不当,可能带来数据不可恢复风险。
  • 作为代理层使用时,仍需遵守各上游 AI 服务的条款、配额与合规要求。

链接

关联主题