AI Flow Pool
Operations Dashboard — zzz.prism.ink
加载中...
CF Neurons 今日已用
010,000
NV Credits 已用
05,000
今日路由次数
Granite-Micro 路由器
Vision Bridge
☁️ Cloudflare Workers AI
正常
预算类型Neurons / 日
日预算10,000
安全限额9,500
安全边际500 neurons
省量模式
重置时间UTC 00:00(北京 08:00)
🟢 NVIDIA NIM
正常
预算类型Lifetime Credits
总额度5,000
安全限额4,950(留 50)
速率限制40 RPM
今日请求
重置永不(lifetime)
📈 今日调度分布
加载中...
🤖 模型节点实时状态

显示所有注册模型的能力评分、延迟追踪和心跳状态。绿色 = 健康,黄色 = 缓慢,红色 = 异常。

🏗️ AI Flow Pool — 多平台免费 API 聚合中转站

零费用运行的智能 AI 中转代理,聚合 Cloudflare Workers AI 和 NVIDIA NIM 两大平台的免费额度,通过智能路由、复合评分和严格预算防护,为开发者提供高质量的 AI 模型服务。

请求处理流程
📥
请求入口
OpenAI 兼容 API — /v1/chat/completions
🛡️
预算防护
预飞行成本检查,确保零费用
🖼️
视觉桥接
自动检测图片,用视觉模型提取文字
🧭
意图路由
Granite-Micro 分类 Easy/Medium/Hard
⚖️
复合评分
ability × speed × preference 选最优模型
模型执行
CF Workers AI / NVIDIA NIM 执行推理
🔄
降级兜底
失败自动 fallback → 零成本 Beta
Cloudflare Workers AI
预算10,000 neurons/天
重置UTC 00:00
模型数8 个 + 1 Vision Bridge
NVIDIA NIM
预算5,000 lifetime credits
重置永不重置
模型数10 个
🔑 核心技术特性
🛡️ 零费用防护
预飞行成本检查、neuron 投影预测、安全边际缓冲、超限自动降级
⚖️ 复合评分
ability × speed × preference 三维权重,难度自适应:Hard 重能力,Easy 重速度
🖼️ Vision Bridge
自动检测图片,Llama-3.2-11B-Vision 提取文字描述,~15 neurons/张
📊 动态延迟追踪
EMA 算法实时追踪每个模型的响应延迟和成功率
🔄 智能降级
快速 NV → CF GLM → 省量模型 → 零成本 Beta → 服务停止
🧭 意图路由
Granite-Micro 路由器 + 关键词二次校验,精准分类 Easy/Medium/Hard
📋 版本迭代历程
v7.0.0 2026-04-02
Strict Zero-Cost Guard + Vision Bridge
  • 🛡️ 严格零费用防护:预飞行成本检查 + neuron 投影 + 安全边际
  • 🖼️ Vision Bridge:自动图片→文字提取,非视觉模型也能理解图片
  • CF 安全边际 500 neurons,NV 安全边际 50 credits
  • 单请求 neuron 上限 800,超限自动降级
  • 双平台耗尽 → 零成本 Beta 模式
v6.0.0 2026-04-02
Latency-Aware Smart Routing
  • 动态延迟追踪(EMA 算法)
  • 复合评分:ability × 0.4 + speed × 0.3 + preference × 0.3
  • 请求超时 + 自动 fallback(NV 10s/CF 15s)
  • UNSTABLE 模型排除出默认选择
  • 用户偏好加成:GLM > Kimi > Claude
v5.0.0 2026-04-01
NVIDIA NIM Multi-Model Integration
  • 接入 NVIDIA NIM 平台(5000 lifetime credits)
  • 10+ NV 模型:Mistral-119B, Nemotron-120B, QwQ-32B 等
  • 智能路由器(Granite-Micro)意图分类
  • CF + NV 双平台负载均衡
v4.0.0 2026-03-31
Multi-Model Smart Router
  • Granite-Micro 路由器:自动分类 Easy/Medium/Hard
  • GLM-4.7-Flash + Qwen-Coder + QwQ + GPT-OSS 多模型池
  • 零成本 Beta 模型兜底
  • neuron 消耗追踪 + 自动降级
v3.0.0 2026-03-30
OpenAI-Compatible Proxy Foundation
  • OpenAI 兼容 API(/v1/chat/completions)
  • Cloudflare Workers AI 绑定
  • Streaming + Non-streaming 支持
  • KV 用量追踪