🛡️ 零费用防护
预飞行成本检查、neuron 投影预测、安全边际缓冲、超限自动降级
⚖️ 复合评分
ability × speed × preference 三维权重,难度自适应:Hard 重能力,Easy 重速度
🖼️ Vision Bridge
自动检测图片,Llama-3.2-11B-Vision 提取文字描述,~15 neurons/张
📊 动态延迟追踪
EMA 算法实时追踪每个模型的响应延迟和成功率
🔄 智能降级
快速 NV → CF GLM → 省量模型 → 零成本 Beta → 服务停止
🧭 意图路由
Granite-Micro 路由器 + 关键词二次校验,精准分类 Easy/Medium/Hard