看 API 定价梯度
区分 input / output / cache,按你的实际 prompt 比例算单价。别只看官网首屏的最低价。
这一类是自己造底座模型的原始厂商。买他们的 API 等于直接对接源头,价格、并发限额、模型迭代节奏都最敏感。同一个能力,旗舰和上一代之间常常差 3-10 倍价格,选错版本就是直接烧钱。
区分 input / output / cache,按你的实际 prompt 比例算单价。别只看官网首屏的最低价。
上一代模型常被打折清库存,效果未必差太多。新任务先用旗舰跑通,再降级测能否扛住。
页面上打 free tag 的,是有真正免费 API 额度(如 Groq、Gemini);消费者会员的免费聊天不算。
境内业务需要数据不出境,看清模型节点和合同主体;跨境调用还要算上代理/专线成本。
硅基流动当前公开提供平台级免费额度、按量计费云服务,以及面向企业推理场景的多档预留实例月付方案。
Kimi 开放平台当前可确认提供 Kimi K2.6、K2 系列与 Moonshot V1 三档上下文的公开按量价格,以及 Batch API 6 折和联网搜索工具定价。
MiniMax 当前可确认 Token Plan 六档月付与六档年付、M2.7/M2.5 系列按量价格,以及多档语音和视频资源包。
智谱当前公开可确认 GLM Coding Plan 三档连续包季折扣、多款旗舰模型缓存存储限时免费、GLM-4.7-Flash 全免费、Batch API 五折、搜索工具 4 折体验包,以及部分模型免费商用授权入口。
DeepSeek 当前可确认提供 v4-flash 与 v4-pro 的新按量价格,其中 v4-pro 限时 2.5 折,缓存命中价格已降至首发价 1/10。
OpenAI 当前可确认 GPT-5.5、GPT-5.4、GPT-5.4 mini 按量价格,以及 Realtime / Image / Web search / Containers 与 Batch API 5 折。
Anthropic 当前公开提供 Claude Free、Pro、Max、Team、Enterprise 套餐,以及 Claude Platform API、Managed Agents、Web search、Code execution 等官方计费能力。
讯飞星辰 MaaS 当前可确认提供 Coding Plan 三档订阅套餐,另有首购优惠与邀请送推理服务礼品卡。
Xiaomi MiMo 当前可确认 Token Plan 四档订阅、夜间 8 折、连续包月低至 7 折、邀请赠金、TTS 全档位套餐限时免费及多档模型按量价格。
腾讯云当前公开提供通用 Token Plan 与 Hy Token Plan 两大系列个人版订阅套餐,共 8 档月付方案,覆盖龙虾、AI 编码与 Agent 工作负载场景。
阶跃星辰当前公开提供面向 Coding 与 Agent 场景的 4 档 Step Plan 订阅,以及普通 API 按量计费与多项限免模型。
商汤当前公开提供 SenseNova Token Plan Free 公测订阅,价格为 ¥0/月;Lite / Pro 仍处于即将上线状态。