看 API 定价梯度
区分 input / output / cache,按你的实际 prompt 比例算单价。别只看官网首屏的最低价。
这一类是自己造底座模型的原始厂商。买他们的 API 等于直接对接源头,价格、并发限额、模型迭代节奏都最敏感。同一个能力,旗舰和上一代之间常常差 3-10 倍价格,选错版本就是直接烧钱。
区分 input / output / cache,按你的实际 prompt 比例算单价。别只看官网首屏的最低价。
上一代模型常被打折清库存,效果未必差太多。新任务先用旗舰跑通,再降级测能否扛住。
页面上打 free tag 的,是有真正免费 API 额度(如 Groq、Gemini);消费者会员的免费聊天不算。
境内业务需要数据不出境,看清模型节点和合同主体;跨境调用还要算上代理/专线成本。
硅基流动聚合 50+ 主流模型的 API 服务,提供 DeepSeek-V4-Pro/Flash、GLM-5/5.1、Qwen3.6/3.5、Kimi-K2.6、MiniMax-M2.5 等模型按量计费,同时提供大量免费模型(Embedding/OCR/TTS/图片生成)和企业级预留实例服务。
火山方舟提供 Coding Plan、Agent Plan 订阅套餐,支持 Doubao/DeepSeek/GLM/MiniMax/Kimi 等多模型,兼容 Claude Code、Cursor、OpenClaw 等主流编程工具。同时提供按量付费、TPM 保障包、节省计划月度钱包等灵活计费方案。
小米 MiMo 开放平台提供 Token Plan 四档订阅套餐、mimo-v2.5 系列按量计费定价及 TTS 限时免费。
智谱提供 GLM Coding Plan 三档编程订阅、GLM-4.7-Flash 全免费、新用户 2000 万 Tokens 及 Batch API 五折优惠。
Anthropic 当前公开提供 Claude Free、Pro、Max、Team、Enterprise 套餐,以及 Claude Platform API、Managed Agents、Web search、Code execution 等官方计费能力。
DeepSeek 当前可确认提供 deepseek-v4-flash 与 deepseek-v4-pro 的最新按量价格,其中 deepseek-v4-pro 限时 75% off,缓存命中输入价格已降至首发价 1/10。
讯飞星火提供 Spark 系列(Lite/Pro/Ultra/X2/X2-Flash)及星辰 MaaS 开源模型服务,X2-Flash 有 5 档套餐包,MaaS 平台接入 GLM-5.1、Qwen3.6、DeepSeek-V3.2 等主流开源模型。
MiniMax 提供 Token Plan 标准版/极速版订阅套餐,覆盖 M2.7/M2.7-highspeed 全模态模型,同时提供文本、语音、视频、音乐、图像按量计费及资源包。
Kimi 提供 K2.6/K2.5/Moonshot V1 多模型 API 按量计费,同时通过 Kimi 会员/Kimi Code 提供 4 档编程订阅套餐(Andante~Allegro),兼容 Claude Code、Cursor、OpenClaw 等主流工具。
OpenAI 当前可确认 GPT-5.5、GPT-5.4、GPT-5.4 mini 按量价格,以及 Realtime / Image / Web search / Containers 与 Batch API 5 折。