Vendor Models

zhipuai API 模型

zhipuai 当前整理 26 个模型,覆盖 音视频 1 个、文本 22 个、图像 1 个、代码 2 个 等方向,包含模型名称、标签、人民币价格、上下文参数、能力说明和 OpenAI compatible 接入方式。

zhipuai 模型能力概览

zhipuai API 页面按模型类型、标签、价格和上下文整理,方便开发者理解该厂商模型覆盖范围。当前能力分布:音视频 1 个、文本 22 个、图像 1 个、代码 2 个。

收录状态本站于 2026-05-08 生成当前厂商资料快照,并随数据源更新。
长上下文代表glm-4-long 1M;glm-4.6 200k;glm-4.6-thinking 200k
价格信息模型列表包含输入、输出、缓存或固定调用等人民币价格项,缺失项以控制台为准。
接入方式统一使用 https://api.aliapi.me/v1 作为 OpenAI compatible Base URL。

选型建议

  • 先按文本、代码、图像、音视频、检索等类型缩小范围。
  • 对比上下文窗口、最大输出、价格倍率和模型标签。
  • 生产接入前使用目标模型名称发起小流量测试,并观察调用日志、延迟和错误码。

常见问题

zhipuai API 有哪些模型?

zhipuai 当前收录 26 个模型,覆盖 音视频 1 个、文本 22 个、图像 1 个、代码 2 个 能力方向。

zhipuai 模型如何选择?

建议先按任务类型筛选,再结合价格、上下文、输出参数和同厂商模型对比。代表模型包括 cogvideox_video_api、glm-3-turbo、glm-4、glm-4-0520。

zhipuai API 如何接入?

在 SDK 或工具中使用 aliapi.me 的 OpenAI compatible Base URL,并填写页面列出的模型名称。

Model List

zhipuai 全部模型

点击模型名称进入独立模型详情页,查看上市/收录时间、能力、场景、价格和接入参数。

模型名称标签价格原价/倍率参数
cogvideox_video_api视频暂无价格--
glm-3-turbo上下文 128k / 输出 4k对话暂无价格倍率 1.786上下文 128k / 输出 4k
glm-4上下文 128k / 输出 4k对话输入 ¥100 / M tokens倍率 35.715上下文 128k / 输出 4k
glm-4-0520上下文 128k / 输出 4k对话输入 ¥100 / M tokens倍率 34.25上下文 128k / 输出 4k
glm-4-air上下文 128k / 输出 4k对话输入 ¥0.5 / M tokens倍率 0.3425上下文 128k / 输出 4k
glm-4-airx上下文 8k / 输出 4k对话输入 ¥10 / M tokens倍率 3.425上下文 8k / 输出 4k
glm-4-alltools上下文 128k / 输出 4k未标注暂无价格倍率 34.25上下文 128k / 输出 4k
glm-4-flash上下文 128k / 输出 4k对话暂无价格固定倍率 0上下文 128k / 输出 4k
glm-4-long上下文 1M / 输出 4k对话暂无价格倍率 0.7上下文 1M / 输出 4k
glm-4-plus上下文 128k / 输出 4k对话输入 ¥5 / M tokens倍率 2.5上下文 128k / 输出 4k
glm-4.5上下文 131.1k / 输出 131.1k函数工具对话推理输入 ¥3 / M tokens;输出 ¥14 / M tokens倍率 1.185上下文 131.1k / 输出 131.1k
glm-4.5-air上下文 131.1k / 输出 131.1k对话推理函数工具输入 ¥0.8 / M tokens;输出 ¥6 / M tokens倍率 0.3上下文 131.1k / 输出 131.1k
glm-4.5-airx上下文 131.1k / 输出 131.1k对话推理函数工具输入 ¥4 / M tokens;输出 ¥16 / M tokens倍率 2上下文 131.1k / 输出 131.1k
glm-4.5-x上下文 131.1k / 输出 131.1k对话推理函数工具输入 ¥12 / M tokens;输出 ¥32 / M tokens倍率 4上下文 131.1k / 输出 131.1k
glm-4.5v上下文 65.5k / 输出 16.4k推理视觉输入 ¥2 / M tokens;输出 ¥6 / M tokens倍率 0.79上下文 65.5k / 输出 16.4k
glm-4.6上下文 200k对话推理视觉输入 ¥3 / M tokens;输出 ¥14 / M tokens倍率 1.185上下文 200k
glm-4.6-thinking上下文 200k对话推理视觉输入 ¥3 / M tokens;输出 ¥14 / M tokens倍率 1.185上下文 200k
glm-4.6v上下文 128k图像分析多模态对话视觉输入 ¥1 / M tokens;输出 ¥3 / M tokens倍率 0.5上下文 128k
glm-4.7上下文 200k / 输出 128k对话推理输入 ¥3 / M tokens;输出 ¥14 / M tokens;缓存命中 ¥0.6 / M tokens倍率 1.185上下文 200k / 输出 128k
glm-4.7-guan上下文 200k / 输出 128k对话输入 ¥3 / M tokens;输出 ¥14 / M tokens;缓存命中 ¥0.6 / M tokens倍率 1.5上下文 200k / 输出 128k
glm-4.7-nothinking上下文 200k / 输出 128k对话输入 ¥3 / M tokens;输出 ¥14 / M tokens;缓存命中 ¥0.6 / M tokens倍率 1.185上下文 200k / 输出 128k
glm-4v上下文 2k对话输入 ¥50 / M tokens倍率 17.125上下文 2k
glm-4v-plus上下文 2k对话输入 ¥4 / M tokens倍率 3.425上下文 2k
glm-5上下文 200k / 输出 128k对话推理视觉输入 ¥4 / M tokens;输出 ¥18 / M tokens;缓存命中 ¥1 / M tokens倍率 1.58上下文 200k / 输出 128k
glm-5-turbo上下文 200k / 输出 128k代码对话输入 ¥7 / M tokens;输出 ¥26 / M tokens;缓存命中 ¥1.8 / M tokens倍率 3.5上下文 200k / 输出 128k
glm-5.1上下文 200k / 输出 128k代码对话推理输入 ¥8 / M tokens;输出 ¥28 / M tokens倍率 3.16上下文 200k / 输出 128k