Vendor Models

zhipuai API 模型

zhipuai 当前整理 26 个模型，覆盖音视频 1 个、文本 22 个、图像 1 个、代码 2 个等方向，包含模型名称、标签、人民币价格、上下文参数、能力说明和 OpenAI compatible 接入方式。

查看模型接入文档

zhipuai 模型能力概览

zhipuai API 页面按模型类型、标签、价格和上下文整理，方便开发者理解该厂商模型覆盖范围。当前能力分布：音视频 1 个、文本 22 个、图像 1 个、代码 2 个。

收录状态本站于 2026-05-08 生成当前厂商资料快照，并随数据源更新。

长上下文代表glm-4-long 1M；glm-4.6 200k；glm-4.6-thinking 200k

价格信息模型列表包含输入、输出、缓存或固定调用等人民币价格项，缺失项以控制台为准。

接入方式统一使用 https://api.aliapi.me/v1 作为 OpenAI compatible Base URL。

选型建议

先按文本、代码、图像、音视频、检索等类型缩小范围。
对比上下文窗口、最大输出、价格倍率和模型标签。
生产接入前使用目标模型名称发起小流量测试，并观察调用日志、延迟和错误码。

常见问题

zhipuai API 有哪些模型？

zhipuai 当前收录 26 个模型，覆盖音视频 1 个、文本 22 个、图像 1 个、代码 2 个能力方向。

zhipuai 模型如何选择？

建议先按任务类型筛选，再结合价格、上下文、输出参数和同厂商模型对比。代表模型包括 cogvideox_video_api、glm-3-turbo、glm-4、glm-4-0520。

zhipuai API 如何接入？

在 SDK 或工具中使用 aliapi.me 的 OpenAI compatible Base URL，并填写页面列出的模型名称。

Model List

zhipuai 全部模型

点击模型名称进入独立模型详情页，查看上市/收录时间、能力、场景、价格和接入参数。

模型名称	标签	价格	原价/倍率	参数
`cogvideox_video_api`	视频	暂无价格	-	-
`glm-3-turbo`上下文 128k / 输出 4k	对话	暂无价格	倍率 1.786	上下文 128k / 输出 4k
`glm-4`上下文 128k / 输出 4k	对话	输入￥100 / M tokens	倍率 35.715	上下文 128k / 输出 4k
`glm-4-0520`上下文 128k / 输出 4k	对话	输入￥100 / M tokens	倍率 34.25	上下文 128k / 输出 4k
`glm-4-air`上下文 128k / 输出 4k	对话	输入￥0.5 / M tokens	倍率 0.3425	上下文 128k / 输出 4k
`glm-4-airx`上下文 8k / 输出 4k	对话	输入￥10 / M tokens	倍率 3.425	上下文 8k / 输出 4k
`glm-4-alltools`上下文 128k / 输出 4k	未标注	暂无价格	倍率 34.25	上下文 128k / 输出 4k
`glm-4-flash`上下文 128k / 输出 4k	对话	暂无价格	固定倍率 0	上下文 128k / 输出 4k
`glm-4-long`上下文 1M / 输出 4k	对话	暂无价格	倍率 0.7	上下文 1M / 输出 4k
`glm-4-plus`上下文 128k / 输出 4k	对话	输入￥5 / M tokens	倍率 2.5	上下文 128k / 输出 4k
`glm-4.5`上下文 131.1k / 输出 131.1k	函数工具对话推理	输入￥3 / M tokens；输出￥14 / M tokens	倍率 1.185	上下文 131.1k / 输出 131.1k
`glm-4.5-air`上下文 131.1k / 输出 131.1k	对话推理函数工具	输入￥0.8 / M tokens；输出￥6 / M tokens	倍率 0.3	上下文 131.1k / 输出 131.1k
`glm-4.5-airx`上下文 131.1k / 输出 131.1k	对话推理函数工具	输入￥4 / M tokens；输出￥16 / M tokens	倍率 2	上下文 131.1k / 输出 131.1k
`glm-4.5-x`上下文 131.1k / 输出 131.1k	对话推理函数工具	输入￥12 / M tokens；输出￥32 / M tokens	倍率 4	上下文 131.1k / 输出 131.1k
`glm-4.5v`上下文 65.5k / 输出 16.4k	推理视觉	输入￥2 / M tokens；输出￥6 / M tokens	倍率 0.79	上下文 65.5k / 输出 16.4k
`glm-4.6`上下文 200k	对话推理视觉	输入￥3 / M tokens；输出￥14 / M tokens	倍率 1.185	上下文 200k
`glm-4.6-thinking`上下文 200k	对话推理视觉	输入￥3 / M tokens；输出￥14 / M tokens	倍率 1.185	上下文 200k
`glm-4.6v`上下文 128k	图像分析多模态对话视觉	输入￥1 / M tokens；输出￥3 / M tokens	倍率 0.5	上下文 128k
`glm-4.7`上下文 200k / 输出 128k	对话推理	输入￥3 / M tokens；输出￥14 / M tokens；缓存命中￥0.6 / M tokens	倍率 1.185	上下文 200k / 输出 128k
`glm-4.7-guan`上下文 200k / 输出 128k	对话	输入￥3 / M tokens；输出￥14 / M tokens；缓存命中￥0.6 / M tokens	倍率 1.5	上下文 200k / 输出 128k
`glm-4.7-nothinking`上下文 200k / 输出 128k	对话	输入￥3 / M tokens；输出￥14 / M tokens；缓存命中￥0.6 / M tokens	倍率 1.185	上下文 200k / 输出 128k
`glm-4v`上下文 2k	对话	输入￥50 / M tokens	倍率 17.125	上下文 2k
`glm-4v-plus`上下文 2k	对话	输入￥4 / M tokens	倍率 3.425	上下文 2k
`glm-5`上下文 200k / 输出 128k	对话推理视觉	输入￥4 / M tokens；输出￥18 / M tokens；缓存命中￥1 / M tokens	倍率 1.58	上下文 200k / 输出 128k
`glm-5-turbo`上下文 200k / 输出 128k	代码对话	输入￥7 / M tokens；输出￥26 / M tokens；缓存命中￥1.8 / M tokens	倍率 3.5	上下文 200k / 输出 128k
`glm-5.1`上下文 200k / 输出 128k	代码对话推理	输入￥8 / M tokens；输出￥28 / M tokens	倍率 3.16	上下文 200k / 输出 128k