PPIO上线智谱GLM-4.5V
2025-08-11来源:本站

今天,PPIO 首发上线智谱新一代视觉推理模型 GLM-4.5V,该模型基于 GLM-4.5-Air 基础架构开发,继承了 GLM-4.1V-Thinking 的技术路线,采用 1060 亿参数的混合专家(MoE)架构实现高效扩展。
GLM-4.5V 具备全方位的视觉理解能力,包括图像/视频分析、图形界面交互、复杂文档处理以及精准的视觉元素定位等核心能力。
在中国 GeoGuessr 地理定位挑战赛中,GLM-4.5V 仅用 16 小时就超越了 99% 的人类选手(共 21000 人参与),一周内攀升至第 66 名。
在 PPIO 平台,GLM-4.5V 的价格为:输入: ¥4.5/百万 tokens,输出: ¥13/百万 tokens.
模型特点据智谱官方表示, GLM-4.5V 在 42 项基准测试中均达到同规模开源模型的最高水平。并且,通过高效的混合训练,GLM-4.5V 能够处理各种类型的视觉内容,实现全场景视觉推理。
- 图像推理
在图像推理上, GLM-4.5V不仅可以进行场景理解,还能够对复杂多图像进行综合分析,并实现高精度的地理空间识别。输入提示词:解读一下上传图片的内容。

- 地理识别
并且, GLM-4.5V 还支持高精度的地理空间识别。例如:上传一张无锡照片,让 GLM-4.5V 尝试分析该照片拍摄地区。

可以看出,GLM-4.5V 可以准确理解图片内容,并作出精准分析。
此外,GLM-4.5V 还具备 GUI 任务处理能力、复杂图表和长文档分析能力,以及视觉元素定位能力,为各类应用场景提供技术支撑。
PPIO 一直致力于为企业和开发者提供更高性能的模型 API 服务,帮助企业将先进技术快速集成到企业现有的工作流程中。