GLM-5: El gigante open-source de China que rivaliza con Claude y GPT

GLM-5 de Zhipu AI cuenta con 744 mil millones de parámetros, se distribuye bajo licencia MIT y sus benchmarks están a corta distancia de Claude Opus 4.5 y GPT-5.2. Entrenado completamente en chips Huawei y con un precio aproximadamente 6 veces menor que sus rivales propietarios, es uno de los modelos open-source más potentes disponibles hoy.

El 11 de febrero de 2026, el laboratorio chino de IA Zhipu AI (ahora rebautizado como Z.ai) lanzó GLM-5, un nuevo modelo de lenguaje grande open-source que compite directamente con Claude Opus 4.5, GPT-5.2 y Gemini 3 Pro en benchmarks de codificación, razonamiento y tareas agentivas.

El mercado reaccionó con fuerza. Las acciones de Zhipu en Hong Kong subieron un 28,7% el día del lanzamiento. Curiosamente, antes del anuncio oficial, un modelo misterioso llamado "Pony Alpha" ya estaba publicando las mejores puntuaciones en OpenRouter. Resultó ser GLM-5 funcionando bajo un nombre diferente.

Aquí está lo que contiene y cómo se compara.

¿Qué es GLM-5?

GLM-5 es el modelo de lenguaje grande de quinta generación de Zhipu AI, una empresa que se desprendió de la Universidad de Tsinghua en 2019 y completó una salida a bolsa en Hong Kong en enero de 2026, recaudando aproximadamente $558 millones.

El modelo está construido sobre una arquitectura de Mezcla de Expertos (MoE) con 744 mil millones de parámetros totales, de los cuales solo 40 mil millones están activos por inferencia. Esto es casi el doble del tamaño de su predecesor GLM-4.5, que tenía 355 mil millones de parámetros. Los datos de pre-entrenamiento también saltaron de 23 billones a 28,5 billones de tokens.

GLM-5 integra DeepSeek Sparse Attention (DSA), una técnica originalmente desarrollada por DeepSeek, para reducir los costos de implementación mientras preserva la capacidad de contexto largo hasta 200K tokens.

GLM-5 de un vistazo

Especificación	Detalles
Parámetros totales	744B
Parámetros activos (por token)	40B
Arquitectura	Mezcla de Expertos (MoE), 256 expertos, 8 activos por token
Datos de pre-entrenamiento	28,5 billones de tokens
Ventana de contexto	200K tokens
Mecanismo de atención	DeepSeek Sparse Attention (DSA)
Licencia	MIT
Hardware de entrenamiento	Chips Huawei Ascend (totalmente doméstico)
Disponibilidad	HuggingFace, API de Z.ai, OpenRouter

GLM-5 fue entrenado completamente en chips Huawei Ascend usando el framework MindSpore, logrando independencia total del hardware fabricado en EE.UU. Dadas las restricciones de exportación actuales de EE.UU. sobre chips de IA avanzados, este es un hito estratégico significativo para el ecosistema de IA de China.

Rendimiento en benchmarks: ¿Cómo se compara GLM-5?

Zhipu AI posiciona GLM-5 como el modelo open-source más capaz disponible, y los números de los benchmarks respaldan eso en gran medida. Así se compara con los modelos frontera actuales.

Codificación e ingeniería

Benchmark	GLM-5	Claude Opus 4.5	GPT-5.2	Gemini 3 Pro	DeepSeek-V3.2	Kimi K2.5
SWE-bench Verified	77,8%	80,9%	80,0%	76,2%	73,1%	76,8%
SWE-bench Multilingual	73,3%	77,5%	72,0%	65,0%	70,2%	73,0%
Terminal-Bench 2.0	56,2	59,3	54,0	54,2	39,3	50,8

Claude Opus 4.5 todavía lidera en codificación, pero GLM-5 no está lejos, y es open-source y gratuito.

Razonamiento

Benchmark	GLM-5	Claude Opus 4.5	GPT-5.2	Gemini 3 Pro	DeepSeek-V3.2	Kimi K2.5
HLE (Humanity's Last Exam)	30,5	28,4	35,4	37,2	25,1	31,5
HLE con herramientas	50,4	43,4	45,5	45,8	40,8	51,8
AIME 2026 I	92,7	93,3	-	90,6	92,7	92,5
GPQA-Diamond	86,0	87,0	92,4	91,9	82,4	87,6

GLM-5 supera a Claude Opus 4.5 en Humanity's Last Exam (tanto solo texto como con herramientas) y se mantiene firme frente a GPT-5.2 y Gemini 3 Pro en benchmarks matemáticos.

Tareas agentivas

Benchmark	GLM-5	Claude Opus 4.5	GPT-5.2	Gemini 3 Pro	DeepSeek-V3.2	Kimi K2.5
BrowseComp (con contexto)	75,9	67,8	65,8	59,2	67,6	74,9
t2-Bench	89,7	91,6	85,5	90,7	85,3	80,2
MCP-Atlas	67,8	65,2	68,0	66,6	62,2	63,8
Vending Bench 2	$4.432	$4.967	$3.591	$5.478	$1.034	$1.198

Los benchmarks agentivos merecen una mirada más cercana. En BrowseComp (búsqueda web basada en agentes y gestión de contexto), GLM-5 supera a todos los modelos en la comparación, incluyendo los propietarios.

Alucinación: Una tasa récord baja

GLM-5 obtuvo -1 en el Índice AA-Omniscience de Artificial Analysis, lo que representa una mejora de 35 puntos sobre su predecesor. Esto lo convierte en el modelo con mejor rendimiento en cuanto a reconocer los límites de su propio conocimiento y abstenerse de generar información falsa. Actualmente lidera todos los modelos evaluados de OpenAI, Anthropic y Google en esta categoría.

Para casos de uso empresarial donde la precisión importa más que la creatividad, esta es una ventaja significativa.

Precios: 6 veces más barato que Claude Opus

GLM-5 está disponible en OpenRouter y la API de Z.ai a precios competitivos:

Modelo	Entrada (por 1M tokens)	Salida (por 1M tokens)
GLM-5	~$0,80	~$2,56
GPT-5.2	$2,50	$10,00
Claude Opus 4.6	$5,00	$25,00

Eso es aproximadamente 6 veces más barato en entrada y casi 10 veces más barato en salida comparado con Claude Opus 4.6.

Generación de documentos: Más allá del chat

GLM-5 introduce capacidades nativas de "Modo Agente" que van más allá del chat tradicional. En lugar de solo devolver texto, el modelo puede tomar un prompt y producir un archivo .docx, .pdf o .xlsx terminado directamente. La plataforma Z.ai (chat.z.ai) tiene este modo integrado.

El modelo también es compatible con agentes de codificación populares como Claude Code, OpenCode y Roo Code, así como OpenClaw, un framework para flujos de trabajo agentivos entre aplicaciones y dispositivos.

Ejecuta GLM-5 localmente

Una de las mayores ventajas de un modelo con licencia MIT: puedes ejecutarlo tú mismo. GLM-5 soporta despliegue via vLLM, SGLang y xLLM.

Usando vLLM (Docker)

bash

docker pull vllm/vllm-openai:nightly

Despliegue

bash

vllm serve zai-org/GLM-5-FP8      --tensor-parallel-size 8      --gpu-memory-utilization 0.95

Usando SGLang (Docker)

bash

# Para GPUs Hopper
docker pull lmsysorg/sglang:glm5-hopper

# Para GPUs Blackwell
docker pull lmsysorg/sglang:glm5-blackwell

La versión cuantizada FP8 se recomienda para despliegues en producción. Los pesos del modelo están disponibles en HuggingFace: zai-org/GLM-5

La ola open-source de IA de China

GLM-5 no está ocurriendo en aislamiento. Es parte de una ola acelerada de lanzamientos de IA open-source de China. Según un estudio de Stanford, los modelos de IA chinos históricamente han ido aproximadamente siete meses detrás de sus contrapartes estadounidenses. GLM-5 llegó solo unos tres meses después de los últimos lanzamientos de Anthropic, Google y OpenAI, reduciendo ese retraso a la mitad.

Para desarrolladores y empresas, esto se traduce en más opciones, precios más bajos y presión creciente sobre los modelos propietarios para justificar sus precios premium.

¿Deberías probar GLM-5?

GLM-5 tiene más sentido si necesitas un modelo capaz pero no puedes o no quieres depender de APIs propietarias. Algunos escenarios donde destaca:

Inferencia auto-alojada con soberanía de datos. Si operas bajo GDPR o regulaciones similares y necesitas control total sobre dónde van tus datos, GLM-5 con licencia MIT y despliegue local es una de las opciones más fuertes disponibles ahora.
Cargas de trabajo de alto volumen con presupuesto. A ~$0,80/1M tokens de entrada, los equipos que ejecutan miles de solicitudes diarias pueden reducir costos significativamente comparado con Claude o GPT.
Codificación y tareas agentivas. Las puntuaciones de GLM-5 en SWE-bench y BrowseComp lo ponen en la misma liga que los modelos propietarios.

Las advertencias habituales aplican: las puntuaciones de benchmarks no siempre se traducen en usabilidad del mundo real. Pero la brecha se está reduciendo, y GLM-5 eleva el estándar de lo disponible como modelo libre y abierto.

Pruébalo en chat.z.ai o descarga los pesos desde HuggingFace.

Fuentes:

¿Qué es GLM-5?

GLM-5 de un vistazo

Rendimiento en benchmarks: ¿Cómo se compara GLM-5?

Codificación e ingeniería

Razonamiento

Tareas agentivas

Alucinación: Una tasa récord baja

Precios: 6 veces más barato que Claude Opus

Generación de documentos: Más allá del chat

Ejecuta GLM-5 localmente

Usando vLLM (Docker)

Despliegue

Usando SGLang (Docker)

La ola open-source de IA de China

¿Deberías probar GLM-5?

Descubre lo que la IA puede hacer por tu sitio web