Tecnología

GLM-5.2: El modelo chino que humilla a GPT-5.5 por un sexto del precio

20 de junio de 2026 · 7 min de lectura · 0 vistas

GLM-5.2: El modelo chino que humilla a GPT-5.5 por un sexto del precio

Hilo sobre GLM-5.2, el modelo chino que acaba de superar a GPT-5.5 en programación por un sexto del precio, con pesos abiertos y licencia MIT sin fronteras.

Lo Que No Te Cuentan: Un modelo chino de IA acaba de superar a GPT-5.5 en programación, cuesta un sexto del precio y viene con licencia MIT sin fronteras

GLM-5.2 tiene 744.000 millones de parámetros, una ventana de un millón de tokens y los laboratorios occidentales ya no saben cómo justificar sus precios

¿Te acuerdas de esa vez que pagaste 30 dólares por un millón de tokens de salida? Z.ai te cobra 4,40. Y programa mejor.

13 de junio de 2026, Pekín.

Z.ai —la startup china antes conocida como Zhipu AI— lanzó GLM-5.2. Un modelo de lenguaje con 744.000 millones de parámetros. 40.000 millones de parámetros activos por tarea. Ventana de contexto de un millón de tokens. Y una arquitectura llamada IndexShare que reduce el consumo computacional en un factor de 2,9.

En el benchmark FrontierSWE —el más exigente para programación de largo alcance— GLM-5.2 alcanzó el 74,4 %. GPT-5.5 de OpenAI se quedó en 72,6 %. Solo Claude Opus 4.8 de Anthropic lo superó, y por un margen mínimo: 75,1 %.

En SWE-bench Pro: 62,1 % para GLM-5.2, contra 58,6 % de GPT-5.5.

En PostTrainBench: 34,3 % contra 25,0 % de GPT-5.5.

En SWE-Marathon —sesiones de programación autónoma que duran horas— 13,0 % contra 12,0 %.

"Creíamos que ningún modelo chino de IA se acercaría pronto a Fable 5 o GPT-5.5. Entonces llegó GLM-5.2."

Así lo tituló Xataka. Y la comunidad de desarrolladores respondió con algo que no esperaba: alivio.

El precio que no tiene sentido

La API de GLM-5.2 cuesta 1,40 dólares por millón de tokens de entrada y 4,40 de salida. El plan de codificación Lite cuesta 12,60 dólares al mes.

Comparación cruel:

| GLM-5.2 | $1,40 | $4,40 | $5,80 |

| GPT-5.5 | $5,00 | $30,00 | $35,00 |

| Claude Opus 4.8 | $5,00 | $25,00 | $30,00 |

| Claude Fable 5 | $10,00 | $50,00 | $60,00 |

GLM-5.2 cuesta un sexto de GPT-5.5. Un quinto de Opus 4.8. Un décimo de Fable 5.

Y los pesos son abiertos. Licencia MIT. Sin restricciones regionales. Sin "acceptable use policies" que te digan qué puedes construir. Descárgalo de Hugging Face. Modifícalo. Ejecútalo localmente. Véndelo si quieres.

"The most disruptive aspect of the GLM-5.2 release is its licensing. Z.ai released the model's weights under an MIT open-source license, establishing it as a 'Pure Open' system."

Así lo analizó VentureBeat. Y añadieron algo que duele:

"For enterprise technical decision-makers, z.ai's GLM-5.2 provides a highly capable path to host frontier-level AI locally, entirely bypassing the geographic fencing and commercial limitations."

Traducción: mientras Anthropic cierra sus modelos por orden del gobierno de EE. UU., Z.ai abre los suyos al mundo sin pedir permiso.

La arquitectura que engaña a la física

GLM-5.2 usa Mixture-of-Experts (MoE): 744.000 millones de parámetros totales, pero solo 40.000 millones activos por tarea. El resto duerme. Espera. Se activa solo cuando su especialidad es necesaria.

IndexShare —la innovación clave— reutiliza el mismo indexador en cada cuatro capas de atención dispersa. A un millón de tokens de contexto, esto reduce los FLOPs por token en un factor de 2,9.

También tiene Multi-Token Prediction (MTP) para decodificación especulativa: aumenta la longitud de tokens aceptados en un 20 % durante la inferencia.

Y dos modos de razonamiento: "High" para equilibrar rendimiento y latencia; "Max" para empujar los límites del problema. En Max usa casi 85.000 tokens de salida por tarea. En High, la mitad, con solo una pequeña pérdida de precisión.

"IndexShare re-uses one indexer for every four sparse attention layers, reducing compute needs."

Así lo describió VentureBeat. Y en X, el observador Lisan al Gaib (@scaling01) fue más directo:

"frontier labs are absolutely scamming you on API pricing"

Los laboratorios de frontera te están estafando con los precios de las API. Márgenes superiores al 90 %. Mientras tanto, modelos abiertos como GLM-5.2 operan con beneficios reales sin depender de los últimos chips Blackwell.

El giro polémico

Aquí está el truco que nadie menciona.

GLM-5.2 no es mejor que GPT-5.5 porque los ingenieros chinos sean más listos. Es mejor porque no tienen que justificar una valoración de 965.000 millones de dólares.

Anthropic vale casi un billón. OpenAI, más. Google, infinito. Sus modelos no solo deben funcionar: deben generar rentabilidad para inversores que exigen crecimiento exponencial. Y esa rentabilidad se extrae de tu bolsillo, token a token.

Z.ai no cotiza en bolsa. No tiene inversores de riesgo gritando en las reuniones del consejo. No necesita justificar precios de 30 dólares por millón de tokens. Puede cobrar 4,40 y seguir siendo rentable.

La ironía definitiva: la empresa que más cuesta es la que menos te da. Y la que menos cuesta es la que más te ofrece.

Y hay algo más. El gobierno de EE. UU. prohibió a los extranjeros usar Claude Fable 5. Anthropic obedeció. Cerró el acceso. Dejó a desarrolladores de todo el mundo sin su herramienta.

Z.ai hizo lo contrario. "No regional limits", dice su licencia MIT. "Technical access without borders". Mientras Washington construye muros digitales, Pekín ofrece puentes.

Traducción: la guerra fría de la IA no se gana con el modelo más caro. Se gana con el modelo más accesible. Y GLM-5.2 acaba de demostrar que accesibilidad y calidad no son excluyentes.

La pregunta que no te dejará dormir

Si mañana descubrieras que puedes tener el mismo rendimiento de programación que GPT-5.5 por un sexto del precio, con pesos abiertos, sin restricciones geográficas y sin depender de una empresa que cierra sus modelos cuando Washington lo ordena...

¿seguirías pagando la prima de OpenAI por lealtad de marca o empezarías a preguntarte si has estado financiando tu propia dependencia tecnológica?

Y si decides cambiar, ¿cuántos meses pasarán antes de que descubras que los "líderes de la industria" eran solo los que más cobraban y no los que más daban?

GLM-5.2 no es perfecto. Es más lento que GPT-5.5 al responder. Tarda más en razonar. En tareas creativas de redacción, Anthropic y Google siguen siendo superiores. Y necesitas 256 GB de memoria unificada para ejecutarlo localmente: un Mac Studio, no un portátil.

Pero en programación, en ingeniería de software, en tareas de largo alcance donde el contexto importa más que la velocidad, GLM-5.2 está en la frontera.

Y lo más importante: es tuyo. No de OpenAI. No de Anthropic. No de Google. Tuyo. Descárgalo. Modifícalo. Ejecútalo en tu servidor. Sin licencias restrictivas. Sin "acceptable use policies". Sin miedo a que un gobierno cierre el acceso mañana.

Z.ai no es una ONG. Es una empresa que compite. Pero compite con una lógica diferente: ganar por volumen, no por precio. Por acceso, no por exclusividad. Por abrir, no por cerrar.

Y mientras tanto, en San Francisco, Anthropic sigue pidiendo una pausa global en el desarrollo de IA. En Washington, el gobierno sigue confiscando modelos. Y en Pekín, Z.ai sigue lanzando pesos abiertos que cualquiera puede usar.