GLM-5: Čínsky open-source gigant, ktorý konkuruje Claude a GPT

GLM-5 od Zhipu AI prichádza so 744 miliardami parametrov, je vydaný pod licenciou MIT a v benchmarkoch sa priblížil ku Claude Opus 4.5 a GPT-5.2. Trénovaný výlučne na čipoch Huawei a ocenený približne 6-krát lacnejšie ako jeho proprietárni rivali, je jedným z najsilnejších open-source modelov dostupných dnes.

februára 2026 čínske AI laboratórium Zhipu AI (teraz premenované na Z.ai) vydalo GLM-5, nový open-source veľký jazykový model, ktorý priamo konkuruje Claude Opus 4.5, GPT-5.2 a Gemini 3 Pro v kódovaní, uvažovaní a agentových benchmarkoch.

Trh reagoval silno. Akcie Zhipu v Hongkongu vyskočili o 28,7 % v deň vydania. Zaujímavé je, že pred oficiálnym oznámením záhadný model s názvom "Pony Alpha" už dosahoval najvyššie skóre na OpenRouter. Ukázalo sa, že to bol GLM-5 bežiaci pod iným názvom.

Tu je to, čo je vo vnútri a ako sa porovnáva.

Čo je GLM-5?

GLM-5 je piata generácia veľkého jazykového modelu od Zhipu AI, spoločnosti, ktorá vznikla na Univerzite Tsinghua v roku 2019 a dokončila IPO v Hongkongu v januári 2026, pričom získala približne 558 miliónov dolárov.

Model je postavený na architektúre Mixture-of-Experts (MoE) so 744 miliardami celkových parametrov, z ktorých je len 40 miliárd aktívnych na jednu inferenciu. To je takmer dvojnásobok veľkosti jeho predchodcu GLM-4.5, ktorý mal 355 miliárd parametrov. Predtrénovanie tiež skočilo z 23 biliónov na 28,5 bilióna tokenov.

GLM-5 integruje DeepSeek Sparse Attention (DSA), techniku pôvodne vyvinutú spoločnosťou DeepSeek, na zníženie nákladov na nasadenie pri zachovaní kapacity pre dlhý kontext až 200K tokenov.

GLM-5 v skratke

Špecifikácia	Podrobnosti
Celkové parametre	744B
Aktívne parametre (na token)	40B
Architektúra	Mixture-of-Experts (MoE), 256 expertov, 8 aktívnych na token
Predtrénovacie dáta	28,5 bilióna tokenov
Kontextové okno	200K tokenov
Mechanizmus pozornosti	DeepSeek Sparse Attention (DSA)
Licencia	MIT
Tréningový hardvér	Čipy Huawei Ascend (plne domáce)
Dostupnosť	HuggingFace, Z.ai API, OpenRouter

GLM-5 bol trénovaný výlučne na čipoch Huawei Ascend pomocou frameworku MindSpore, čím dosiahol úplnú nezávislosť od hardvéru vyrábaného v USA. Vzhľadom na súčasné americké exportné obmedzenia na pokročilé AI čipy je to významný strategický míľnik pre čínsky AI ekosystém.

Výkon v benchmarkoch: Ako sa GLM-5 porovnáva?

Zhipu AI pozicionuje GLM-5 ako najschopnejší dostupný open-source model a čísla z benchmarkov to do veľkej miery potvrdzujú.

Kódovanie a inžinierstvo

Benchmark	GLM-5	Claude Opus 4.5	GPT-5.2	Gemini 3 Pro	DeepSeek-V3.2	Kimi K2.5
SWE-bench Verified	77,8 %	80,9 %	80,0 %	76,2 %	73,1 %	76,8 %
SWE-bench Multilingual	73,3 %	77,5 %	72,0 %	65,0 %	70,2 %	73,0 %
Terminal-Bench 2.0	56,2	59,3	54,0	54,2	39,3	50,8

Claude Opus 4.5 stále vedie v kódovaní, ale GLM-5 nie je ďaleko a je open-source a zadarmo.

Uvažovanie

Benchmark	GLM-5	Claude Opus 4.5	GPT-5.2	Gemini 3 Pro	DeepSeek-V3.2	Kimi K2.5
HLE (Humanity's Last Exam)	30,5	28,4	35,4	37,2	25,1	31,5
HLE s nástrojmi	50,4	43,4	45,5	45,8	40,8	51,8
AIME 2026 I	92,7	93,3	-	90,6	92,7	92,5
GPQA-Diamond	86,0	87,0	92,4	91,9	82,4	87,6

GLM-5 prekonáva Claude Opus 4.5 v Humanity's Last Exam (textová verzia aj s nástrojmi).

Agentové úlohy

Benchmark	GLM-5	Claude Opus 4.5	GPT-5.2	Gemini 3 Pro	DeepSeek-V3.2	Kimi K2.5
BrowseComp (s kontextom)	75,9	67,8	65,8	59,2	67,6	74,9
τ²-Bench	89,7	91,6	85,5	90,7	85,3	80,2
MCP-Atlas	67,8	65,2	68,0	66,6	62,2	63,8
Vending Bench 2	$4 432	$4 967	$3 591	$5 478	$1 034	$1 198

V BrowseComp GLM-5 prekonáva každý model v porovnaní, vrátane proprietárnych.

Halucinácie: Rekordne nízka miera

GLM-5 dosiahol -1 na indexe Artificial Analysis AA-Omniscience, čo predstavuje 35-bodové zlepšenie oproti predchodcovi. V súčasnosti vedie medzi všetkými testovanými modelmi od OpenAI, Anthropic a Google v tejto kategórii.

Ceny: 6-krát lacnejší ako Claude Opus

Model	Vstup (za 1M tokenov)	Výstup (za 1M tokenov)
GLM-5	~$0,80	~$2,56
GPT-5.2	$2,50	$10,00
Claude Opus 4.6	$5,00	$25,00

To je približne 6-krát lacnejšie na vstupe a takmer 10-krát lacnejšie na výstupe v porovnaní s Claude Opus 4.6.

Generovanie dokumentov: Za hranicou chatu

GLM-5 zavádza natívne schopnosti "Agent Mode", ktoré presahujú tradičný chat. Model môže priamo vytvoriť hotový súbor .docx, .pdf alebo .xlsx. Platforma Z.ai (chat.z.ai) má tento režim zabudovaný.

Model je tiež kompatibilný s populárnymi kódovacími agentmi ako Claude Code, OpenCode a Roo Code, ako aj s OpenClaw, frameworkom pre medziaplikačné agentové workflow.

Spustite GLM-5 lokálne

GLM-5 podporuje nasadenie cez vLLM, SGLang a xLLM.

Použitie vLLM (Docker)

bash

docker pull vllm/vllm-openai:nightly

Nasadenie

bash

vllm serve zai-org/GLM-5-FP8 \
     --tensor-parallel-size 8 \
     --gpu-memory-utilization 0.95

Použitie SGLang (Docker)

bash

# Pre Hopper GPU
docker pull lmsysorg/sglang:glm5-hopper

# Pre Blackwell GPU
docker pull lmsysorg/sglang:glm5-blackwell

Váhy modelu sú dostupné na HuggingFace: zai-org/GLM-5

Čínska vlna open-source AI

GLM-5 nevzniká izolovane. Je súčasťou zrýchľujúcej sa vlny čínskych open-source AI vydaní. Podľa štúdie Stanfordu čínske AI modely historicky zaostávali asi sedem mesiacov za americkými. GLM-5 prišiel len asi tri mesiace po najnovších vydaniach od Anthropic, Google a OpenAI, čím efektívne skrátil toto oneskorenie na polovicu.

Konkurencia v rámci čínskej AI krajiny sa tiež zostruje. Kimi K2.5 od Moonshot AI volí iný architektonický prístup s využitím rojov agentov pracujúcich paralelne. Medzitým DeepSeek-V3.2 teraz zaostáva za GLM-5 aj Kimi K2.5 vo viacerých benchmarkoch.

Mali by ste vyskúšať GLM-5?

GLM-5 dáva najväčší zmysel, ak potrebujete schopný model, ale nemôžete alebo nechcete sa spoliehať na proprietárne API.

Lokálna inferencia s dátovou suverenitou. Ak pôsobíte pod GDPR, GLM-5 s licenciou MIT a lokálnym nasadením je jednou z najsilnejších dostupných možností.
Vysokoobjemové záťaže s obmedzeným rozpočtom. Pri ~$0,80/1M vstupných tokenov môžu tímy výrazne znížiť náklady v porovnaní s Claude alebo GPT.
Kódovanie a agentové úlohy. Výsledky GLM-5 v SWE-bench a BrowseComp ho zaraďujú do rovnakej ligy ako proprietárne modely.

Vyskúšajte ho na chat.z.ai alebo si stiahnite váhy z HuggingFace.

Zdroje:

Čo je GLM-5?

GLM-5 v skratke

Výkon v benchmarkoch: Ako sa GLM-5 porovnáva?

Kódovanie a inžinierstvo

Uvažovanie

Agentové úlohy

Halucinácie: Rekordne nízka miera

Ceny: 6-krát lacnejší ako Claude Opus

Generovanie dokumentov: Za hranicou chatu

Spustite GLM-5 lokálne

Použitie vLLM (Docker)

Nasadenie

Použitie SGLang (Docker)

Čínska vlna open-source AI

Mali by ste vyskúšať GLM-5?

Pozrite sa, čo AI môže urobiť pre váš web