- februára 2026 čínske AI laboratórium Zhipu AI (teraz premenované na Z.ai) vydalo GLM-5, nový open-source veľký jazykový model, ktorý priamo konkuruje Claude Opus 4.5, GPT-5.2 a Gemini 3 Pro v kódovaní, uvažovaní a agentových benchmarkoch.
Trh reagoval silno. Akcie Zhipu v Hongkongu vyskočili o 28,7 % v deň vydania. Zaujímavé je, že pred oficiálnym oznámením záhadný model s názvom "Pony Alpha" už dosahoval najvyššie skóre na OpenRouter. Ukázalo sa, že to bol GLM-5 bežiaci pod iným názvom.
Tu je to, čo je vo vnútri a ako sa porovnáva.
Čo je GLM-5?
GLM-5 je piata generácia veľkého jazykového modelu od Zhipu AI, spoločnosti, ktorá vznikla na Univerzite Tsinghua v roku 2019 a dokončila IPO v Hongkongu v januári 2026, pričom získala približne 558 miliónov dolárov.
Model je postavený na architektúre Mixture-of-Experts (MoE) so 744 miliardami celkových parametrov, z ktorých je len 40 miliárd aktívnych na jednu inferenciu. To je takmer dvojnásobok veľkosti jeho predchodcu GLM-4.5, ktorý mal 355 miliárd parametrov. Predtrénovanie tiež skočilo z 23 biliónov na 28,5 bilióna tokenov.
GLM-5 integruje DeepSeek Sparse Attention (DSA), techniku pôvodne vyvinutú spoločnosťou DeepSeek, na zníženie nákladov na nasadenie pri zachovaní kapacity pre dlhý kontext až 200K tokenov.
GLM-5 v skratke
| Špecifikácia | Podrobnosti |
|---|---|
| Celkové parametre | 744B |
| Aktívne parametre (na token) | 40B |
| Architektúra | Mixture-of-Experts (MoE), 256 expertov, 8 aktívnych na token |
| Predtrénovacie dáta | 28,5 bilióna tokenov |
| Kontextové okno | 200K tokenov |
| Mechanizmus pozornosti | DeepSeek Sparse Attention (DSA) |
| Licencia | MIT |
| Tréningový hardvér | Čipy Huawei Ascend (plne domáce) |
| Dostupnosť | HuggingFace, Z.ai API, OpenRouter |
GLM-5 bol trénovaný výlučne na čipoch Huawei Ascend pomocou frameworku MindSpore, čím dosiahol úplnú nezávislosť od hardvéru vyrábaného v USA. Vzhľadom na súčasné americké exportné obmedzenia na pokročilé AI čipy je to významný strategický míľnik pre čínsky AI ekosystém.
Výkon v benchmarkoch: Ako sa GLM-5 porovnáva?
Zhipu AI pozicionuje GLM-5 ako najschopnejší dostupný open-source model a čísla z benchmarkov to do veľkej miery potvrdzujú.
Kódovanie a inžinierstvo
| Benchmark | GLM-5 | Claude Opus 4.5 | GPT-5.2 | Gemini 3 Pro | DeepSeek-V3.2 | Kimi K2.5 |
|---|---|---|---|---|---|---|
| SWE-bench Verified | 77,8 % | 80,9 % | 80,0 % | 76,2 % | 73,1 % | 76,8 % |
| SWE-bench Multilingual | 73,3 % | 77,5 % | 72,0 % | 65,0 % | 70,2 % | 73,0 % |
| Terminal-Bench 2.0 | 56,2 | 59,3 | 54,0 | 54,2 | 39,3 | 50,8 |
Claude Opus 4.5 stále vedie v kódovaní, ale GLM-5 nie je ďaleko a je open-source a zadarmo.
Uvažovanie
| Benchmark | GLM-5 | Claude Opus 4.5 | GPT-5.2 | Gemini 3 Pro | DeepSeek-V3.2 | Kimi K2.5 |
|---|---|---|---|---|---|---|
| HLE (Humanity's Last Exam) | 30,5 | 28,4 | 35,4 | 37,2 | 25,1 | 31,5 |
| HLE s nástrojmi | 50,4 | 43,4 | 45,5 | 45,8 | 40,8 | 51,8 |
| AIME 2026 I | 92,7 | 93,3 | - | 90,6 | 92,7 | 92,5 |
| GPQA-Diamond | 86,0 | 87,0 | 92,4 | 91,9 | 82,4 | 87,6 |
GLM-5 prekonáva Claude Opus 4.5 v Humanity's Last Exam (textová verzia aj s nástrojmi).
Agentové úlohy
| Benchmark | GLM-5 | Claude Opus 4.5 | GPT-5.2 | Gemini 3 Pro | DeepSeek-V3.2 | Kimi K2.5 |
|---|---|---|---|---|---|---|
| BrowseComp (s kontextom) | 75,9 | 67,8 | 65,8 | 59,2 | 67,6 | 74,9 |
| τ²-Bench | 89,7 | 91,6 | 85,5 | 90,7 | 85,3 | 80,2 |
| MCP-Atlas | 67,8 | 65,2 | 68,0 | 66,6 | 62,2 | 63,8 |
| Vending Bench 2 | $4 432 | $4 967 | $3 591 | $5 478 | $1 034 | $1 198 |
V BrowseComp GLM-5 prekonáva každý model v porovnaní, vrátane proprietárnych.
Halucinácie: Rekordne nízka miera
GLM-5 dosiahol -1 na indexe Artificial Analysis AA-Omniscience, čo predstavuje 35-bodové zlepšenie oproti predchodcovi. V súčasnosti vedie medzi všetkými testovanými modelmi od OpenAI, Anthropic a Google v tejto kategórii.
Ceny: 6-krát lacnejší ako Claude Opus
| Model | Vstup (za 1M tokenov) | Výstup (za 1M tokenov) |
|---|---|---|
| GLM-5 | ~$0,80 | ~$2,56 |
| GPT-5.2 | $2,50 | $10,00 |
| Claude Opus 4.6 | $5,00 | $25,00 |
To je približne 6-krát lacnejšie na vstupe a takmer 10-krát lacnejšie na výstupe v porovnaní s Claude Opus 4.6.
Generovanie dokumentov: Za hranicou chatu
GLM-5 zavádza natívne schopnosti "Agent Mode", ktoré presahujú tradičný chat. Model môže priamo vytvoriť hotový súbor .docx, .pdf alebo .xlsx. Platforma Z.ai (chat.z.ai) má tento režim zabudovaný.
Model je tiež kompatibilný s populárnymi kódovacími agentmi ako Claude Code, OpenCode a Roo Code, ako aj s OpenClaw, frameworkom pre medziaplikačné agentové workflow.
Spustite GLM-5 lokálne
GLM-5 podporuje nasadenie cez vLLM, SGLang a xLLM.
Použitie vLLM (Docker)
docker pull vllm/vllm-openai:nightly
Nasadenie
vllm serve zai-org/GLM-5-FP8 \
--tensor-parallel-size 8 \
--gpu-memory-utilization 0.95
Použitie SGLang (Docker)
# Pre Hopper GPU
docker pull lmsysorg/sglang:glm5-hopper
# Pre Blackwell GPU
docker pull lmsysorg/sglang:glm5-blackwell
Váhy modelu sú dostupné na HuggingFace: zai-org/GLM-5
Čínska vlna open-source AI
GLM-5 nevzniká izolovane. Je súčasťou zrýchľujúcej sa vlny čínskych open-source AI vydaní. Podľa štúdie Stanfordu čínske AI modely historicky zaostávali asi sedem mesiacov za americkými. GLM-5 prišiel len asi tri mesiace po najnovších vydaniach od Anthropic, Google a OpenAI, čím efektívne skrátil toto oneskorenie na polovicu.
Konkurencia v rámci čínskej AI krajiny sa tiež zostruje. Kimi K2.5 od Moonshot AI volí iný architektonický prístup s využitím rojov agentov pracujúcich paralelne. Medzitým DeepSeek-V3.2 teraz zaostáva za GLM-5 aj Kimi K2.5 vo viacerých benchmarkoch.
Mali by ste vyskúšať GLM-5?
GLM-5 dáva najväčší zmysel, ak potrebujete schopný model, ale nemôžete alebo nechcete sa spoliehať na proprietárne API.
- Lokálna inferencia s dátovou suverenitou. Ak pôsobíte pod GDPR, GLM-5 s licenciou MIT a lokálnym nasadením je jednou z najsilnejších dostupných možností.
- Vysokoobjemové záťaže s obmedzeným rozpočtom. Pri ~$0,80/1M vstupných tokenov môžu tímy výrazne znížiť náklady v porovnaní s Claude alebo GPT.
- Kódovanie a agentové úlohy. Výsledky GLM-5 v SWE-bench a BrowseComp ho zaraďujú do rovnakej ligy ako proprietárne modely.
Vyskúšajte ho na chat.z.ai alebo si stiahnite váhy z HuggingFace.
Zdroje:


