GLM-5: Čínsky open-source gigant, ktorý konkuruje Claude a GPT

    8 min čítania
    Ing. Patrik Kelemen
    GLM-5: Čínsky open-source gigant, ktorý konkuruje Claude a GPT

    GLM-5 od Zhipu AI prichádza so 744 miliardami parametrov, je vydaný pod licenciou MIT a v benchmarkoch sa priblížil ku Claude Opus 4.5 a GPT-5.2. Trénovaný výlučne na čipoch Huawei a ocenený približne 6-krát lacnejšie ako jeho proprietárni rivali, je jedným z najsilnejších open-source modelov dostupných dnes.

    Namiru AI

    AI zákaznícka podpora pre váš web

    Vložte svoju URL. Získajte agenta podpory za 30 sekúnd.

    1. februára 2026 čínske AI laboratórium Zhipu AI (teraz premenované na Z.ai) vydalo GLM-5, nový open-source veľký jazykový model, ktorý priamo konkuruje Claude Opus 4.5, GPT-5.2 a Gemini 3 Pro v kódovaní, uvažovaní a agentových benchmarkoch.

    Trh reagoval silno. Akcie Zhipu v Hongkongu vyskočili o 28,7 % v deň vydania. Zaujímavé je, že pred oficiálnym oznámením záhadný model s názvom "Pony Alpha" už dosahoval najvyššie skóre na OpenRouter. Ukázalo sa, že to bol GLM-5 bežiaci pod iným názvom.

    Tu je to, čo je vo vnútri a ako sa porovnáva.


    Čo je GLM-5?

    GLM-5 je piata generácia veľkého jazykového modelu od Zhipu AI, spoločnosti, ktorá vznikla na Univerzite Tsinghua v roku 2019 a dokončila IPO v Hongkongu v januári 2026, pričom získala približne 558 miliónov dolárov.

    Model je postavený na architektúre Mixture-of-Experts (MoE) so 744 miliardami celkových parametrov, z ktorých je len 40 miliárd aktívnych na jednu inferenciu. To je takmer dvojnásobok veľkosti jeho predchodcu GLM-4.5, ktorý mal 355 miliárd parametrov. Predtrénovanie tiež skočilo z 23 biliónov na 28,5 bilióna tokenov.

    GLM-5 integruje DeepSeek Sparse Attention (DSA), techniku pôvodne vyvinutú spoločnosťou DeepSeek, na zníženie nákladov na nasadenie pri zachovaní kapacity pre dlhý kontext až 200K tokenov.

    GLM-5 v skratke

    ŠpecifikáciaPodrobnosti
    Celkové parametre744B
    Aktívne parametre (na token)40B
    ArchitektúraMixture-of-Experts (MoE), 256 expertov, 8 aktívnych na token
    Predtrénovacie dáta28,5 bilióna tokenov
    Kontextové okno200K tokenov
    Mechanizmus pozornostiDeepSeek Sparse Attention (DSA)
    LicenciaMIT
    Tréningový hardvérČipy Huawei Ascend (plne domáce)
    DostupnosťHuggingFace, Z.ai API, OpenRouter

    GLM-5 bol trénovaný výlučne na čipoch Huawei Ascend pomocou frameworku MindSpore, čím dosiahol úplnú nezávislosť od hardvéru vyrábaného v USA. Vzhľadom na súčasné americké exportné obmedzenia na pokročilé AI čipy je to významný strategický míľnik pre čínsky AI ekosystém.


    Výkon v benchmarkoch: Ako sa GLM-5 porovnáva?

    Zhipu AI pozicionuje GLM-5 ako najschopnejší dostupný open-source model a čísla z benchmarkov to do veľkej miery potvrdzujú.

    Kódovanie a inžinierstvo

    BenchmarkGLM-5Claude Opus 4.5GPT-5.2Gemini 3 ProDeepSeek-V3.2Kimi K2.5
    SWE-bench Verified77,8 %80,9 %80,0 %76,2 %73,1 %76,8 %
    SWE-bench Multilingual73,3 %77,5 %72,0 %65,0 %70,2 %73,0 %
    Terminal-Bench 2.056,259,354,054,239,350,8

    Claude Opus 4.5 stále vedie v kódovaní, ale GLM-5 nie je ďaleko a je open-source a zadarmo.

    Uvažovanie

    BenchmarkGLM-5Claude Opus 4.5GPT-5.2Gemini 3 ProDeepSeek-V3.2Kimi K2.5
    HLE (Humanity's Last Exam)30,528,435,437,225,131,5
    HLE s nástrojmi50,443,445,545,840,851,8
    AIME 2026 I92,793,3-90,692,792,5
    GPQA-Diamond86,087,092,491,982,487,6

    GLM-5 prekonáva Claude Opus 4.5 v Humanity's Last Exam (textová verzia aj s nástrojmi).

    Agentové úlohy

    BenchmarkGLM-5Claude Opus 4.5GPT-5.2Gemini 3 ProDeepSeek-V3.2Kimi K2.5
    BrowseComp (s kontextom)75,967,865,859,267,674,9
    τ²-Bench89,791,685,590,785,380,2
    MCP-Atlas67,865,268,066,662,263,8
    Vending Bench 2$4 432$4 967$3 591$5 478$1 034$1 198

    V BrowseComp GLM-5 prekonáva každý model v porovnaní, vrátane proprietárnych.


    Halucinácie: Rekordne nízka miera

    GLM-5 dosiahol -1 na indexe Artificial Analysis AA-Omniscience, čo predstavuje 35-bodové zlepšenie oproti predchodcovi. V súčasnosti vedie medzi všetkými testovanými modelmi od OpenAI, Anthropic a Google v tejto kategórii.


    Ceny: 6-krát lacnejší ako Claude Opus

    ModelVstup (za 1M tokenov)Výstup (za 1M tokenov)
    GLM-5~$0,80~$2,56
    GPT-5.2$2,50$10,00
    Claude Opus 4.6$5,00$25,00

    To je približne 6-krát lacnejšie na vstupe a takmer 10-krát lacnejšie na výstupe v porovnaní s Claude Opus 4.6.


    Generovanie dokumentov: Za hranicou chatu

    GLM-5 zavádza natívne schopnosti "Agent Mode", ktoré presahujú tradičný chat. Model môže priamo vytvoriť hotový súbor .docx, .pdf alebo .xlsx. Platforma Z.ai (chat.z.ai) má tento režim zabudovaný.

    Model je tiež kompatibilný s populárnymi kódovacími agentmi ako Claude Code, OpenCode a Roo Code, ako aj s OpenClaw, frameworkom pre medziaplikačné agentové workflow.


    Spustite GLM-5 lokálne

    GLM-5 podporuje nasadenie cez vLLM, SGLang a xLLM.

    Použitie vLLM (Docker)

    bash
    docker pull vllm/vllm-openai:nightly
    

    Nasadenie

    bash
    vllm serve zai-org/GLM-5-FP8 \
         --tensor-parallel-size 8 \
         --gpu-memory-utilization 0.95
    

    Použitie SGLang (Docker)

    bash
    # Pre Hopper GPU
    docker pull lmsysorg/sglang:glm5-hopper
    
    # Pre Blackwell GPU
    docker pull lmsysorg/sglang:glm5-blackwell
    

    Váhy modelu sú dostupné na HuggingFace: zai-org/GLM-5


    Čínska vlna open-source AI

    GLM-5 nevzniká izolovane. Je súčasťou zrýchľujúcej sa vlny čínskych open-source AI vydaní. Podľa štúdie Stanfordu čínske AI modely historicky zaostávali asi sedem mesiacov za americkými. GLM-5 prišiel len asi tri mesiace po najnovších vydaniach od Anthropic, Google a OpenAI, čím efektívne skrátil toto oneskorenie na polovicu.

    Konkurencia v rámci čínskej AI krajiny sa tiež zostruje. Kimi K2.5 od Moonshot AI volí iný architektonický prístup s využitím rojov agentov pracujúcich paralelne. Medzitým DeepSeek-V3.2 teraz zaostáva za GLM-5 aj Kimi K2.5 vo viacerých benchmarkoch.


    Mali by ste vyskúšať GLM-5?

    GLM-5 dáva najväčší zmysel, ak potrebujete schopný model, ale nemôžete alebo nechcete sa spoliehať na proprietárne API.

    • Lokálna inferencia s dátovou suverenitou. Ak pôsobíte pod GDPR, GLM-5 s licenciou MIT a lokálnym nasadením je jednou z najsilnejších dostupných možností.
    • Vysokoobjemové záťaže s obmedzeným rozpočtom. Pri ~$0,80/1M vstupných tokenov môžu tímy výrazne znížiť náklady v porovnaní s Claude alebo GPT.
    • Kódovanie a agentové úlohy. Výsledky GLM-5 v SWE-bench a BrowseComp ho zaraďujú do rovnakej ligy ako proprietárne modely.

    Vyskúšajte ho na chat.z.ai alebo si stiahnite váhy z HuggingFace.


    Zdroje:

    Vytvorené Namiru.ai - plug-and-play AI chat pre váš web.

    Patrik Kelemen
    Author
    Ing. Patrik Kelemen
    Founder of Namiru.aiSlovakia, EU

    Senior software engineer with 10+ years of experience, specializing in AI chat widgets and automation. Building Namiru.ai to help businesses leverage AI without complexity.

    AI AgentsAngularReactNodeJSAWSAzure
    Páčil sa vám tento článok?

    Pozrite sa, čo AI môže urobiť pre váš web

    Vložte svoju URL a sledujte, ako váš AI agent ožije za pár sekúnd.

    Vaši zákazníci dostanú okamžité odpovede. Vy získate leady, analytiku a svoj čas späť.

    Bez kreditnej karty

    Namiru.ai

    AI chat for your website