GLM-5: Čínský open-source gigant, který konkuruje Claude a GPT

    7 min čtení
    Ing. Patrik Kelemen
    GLM-5: Čínský open-source gigant, který konkuruje Claude a GPT

    GLM-5 od Zhipu AI přichází se 744 miliardami parametrů, je vydán pod licencí MIT a v benchmarcích se přiblížil ke Claude Opus 4.5 a GPT-5.2. Trénovaný výhradně na čipech Huawei a oceněný přibližně 6x levněji než jeho proprietární rivalové, je jedním z nejsilnějších open-source modelů dostupných dnes.

    Namiru AI

    AI zákaznická podpora pro váš web

    Vložte svou URL. Získejte agenta podpory za 30 sekund.

    1. února 2026 čínská AI laboratoř Zhipu AI (nyní přejmenovaná na Z.ai) vydala GLM-5, nový open-source velký jazykový model, který přímo konkuruje Claude Opus 4.5, GPT-5.2 a Gemini 3 Pro v kódování, uvažování a agentových benchmarcích.

    Trh reagoval silně. Akcie Zhipu v Hongkongu vyskočily o 28,7 % v den vydání. Zajímavé je, že před oficiálním oznámením záhadný model s názvem "Pony Alpha" již dosahoval nejvyšších skóre na OpenRouter. Ukázalo se, že to byl GLM-5 běžící pod jiným názvem.

    Zde je to, co je uvnitř a jak se srovnává.


    Co je GLM-5?

    GLM-5 je pátá generace velkého jazykového modelu od Zhipu AI, společnosti, která vznikla na Univerzitě Tsinghua v roce 2019 a dokončila IPO v Hongkongu v lednu 2026, přičemž získala přibližně 558 milionů dolarů.

    Model je postaven na architektuře Mixture-of-Experts (MoE) se 744 miliardami celkových parametrů, z nichž je pouze 40 miliard aktivních na jednu inferenci. To je téměř dvojnásobek velikosti jeho předchůdce GLM-4.5, který měl 355 miliard parametrů.

    GLM-5 integruje DeepSeek Sparse Attention (DSA) ke snížení nákladů na nasazení při zachování kapacity pro dlouhý kontext až 200K tokenů.

    GLM-5 ve zkratce

    SpecifikacePodrobnosti
    Celkové parametry744B
    Aktivní parametry (na token)40B
    ArchitekturaMixture-of-Experts (MoE), 256 expertů, 8 aktivních na token
    Předtrénovací data28,5 bilionu tokenů
    Kontextové okno200K tokenů
    Mechanismus pozornostiDeepSeek Sparse Attention (DSA)
    LicenceMIT
    Tréningový hardwareČipy Huawei Ascend (plně domácí)
    DostupnostHuggingFace, Z.ai API, OpenRouter

    GLM-5 byl trénován výhradně na čipech Huawei Ascend pomocí frameworku MindSpore, čímž dosáhl úplné nezávislosti na hardwaru vyráběném v USA.


    Výkon v benchmarcích

    Kódování a inženýrství

    BenchmarkGLM-5Claude Opus 4.5GPT-5.2Gemini 3 ProDeepSeek-V3.2Kimi K2.5
    SWE-bench Verified77,8 %80,9 %80,0 %76,2 %73,1 %76,8 %
    SWE-bench Multilingual73,3 %77,5 %72,0 %65,0 %70,2 %73,0 %
    Terminal-Bench 2.056,259,354,054,239,350,8

    Claude Opus 4.5 stále vede v kódování, ale GLM-5 není daleko a je open-source a zdarma.

    Uvažování

    BenchmarkGLM-5Claude Opus 4.5GPT-5.2Gemini 3 ProDeepSeek-V3.2Kimi K2.5
    HLE (Humanity's Last Exam)30,528,435,437,225,131,5
    HLE s nástroji50,443,445,545,840,851,8
    AIME 2026 I92,793,3-90,692,792,5
    GPQA-Diamond86,087,092,491,982,487,6

    GLM-5 překonává Claude Opus 4.5 v Humanity's Last Exam (textová verze i s nástroji).

    Agentové úlohy

    BenchmarkGLM-5Claude Opus 4.5GPT-5.2Gemini 3 ProDeepSeek-V3.2Kimi K2.5
    BrowseComp (s kontextem)75,967,865,859,267,674,9
    τ²-Bench89,791,685,590,785,380,2
    MCP-Atlas67,865,268,066,662,263,8
    Vending Bench 2$4 432$4 967$3 591$5 478$1 034$1 198

    V BrowseComp GLM-5 překonává každý model ve srovnání, včetně proprietárních.


    Halucinace: Rekordně nízká míra

    GLM-5 dosáhl -1 na indexu Artificial Analysis AA-Omniscience, což představuje 35bodové zlepšení oproti předchůdci. V současnosti vede mezi všemi testovanými modely od OpenAI, Anthropic a Google.


    Ceny: 6x levnější než Claude Opus

    ModelVstup (za 1M tokenů)Výstup (za 1M tokenů)
    GLM-5~$0,80~$2,56
    GPT-5.2$2,50$10,00
    Claude Opus 4.6$5,00$25,00

    To je přibližně 6x levnější na vstupu a téměř 10x levnější na výstupu ve srovnání s Claude Opus 4.6.


    Generování dokumentů: Za hranicí chatu

    GLM-5 zavádí nativní schopnosti "Agent Mode". Model může přímo vytvořit hotový soubor .docx, .pdf nebo .xlsx. Platforma Z.ai (chat.z.ai) má tento režim zabudovaný.

    Model je také kompatibilní s populárními kódovacími agenty jako Claude Code, OpenCode a Roo Code, jakož i s OpenClaw, frameworkem pro meziaplikační agentové workflow.


    Spusťte GLM-5 lokálně

    GLM-5 podporuje nasazení přes vLLM, SGLang a xLLM.

    Použití vLLM (Docker)

    bash
    docker pull vllm/vllm-openai:nightly
    

    Nasazení

    bash
    vllm serve zai-org/GLM-5-FP8 \
         --tensor-parallel-size 8 \
         --gpu-memory-utilization 0.95
    

    Použití SGLang (Docker)

    bash
    # Pro Hopper GPU
    docker pull lmsysorg/sglang:glm5-hopper
    
    # Pro Blackwell GPU
    docker pull lmsysorg/sglang:glm5-blackwell
    

    Váhy modelu jsou dostupné na HuggingFace: zai-org/GLM-5


    Čínská vlna open-source AI

    GLM-5 nevzniká izolovaně. Podle studie Stanfordu čínské AI modely historicky zaostávaly asi sedm měsíců za americkými. GLM-5 přišel jen asi tři měsíce po nejnovějších vydáních od Anthropic, Google a OpenAI, čímž efektivně zkrátil toto zpoždění na polovinu.

    Kimi K2.5 od Moonshot AI volí jiný architektonický přístup s využitím rojů agentů. Mezitím DeepSeek-V3.2 nyní zaostává za GLM-5 i Kimi K2.5 ve více benchmarcích.


    Měli byste vyzkoušet GLM-5?

    • Lokální inference s datovou suverenitou. Pokud působíte pod GDPR, GLM-5 s licencí MIT a lokálním nasazením je jednou z nejsilnějších dostupných možností.
    • Vysokoobjemové zátěže s omezeným rozpočtem. Při ~$0,80/1M vstupních tokenů mohou týmy výrazně snížit náklady ve srovnání s Claude nebo GPT.
    • Kódování a agentové úlohy. Výsledky GLM-5 v SWE-bench a BrowseComp ho řadí do stejné ligy jako proprietární modely.

    Vyzkoušejte ho na chat.z.ai nebo si stáhněte váhy z HuggingFace.


    Zdroje:

    Vytvořeno Namiru.ai - plug-and-play AI chat pro váš web.

    Patrik Kelemen
    Author
    Ing. Patrik Kelemen
    Founder of Namiru.aiSlovakia, EU

    Senior software engineer with 10+ years of experience, specializing in AI chat widgets and automation. Building Namiru.ai to help businesses leverage AI without complexity.

    AI AgentsAngularReactNodeJSAWSAzure
    Líbil se vám tento článek?

    Podívejte se, co AI může udělat pro váš web

    Vložte svou URL a sledujte, jak váš AI agent ožije během sekund.

    Vaši zákazníci dostanou okamžité odpovědi. Vy získáte leady, analytiku a svůj čas zpět.

    Bez kreditní karty

    Namiru.ai

    AI chat for your website