春节期间,国产人工智能领域迎来一波新品发布热潮,其中智谱科技推出的新一代大模型GLM-5成为行业焦点。这款模型不仅与备受瞩目的DeepSeek V4同期亮相,更凭借技术突破引发资本市场强烈反应——公司股价在短期内实现三倍增长,总市值突破1500亿港币大关。
全球模型服务平台OpenRouter此前上线的一款代号"Pony Alpha"的匿名模型,因在代码生成任务中展现出与Claude Opus相当的实力而引发技术圈热议。经过多方验证,该模型的真实身份逐渐浮出水面:系统提示词中自述为GLM架构,且存在与GLM家族模型相同的文本处理漏洞——当输入"锅内倒入植物油烧热"这类中文烹饪指令时,模型会输出混乱结果。这些特征与智谱即将发布的GLM-5高度吻合。
技术解析显示,GLM-5采用与DeepSeek-V3/V3.2相同的稀疏注意力机制(DSA),总参数量达7450亿,是前代GLM-4.7的两倍规模。其创新性的多token预测架构包含78层隐藏层,通过256个专家模块实现动态计算,每次激活8个专家模块即可输出约440亿参数的推理结果,稀疏度控制在5.9%水平。这种设计使模型在保持高效运算的同时,上下文处理能力扩展至202K token。
值得关注的是,GLM-5在技术复用方面取得突破。通过兼容DeepSeek的稀疏架构,新模型可直接调用vLLM、SGLang等主流推理框架的优化方案,显著降低企业级部署的技术门槛。这种技术协同效应被视为推动智谱股价飙升的关键因素之一——资本市场预期该模型将加速在金融、医疗等领域的商业化落地。
尽管GLM-5在文本处理领域展现强劲实力,但其多模态能力仍存提升空间。作为DeepSeek技术路线的延续者,该模型现阶段主要聚焦文本生成,与当前主流大模型普遍具备的视频处理能力形成对比。业内人士指出,随着2026年多模态技术成为行业标配,GLM系列模型可能需要通过架构升级来弥补这一短板。
资本市场对GLM-5的热烈反响已转化为实际数据:智谱科技股价较数月前IPO时暴涨200%,总市值突破1500亿港币。这种增长态势既反映投资者对国产大模型技术突破的认可,也预示着AI领域新一轮竞争格局正在形成。随着GLM-5在全球市场的持续渗透,中国人工智能企业的技术影响力正在从亚太地区向全球范围扩展。















