商汤科技近日在港交所发布公告,宣布通过一般授权配售新B类股份,此轮配售吸引了至少六家机构踊跃认购。这一动作不仅展现了资本市场对商汤科技长期发展潜力的认可,更凸显了市场对其在AI领域持续创新能力的坚定信心。公告明确指出,配售所得资金将主要用于进一步扩大AIDC“大装置”的规模,并提升其国产化比例,为AI技术的自主可控发展注入新动力。
在AI产业生态中,一个值得关注的动态是寒武纪与商汤科技的深度合作。寒武纪宣布其芯片已完成对商汤“日日新”Seko系列多模态模型的适配,且实现了“Day 0”级别的同步支持。这一成就意味着,在寒武纪的官方适配名单中,仅有DeepSeek与商汤“日日新”两款模型能够达到如此高效的响应水平。此举不仅标志着国产芯片在文本逻辑处理领域已具备成熟能力,更在多模态场景中实现了关键性突破,为AI技术的广泛应用奠定了坚实基础。
从技术层面看,这一突破是对传统Scaling Law框架下供应链约束的有效回应。随着单纯依赖算力堆叠的线性增长路径逐渐失效,AI产业正寻求新的发展路径。商汤与寒武纪的合作,正是这一转型的生动实践。它预示着AI产业的竞争焦点已从参数规模的竞逐,转向对物理现实的深度回归。原生AI企业正通过与国产芯片的深度融合,加速推动芯片技术的成熟化进程。
然而,AI国产化的道路并非坦途。尽管国产芯片力量蓬勃兴起,但硬件架构的不统一却成为制约发展的瓶颈。不同品牌芯片间的迁移成本高昂,形成了技术孤岛,阻碍了AI技术的规模化应用。面对这一挑战,商汤科技选择了一条长期主义的发展道路,致力于构建全面国产化的AI生态体系。
商汤大装置(SenseCore)在这一战略中扮演了核心角色。它不仅是一个算力中心,更是一个异构调度与适配平台,为国产芯片提供了千亿参数级、超大规模并发的真实业务场景。在这样的环境中,国产芯片的潜能得以充分激发,优化空间得以极限拓展。商汤通过抽象出统一的软件介质,实现了跨异构加速卡的统一训练,为上层应用提供了标准化的接口。这一创新不仅降低了开发者的使用门槛,更让端侧用户能够轻松获取高性能、高性价比的国产算力。
商汤与寒武纪的合作模式,为国产芯片的发展提供了新的思路。双方不仅停留在硬件采购层面,更深入到了技术耦合的深水区。商汤利用自身在大模型研发和基础设施构建上的经验,反哺芯片设计,共同构建了“阶梯式产品创新体系”。这种软硬协同的模式,不仅提升了国产算力的整体性能,更为AI技术的商业化落地提供了有力支撑。
在与摩尔线程的合作中,商汤则展现了技术共生的智慧。摩尔线程在图形渲染领域的深厚积累,恰好满足了商汤在AIGC视频生成中的复合算力需求。双方通过互补合作,共同推动了AI技术在视频生成领域的创新应用。而与沐曦的合作,则进一步验证了新架构芯片在特定高难度任务上的潜力。商汤通过具体业务场景的适配广度,为沐曦提供了丰富的场景验证,双方共同确立了“算力集群+行业拓展”的全方位合作模式。
值得一提的是,商汤在国内市场首次完成了华为昇腾910C的超节点全面适配。这一突破不仅意味着国产GPU在千亿参数级大模型的训练与推理中通过了工业级标准的严苛考验,更标志着国产算力和国产架构正以一体化的方式,从“可用”走向“好用”。商汤用大装置SenseCore和日日新大模型体系全面适配为国产芯片“练兵”的战略,成功解决了AI国产化进程中的关键应用基础设施难题。
在工程化创新方面,商汤同样展现出了强大的实力。与记忆张量的合作中,双方攻克了“GPGPU架构适配难度远高于NPU”的行业难题,实现了PD分离技术的首次大规模商用落地。这一创新通过将预填充与解码过程在物理上分离并异构部署,显著提升了国产GPU的推理性价比。而在视频生成领域,商汤开源的LightX2V推理框架更是行业首个能实现实时视频生成的框架。其国产化适配插件模式不仅支持多款主流国产芯片,更在几乎不损失画质的前提下,将推理性能提升了3倍以上。
商汤的战略触角不仅延伸至云端大装置,更深入到了端侧世界。其产品矩阵涵盖了从大装置到日日新多模态模型、再到端侧应用的全栈生态。以小浣熊AI办公应用为例,该应用不仅完成了国产芯片适配,其端侧模型精度更能够对标云端。这一突破打破了“国产算力难以在终端普及”的魔咒,为AI技术的广泛应用提供了更多可能性。而在城市管理、金融、医疗等对数据主权极其敏感的业务领域,商汤提供的全栈国产化私有化部署方案更是精准击中了客户痛点,实现了从技术验证到真正商业化的跨越。















