AI推理芯片领域迎来新突破,初创企业Positron近日对外展示了其第二代ASIC芯片设计——Asimov。这款芯片被宣称在Token能效与性价比方面表现卓越,可达到英伟达Rubin GPU的五倍水平,引发了行业广泛关注。
Positron团队深入分析后指出,当前Transformer推理运行的主要瓶颈并非算力,而是内存。基于这一洞察,Asimov芯片在设计上采取了内存优先的策略。通过优化设计,该芯片实现了高达90%的内存带宽利用率,同时从架构层面减少了不必要的远程数据传输,有效提升了数据处理效率。
从硬件配置来看,Asimov芯片由两个计算模块构成,每个模块均配备了支持多种数据格式的脉动阵列。在内存方面,每个计算模块直接连接432GB的LPDDR5x内存,并通过PCIe 6.0或CXL 3.0接口连接至多720GB的KV Cache缓存内存。整个芯片的热设计功耗(TDP)为400W,内存总容量高达2304GB,总带宽达到2.76 TB/s,且支持风冷散热方案。
在系统集成方面,Asimov芯片支持16Tbps的芯片间互联,可构建多样化的拓扑结构。其推出的Titan推理服务器系统采用19英寸4U机架规格,集成了4颗Asimov芯片。该系统能够支持16T参数模型的推理任务,并具备10M的上下文窗口容量。更引人注目的是,单个系统最多可扩展至4096套Titan,展现出强大的扩展能力。
据Positron公司透露,Asimov芯片的研发工作正在稳步推进,目标是在2026年底完成芯片流片,并计划于2027年初正式投入量产。这一时间表的公布,让业界对这款芯片的实际表现充满期待。















