浪潮Yuan3.0 Ultra多模态大模型开源:高效架构助力企业级AI应用新突破

   时间:2026-03-07 13:23 来源:快讯作者:苏婉清

浪潮旗下YuanLab.ai团队今日宣布,正式开源面向万亿参数规模设计的源Yuan3.0 Ultra多模态基础大模型。该模型通过系统性优化训练效率与架构设计,在复杂企业场景中展现出显著优势,成为智能体框架构建的重要技术支撑。

模型采用统一多模态架构,由视觉编码器、语言主干网络及多模态对齐模块构成。其中语言主干网络基于混合专家(MoE)架构搭建,包含103层Transformer结构,初始训练参数规模达15150亿。通过LAEP方法创新,团队在预训练阶段将有效参数优化至10100亿,算力效率提升49%,激活参数最终稳定在688亿规模。

针对企业级应用需求,研发团队在模型设计中深度融合三大核心能力:多模态文档理解可精准解析图文混排内容;检索增强生成(RAG)技术实现跨文档知识关联;表格数据分析模块支持多级结构表格的智能处理。这些特性使模型能高效完成内容摘要、工具调用等复杂任务,为基于OpenClaw等智能体框架的企业Agent AI提供关键能力支撑。

技术突破方面,Localized Filtering Attention(LFA)机制的引入显著提升了语义建模精度。相比传统注意力结构,该机制通过优化信息筛选路径,在保持计算效率的同时获得更高的模型准确度。测试数据显示,在处理结构化与非结构化混合数据时,模型表现优于同类产品12%-18%。

此次开源内容全面覆盖技术生态,包含16bit与4bit量化模型权重、完整训练方法论、技术白皮书及多维度评测报告。开发社区可基于现有框架进行二次训练,快速适配金融、医疗、制造等行业的定制化需求。据团队透露,源Yuan3.0基础模型系列还将陆续推出Flash(400亿参数)、Pro(2000亿参数)等版本,形成覆盖不同场景的完整产品线。

 
 
更多>同类内容
推荐图文
推荐内容
点击排行
 
智快科技微信账号
ITBear微信账号

微信扫一扫
加微信拉群
电动汽车群
科技数码群