火山引擎:AI加速落地行业,Agent技术引领企业生产力新变革

   时间:2025-12-19 07:33 来源:快讯作者:沈瑾瑜

12月1日,豆包手机正式开启小规模市场发售,市场反响热烈程度远超预估。尽管该手机助手尚未打通各类应用程序的API接口,但其凭借AI技术模拟用户点击、滑动等操作,直接理解屏幕内容并跨应用执行指令,成功在某种程度上打破了应用程序间的“信息孤岛”现象,实现了应用间的协同操作。

在12月17日举办的FORCE原动力大会上,火山引擎宣布推出豆包大模型1.8版本。该版本不仅强化了Agent相关能力,还在多模态理解和上下文管理方面取得显著进展。与此同时,万亿Token俱乐部成员数量突破100家,这一规模已超越某头部云服务提供商。火山引擎总裁谭待在会上强调,模型领域的关键不在于竞争,而在于共同开拓市场。他指出,火山引擎率先提出模型的重要性,并通过技术革新大幅降低成本,同时保持盈利能力。这一策略最初引发质疑,但如今已有更多厂商跟进降价措施。

谭待在现场公布的数据显示,截至今年12月,豆包大模型的日均token使用量突破50万亿,较去年同期增长超10倍,自发布以来累计增长417倍。目前已有超过100家企业客户的累计token使用量超过一万亿,标志着企业级AI应用正加速规模化落地。豆包大模型1.8版本在设计阶段便聚焦多模态Agent场景,系统性提升了多轮交互、复杂指令遵循及操作系统级Agent操作能力。在视觉能力方面,该版本通过底层升级实现了对低帧率超长视频的理解,并在视频语义解析、空间关系理解及文档结构化处理等领域取得突破。其原生支持的智能上下文管理机制允许用户通过策略配置自动清理历史信息,确保超长多步骤任务的稳定执行。

火山引擎的视频生成模型Seedance也迎来重大升级。从春季发布的1.0版本到冬季的1.5 Pro版本,该模型采用原生音视频联合生成架构,支持环境音、背景音乐及人声等多元素同步输出,实现毫秒级音画对齐。Seedance 1.5 Pro还具备多人跨语言对话能力,可根据画面中说话角色的数量和景深信息精准匹配口型,有效解决“张口不发声”或口型错位等问题。该版本原生支持多语言及四川话、粤语、上海话等中文方言,显著拓展了视频内容创作的实用场景。相较于市场上其他模型在口型匹配和语义一致性方面的不足,Seedance 1.5 Pro在这两项关键指标上实现显著提升。

在定价策略上,火山引擎推出业内首个“AI节省计划”,覆盖旗下所有按量后付的大模型产品,包括豆包大模型家族及第三方开源模型,最高可为用户节省47%的使用成本。针对企业Agent应用的规模化落地难题,火山引擎推出推理代工服务,提供极致弹性伸缩、全栈推理优化及分布式缓存支持。该服务被比喻为“已调校完成的顶级赛车”,用户只需“插入模型发动机”即可快速运行。

随着大模型智能水平的持续提升,Agent技术正逐步渗透企业核心业务。谭待预测,未来两三年内Agent将引发生产力革命,但企业当前更关注如何将构建好的Agent转化为大规模业务价值。为此,火山引擎发布AI Agent平台AgentKit+HiAgent技术体系。其中,AgentKit作为基础设施底座,集成了身份认证、运行时环境、云沙箱、网关、记忆库、可观测性、评测系统及安全围栏等功能。传统Agent开发需手动调用模型、解析结果并处理异常状态,前端逻辑需编写七八百行代码,后端接口及云资源调用同样需要相同量级,总代码量达1500至2000行且易出错。AgentKit通过SDK和服务化封装将复杂控制逻辑开箱即用,前端Agent仅需约50行代码,后端仅需十几行即可完成简单串联,整套实现控制在61行以内,代码量减少约96%。依托预置云端服务,该平台显著提升了Agent开发与运行的稳定性,加速了企业将Agent推向生产环境的进程。

火山引擎于2024年发布的HiAgent解决方案也在持续迭代。今年推出的“1+N+X”体系包含统一AI任务调度入口、N个企业通用智能体及X个业务定制智能体应用,进一步助力企业加速Agent规模化部署。通过这些技术突破,火山引擎正推动AI从技术潜力转化为实际行业生产力。

 
 
更多>同类内容
推荐图文
推荐内容
点击排行
 
智快科技微信账号
ITBear微信账号

微信扫一扫
加微信拉群
电动汽车群
科技数码群