近日,OpenAI Codex团队负责人Tibo在社交平台发布消息,宣布Codex App、CLI和SDK现已支持接入任意开源模型,不再局限于OpenAI自家模型,并附上了官方配置文档链接,指向OSS模式和本地provider相关内容。这一举措打破了OpenAI长期以来给人的封闭印象,引发了广泛关注。
Codex并非普通工具,它是一个功能完备的工作台。模型在其中不仅要具备语言交互能力,更要能够切实执行任务,如读写文件、调用shell、抓取网页、执行命令,还能依据工具返回结果持续推理,最终输出可交付成果。
此前,OpenAI被诟病封闭,不仅因为模型不开源,更关键的是其工具、模型和工作流被封闭在自家体系内。用户虽可使用,但难以进行拆分和重组。像Codex这类Agent工具,是模型能力、工具调用、上下文管理、权限控制和本地环境等多种要素的组合。模型能力越强、工作台越完善,用户粘性就越高。此次OpenAI为Codex设置custom model provider入口,在产品姿态上展现出不再将Codex与自家模型死死绑定的转变。
然而,实际情况并非表面那般简单。所谓“Codex支持第三方模型”,并非填个Key就能直接使用第三方模型。以DeepSeek V4 Pro为例,其官方API主入口为Chat Completions,虽能用OpenAI SDK调用,也能正常填写模型名称,对多数聊天应用、普通API调用及OpenAI SDK兼容场景来说没有问题,但Codex并非以这种方式请求。
Codex官方高级配置文档虽提及自定义模型供应商,允许定义连接模型的方式,包括接口地址、协议类型、鉴权方式和附加请求信息,用户也可在配置文件中新增模型供应商并让Codex指向它。但经实测,首次尝试接入DeepSeek V4 Pro的API失败。翻阅官方技术文档后发现,Codex当前自定义供应商公开支持的协议仅有Responses API一种,且为默认协议。这意味着模型供应商能否接入,不仅取决于是否有API,还取决于能否提供Codex所需的Responses形态。
DeepSeek官方API主入口为Chat Completions,并不存在Codex要访问的Responses接口,所以直接连接会返回404错误。实际上,即便都宣称“兼容OpenAI”,也存在不同层次。Chat Completions和Responses API是不同接口,普通聊天、工具调用、流式输出、推理块、函数调用结果回传等在不同协议中的结构并不完全相同,这些差异对用户而言隐藏在配置之后,但对Codex这类Agent工作台来说,直接影响任务能否正常运行。
不过,转机出现在DeepSeek的另一个入口——Anthropic API兼容端点。DeepSeek官方文档除常见OpenAI格式入口外,还提供了Anthropic格式入口,该入口更适合承载工具调用、工具返回结果等Agent场景所需的结构,与Codex工作方式更为接近。最终,通过在本机添加一层轻量“翻译器”,让Codex按自身熟悉方式发起任务,“翻译器”将请求转换为DeepSeek能理解的格式,DeepSeek返回结果后再翻译回Codex可继续执行工具的形态,才成功实现接入。
目前,像DeepSeek、Mimo、Kimi、智谱GLM等模型,都无法直接用API Key接入Codex,只能借助转接桥,这与之前流行的CC Swich方案类似。当然,若想直接接入,阿里百炼大模型目前提供Responses接口,不过价格为200元/月。
在接入DeepSeek并完成配置后,对其进行了实际任务测试。第一个任务是全网搜索相关资料,结合官网介绍、文章、特色报道等,制作一份雷科技的商务招商文档并输出为Markdown文件。此任务涉及多个Agent能力点,如资料查找、信息提取、结构重组和文件生成等。DeepSeek V4 Pro起初内置网页搜索工具不可用,便直接从本地终端抓取雷科技官网一手页面,最终生成一份320行的Markdown文档,内容涵盖品牌定位、媒体矩阵、用户画像等多个方面,虽页面粗糙但可用。
第二个任务是读取上一步生成的招商文档,制作一份雷科技2026年度招商报告PPT并输出为HTML格式,以此测试连续任务能力。模型需理解上一步文件中的9个章节,将其改造成10页slide。最终输出一个约790行、近40KB的单文件HTML,包含暗色科技风主题、蓝紫强调色等多种元素,虽非精修设计稿,但已是一个可打开、预览和修改的交付物。从完成度看,DeepSeek在这组轻量任务中表现尚可,资料整理速度快,长文档组织能力不错,遇到工具不可用时会尝试绕路,生成Markdown和HTML这类文本型文件较为顺利,可承担初稿生产任务。
不过,在体验上,DeepSeek与官方模型相比仍有差距。Codex与GPT 5.5同属一个生态,模型、工具调用等各方面都能顺利协同。而Deepseek在Codex中运行链路长,中间经过转接桥,速度明显慢于“官配”组合。尤其在Codex的Agent工作流中,模型需一边调用工具、等待结果,一边继续推理,链路增加和工具调用的来回跑动,导致速度体感更慢。
在消耗方面,DeepSeek表现出较高的性价比。给DeepSeek账户充值10元,完成两个任务以及几轮聊天和调试后,余额还剩9.27元,仅花费7毛多。若全为这类任务,确实可考虑放弃ChatGPT Plus每月20美元的订阅费。
此次Codex开放第三方模型接入,对多数普通用户而言,意义或许不大。若追求简单、丝滑体验,开通Plus会员性价比尚可,毕竟它与ChatGPT打包在一起。但对于开源模型来说,却是难得的机遇。
过去,国产和开源模型要进入开发者真实工作流,需自行构建众多产品层能力。模型发布API只是第一步,后续还有IDE插件、命令行工具等诸多工作。Codex这类工具搭建好了工作台,负责与本地文件系统交互、执行命令、展示工具调用等,第三方模型接入后,可直接获得一个成熟的Agent容器。这对智谱、DeepSeek、Qwen、Kimi等模型都是发展契机。
以智谱为例,其近期上线GLM - 5.2,强调1M无损上下文、长程任务能力提升,在复杂系统工程、深度调试中表现更稳,在代码任务和长程Agent场景性能获开发者好评。同时,智谱的GLM Coding Plan因太火爆而成为稀缺资源,这表明国产模型竞争已从单纯发布强模型,转向围绕Coding Plan、开发工具接入、Agent工作流额度和真实工程体验展开。
智谱也有自己的Agent工具,其图形化Agent工作台可让用户交给模型代码任务、长程任务和工程任务。但对模型厂商而言,自建工作台与接入Codex这类成熟工作台并不冲突。自家工具用于展示完整能力和打磨闭环体验,接入Codex则可进入被大量开发者熟悉的工作环境,增加被使用和比较的机会。OpenAI消息发布后,智谱股价一度大涨超22%,突破2000港元大关,市值创新高,这从侧面反映出市场对此的积极反应。
不过,OpenAI开放Codex provider并非放弃控制权。工作台标准仍由其定义,Responses API、模型配置等关键环节围绕OpenAI体系展开。OpenAI或许希望将Codex打造成更通用的Agent工作台,官方模型提供最强能力和最佳体验,第三方模型扩展场景、降低成本、覆盖更多供应商需求,让用户选择在OpenAI定义的工作台内进行。目前来看,OpenAI的开放程度仍显不足。















