GPT-5诞生之路坎坷:核心人才流失,推理难题待解,英伟达助力突破

   时间:2025-08-02 15:52 来源:ITBEAR作者:顾青青

近日,关于人工智能巨头OpenAI的下一代语言模型GPT-5的诞生历程,外媒The Information披露了一系列鲜为人知的内幕消息,引发了业界的广泛关注。

据悉,GPT-5的诞生之路并非一帆风顺。在研发过程中,OpenAI遭遇了人才流失、内部混乱以及技术瓶颈等多重挑战。尤其是核心研究团队的部分成员被meta(脸书母公司)的高薪挖角,直接导致了OpenAI内部组织架构的动荡。这一变动甚至引发了研究副总裁Jerry Tworek在Slack上的公开抱怨,表达了团队面临的困境,这一消息被众多同事所见。

然而,就在这些负面消息频出的同时,OpenAI却传来了另一则好消息。公司成功筹集了83亿美元的巨额融资,使其估值飙升至3000亿美元。这笔资金是OpenAI今年400亿美元融资计划的一部分,由Dragoneer投资集团领投,Blackstone、TPG、Fidelity、Founders Fund和红杉资本等多家投资机构跟投。尽管Dragoneer是本轮融资的最大出资方,但软银仍是整个融资计划的牵头者。

尽管融资成功为OpenAI注入了新的活力,但GPT-5的研发进展却并未如预期般顺利。据外媒报道,GPT-5并未实现像GPT-3到GPT-4那样的技术飞跃。实际上,原本被寄予厚望的Orion模型,在经历了一系列测试后,因其性能未能达到预期,最终被降级为GPT-4.5,并于今年2月低调发布。GPT-4.5的推出并未引起市场的广泛关注,迅速淡出了公众的视野。

Orion模型的失败,暴露了OpenAI在预训练阶段遇到的天花板问题。随着高质量网络数据的日益枯竭,原本在小模型上有效的训练技巧,在大模型上却失效了。这不仅导致了GPT-5的延期,也让OpenAI团队内部陷入了自我怀疑。

尽管如此,OpenAI并未放弃对GPT-5的研发。据报道,公司正在开发一种名为“通用验证器”的新技术,该技术可以自动化地确保模型在强化学习(RL)过程中产生高质量的答案。这一技术的核心是让一个大型语言模型(LLM)承担起检查和评估另一个模型答案的任务,并利用各种信息源对答案进行核实。这一创新有望为GPT-5的性能提升提供有力支持。

OpenAI在推理模型方面也取得了新的突破。基于一项名为Q*的技术突破,OpenAI开发了一系列推理模型,这些模型在获得更多算力时表现出更佳的性能。尽管在将推理模型转化为聊天版本时遇到了一些挑战,但OpenAI仍在不断探索和优化这一技术路径。

尽管GPT-5的发布日期尚未确定,但OpenAI的高管们对模型的未来充满信心。他们相信,沿着目前的架构路径发展,模型有朝一日将达到GPT-8的水平。CEO山姆·奥特曼也表示,利用现有技术,OpenAI有望创造出通用人工智能(AGI)。这些乐观的预期,无疑为OpenAI的未来增添了更多的想象空间。

 
 
更多>同类内容
推荐图文
推荐内容
点击排行
 
智快科技微信账号
ITBear微信账号

微信扫一扫
加微信拉群
电动汽车群
科技数码群