当公众还在讨论AI代码出错、效率低下时,实验室里的研究者却目睹着另一番景象——AI不仅能独立完成复杂任务,其能力曲线更以惊人的指数速度攀升。AlphaGo与AlphaZero核心开发者Julian Schrittwieser近日公开警告:人类对AI的认知,已与前沿现实脱节至少一个技术世代。
Julian以新冠疫情初期为喻:2020年全球对病毒传播的认知滞后,导致防疫措施被动;如今AI的发展正面临同样的认知鸿沟。他指出,大众紧盯模型出错细节便断言"AI不过如此",却忽视了三年前AI写程序还被视为科幻的现实。"我们正在重复疫情初期的错误——用线性思维理解指数级变化。"
支撑这一观点的,是METR机构最新研究数据。该机构通过测量AI自主完成真实任务的时长发现:Claude 3.7 Sonnet已能持续处理1小时软件工程任务,且能力曲线每7个月翻倍。更震撼的是,Grok 4、Claude Opus 4.1等新模型已突破2小时大关。按照当前趋势推算,2026年年中AI将具备8小时连续工作能力,2027年更可能在特定领域超越人类专家。
跨行业评测进一步验证了这一趋势。OpenAI的GDPval项目对44个职业、9大行业的1320项真实任务进行测试,结果显示GPT-5在多数职业任务中已接近人类水平,而发布更早的Claude Opus 4.1甚至在多个维度超越GPT-5,接近行业专家表现。值得注意的是,测试任务由平均14年经验的专家设计,且采用盲评方式——评审仅看结果,不知作者是人类还是AI。
尽管数据令人振奋,质疑声也随之而来。技术评论员Atharva Raykar指出,将AI发展类比病毒传播存在风险:"疫情扩散有生物学机制支撑,而AI进步依赖持续的技术突破。如果没有推理模型等关键创新,能力曲线可能早已停滞。"他同时强调,当前测试任务复杂度较低(平均3/16分),远不及现实工程项目的7-16分区间,这可能导致对AI真实能力的高估。
面对质疑,Julian承认评测体系存在局限,但强调短期趋势(1-2年)的可靠性。"问题不在于曲线是否会突然转折,而在于社会是否为可能到来的变革做好准备。"他预测,到2026年底,将有模型在多个行业达到人类专家水平;2027年后,AI可能在垂直领域频繁超越人类,成为生产力主力。
对于AI的未来,Julian描绘了更积极的图景:人类作为指挥者,身边环绕数十甚至上百个AI助手。这种协作模式不是简单的效率提升,而是可能带来10倍、100倍的生产力飞跃。"科研、医疗、法律、金融——所有行业都将因此重组。"他强调,这不是"AI取代人类"的零和博弈,而是"人类与超强工具共舞"的新时代。
当前的数据显示,AI能力正以每7个月翻倍的速度进化。按照这一轨迹,2026年或许将成为关键转折点——AI不再局限于实验室,而是真正走入各行各业,改写经济运行的基本逻辑。当这一天到来时,每个人都需要思考:是抗拒变化,还是成为首批与AI团队并肩工作的人?















