阿里云近日正式推出新一代大语言模型Qwen3.6-Plus,这款被定位为"国产最强编程模型"的产品,标志着国内人工智能技术从基础认知能力向应用落地能力的实质性跨越。在智能体编程评测SWE-bench系列及真实世界任务Claw-eval中,该模型以显著优势超越GLM-5、Kimi-K2.5等2-3倍参数量级的竞品,编程能力已接近国际顶尖的Claude系列模型。
在逻辑推理测试中,Qwen3.6-Plus展现出惊人的结构化思维能力。面对"甲说乙说谎,乙说丙说谎,丙说甲乙都在说谎"的经典悖论题,模型摒弃概率猜测模式,通过"假设-验证-排除"的三段式推理,最终锁定乙为唯一说真话者。整个推导过程包含12个逻辑节点,每个结论都附有完整的验证依据,这种深度思考能力在现有模型中极为罕见。
复杂指令执行测试进一步验证了模型的工业级可靠性。当要求"用反问句开头、300字内、避免特定词汇、比喻结尾且模仿科技记者语气"创作自我介绍时,模型生成的文本不仅精准满足所有约束条件,更展现出专业级的信息密度控制能力。其输出文本的逻辑连贯性和表达克制度,已达到可直接作为商业稿件使用的标准。
工程落地能力测试中,Qwen3.6-Plus的表现更具突破性。面对"开发AI短视频脚本生成工具"的需求,模型自动完成需求拆解、技术栈规划、前后端架构设计等完整产品开发流程。从用户选题到脚本优化,模型不仅输出交互流程图,还提供接口代码示例、部署方案及成本优化建议,形成可直接落地的系统级解决方案。
行业观察家指出,Qwen3.6-Plus的发布重新定义了国产大模型的评价标准。从早期的知识广度比拼,到如今的稳定性与工程化能力竞争,这种转变折射出AI技术向生产力工具演进的必然趋势。当模型能够自主完成业务拆解、风险规避和系统设计时,其角色已从辅助工具升级为独立的数字生产单元。
目前Qwen3.6-Plus已登陆阿里云百炼平台,输入价格低至每百万Tokens 2元。基础版千问3.6同步在悟空APP、千问APP等渠道开放体验,开发者可通过阿里生态体系直接调用最新模型能力。















