4月2日,阿里千问发布新一代大语言模型Qwen3.6-Plus,已通过阿里云百炼 API 开放调用。千问3.6整体性能较3.5进步显著,并且涌现出极强的智能体编程能力,在系列编程能力权威评测中,千问3.6编程表现超越2倍乃至3倍参数量的GLM-5、Kimi-K2.5等模型,成为当下编程能力最强的国产模型,接近全球最强编程模型 Claude 系列。
相较于上一代模型,千问3.6整体性能提升明显,尤其是编程Coding能力、智能体Agent能力和工具调用能力都实现了全面跃升。在SWE-bench系列真实编程任务测试、考察终端编程的Terminal-Bench2.0、长程编程任务NL2Repo,以及Claw-Eval、QwenClawBench等真实世界Agent能力评测中,Qwen3.6-Plus表现可完全匹敌Claude Opus 4.5,并显著超越了2倍乃至3倍其参数的GLM-5、Kimi-K2.5等国产模型。