阿里Qwen3.6-Plus,Agentic Coding掀了硅谷的桌子
创始人
2026-04-05 11:14:56
0

Anthropic前段时间出了一份《2026 Agentic Coding Trends Report》,预测就在今年,开发者会从写代码的人变成指挥AI写代码的人。

最近流行一个说法,Agentic Coding:让AI不只帮你写代码,而是直接帮你把活干了。

你只要说清楚想要个什么东西,AI自己去理解、拆解、写代码、测试、改bug,直到交付一个能用的成品。

然后,就在这个全行业卷编程的节骨眼上,阿里发布了他们最新的大模型,Qwen3.6-Plus。

我的第一反应是:3.5不是春节才出的吗,前几天还刚出了个3.5-Omni,迭代速度简直是二倍速。

而且还不只是这一个模型,过去这一周,除了3.5-Omni,阿里还发了图像模型Wan2.7-Image,再加上这次的Qwen3.6-Plus,主打一个全面开花。

据说旗舰版Qwen3.6-Max也已经在路上了。

这次我不打算罗列Benchmark数据。

尽管Qwen3.6-Plus在SWE-bench Verified、Terminal-Bench 2、NL2Repo等权威评测中,全面超越了GLM-5和Kimi-K2.5。

整体水平,逼近Claude Opus 4.5。

我更想跟你聊聊,实测过程中让我印象深刻的那几个瞬间。

01

从Vibe Coding到Agentic Coding

这次真不是噱头

先聊最让我兴奋的部分。

4月2号凌晨,Qwen3.6-Plus刚上架阿里云百炼,我第一时间搞到了API Key。

二话没说,直接上了个硬核需求:做一个具备动态交互功能的Agent组织架构展示网站,要求包含动态粒子背景、响应式布局,并且在移动端要完美适配。

说实话,放以前,这种需求我得干到凌晨三点。

自己写Three.js的初始化代码、调相机参数、折腾粒子系统的性能优化,光调试就能耗掉大把时间。

但现在不一样了。

我把需求丢给Qwen3.6-Plus,它没有急着输出代码,而是先给出了详细的任务拆解。

从技术栈选择(React + Three.js),到文件结构规划,再到核心功能模块的实现步骤。

然后开始自动生成代码,在这个过程中还主动调用了工具进行预览和测试。

整个流程,从输入需求到拿到一个可以直接运行的完整项目,全程我几乎没有写过一行代码。

Qwen3.6-Plus不仅完成了前端页面的开发,还实现了粒子系统的动态效果和完整的交互逻辑。这让我挺震撼的。

几年前的Vibe Coding,说白了还是辅助性质的。你描述需求,AI生成代码片段,然后你需要自己把这些片段拼接起来,调试修复bug,反复折腾好几轮才能跑起来。

但现在,Qwen3.6-Plus展现出的Agentic Coding能力,是真的在试图替代整个开发流程。

它不只是帮你写代码,而是直接帮你把活干了。

只需要说清楚你想要什么,它自己去理解、拆解、写代码、测试、改bug,直到交付一个能用的成品。

这就是Agentic Coding的核心价值。

GitHub上已经有开发者把Qwen3.6-Plus接入Copilot替代品中使用,反馈最多的是终于不用在GPT-4和Claude之间来回切换了。

侧面说明,Qwen3.6-Plus确实达到了一个可以日常最强使用的水平。

让Qwen3.6-Plus结合我的个人数据、全网信息,设计一个个人网站。

一轮对话,耗时3分钟左右,消耗0.5万个token,约等于0.15元。

网页完成度相当不错。

还有个细节值得一说。

Qwen3.6-Plus默认支持100万token的超长上下文窗口,最大输出可达65536 tokens。

这意味着你可以一次性把整个代码仓库丢给它,它能理解跨文件的依赖关系,完成仓库级的复杂重构任务。这种能力在过去是只有Claude等顶级模型才能做到的。

以前,做大规模代码重构,你可能需要手动分析几百个文件的依赖关系,小心翼翼地改,生怕改崩了。

现在,你可以把整个项目交给AI,它能自己读代码、分析依赖、规划改动路径、逐步实施、测试验证,最后交付一个经过测试的重构版本。

如果你现在去阿里云百炼上调用Qwen3.6-Plus,每百万token输入最低只要2元。

相比Claude Opus 4.6每百万token输入5美元、输出25美元的价格,Qwen3.6-Plus的性价比确实非常有竞争力。

我在实测中完成上述那个复杂的3D网页项目,总共花费不到1块钱。

这种成本优势,让大规模应用AI编程变得真正可行了。

02

原生多模态,给Agent装了双眼睛

如果说Agentic Coding是Qwen3.6-Plus的大脑,那原生多模态理解就是它真正的眼睛。

以前的多模态模型,大多是后期拼接视觉模块的方案。

也就是说,模型在处理文字和图片时,用的是两套不同的机制,然后再把结果拼在一起。

这种方式的问题是,模型很难真正理解图片和文字之间的关系,就像一个人用左眼看图、右眼读字,两只眼睛看到的没法真正融合在一起。

但Qwen3.6-Plus不一样。

它基于原生多模态数据训练,从底层就把视觉和语言能力融合在了一起。

我测试了视觉智能体编程的场景。

随便找了一张设计稿截图丢给模型,告诉它按照这个设计稿的风格,生成一个AI异类弗兰克个人网页展示页面。

模型不仅准确地提取了设计稿的色彩风格、布局结构,还自主完成了代码生成、样式调整和交互实现。

官方Demo中有一个很有意思的测试:让Qwen3.6-Plus规划从北京大兴机场到北京首都机场的最快路线。

我按照同样的方法测试了一下,模型的方案与高德地图上的最快路径完全一致。

这说明模型能够理解真实世界的空间关系和交通网络,不只是简单地从文本中查找答案。

还有更进阶的应用。

有网友实测上传了一段200多兆的视频,视频里他一边滚动网站页面,一边用非常口语化甚至抽象的语言描述需要的功能和特效,连帅不帅这样的词都用上了。

Qwen3.6-Plus读完视频后,按照描述成功复刻出了高度相似的效果,甚至连进入专业评选这样的需求都准确实现了。

以前,最头疼的就是怎么把自己的想法翻译成纯文本告诉AI,术语太多,精确描述一件事和写论文没什么区别。

现在,当多模态能力,让Qwen3.6-Plus能看到一切、读取一切,普通的vibe coding就已经黯然失色了。

这种打通了看懂界面到生成代码再到调用工具完成修改的完整链路,我觉得才是未来AI开发真正的方向。

03

价格屠夫又回来了,这次是认真的

说实话,阿里这次在定价上挺狠的。

Qwen3.6-Plus已上架阿里云百炼,每百万token输入最低2元。

即使按原价算,也远低于Claude Opus 4.6的5美元每百万输入、25美元每百万输出的定价。

按当前汇率换算,价格不到Claude的十分之一。

这还不是全部。

Qwen3.6-Plus已经登陆悟空、Qoder等阿里AI应用和平台,普通用户可以直接免费体验。

我实测完成了上面提到的那个3D网页项目,总共才消耗了不到两块钱。

有开发者做了个简单的成本测算:如果你每天用Qwen3.6-Plus完成10个中等复杂度的编程任务,日均花费可能不到5元。

相比之下,如果用Claude Opus 4.6完成同样的工作量,日均花费可能高达几百元。

这种成本差异,对于独立开发者、初创团队、学生开发者来说,意义不言而喻。

而且阿里这次的定价策略,显然不只是为了打价格战。

从商业逻辑来看,更低的使用门槛意味着更多的开发者和企业愿意尝试和接入,从而积累更多的使用数据和反馈,反过来推动模型的持续优化。

这是一个正循环。

Qwen 3.5是2026年2月发布的,不到两个月时间,Qwen已经演进到3.6,迭代速度明显加速。

而Qwen3.6-Plus还只是系列的首款模型,性能更强的旗舰版Qwen3.6-Max也将于近期发布,系列后续还将开源其他尺寸的模型。这种多尺寸覆盖的策略,让不同需求的用户都能找到合适的选择。

这种快速迭代和全面的布局,正说明千问不再是以前那个只靠单一模型打天下的选手了。

04

不只是模型,阿里正在织一张更大的网

过去这段时间,阿里在AI领域的动作密集得有点让人应接不暇。

3月30日,国产最强全模态大模型Qwen3.5-Omni发布;

4月1日,国产最佳图像生成与编辑统一模型Wan2.7-Image发布;

4月2日,Qwen3.6-Plus上线。三个模型覆盖多模态、图像生成、编程、Agent等不同领域,每个都在各自领域达到SOTA水平。

Wan2.7-Image值得单独说两句。

这个模型直击当前AI生图领域的痛点,解决了标准脸审美疲劳和色彩盲盒等问题,实现了千人千面,能捏出活人感,还支持Hex色值精准调色、3K Token超长文本印刷级渲染。

更重要的是,Wan2.7-Image已经支持Skill调用,让龙虾画画成为现实,全面解锁了生成模型的应用场景。

不过,模型能力只是故事的一部分。

真正让我觉得有意思的,是阿里正在发生的一场组织变革。

阿里成立了ATH(Alibaba Token Hub)事业群,目的是增强从大模型到AI应用的协同。

这次模型连续发布,阿里内部重点推的AI产品如悟空、qoder等应用第一时间接入,说明协同效应正在生效。

换句话说,阿里终于不只是埋头做模型了,他们在认认真真地思考怎么让模型真正用起来。

这种从实验室到产业化的跨越,对于千问的未来生态建设来说,可能比模型本身的能力提升更加重要。

说了这么多,我想分享几个更深层的判断。

第一,Agentic Coding正在重新定义编程这件事本身。以前,写代码是程序员的核心工作;现在,写代码正在变成AI的工作,而程序员的核心价值正在转向需求理解、系统设计、架构决策和结果验收。

第二,多模态能力正在成为AI Agent的标配。纯文本模型的天花板已经越来越明显。未来的AI Agent需要能够理解这个世界,而这个世界是图文并茂、声色俱全的。

原生多模态训练带来的理解深度,是后期拼接方案难以企及的。Qwen3.6-Plus在视觉智能体编程上的尝试,就是沿着这个方向迈出的重要一步。

第三,国产AI正在从追赶者变成定义者。在SWE-bench等权威评测中,Qwen3.6-Plus已经超越了参数规模是其2至3倍的GLM-5和Kimi-K2.5,逼近Claude Opus 4.5。

说明国产模型在算法效率和工程实现上已经有了质的突破,不再是单纯靠堆参数来提升性能。这种以小胜大的能力,才是真正体现技术实力的地方。

期待千问能继续保持这种快速迭代的节奏,用更短的时间缩小与Claude的差距。

相关内容

热门资讯

2026年文化产业投融资报告 今天分享的是:2026年文化产业投融资报告 报告共计:24页 这份报告系统梳理了我国文化产业的发展现...
经济日报头版头条:驳“中国经济... 【编者按】 今天出版的《经济日报》在头版头条刊发题为《驳“中国经济见顶论”》的评论员文章。这是该报连...
国投证券2025年净利增35%... 财联社4月3日讯(记者 陈俊兰)随着国投资本年报正式披露,国投证券2025年业绩全貌也随之浮出水面。...
国内航线燃油附加费今起调整 8... 日前,国航、厦航、中联航等多家航司发布公告,调整国内航线旅客运输燃油附加费收取标准。 △资料图 自...
著名经济学家李稻葵出席第十一届... 3月29日至4月1日,由中国商业联合会、天九共享平台集团联合主办的第十一届中国独角兽嘉年华暨“十五五...
阿里Qwen3.6-Plus,... Anthropic前段时间出了一份《2026 Agentic Coding Trends Repor...
暴跌437%,巨亏234亿,复... 来源:商业汇评 作者:枫叶 利润暴跌437.97%! 一夜巨亏234亿,相当于亏掉过去5年的全部利润...
全球石油危机或将蔓延 图为3月9日,车辆在西班牙首都马德里一处加油站排队加油。 (新华社发) 美以伊战事已持续一个月有余,...
量身定制融资方案,这家银行为张... 张雪火了。据新华社报道,在3月29日结束的世界超级摩托车锦标赛(WSBK)葡萄牙站World SSP...
中国石油2025年净利润157... 本报(chinatimes.net.cn)记者何一华 李未来 北京报道 继中国石化(600028.S...
聚焦APEC新机遇,深圳国企民... 4月3日,“企·航”计划走进深圳国资国企——国企民企协同发展对接会在深圳能源国际大厦举行,现场成立深...
2026年全球经济展望报告(英... 法国兴业银行 2026 年 3 月发布的全球经济展望报告指出,全球经济正处于地缘冲突与 AI 投资热...
原创 异... 在浩瀚的星空下,每一颗星星都承载着不同的情感故事。对于身处异地恋的恋人们来说,跨越距离的考验是一道难...
股市述评|春风未远,脚步先稳 公众号转载山西经济日报稿件,须申请授权。 本周A股盘面坎坷,却也远未到失序的地步。若只看指数涨跌,盘...
西安银行国资股权划转,业绩逆袭... 来源:子弹财经 3月中旬,西安银行发布公告称,该行第九大股东长安国际信托股份有限公司(简称“长安...
消费者花60万购买首席服务却遭... 消费日报网讯(记者刘锦桃)投顾机构利用短视频平台打造的一个个“财经大V”“荐股神话”,让无数股市“小...
NCE平台:就业稳健背景下金价... 来源:市场资讯 4月3日,美国劳动力市场持续展现出较强韧性,首次申请失业救济人数依然处于相对低位。N...
江阴周庄长乐花海带动一波消费潮... 春和景明,樱缀乡村。近日,江阴市周庄镇长乐村樱花嘉年华正式启幕,以漫山粉白樱花为核心抓手,精准契合春...
连亏4年后迎新“金主”?珠海中... 4月3日晚间,珠海中富(000659)发布关于控股股东、实际控制人拟发生变更的提示性公告。公司股票将...
原创 日... 编辑丨子渝 文丨子渝 本文陈述所有内容皆有可靠信息来源,赘述在文章结尾 日元一路跌穿关键警戒...