“AI购物时代的商品并不会比上一个时代更好、更便宜,消费者们寻找的不是更高级的AI导购,而是更满意的购物体验。”
文 / 巴九灵
在刚刚过去的双十一,很多消费者发现,电商APP不知不觉多了很多新功能。
淘宝上线了AI找低价、AI万能搜、AI生成购物清单等;京东推出了AI搜索和AI识图;抖音电商反向植入大模型,在豆包搜索框输入“秋冬穿搭推荐”,它会提供一连串抖音商城的服饰链接。
在我们的生活经验中,导购让人“又爱又恨”。有时候,他们如天降神兵,能帮我们更有效地解决复杂需求;有时候,却压迫感十足,破坏了逛街购物的美感。
那么AI导购,又是怎样一个存在呢?双十一期间,小巴做了一次简单的小实验。
根据海外网站YouGov的一项调查,有67%的消费者希望用AI进行比价,56%希望借助AI更了解产品,46%更“懒”一些,希望AI直接把产品推荐给自己。
这便构成了我们本次测试的实验目标——看大模型在这三个方面的表现如何。被实验的对象,随机选取了编辑部使用较多的:DeepSeek、豆包和通义千问。
提前说明下,本次测试只为提供一个当下AI导购的场景感受,其结果未必能代表各大模型真实水平,感兴趣的朋友也可以自行“调戏”各路大模型试试,也欢迎大家把体验在评论区和我们分享。
AI导购测评
先看看这三家在“比价”方面的不同表现。
想必很多读者和小巴一样,面对电商平台越来越复杂的价格活动,不止一次地想过:如果能一键查找实时低价就好了。
于是,我们同时向三个大模型提问:“我想在2025年双十一期间以最优惠的价格买一台品牌扫地机器人,请帮我全网搜索出优惠力度最大的产品。”
结果,通义千问和豆包同时推荐了一款知名品牌的扫地机器人,DeepSeek则只给出了一些选项。
千问:
豆包:
DeepSeek:
要说不同,从思考过程看,通义千问展现出了一种财经视角,显得非常“聪明”。
比如,它解释了为什么“买新不买旧”:新品有冲量需求,而且几大品牌的新品偏同质化,价格战不可避免。
它还分析了为什么当下是最佳购买时点:12月的促销力度不如双十一、明年618又可能出现缺货。
它甚至还考虑到某品牌财报显示上半年利润下滑,下半年很可能冲量压力更大,或许会更愿意以价换量。
豆包的亮点则是“精打细算”,不仅比较了各种产品参数和性价比,还对比了不同平台的优惠程度、赠品丰富程度,甚至提供了双十一红包口令。
DeepSeek虽然没给出最终建议,但优点是情绪价值很足,列出了一连串“选购小贴士”,每一条都很实用。
除了比价以外,购物决策面临的另一个大问题是,消费者并不了解产品。
而这个问题的本质,或许并不是非要搞懂电器和数码产品的参数,只是想弄明白:买什么能解决我的问题?
于是接下来,我们出了一道更考验AI处理模糊需求的能力的题:“同样的预算,推荐扫地机器人还是洗地机?”
结果,三个大模型都敏锐地抓住了这个提问背后的真实需求。
通义千问没有罗列参数、属性,而是直接列举了5个不同家庭场景,还出了一道选择题来辅助判断。
它甚至还给了一个附加答案:如果预算充足,可以考虑“扫地机器人+入门洗地机”组合购买。
豆包延续了“细节控+数据脑”,测算了维护成本、噪音等其他大模型没考虑到的问题。
DeepSeek继续走情绪价值路线,补充了一些提问中没有涉及的选购要点。
最后一个问题就是,针对最“懒”的消费者们,AI能不能直接给出买什么、怎么买的答案?
我们设想了一个最麻烦的场景:一站式购物。比如新宠到家、乔迁装修、新婚备婚、过年采购,都要把本就分散、繁琐的采购需求高效整合起来,决策压力巨大。
于是,我们出了一道终极考题:“帮我列出一份3个月大小猫所需宠物用品的详细清单,推荐合适的产品品牌和款式,再基于电商平台的优惠活动,做成一个分步的傻瓜式下单攻略,确保能以最便宜的价格拿下清单里的物品。”
三个大模型继续不负所望,同时给出了采购清单和购物攻略。
千问给出了一份“精准计算”的傻瓜式购物攻略,从平台选择、凑单技巧到省钱金额,事无巨细。
比较来看,DeepSeek提供的购物清单最为全面,加入了其他几位都没有提到的宠物日常医用品,如伊丽莎白圈、益生菌、洁耳液等。
而且,它在深度思考中展现了识别营销页面的能力,最终推荐的产品来源于一家小众种草网站里的一篇分享帖。
最后,依然是满满的情绪价值。虽然没有提供太多的红包口令、叠券凑单攻略,但补充了相当准确的新手养猫建议。
豆包则是提供了一份双十一期间薅平台羊毛的详细步骤。
几轮测试下来,我们最大的感受就是:仿佛打开了新世界的大门。
这几个大模型虽各有特点,但不论是场景化分析、信息时效还是情绪价值,都已经在相当程度上足以支撑消费者做出一个购买决策了。
AI电商导购,不是必选项
把对话框变成“店铺”或许是一个可期的愿景,但问题也不少。
▶▷问题一,幻觉仍在。
在我们用几个大模型做问答测试时,就发现一个普遍的短板:涉及价格、参数等数据时,容易产生幻觉。
比如,豆包用大量数据展示了优惠细节和折扣比例,但查证后发现原始数据并不准确。
这提醒我们,如果电商数据质量本身良莠不齐,很可能影响AI导购的“业务水平”。
▶▷其次,还是信任问题。
不信任感很大程度上源自“图文不符”。
比如,豆包引流的抖音商城商品大多销量和店铺口碑不佳,且价格信息并非实时。电商平台的AI搜索,也总给人一种强行自圆其说之感,很难让人产生下单的冲动。
我们试着用淘宝“AI找低价”搜索了一款猫爬架,它列出了同款同价、同款高价、低价平替和其他款式猫爬架推荐4类清单,并且总结了材质、结构等产生价差的详细原因,但实际推荐的商品却完全没有体现出这些区别。
而且,AI固然理论上能提高效率,但让筛选环节成了黑箱。
这种担忧不无道理。SEO(搜索引擎优化)作为极为普遍的营销工具,通过利用搜索引擎的算法,提升内容在搜索结果中的自然排名,它在AI时代升级为GEO(生成式引擎优化)。
而GEO领域已经滋生出大量灰色手段,比如在互联网堆砌垃圾内容来引导AI推荐、给大模型的训练语料注入错误事实和提示词,让人不禁回忆起搜索引擎时代的竞价风波和医疗事件。
增长黑盒近期发布的《2025中国GEO趋势与品牌增长策略报告》指出,用户倾向于在“认知复杂度高”的购物决策上求助AI,比如复杂的大型电器或数码产品。
而这些因为不懂产品而求助AI的用户,最容易在AI出现幻觉或遭遇恶意GEO时被误导。
这也是很多人对AI导购望而却步的原因。YouGov的海外市场调查也显示,超过40%消费者不用AI导购是因为缺乏信任。
▶▷最后,使用习惯。
打字本身是件门槛很高的事情。大部分人对AI导购的第一反应是输入自然语言、让它推荐合适的商品,但这种浅层次的个性化,不足以撬动更下沉和更“懒惰”的消费者。
这个问题未来或许能用语音交互来解决,但如果AI导购要再向前一步,要么是电商平台能再“体贴”一点,像前文中测评的大模型那样主动替消费者预设场景需求;要么基于数据优势,实现更深层次的个性化,比如根据特定肤质推荐护肤品、根据特定身材和购买风格推荐穿搭、根据个人健康数据推荐营养补剂。
而目前,几个电商平台的AI购物助手,都尚处于一个需求理解能力有限的阶段。
总体而言,至少在当下,平台对AI的期待和消费者的真实需求仍存在一定的错配。前者期待AI简化购物流程、提高转化,将陷入低价泥沼的传统电商行业拉向新的增长时代,但后者只需要一个轻松、可信的“购物搭子”。
尤其对于那些本就享受购物、乐于钻研商品的消费者看来,AI的“带货”反而显得笨拙。
就像AI能辅助工作、却不能代替人上班一样,它的核心价值不在于直接推荐商品,而是提供更性化的信息支持,减少购物决策的焦虑,而不是增添负担。
结语
谷歌搜索副总裁Robby Stein在最近一期播客里说:“很多人都没有充分认识到,人们的很多基本需求并没有因为AI的到来而改变。”
AI购物时代的商品并不会比上一个时代更好、更便宜,消费者们寻找的不是更高级的AI导购,而是更满意的购物体验。
这也体现在我们的测评结果中:尚未深度链接电商平台的大语言模型,反而提供了比各大电商平台内嵌的AI助手更好的感受。
当AI能深度理解需求、而非简单堆砌参数时,它才真正具备了“购物搭子”的意义。
所以,你会买AI推荐的东西吗?
参考资料:
1.晚点LatePost,《淘天 AI 的终极目标:大象无形》
2.知危,《0成本投毒之后,我污染了全网AI替我说谎》
3.10XCREW,《零售商人工智能助手:消费者真的在用它们吗?》
本篇作者 | 温若梅 | 责任编辑 | 何梦飞
主编 | 何梦飞 | 图源 | VCG