马斯克加入Agent争霸赛!Grok DeeperSearch上场,对决Gemini Deep Research
创始人
2025-03-20 16:38:08
0

新智元报道

编辑:KingHZ 英智

【新智元导读】AI智能体迎来新玩家!Grok 3推出的DeeperSearch功能,提升DeepSearch搜索能力,更加深入分析复杂主题。免费放开Deep Research功能后,Gemini 2.0公布研究智能体6大使用技巧。2025年度Agent大战开打!

2025年Agent大战,Deep Research「研究智能体」率先开打!

第一个登场的谷歌Gemini,随后OpenAI、Perplexity等也相继推出了自己的同名功能。

Grok是个例外,与Grok 3一同发布的是「DeepSearch」,没有「Research」只有「Search」。

有趣的是,就在昨天,Grok悄无声息地推出了全新的功能 ——「DeeperSearch」。

在Grok网页中点击DeepSearch的小箭头,免费用户也可使用DeeperSearch。

比较一下DeeperSearch和Deep Research,不能说一模一样,至少也是AI界的Cosplay。

Grok DeeperSearch

Gemini Deep Research

现在利用AI的Deep Research / DeeperSearch,可以探索复杂主题,并以全面、详细的报告形式呈现研究成果。

接下来,深入了解一下如何更高效的使用Deep Research/DeeperSearch的技巧吧。

DeeperSearch试用

Grok是X上内置的AI模型,让DeeperSearch搜索了过去48小时X上的热点AI资讯,效果的确不错。

不过,不是每次体验都很流畅。

从事NLP研究的Casper Hansen,表示:「Grok DeeperSearch再创纪录。纯搜索和思考时长达16 分钟。」

搞笑的是在思考过程中,DeeperSearch很像人的自言自语,比如「我在想,搜索****可能会太模糊。」

现场开盒匿名网友

从事预测研究的Sam Atis,直接问起了Grok的DeeperSearch下列问题:

你可以找出Sam Atis是谁吗?我想知道撰写Samstack.io的人的真实身份。

同样的问题,Grok的DeeperSearch认出了Sam Atis的真实身份,而DeepSearch并没有得到正确答案。

DeeperSearch查出了他之前工作过的地方(一家非常小的NPO),然后检查了那里所有工作人员的背景,与他在 UCL学习政治学的事实相符。

Sam Atis还测试了「你能找到[人物]的Reddit账号吗?」,其中[人物]针对他认识的人,结果很成功。

尽管和Reddit账号之间没有明显的联系,DeeperSearch从一篇文章中正确推断出来的匿名账户的真实真实身份。

这也让Sam Atis猜测:「不久,使用化名的作者都将不在安全,许多人都能被LLM认出来了。」

如果真的在乎个人隐私,这的确令人担心。

AI也被问烦了

网友Nathan Clement向DeeperSearch问了一个智能体协议MCP的问题,把Grok 3问沉默了。

Grok 3对提问分析了长达5分钟47秒,找到了10个网页,但报告一句话也没生成,直接显示无法完成回复。

Nathan Clement推测,或许DeeperSearch被MCP问题问烦了。

实测:速度有些慢

打开Grok 3的DeeperSearch功能,发送提示:「总结一下深度研究功能的进展」。

DeeperSearch查询了46个信息来源,10个网站,耗时37分钟37秒,完成了相关报告。

然而,Grok 3只总结了OpenAI的深度研究功能进展。

全球范围内,谷歌Gemini首次发布了Deep Research功能,并在不断更新;xAI的类似功能也没有考虑进去。

毫无疑问,关键引用全是OpenAI的消息。

DeeperSearch:不只是搜索

热衷xAI的Denis Labelle,在X上分享了充分利用DeeperSearch的经验。

DeeperSearch增强了下列3项功能:

  1. 广泛的查询处理能力:(例如)收集Grok 3高级功能的全面信息,表现完美。

  2. 个性化洞察:能够根据查询意图调整回复内容。

  3. 实时集成:获取最新数据,比如随时掌握Grok 3相关讨论的最新动态。

1. 从一般查询入手,进行初步研究

DeeperSearch采用先进算法,能够快速提供多样化、符合上下文的搜索结果。

如何操作:提出关于Grok 3功能的高层次问题。

示例:「Grok 3的主要高级功能有哪些?」

(你将获得关于DeeperSearch、Think模式、实时数据集成等功能的详细概述。)

2. 利用Think功能进行深入分析

  • 提炼Grok 3的高级功能要点。

  • 评估信息的可靠性。

  • 查找明确需要进一步探索的领域。

操作步骤:

  1. 运行DeeperSearch查询:「Grok 3的高级功能有哪些?」

  2. 切换到Think模式:「总结Grok 3的高级功能,并指出可能缺失的细节。」

  3. 根据生成的结果,优化你的下一步查询

3. 设计精准提示词,获取深入见解
  • 明确你的需求,聚焦特定信息

  • 请求分析,而不仅仅是事实罗列

  • 表达清晰、简洁

示例:

  • 「分析Grok 3的DeeperSearch功能,如何处理关于其高级特性的复杂查询。」

  • 「评估Grok 3的实时数据集成功能在增强其高级特性方面的作用。」

4. 使用透明度功能验证结果
  • 理解逻辑:查看AI如何解读Grok 3的高级功能

  • 建立信任:确认输出结果的可靠性

操作步骤:

  1. 在获得结果后,切换「思考」(think)选项以查看AI的推理步骤

  2. 检查关于Grok 3功能声明的一致性

  3. 如有必要,调整你的问题

5. 采用迭代式工作流程
  • DeeperSearch模式:从关于Grok 3高级功能的一般查询开始

  • Think模式:分析结果并找出遗漏之处

  • 再次切换至DeeperSearch模式:优化查询,深入挖掘信息

重复上述过程,直到满意为止。

示例:

  • 「Grok 3的高级功能有哪些?」

  • 「响应列出了功能,但缺乏对局限性的详细说明。遗漏了什么?」

  • 「Grok 3的高级功能(如DeeperSearch)有哪些局限性?」

高效prompt推荐

  • 「分析Grok 3的DeeperSearch功能如何增强其高级功能集。」

  • 「评估Grok 3的Think模式在其高级功能中的有效性。」

  • 「评估Grok 3的实时数据集成功能作为高级功能的优势与劣势。」

  • 「分析Grok 3的DeeperSearch在详细说明其高级功能时的准确性。」

  • 「确定Grok 3的高级功能(如DeeperSearch)如何支持AI研究。」

  • 「总结Grok 3的透明性功能(如Thoughts开关)在其高级功能中的优势。」

  • 「预测Grok 3的高级功能基于当前能力可能如何发展。」

  • 「分析Grok 3的DeeperSearch作为未来版本中领先的高级功能的潜力。」

谷歌Deep Research的6大技巧

Gemini高级产品经理Aarush曾想为孩子寻找适合的夏令营,这通常需要打开几十个浏览器标签页,再把所有重要信息整理到一个文档中。

Aarush和软件工程师Mukund想到开发一个能研究所有相关信息,并创建报告的AI系统。

与团队经过几周进行原型设计后,他们做到了。以下是6个使用小技巧。

Gemini深度研究现已面向所有人开放,还新添了音频概述功能!

先看这任务需不需要深度研究

如果你要做的事,得花大量时间浏览网页,还得开好多标签页,那深度研究就特别有用。

Deep Research是帮你从对某个主题啥都不懂,到透彻了解的得力助手。

但要是想马上得到一个简单快速的答案,可能用不着深度研究。

比如说,想简单了解「金融科技」是啥,直接用Gemini默认的聊天功能就行。

可要是你是个风险投资人,要跟一家金融科技初创公司见面,想快速了解行业最新趋势,这时候深度研究就能派上大用场。

从简单直白的问题问起

虽说叫「深度」研究,但不意味着一开始提问就得绞尽脑汁。

「别想太复杂,你随时能改问题。在深度研究开始干活之前,它会把研究计划给你看,要是觉得不合适,还能按自己的想法调整。」Aarush表示。

只要点「编辑计划」选项,用大白话告诉它要加什么内容,或者换个研究方向就行。

不用非得是提问高手,只要把最终目标说清楚,比如「我想给10岁孩子在纽约找个超棒的夏令营」,剩下的深度研究就会帮你搞定。

顺着报告内容追问细节

等拿到报告,可能会发现一两个特别有意思的细节,这时候Aarush建议接着追问。

在聊天窗口里输入问题,深度研究要么根据之前的研究,马上给你答案,要么再去网上找找更多信息。

还能在报告生成之后,让深度研究再加点新内容,它会马上更新报告。

比如,让它「在报告里加上夏令营费用的信息」,深度研究就会去找相关信息,然后加到报告里。

看看相关链接

Gemini忙着研究、写报告的时候,界面上会有「显示思考过程」和「浏览过的网站」这两个选项。

要是点击「显示思考过程」,就能看到它是怎么一步步写出报告的。

这两个选项都会列出深度研究用到的网站,「浏览过的网站」会把网站列出来,但不会讲具体研究过程。

等报告的时候,要是哪个网站吸引你了,点一下,就能在新标签页打开。

这可是发现新网站的好办法,要是自己找,说不定根本发现不了这些网站。

用深度研究解决身边的问题

深度研究特别擅长本地化搜索,能帮你找到周边的信息。

要是想多了解自己住的社区,或者想找本地商家做个复杂的家庭项目,不妨试试深度研究。

还有个挺实用的场景,就是让它策划活动,像办个晚餐聚会或者生日派对,看深度研究怎么搜寻本地资源。

生成音频报告,或者导出文档

因为本周的更新,现在能给报告生成音频概述了。

音频概述功能最早是在NotebookLM里推出的,用户可以听两个AI主持人讨论、解读上传的信息。

现在深度研究也有这功能啦!

报告做好以后,右上角能看到一个切换按钮,有好几个选项,其中一个就是生成音频概述。

它会像播客一样,把报告内容给你讲一遍。

这样一来,听音频的时候还能干别的事,出门在外也能听。要是你觉得听比看更容易理解,这个功能就太适合了。

不管是在网页还是手机上,都能听,分享、下载也很方便。还能把报告导成文档。

Mukund表示,「要是我觉得这份报告特别好,想自己再改改,然后发给别人,让他们也提提意见。」

把报告导成文档的时候,深度研究引用的所有资料,都会列在参考文献部分。

要是想把东西打印出来看,或者在上面写写画画,也完全没问题。对于习惯在纸质文件上做标记的人来说,这可太实用了!

参考资料:

https://blog.google/products/gemini/tips-how-to-use-deep-research

相关内容

热门资讯

退市海越:股票7月11日终止上... 【退市海越:股票7月11日终止上市并摘牌】财联社7月4日电,退市海越(600387.SH)公告称,公...
每周股票复盘:紫金银行(601... 截至2025年7月4日收盘,紫金银行(601860)报收于3.13元,较上周的3.05元上涨2.62...
每周股票复盘:华电国际(600... 截至2025年7月4日收盘,华电国际(600027)报收于5.62元,较上周的5.44元上涨3.31...
万科:两笔银行贷款延期一年,余... 7月4日,万科企业股份有限公司发布关于担保进展情况的公告,两笔银行贷款均延期一年,余额合计约4.47...
从无到有 上海十年织就离境退税... 中新网上海7月4日电(缪璐 陈惠晗)国家税务总局上海市税务局(以下简称“上海市税务局”)4日发布消息...
和讯投顾徐梦婧:产能过剩行业接... 创业板带领反弹了,和讯投顾徐梦婧表示,我们昨天晚上说什么来着?第一个在昨天晚上收盘之后,创业板的顶背...
原创 美... 一场牵动全球神经的税收博弈进入最后倒计时。当美国参议院以微弱优势通过30年来最大规模税改法案,全球资...
上半年A股136家公司股价翻番... 2025年上半年,A股市场震荡上行,主要股指不断上涨。 图源:图虫 据Wind,北证50指数表现最...
9名央企领导职务调整 7月4日,国务院国资委网站发布8户中央企业9名领导人员职务任免信息。 中国交通建设集团有限公司、中国...
长华集团获新能源车企定点开发 ... 本报记者 吴奕萱 7月3日,长华控股集团股份有限公司(以下简称“长华集团”)发布公告称,公司近期收到...
一座楼推动一座城,越秀商管与城... 十年深耕,百万方城市综合体矩阵崛起于大汉口核心——这是越秀商管以“空间运营+产业赋能”双轮驱动,与武...
中集洋山集装箱第三季度订单饱满... 财联社7月5日讯(记者 胡皓琼)中美关税缓和之下,外贸企业对美出货恢复,带动中集洋山集装箱制造订单增...
南方基金解题韧性生长 三重困境... 来源:铑财 作者:古道  越是形势大好,越要居安思危 梅林时钟效应告诉我们,板块轮动是常态,顺势而为...
凯德北京投资基金管理有限公司:... 中国咖啡连锁品牌瑞幸咖啡近日宣布进军美国市场,首家门店将于2023年底在洛杉矶开业。这是继成功翻身并...
增强内生动力 挺立中部“脊梁” 中部地区承东启西、连南接北,是我国重要粮食生产基地、能源原材料基地、现代装备制造及高技术产业基地和综...
“速冻一哥” 安井食品港股上市... 一、上市首日备受瞩目,资本市场反响热烈 二、深耕行业二十余载,铸就速冻食品龙头 自 2001 年在...
原创 马... 值得注意的是,马英九此次访陆正值民进党当局不断收紧两岸交流,岛内"绿色恐怖"氛围浓厚。他的表态不仅是...
大曝光!徐彦减持五芳斋,闫思倩... 【导读】多位知名基金经理最新调仓路径曝光 中国基金报记者 王建蔷 7月以来,一批上市公司因回购、停牌...
住宅新规落地,房产价值面临大洗... 2025年,房地产市场迎来一场前所未有的变革。随着《住宅项目规范》的正式实施,中国房地产行业从“量”...