马斯克加入Agent争霸赛!Grok DeeperSearch上场,对决Gemini Deep Research
创始人
2025-03-20 16:38:08
0

新智元报道

编辑:KingHZ 英智

【新智元导读】AI智能体迎来新玩家!Grok 3推出的DeeperSearch功能,提升DeepSearch搜索能力,更加深入分析复杂主题。免费放开Deep Research功能后,Gemini 2.0公布研究智能体6大使用技巧。2025年度Agent大战开打!

2025年Agent大战,Deep Research「研究智能体」率先开打!

第一个登场的谷歌Gemini,随后OpenAI、Perplexity等也相继推出了自己的同名功能。

Grok是个例外,与Grok 3一同发布的是「DeepSearch」,没有「Research」只有「Search」。

有趣的是,就在昨天,Grok悄无声息地推出了全新的功能 ——「DeeperSearch」。

在Grok网页中点击DeepSearch的小箭头,免费用户也可使用DeeperSearch。

比较一下DeeperSearch和Deep Research,不能说一模一样,至少也是AI界的Cosplay。

Grok DeeperSearch

Gemini Deep Research

现在利用AI的Deep Research / DeeperSearch,可以探索复杂主题,并以全面、详细的报告形式呈现研究成果。

接下来,深入了解一下如何更高效的使用Deep Research/DeeperSearch的技巧吧。

DeeperSearch试用

Grok是X上内置的AI模型,让DeeperSearch搜索了过去48小时X上的热点AI资讯,效果的确不错。

不过,不是每次体验都很流畅。

从事NLP研究的Casper Hansen,表示:「Grok DeeperSearch再创纪录。纯搜索和思考时长达16 分钟。」

搞笑的是在思考过程中,DeeperSearch很像人的自言自语,比如「我在想,搜索****可能会太模糊。」

现场开盒匿名网友

从事预测研究的Sam Atis,直接问起了Grok的DeeperSearch下列问题:

你可以找出Sam Atis是谁吗?我想知道撰写Samstack.io的人的真实身份。

同样的问题,Grok的DeeperSearch认出了Sam Atis的真实身份,而DeepSearch并没有得到正确答案。

DeeperSearch查出了他之前工作过的地方(一家非常小的NPO),然后检查了那里所有工作人员的背景,与他在 UCL学习政治学的事实相符。

Sam Atis还测试了「你能找到[人物]的Reddit账号吗?」,其中[人物]针对他认识的人,结果很成功。

尽管和Reddit账号之间没有明显的联系,DeeperSearch从一篇文章中正确推断出来的匿名账户的真实真实身份。

这也让Sam Atis猜测:「不久,使用化名的作者都将不在安全,许多人都能被LLM认出来了。」

如果真的在乎个人隐私,这的确令人担心。

AI也被问烦了

网友Nathan Clement向DeeperSearch问了一个智能体协议MCP的问题,把Grok 3问沉默了。

Grok 3对提问分析了长达5分钟47秒,找到了10个网页,但报告一句话也没生成,直接显示无法完成回复。

Nathan Clement推测,或许DeeperSearch被MCP问题问烦了。

实测:速度有些慢

打开Grok 3的DeeperSearch功能,发送提示:「总结一下深度研究功能的进展」。

DeeperSearch查询了46个信息来源,10个网站,耗时37分钟37秒,完成了相关报告。

然而,Grok 3只总结了OpenAI的深度研究功能进展。

全球范围内,谷歌Gemini首次发布了Deep Research功能,并在不断更新;xAI的类似功能也没有考虑进去。

毫无疑问,关键引用全是OpenAI的消息。

DeeperSearch:不只是搜索

热衷xAI的Denis Labelle,在X上分享了充分利用DeeperSearch的经验。

DeeperSearch增强了下列3项功能:

  1. 广泛的查询处理能力:(例如)收集Grok 3高级功能的全面信息,表现完美。

  2. 个性化洞察:能够根据查询意图调整回复内容。

  3. 实时集成:获取最新数据,比如随时掌握Grok 3相关讨论的最新动态。

1. 从一般查询入手,进行初步研究

DeeperSearch采用先进算法,能够快速提供多样化、符合上下文的搜索结果。

如何操作:提出关于Grok 3功能的高层次问题。

示例:「Grok 3的主要高级功能有哪些?」

(你将获得关于DeeperSearch、Think模式、实时数据集成等功能的详细概述。)

2. 利用Think功能进行深入分析

  • 提炼Grok 3的高级功能要点。

  • 评估信息的可靠性。

  • 查找明确需要进一步探索的领域。

操作步骤:

  1. 运行DeeperSearch查询:「Grok 3的高级功能有哪些?」

  2. 切换到Think模式:「总结Grok 3的高级功能,并指出可能缺失的细节。」

  3. 根据生成的结果,优化你的下一步查询

3. 设计精准提示词,获取深入见解
  • 明确你的需求,聚焦特定信息

  • 请求分析,而不仅仅是事实罗列

  • 表达清晰、简洁

示例:

  • 「分析Grok 3的DeeperSearch功能,如何处理关于其高级特性的复杂查询。」

  • 「评估Grok 3的实时数据集成功能在增强其高级特性方面的作用。」

4. 使用透明度功能验证结果
  • 理解逻辑:查看AI如何解读Grok 3的高级功能

  • 建立信任:确认输出结果的可靠性

操作步骤:

  1. 在获得结果后,切换「思考」(think)选项以查看AI的推理步骤

  2. 检查关于Grok 3功能声明的一致性

  3. 如有必要,调整你的问题

5. 采用迭代式工作流程
  • DeeperSearch模式:从关于Grok 3高级功能的一般查询开始

  • Think模式:分析结果并找出遗漏之处

  • 再次切换至DeeperSearch模式:优化查询,深入挖掘信息

重复上述过程,直到满意为止。

示例:

  • 「Grok 3的高级功能有哪些?」

  • 「响应列出了功能,但缺乏对局限性的详细说明。遗漏了什么?」

  • 「Grok 3的高级功能(如DeeperSearch)有哪些局限性?」

高效prompt推荐

  • 「分析Grok 3的DeeperSearch功能如何增强其高级功能集。」

  • 「评估Grok 3的Think模式在其高级功能中的有效性。」

  • 「评估Grok 3的实时数据集成功能作为高级功能的优势与劣势。」

  • 「分析Grok 3的DeeperSearch在详细说明其高级功能时的准确性。」

  • 「确定Grok 3的高级功能(如DeeperSearch)如何支持AI研究。」

  • 「总结Grok 3的透明性功能(如Thoughts开关)在其高级功能中的优势。」

  • 「预测Grok 3的高级功能基于当前能力可能如何发展。」

  • 「分析Grok 3的DeeperSearch作为未来版本中领先的高级功能的潜力。」

谷歌Deep Research的6大技巧

Gemini高级产品经理Aarush曾想为孩子寻找适合的夏令营,这通常需要打开几十个浏览器标签页,再把所有重要信息整理到一个文档中。

Aarush和软件工程师Mukund想到开发一个能研究所有相关信息,并创建报告的AI系统。

与团队经过几周进行原型设计后,他们做到了。以下是6个使用小技巧。

Gemini深度研究现已面向所有人开放,还新添了音频概述功能!

先看这任务需不需要深度研究

如果你要做的事,得花大量时间浏览网页,还得开好多标签页,那深度研究就特别有用。

Deep Research是帮你从对某个主题啥都不懂,到透彻了解的得力助手。

但要是想马上得到一个简单快速的答案,可能用不着深度研究。

比如说,想简单了解「金融科技」是啥,直接用Gemini默认的聊天功能就行。

可要是你是个风险投资人,要跟一家金融科技初创公司见面,想快速了解行业最新趋势,这时候深度研究就能派上大用场。

从简单直白的问题问起

虽说叫「深度」研究,但不意味着一开始提问就得绞尽脑汁。

「别想太复杂,你随时能改问题。在深度研究开始干活之前,它会把研究计划给你看,要是觉得不合适,还能按自己的想法调整。」Aarush表示。

只要点「编辑计划」选项,用大白话告诉它要加什么内容,或者换个研究方向就行。

不用非得是提问高手,只要把最终目标说清楚,比如「我想给10岁孩子在纽约找个超棒的夏令营」,剩下的深度研究就会帮你搞定。

顺着报告内容追问细节

等拿到报告,可能会发现一两个特别有意思的细节,这时候Aarush建议接着追问。

在聊天窗口里输入问题,深度研究要么根据之前的研究,马上给你答案,要么再去网上找找更多信息。

还能在报告生成之后,让深度研究再加点新内容,它会马上更新报告。

比如,让它「在报告里加上夏令营费用的信息」,深度研究就会去找相关信息,然后加到报告里。

看看相关链接

Gemini忙着研究、写报告的时候,界面上会有「显示思考过程」和「浏览过的网站」这两个选项。

要是点击「显示思考过程」,就能看到它是怎么一步步写出报告的。

这两个选项都会列出深度研究用到的网站,「浏览过的网站」会把网站列出来,但不会讲具体研究过程。

等报告的时候,要是哪个网站吸引你了,点一下,就能在新标签页打开。

这可是发现新网站的好办法,要是自己找,说不定根本发现不了这些网站。

用深度研究解决身边的问题

深度研究特别擅长本地化搜索,能帮你找到周边的信息。

要是想多了解自己住的社区,或者想找本地商家做个复杂的家庭项目,不妨试试深度研究。

还有个挺实用的场景,就是让它策划活动,像办个晚餐聚会或者生日派对,看深度研究怎么搜寻本地资源。

生成音频报告,或者导出文档

因为本周的更新,现在能给报告生成音频概述了。

音频概述功能最早是在NotebookLM里推出的,用户可以听两个AI主持人讨论、解读上传的信息。

现在深度研究也有这功能啦!

报告做好以后,右上角能看到一个切换按钮,有好几个选项,其中一个就是生成音频概述。

它会像播客一样,把报告内容给你讲一遍。

这样一来,听音频的时候还能干别的事,出门在外也能听。要是你觉得听比看更容易理解,这个功能就太适合了。

不管是在网页还是手机上,都能听,分享、下载也很方便。还能把报告导成文档。

Mukund表示,「要是我觉得这份报告特别好,想自己再改改,然后发给别人,让他们也提提意见。」

把报告导成文档的时候,深度研究引用的所有资料,都会列在参考文献部分。

要是想把东西打印出来看,或者在上面写写画画,也完全没问题。对于习惯在纸质文件上做标记的人来说,这可太实用了!

参考资料:

https://blog.google/products/gemini/tips-how-to-use-deep-research

相关内容

热门资讯

美联储降息乐观情绪,日韩股市双... 来源:第一财经 美联储降息预期下的乐观情绪暂时压过了各类不确定性因素,也包括关税,提振亚太股市整体升...
新易盛:9月15日融资买入18... 证券之星消息,9月15日,新易盛(300502)融资买入18.28亿元,融资偿还24.68亿元,融资...
保险AI科技公司暖哇科技申请港... 9月16日,香港联交所网站披露,保险AI科技公司暖哇洞察科技有限公司(下称暖哇科技)正式向香港联交所...
中东地区机构日益青睐人民币 人民网迪拜9月16日电 (记者管克江)近日,中国银行迪拜分行支持阿联酋国民银行五年来首次发行离岸人民...
原创 帮... 各位打工人兄弟,是不是每天挤完地铁扎进工位,忙到下班连外卖备注都懒得写,一听见“理财”就头大——总觉...
议息在即,特朗普“自己人”正式... 美联储定于9月16日至17日举行货币政策会议,外界普遍预期,美联储将在本次会议上启动降息进程。 就在...
早报|雷军:小米17系列全面对... 雷军:小米 17 系列全面对标 iPhone 罗永浩怒怼西贝「致歉信」:谁虐谁 中汽协会就供应链账期...
兴源环境:9月15日融资买入9... 证券之星消息,9月15日,兴源环境(300266)融资买入974.97万元,融资偿还1100.93万...
深圳水贝现“黄金大劫案”!料商... 近日,蓝鲸新闻记者接到商家爆料,深圳水贝市场出现料商关门停业、老板失联事件,大量上下游中小商户面临巨...
观战台:拜仁恶战切尔西+丁丁反... 欢迎收看2025-26赛季第8期观战台,本文将为您囊括北京时间9月17日至9月19日期间世界足坛重要...
增量险资叠加无风险利率下行,红... 9月16日,招商基金旗下中证红利ETF(515080)将迎来三季度分红权益登记。根据此前分红公告,本...
贺博生:9.16黄金暴涨持续破... 做投资就像打一场战役,一定要在战役开始前定好策略,不仅要在战场上有优势的时候要怎么扩大优势,趁胜追击...
刚刚,金价又创历史新高!美联储... 美联储降息预期推动,国际金价持续走高。今日(9月16日)亚洲早盘,现货黄金一度升至每盎司3689美元...
东南亚电商进入“快车道”,中国... 过去十年,中国电商的飞速发展,几乎改写了全球零售版图。 从双11、618等全民大促,到直播带货的消费...
基金代销:蚂蚁、招行断层式领先... 近日,中国证券投资基金业协会披露了2025年上半年公募基金销售保有规模Top100名单(以权益类基金...
和林微纳:9月15日融资买入1... 证券之星消息,9月15日,和林微纳(688661)融资买入1176.49万元,融资偿还1295.92...
基金忠言|华商基金廿载接力,主... 图片来源:视觉中国 蓝鲸新闻9月15日讯(记者 祁和忠)在国内中型基金公司中,华商基金近20年来坚持...
明略科技CEO吴明辉即将出席2... 全球大模型技术加速演进,行业应用逐步走向纵深。面对通用大模型在专有数据、行业know how等方面的...
12年来首次被单独“约谈”,小... 文 | 镜象娱乐,作者 | 栗子酒 2019年5月,刚开始推进商业化不久的小红书,遇到了一个“门槛...