DeepSeek,突发!
创始人
2025-02-01 21:13:44
0

DeepSeek,继续在全球刷屏!

2月1日,#DeepSeek在美商标被梁文锋校友抢注#的话题冲上微博热搜。据新华每日电讯援引TC报道,一家总部位于美国特拉华州的名称为Delson Group的公司申请了DeepSeek商标。报道称,Delson Group的首席执行官兼创始人名为Willie Lu,后者与DeepSeek创始人梁文锋毕业于同一所大学——浙江大学。

另外,据华为云官方公众号2月1日消息,DeepSeek-R1开源后引发全球用户和开发者关注。经过硅基流动和华为云团队连日攻坚,现在,双方联合首发并上线基于华为云昇腾云服务的DeepSeekR1/V3推理服务。

值得关注的是,最近几天,DeepSeek的热度居高不下。日前,英伟达、微软、亚马逊等AI巨头纷纷宣布,已接入DeepSeek。此外,或许是迫于DeepSeek带来的压力,OpenAI紧急上线新一代推理模型o3-mini,并首次向ChatGPT免费用户开放推理模型。

国泰君安指出,DeepSeek-R1以MIT License完全开源模型权重,并允许商用模型蒸馏,为开发者提供了二次创新的自由空间。这一策略推动中国首次在通用大模型开源领域占据技术制高点,增强全球AI 话语权。同时,开源生态可能加速行业技术路线趋同,通用大模型因同质化加剧竞争,只有拥有真正领先技术的企业才能在这种趋势中留存。因此,此次国产开源模型的突破有望重塑全球AIGC技术路线及产业格局。

在美商标被梁文锋校友抢注

据新华每日电讯援引TC报道称,近日,中国人工智能公司 DeepSeek成为大规模网络攻击的目标。现在,该公司似乎又面临新的麻烦:美国商标纠纷。另一家公司申请了DeepSeek商标:一家总部位于特拉华州的公司,名称为Delson Group Inc.

Delson Group 声称,它自2020年初以来一直在销售DeepSeek品牌的 AI 产品。其首席执行官兼创始人名为 Willie Lu。Willie Lu与 DeepSeek 创始人梁文锋毕业于同一所大学——浙江大学。

DeepSeek,全称杭州深度求索人工智能基础技术研究有限公司,成立于2023年7月17日,是一家创新型科技公司,专注于开发先进的大语言模型(LLM)和相关技术。

DeepSeek在2024年12月26日推出V3(对标GPT4o),因其显著的性能,用户迅速开始增长,同时在1月20日发布R1(对标GPT-o1)后,进一步出圈。根据点点数据,从DeepSeek在美国下载排名从1月22日的201名,迅速在1月27日登顶第一名;根据七麦数据,截至1月30日,DeepSeek在168个国家位居下载榜第一名。

1月24日,著名投资公司A16z的创始人马克·安德森发文称,Deepseek-R1是他见过的最令人惊叹、最令人印象深刻的突破之一,而且还是开源的,它是给世界的一份礼物。最具煽动性的评价来自ScaleAI创始人亚历山大·王(AlexandrWang)。他说:过去十年来,美国可能一直在AI竞赛中领先于中国,但DeepSeek的AI大模型发布可能会“改变一切”。

AI巨头纷纷接入DeepSeek

1月31日,英伟达(NVIDIA)宣布,NVIDIA NIM已经可以使用DeepSeek-R1。英伟达官网当天发布文章指出,DeepSeek-R1是具备最先进推理能力的开放模型,比起直接提供响应,像DeepSeek-R1这样的推理模型,会对查询进行多次推理处理,使用连锁思维、共识和搜寻方法来生成最佳答案。

上述文章写道,为了帮助开发者安全地试验这些功能,并构建自己的专门代理,DeepSeek-R1模型现已作为NVIDIA NIM微服务预览版上线使用。

报道称,DeepSeek先前横空出世重创美国科技股,一度影响英伟达股价重挫17%,引发讨论。英伟达先前也发声,指DeepSeek的进步,代表了英伟达芯片对于内地市场的可用性,而未来,DeepSeek会需要更多英伟达芯片满足服务的需求。

另据参考消息援引台湾东森新闻网报道,近日,与OpenAI是密切合作伙伴的微软宣布,目前已将DeepSeek-R1正式纳入Azure AI Foundry,成为该企业级AI服务平台的一部分。

微软作为OpenAI的最大股东,长期资助OpenAI之余,还深度整合其AI技术,因此将DeepSeek-R1正式纳入的消息曝光后,外界十分关注微软为何在OpenAI对DeepSeek进行调查的同时,仍决定将R1模型纳入其AI服务。

微软强调,DeepSeek-R1模型已通过“严格的红队测试与安全评估”,并经历“模型行为自动化检测与广泛的安全审查,以降低潜在风险”。

微软也在声明中提到,后续微软仍会持续评估DeepSeek-R1模型,并可能进行一定程度的调整与优化,以提升其准确度及审查机制。

1月31日,亚马逊云科技也宣布,客户现已可以在Amazon Bedrock和Amazon SageMaker AI中部署DeepSeek-R1模型。此外,客户还可以通过Amazon EC2、Amazon SageMaker AI,使用Amazon Trainium和Amazon Inferentia部署DeepSeek-R1-Distill。

OpenAI首次向免费用户开放推理模型

DeepSeek的爆火,使得全球在AI领域的竞争进一步白热化。当地时间1月31日,OpenAI正式上线竞品推理模型o3-mini,并首次向免费用户开放推理模型。

OpenAI介绍称,o3-mini支持开发者调整“AI推理努力程度”分为低、中、高三个级别。这种灵活性使得o3-mini可以在面对难题时“更努力思考”,而需要效率时优先考虑回应速度。

据OpenAI披露,在2024年美国数学邀请赛(AIME 2024)的测试中,低推理努力的o3-mini准确率(60%)与o1-mini差不多,但速率更快;而在中等努力下,o3-mini准确率能够提升到79.6%,与o1模型相当。在最高努力水平时,o3-mini的准确率则能进一步提升至87.3%。在博士级科学问题(GPQA Diamond)方面,三种努力程度模型的准确率分别为70.6%、76.8%和79.7%。开发者可根据场景需求,灵活选择低、中、高三级推理强度,使模型在应对复杂挑战时能“深度思考”,或在需要快速响应时优先保证速度。

ChatGPT Plus、Team及Pro用户即日(1月31日)可体验o3-mini,企业用户将在一周后获得访问权限。即日(1月31日)起,免费版用户也可通过消息编辑器选择“推理”模式或重新生成回复来试用o3-mini,这是ChatGPT首次向免费用户开放推理模型。

在OpenAI发布新模型o3-mini后,麻省理工知名AI研究科学家、著名科技播客主持人评价该模型称,OpenAI的o3-mini是个不错的模型,DeepSeek的R1性能和它差不多,但价格更便宜,且能展示推理过程。更好的模型会不断出现(很期待o3 Pro 面世),但 “DeepSeek 时刻” 意义非凡。5年后人们仍会铭记这一伟大时刻,是科技史上的关键节点,部分原因是其地缘政治影响,当然还有诸多其他缘由。

机构:DeepSeek重构大模型生态

DeepSeek日前发布其最新开源模型DeepSeek-R1,用较低的成本达到了接近于OpenAI开发的GPT-o1的性能。这一进展破解了全球人工智能产业长期以来“堆算力”的路径依赖,其影响还波及了资本市场。

从定价看,DeepSeek-R1不仅开源,API(接口)价格还明显低于GPT-o1。DeepSeek-R1输入(缓存命中)、输出定价分别为每百万tokens 1元、6元,低于GPT-o1的55元、438元,具备性价比优势。

国际投行摩根士丹利表示,“更大(的模型)不再等于更聪明”,DeepSeek通过显著提高数据质量和改进模型架构,展示了一条与之前大模型不同的高效训练途径。摩根士丹利说,DeepSeek的模型现在低成本优势突出,与国际知名大模型相比,其成本大约低了一个数量级。

国泰君安指出,DeepSeek-R1以开源、高性能及低成本API对标OpenAI o1。其蒸馏模型的优异表现将支持消费电子、智能驾驶等终端AI的部署,开源策略将重整通用模型竞争格局,大模型的商业化落地将在DeepSeek 的低价API支持下加速,未来垂类应用也有望加速创新迭代。该券商表示,R1在后训练阶段通过大规模强化学习技术,在极少标注数据下提升推理能力,验证了算法优化的高效性。这一技术突破打破了海外企业在复杂任务上的技术垄断,为中国大模型技术参与全球竞争提供了实证支撑。

长江证券也表示,国产模型推理能力对齐业界领先水平,看好推理算力与应用侧受益。一方面,国产推理模型持续迭代,推理侧的scaling up将带来推理算力需求的显著提升;另一方面,通过利用DeepSeek-R1整理的80万个样本进行微调,小型模型推理能力显著提升,或加速垂类模型应用落地进程。

责编:罗晓霞

校对:祝甜婷

相关内容

热门资讯

宁高宁的12个“狠招” 来源:市场资讯 作 者:谭长春 知名管理专家 在当今中国企业的舞台上,宁高宁无疑是一位具影响力的管理...
1至2月国家铁路累计发送货物6... 北京商报讯(记者 卢扬 程靓)3月12日,据中国国家铁路集团有限公司消息,今年1至2月,国家铁路累计...
配料表,食品业的新战场 文 | 华商韬略,作者丨梁梁 随着新版《食品安全国家标准 食品添加剂使用标准》正式落地,一场全民参...
中银慧泽积极3个月持有混合发起... 近期,中银慧泽积极3个月持有混合发起(FOF)基金的业绩表现引起市场关注。 资料显示,中银慧泽积极3...
外卖市场最大的变数出现了 文|零态LT “明知山有虎,偏向虎山行”。这是业内人士听闻京东要大举进入外卖行业后的第一反应。 毕竟...
网友致信雷军要求解决澎湃OS无... 【CNMO科技消息】最近,有米粉给雷军致信,要求解决澎湃OS系统上线以来出现的一系列严重的无障碍问题...
北交所上市公司百甲科技大宗交易... 每经讯,2025年3月12日,北交所上市公司百甲科技(835857,收盘价:7.31元)发生一笔大宗...
盘点杨铭宇董事长杨晓路商业版图... 3月12日,杨铭宇官微发布致歉信:对于近期杨铭宇旗下涉事加盟门店(郑州二七万达店、郑州康复前街店、商...
大涨超50%!禾赛科技拿下海外... 3月12日,受美股禾赛科技(HSAI.O)大涨的带动,A股激光雷达方向全线走强,智能驾驶概念同样走高...
有效保护投资者权益 亟待畅通赔... 证券时报记者 张淑贤 监管部门大力打击上市公司财务造假和大股东资金占用,作为中小投资者,我们发自内心...
智能体爆发?李彦宏扳回一局! 3月6日凌晨,一款名为Manus的AI agent产品,一经亮相便引发全网关注,邀请码甚至被炒到了1...
黄金突然“变脸”!金价大跌后飙... 由于美元走弱以及关税战引发经济放缓的担忧,黄金价格周二(3月11日)飙升近1%。FXStreet分析...
洗盘即是机会? 以下是为您生成的中文快讯: 3 月 10 日是春季行情自 1 月 13 日启动以来的第 34 个重要...
蓝思科技股价狂飙:携手Roki... 近日,被称为“消费电子老将”的蓝思科技股价一路高歌猛进,成为资本市场焦点。同花顺平台数据显示,202...
WTA印第赛:郑钦文2-0完胜... 北京时间3月12日,2025赛季女子网球WTA1000系列赛印第安维尔斯赛继续进行,中国选手郑钦文继...
A股收评:三大指数齐跌!海南板... 3月12日,A股三大指数齐跌,截至收盘,沪指跌0.23%报3371点,深证成指跌0.17%,创业板指...
王家渡食品闪耀福布斯中国大消费... 2025年3月7日,一场大消费领域的思想盛宴——“2025中国大消费产业盛典暨福布斯中国颁奖礼”在上...
原创 东... 《电鳗财经》电鳗号/文 在商业浪潮中,企业扩张与资本运作总是紧密相连。2024年3月7日,国内功能饮...
青岛银行:3月11日融资买入5... 证券之星消息,3月11日,青岛银行(002948)融资买入589.59万元,融资偿还791.98万元...
专业UI/UX设计团队的5大工... 在数字化竞争日益激烈的今天,用户体验(UX)和用户界面(UI)设计已成为产品成功的核心要素。专业的设...