这家科技公司创始人,为何成为总理的“座上宾”?
创始人
2025-02-03 17:58:48
0

1月20日下午,中共中央政治局常委、国务院总理李强主持召开专家、企业家和教科文卫体等领域代表座谈会,听取对《政府工作报告(征求意见稿)》的意见建议。

在此次座谈会上,共有9人先后发言,就解决当前发展中的问题、做好今年政府工作提出了意见建议。他们分别是北京大学经济学院院长张辉浙江大学党委书记任少波中国工商银行党委副书记、行长刘珺,国产大模型企业深度求索(DeepSeek)创始人梁文锋,遨博(北京)智能科技股份有限公司董事长魏洪兴中国机械工业集团有限公司副总经理、总工程师陈学东国家图书馆古籍馆馆长陈红彦中国医学科学院北京协和医院副院长杜斌国际级运动健将、中国体操运动员邹敬园

其中,深度求索(DeepSeek)是来自杭州的一家科技公司。这家公司是什么来头,创始人梁文锋为何能成为总理的“座上宾”?

来自东方的神秘力量,大模型界的“拼多多”

DeepSeek,全称“杭州深度求索人工智能基础技术研究有限公司”,成立于2023年7月,由知名量化资管巨头幻方量化创立。在硅谷,DeepSeek很早就被称作“来自东方的神秘力量”,也是网上热议的“杭州六小龙”之一。

真正让DeepSeek火出圈的是2024年12月26日,这家公司宣布上线并同步开源的DeepSeek-V3模型,并公布了长达53页的训练和技术细节。

它以1/11的算力、仅2000个GPU芯片训练出性能超越GPT-4o的大模型。其总训练成本只有557.6万美元,而GPT-4o的约为1亿美元,使用25000个GPU芯片。双方的成本至少是10倍的差距。在性能上DeepSeek-V3在数学、代码能力和中文知识问答方面还超过了ChatGPT-4o

国外独立测评机构ArtificialAnalysis测试后,发出了“超越了迄今为止所有开源模型”的惊叹;Meta科学家田渊栋感慨:“这是非常伟大的工作。”“性价比”是商业社会中的制胜法宝之一,DeepSeek也因创新的模型架构和史无前例的性价比被称为“大模型界的拼多多”,引发字节阿里百度等大厂的大模型价格大战。

在外部看来,降价很像在抢用户,也有人说这家公司是行业的一条鲶鱼,公司创始人梁文锋表示,“我们不是有意成为一条鲶鱼只是不小心成了一条鲶鱼。”“抢用户并不是我们的主要目的,我们降价一方面是因为在探索下一代模型的结构中,成本先降下来了;另一方面也觉得无论API,还是AI,都应该是普惠的、人人可以用得起的东西。”梁文锋说。

国产大模型之前很少涉足架构层面的创新,也是因为很少有人主动去击破那样一种成见美国更擅长从0-1的技术创新而中国更擅长从1-10的应用创新。何况这种行为非常不划算——新一代模型,过几个月自然有人做出来,中国公司只要跟随、做好应用即可。对模型结构进行创新,意味着没有路径可依,要经历很多失败,时间、经济成本都耗费巨大。

DeepSeek显然是逆行者。在一片认为大模型技术必然趋同,follow是更聪明捷径的喧哗声中,DeepSeek看重“弯路”中积累的价值,并认为中国的大模型创业者除应用创新外,也可以加入到全球技术创新的洪流中。

DeepSeek的很多抉择都与众不同。截至目前,7家中国大模型创业公司中它是唯一一家放弃“既要又要”路线至今专注在研究和技术未做toC应用的公司也是唯一一家未全面考虑商业化坚定选择开源路线甚至都没融过资的公司。这些使得它经常被遗忘在牌桌之外,但在另一端,它又经常在社区被用户“自来水”式传播。

中国大模型将成为不容忽视的力量

与DeepSeek-V3低成本训练一样令人惊叹的是DeepSeek的员工规模。在团队配置上,DeepSeek团队只有139名研发人员,相比OpenAI拥有1200名研究人员,团队规模是DeepSeek的近乎9倍之多。

其中,算子、推理框架、多模态等研发工程师以及深度学习方面的研究人员共有约70人。比如前段时间的热门话题“雷军千万年薪挖95后天才AI少女”,这位“95后AI天才少女”罗福莉就是DeepSeek开源大模型DeepSeek-V2的关键开发者之一

OpenAI前政策主管、Anthropic联合创始人JackClark曾这样评价DeepSeek:“雇佣了一批高深莫测的奇才”,还认为中国制造的大模型,“将和无人机电动汽车一样成为不容忽视的力量。”

梁文锋是谁?

说回DeepSeek创始人梁文锋,他出生于1985年,广东湛江人,此前他接受专访时自称,“我是80年代在广东一个五线城市长大的。我的父亲是小学老师……”

17岁时梁文锋考入浙大读的是电子工程系人工智能方向,毕业后在浙大攻读硕士研究生,论文题目是《基于低成本PTZ摄像机的目标跟踪算法研究》。

2015年,30岁的梁文锋和朋友一起创办了杭州幻方科技有限公司,立志成为世界顶级的量化对冲基金。2016年10月,幻方量化推出第一个AI模型,第一份由深度学习生成的交易仓位上线执行。到2017年底,几乎所有的量化策略都采用AI模型计算。

梁文锋在金牛奖颁奖典礼现场

2023年5月,38岁的梁文锋宣布做通用人工智能(AGI)。7月他正式创办杭州深度求索人工智能基础技术研究有限公司就是DeepSeek公司,专注于AI大模型的研究和开发,公司设在杭州。从公开的工作经历和职业生涯来看,梁文锋在量化投资和高性能计算领域具有深厚的背景和丰富的经验,创业范畴横跨金融和人工智能领域。

多位行业人士和DeepSeek研究员认为,梁文锋是当下中国AI界非常罕见的“兼具强大的infra工程能力和模型研究能力,又能调动资源”“既可以从高处做精准判断,又可以在细节上强过一线研究员”的人,他拥有“令人恐怖的学习能力”,同时又“完全不像一个老板,而更像一个极客”。

这位技术理想主义者,提供了目前中国科技界特别稀缺的一种声音:他是少有的把“是非观”置于“利害观”之前并提醒我们看到时代惯性把“原创式创新”提上日程的人

他在接受有关媒体采访是表示:“过去很多年中国公司习惯了别人做技术创新我们拿过来做应用变现但这并非是一种理所当然。这一波浪潮里,我们的出发点,就不是趁机赚一笔,而是走到技术的前沿,去推动整个生态发展。”“我们认为随着经济发展中国也要逐步成为贡献者而不是一直搭便车。”

对于人才,他表示:“V2模型没有海外回来的人都是本土的前50名顶尖人才可能不在中国但也许我们能自己打造这样的人。”“我们选人的标准一直都是热爱和好奇心所以很多人会有一些奇特的经历很有意思很多人对做研究的渴望远超对钱的在意。”

“因为我们在做最难的事。对顶级人才吸引最大的肯定是去解决世界上最难的问题其实顶尖人才在中国是被低估的。因为整个社会层面的硬核创新太少了,使得他们没有机会被识别出来。我们在做最难的事对他们就是有吸引力的。”

这家公司为何会受邀参加座谈会?

去年,12月18日至20日,李强总理在浙江调研。在杭州,李强来到城西科创大走廊未来科技城展馆和之江实验室调研。他指出,创新是引领发展的第一动力要主动拥抱科技变革浪潮大力开展基础研究和共性关键技术研究加强算力等新型基础设施布局建设取得更多原创性引领性成果,为实现高水平科技自立自强贡献力量。

杭州未来科技城

1月20日,就在参加总理座谈会的当天,DeepSeek正式发布DeepSeek-R1模型。这款大模型在数学、代码、自然语言推理等任务上,性能比肩OpenAIo1正式版。在座谈会上,李强总理提到,“要以科技创新推动新旧动能转换集中力量突破关键核心技术和前沿技术加快推进科技成果产业化努力培育更多经济新增长点。”

DeepSeek只是杭州科技创新的一个代表,国产大模型公司在列总理座谈会,可见国家对科技的重视,也足见杭州在人工智能领域的强大实力。

过去30多年的IT浪潮,中国基本上没有参与到真正的技术创新,扮演的是追随者的角色。梁文锋曾在访谈中提到,“随着经济的发展中国也应该逐步成为技术创新的主要贡献者而不是一直依赖别人的成果。”

来源:“溪流之海洋人生”微信

相关内容

热门资讯

世界杯-乌纳希2球迪亚斯2助 ... 北京时间7月5日凌晨1时,2026世界杯首场1/8决赛打响,加拿大对阵摩洛哥,第21分钟,摩洛哥主力...
怎么判断南昌附近黄金回收机构是... 随着近年黄金价格波动频繁,不少南昌市民有闲置黄金变现的需求,很多市民在寻找附近黄金回收时会首先关注商...
上海电销专用卡服务相关企业情况... 电销类通讯产品行业背景 当前国内众多电销类企业日常运营中,高频外呼是核心业务场景之一,传统通讯产品容...
如何靠“断舍离式消费”过上更轻... 曾几何时,我也迷恋过买买买。 换季就剁手,节日必囤货,刷短视频看到“爆款推荐”立刻加购。 买得多,...
推出储架、提高额度、市价发行,... 在证监会主席吴清“预告”两周之后,再融资新规露出真容。 7月3日晚间,证监会宣布就完善上市公司再融资...
国家网信办就《互联网信息服务管... 国家互联网信息办公室就《互联网信息服务管理办法(修订草案征求意见稿)》再次公开征求意见。《办法(修订...
每周股票复盘:中国银行(601... 截至2026年7月3日收盘,中国银行(601988)报收于5.56元,较上周的5.76元下跌3.47...
原创 7... 2015年,曼哈顿玛登巷161号的项目正式动工。 它坐落在纽约金融区核心位置,紧邻华尔街地标,能同时...
摩根大通警告:若美联储提前加息... 美联储政策路径重新成为黄金定价的核心变量。摩根大通在最新贵金属研究报告中指出,随着实物与零售需求同步...
白宫成造富杠杆:特朗普一年实现... 一些颇为神秘的收益凸显出特朗普加密货币生意中的利益冲突:他不仅是加密货币行业的主要经营者,同时也是该...
医药的至暗时刻,瓶子与瓶塞最先... 文| 锦缎 2026年6月,A股医药板块仍在泥潭里挣扎。中证医药指数从2021年2月17700余点...
“星辰大海、快与慢、定价权”,... 封面新闻记者 易弋力 近年来,跨境电商行业迈入从“成本导向”向“价值导向”转型的关键时期,也迎来了企...
汇禾医疗董秘沈简文年薪176万... 瑞财经 刘治颖 6月30日,上海汇禾医疗科技股份有限公司(以下简称:汇禾医疗)科创板IPO获受理,保...
天热食物易变质!夏季食源性疾病... 【来源:海淀疾控】 食品安全 一到夏天,冰镇西瓜、麻辣小龙虾、凉拌菜、冰饮轮番上桌,吃得过瘾又解暑。...
纯债基上半年强势复苏,混合债基... 财联社7月3日讯(编辑 杨斌)随着上半年债市回暖,纯债基的表现有所复苏。 财联社据Wind数据梳理,...
李彦宏最大IPO来了 “份额抢不到。” 这一幕正在出现在昆仑芯身上。自年初以保密形式向港交所递表以来,昆仑芯上市越来越近。...
伊朗海上浮仓石油积压,正寻求向... 在美国6月对伊石油制裁实施60天全面豁免后,伊朗出口商正寻找买家,大量囤积的伊朗石油在海上不断积压。...
上党区:织密电商发展网 激活产... 今年以来 我区深入落实区委经济工作会议部署 聚焦壮大电商新业态 做强区域公用品牌 通过搭建普惠电商孵...
建党节当天,“一周两次挺身救人... 大众卫生报·新湖南客户端7月2日讯(通讯员 黄云 张媛)“孩子选择在党的生日前夜来到身边,对我来说真...
十多家酒企原酒被拍卖,价格拍出... 白酒行业的深度调整正在从下游渠道端向上游生产端传导。 第一财经记者注意到,阿里拍卖等平台上,白酒原酒...