×
加载中...
比 DeepSeek 更猛的,是 DeepSeek 的创始人
科技狐 2025-02-02 08:01

最近,DeepSeek 火遍国内外,其创始人梁文锋成为焦点。

春节除夕夜,梁文锋的家乡——广东湛江吴川市米历岭村,比往年更添了几分热闹。

当昔日“小神童”的梁文锋踏进家乡时,村口高挂的横幅写着“热烈欢迎文锋,家乡的骄傲与希望!”,街边的双喜拱门上则写着“文锋回乡传佳绩,乡村振兴添动力”。

图片

近日,梁文锋还现身央视《新闻联播》,以 DeepSeek 创始人的身份参加一场座谈会并进行现场发言。


图片

老狐最近看了不少梁文锋的成长经历和最近发言,也对这位创始人有了更深的认识。

图片启蒙之路:从数学学霸到科技梦想家

1985 年,梁文锋出生在广东湛江吴川市的一个普通教师家庭,父母都是小学语文老师。

梁文锋从小就是学校里的“尖子生”,并在数学学科表现出极大天赋。小学六年级时,梁文锋顺利考入吴川一中。初中时就自学完了高中数学,还开始接触大学数学。

图片

最后一排右边第6个是梁文锋。图源:湛江青年

2002 年,17 岁的梁文锋以吴川一中的“高考状元”成绩考入浙江大学电子信息工程专业,一路攻读到信息与通信工程硕士学位。

在浙江大学求学期间,梁文锋不仅学业成绩优异,更是各种学术竞赛和社团活动的积极参与者和表现的佼佼者。

2008 年,全球金融危机爆发,梁文锋带领团队探索机器学习技术在全自动量化交易中的应用潜力,为日后的创业埋下了“种子”。

图片创业之路:从量化投资到 AI 前沿

研究生毕业后,梁文锋先后在网易、阿里巴巴等互联网企业积累了丰富的实战经验。

然而他并没有像周围人一样去大厂做个程序员,而是选择了创业。

2013 年,梁文锋与浙大同学徐进共同创立杭州雅克比投资管理有限公司。

2015 年,又创立杭州幻方科技有限公司(即幻方量化),致力于通过数学和人工智能进行量化投资,到了 2021 年,其资产管理规模已经突破千亿,成为国内量化私募“四大天王”之一。

图片

这段经历不仅展示了梁文锋在金融科技领域的卓越眼光,也为他后续转战人工智能领域积累了丰富的经验和资本。

2022 年,OpenAI 发布了 ChatGPT,全球为之震动。梁文锋敏锐地捕捉到这一机遇,2023 年果断进军通用人工智能(AGI)领域,成立了 DeepSeek。

今年春节期间,DeepSeek 一举登顶中国大陆和美国应用商店的免费 APP 下载排行榜,引起全球科技界的广泛关注。

图片

更令人惊讶的是,DeepSeek 从成立到成为“东方神秘力量”,仅用了短短一年多时间。研发团队仅有 140 人,使用 2048 块低端 GPU,在两个月内投入 557.6 万美元(约 4000 万元人民币),成功研发出震惊世界的大模型。

在研发 DeepSeek-V2 模型时,团队面临如何在降低成本的同时保证模型性能的挑战。梁文锋带领团队进行了无数次试验,尝试了各种不同的技术组合。

经过连续一个月的艰苦努力,团队成功优化了模型,不仅将推理成本降到每百万 token 仅 1 块钱,约等于GPT-4 Turbo 的七十分之一,被称为“AI 界的拼多多”,还在性能上有了显著提升。

同时,DeepSeek 宣布上线并同步开源 DeepSeek-V3 模型,公布了长达 53 页的训练和技术细节。

模型测算数据显示,DeepSeek-V3 虽然在文字生成类任务上表现较弱,但其代码、逻辑推理和数学推理能力均名列前茅。

1 月 20 日晚,DeepSeek 正式发布 DeepSeek-R1 模型,该模型在数学、代码、自然语言推理等任务上,性能比肩 OpenAI 的 GPT-4 正式版,并同步开源模型权重,公开训练技术,促进技术社区的交流与创新协作。

图片突围之路:中国创新从“摘果子”到“种树”

1 月 26 日,《黑神话:悟空》的制作人冯骥称 DeepSeek 可能是一个“国运级”的科技成果,他激动地表示:

“太幸运了!太开心了!这样的震撼突破,来自一个纯粹的中国公司。知识与信息平权,至此又往前迈出了坚实的一步。”

图片

面对这一评价,DeepSeek 创始人梁文锋在除夕夜回应道:“用代码当砖瓦,拿算法做钢筋,在资本与质疑的裂缝中,硬生生垒出通向未来的栈桥。”他在知乎的一篇长文中,详细分享了这次被誉为“国运级”突破的背后故事。

图片

梁文锋提到,DeepSeek 的团队始终站在开源社区的肩膀上,通过不断努力推进国产大模型的技术进步。

他特别分享了一些细节:例如,支持联网搜索的功能来自于内测用户三十天凌晨三点提交的错误日志;一位视障开发者使用 DeepSeek 的 API 开发出“气味导航”应用,让他深刻意识到技术的真正意义,不仅仅在于创新,更在于它对社会的贡献与改变。

图片

在另外一场访谈中,梁文锋直言:“很多人惊讶 DeepSeek 能在硅谷层出不穷的创新中脱颖而出,其实在美国每天发生的大量创新里,我们的表现也许并不出奇。”

但关键在于,这是一个中国公司以真正的创新贡献者身份参与到全球游戏中去。大部分中国公司习惯于跟随,而非从根本上做原创。

图片

老狐认为更深层的冲击或许在于,DeepSeek 选择了一条“反常识”路径——将核心技术开源。

这不仅是商业策略,更是一种文化宣言:当硅谷用闭源生态筑起护城河时,中国公司试图用开放共享重构技术话语权。

正如梁文锋提到的,在过去的几十年里,中国在 IT 领域的成功多源于应用层的快速迭代,如移动支付、社交电商等,但底层技术一直依赖“拿来主义”。

这一惯性路径导致中国企业更多关注短期商业化,而忽视了长期技术沉淀。这种模式不仅使得中国公司在原创性上常处于被动地位,也加深了“创新资本不足”的偏见。

此外,中国长期以来依赖西方技术,造成了创新信心的缺乏和技术生态的断层。以英伟达的 CUDA 为例,数十年的技术积累与协作让其在全球占据了主导地位,而中国的芯片产业和算法研发则面临全链条的生态缺失。

图片

DeepSeek 的破局无疑是一场“非典型”中国实验。

DeepSeek 选择了技术信仰 > 商业 KPI 这样一条路,All in 大模型底层创新,而非跟风做行业落地,这种何尝不是一种“奢侈”?

截至目前,7 家中国大模型创业公司中,它是唯一一家放弃“既要又要”路线,至今专注在研究和技术,未做 to C 应用的公司。

这样的选择背后或许可以从梁文锋的发言中窥见一二:

“过去很多年,中国公司习惯了别人做技术创新,我们拿过来做应用变现,但这并非是一种理所当然。这一波浪潮里,我们的出发点,就不是趁机赚一笔,而是走到技术的前沿,去推动整个生态发展。”

图片

另一方面,DeepSeek 也是 7 家大模型公司中唯一一家未全面考虑商业化,坚定选择开源路线甚至都没融过资的公司。

用“开放共享”取代“闭源收税”,正好印证了梁文锋团队提到的护城河不在代码里,而在人的脑子里。在颠覆性的技术面前,闭源形成的护城河是短暂的,技术没有秘密,但重置需要时间和成本。

图片

“选用了一批没有经验但有潜能的人,以及有一个可以让创新发生的组织架构和企业文化”。这是梁文锋这家大模型创业公司可以与大厂竞争的秘密所在。

OpenAI 前政策主管、Anthropic 联合创始人 Jack Clark认为,DeepSeek 雇佣了一批高深莫测的奇才。

“并没有什么高深莫测的奇才,都是一些 Top 高校的应届毕业生、没毕业的博四、博五实习生,还有一些毕业才几年的年轻人。

“我们选人的标准一直都是热爱和好奇心,V2 模型没有海外回来的人,都是本土的。前 50 名顶尖人才可能不在中国,但也许我们能自己打造这样的人。

梁文锋通过“独具一格”的用人策略,结合自下而上的创意涌现与自上而下的资源调度,成功营造了充满创新文化的氛围,推动公司在技术创新中保持强大动力与灵活性。

DeepSeek 的意义或许远超一家公司的成败,它验证了一个更宏大的命题:中国能否从“技术消费者”进化为“技术创造者”?

DeepSeek 选择开源后,DeepSeek-R1 被全球47 所顶尖高校引入课程,GitHub 衍生项目超 3000 个。这种“技术传染力”正在孵化下一个AI技术社区,而这正是中国科技一个新的突破和开始。

DeepSeek 的崛起不仅促使中国科技创新反思,也让 OpenAI 重新审视其开源策略。

在最近的 Reddit AMA 中,OpenAI CEO 奥特曼公开承认在开源权重 AI 模型这个问题上,我们站错了队,已经认识到闭源并非保持领先的唯一途径。

图片

紧接着,OpenAI 紧急上线 o3-mini 模型,免费用户也可以使用。同时,奥特曼也宣称内部正在考虑开源策略,继续研发模型,但 OpenAI 领先优势不会像以前那么大了。

可以看到的是,梁文锋带领下的 DeepSeek,这条“鲶鱼”仍在持续搅动全球科技界的风云。(转载自:科技狐)

扫码下载app 最新资讯实时掌握