资深投资人揭秘Deepseek“不融资”生存法则 - 新闻详情

资深投资人揭秘Deepseek“不融资”生存法则

来源:深网

分类: 其他

发布时间:2025-06-03 08:34:47

2024年上半年,已经决定投资欧洲人工智能Mistral AI的宋春雨,回国第一时间便要求团队在国内寻找商业模式和MistralAI相似的创业公司。

Mistral AI成立于2023年4月,由三位前谷歌DeepMind和Meta的科学家联合创立。早期他们推出的开源模型Mistral7B曾凭借超低的调用成本及比肩GPT-3.5的性能,迅速成为OpenAI最有力的竞争对手。

宋春雨是联想创投集团高级合伙人和首席投资官,是AI领域的投资老兵,投资项目覆盖AI1.0至AI2.0时代不少明星项目——旷视科技、第四范式、寒武纪、阶跃星辰、智谱AI等。

但在基础大模型最火的2023年,宋春雨没有投任何一个基础大模型公司,反而是投资了开源社区、上层应用及一些算力芯片公司。

“当时在海内外,GPT-4都非常火。但因为调用GPT-4成本高,这种模式不长久,我们要找的是能把大模型像水、电、煤一样接入社会基础设施的公司。”宋春雨说。

宋春雨在海外投资了MistralAI,而在国内发现了同样开源且采用MoE架构的Deepseek。“我去年2月就和梁文锋在交流,但他们不融资。梁文锋对商业化不感兴趣,他专注打磨基础模型,确保每一代模型都保持领先。”宋春雨说。

今年,宋春雨在AI领域的投资方向已经开始向智能体、AI原生应用以及具身智能

等方向迁移,关注大模型如何重构物理世界。

以下是宋春雨对于基础大模型技术迭代、Deepseek不融资、中美AI差距、AI原生应用、具身智能、自动驾驶等看法,在不改变原意的基础上有所删减:

梁文锋拒绝融资背后的逻辑

问:你决定投资Mistral AI主要是因为这家公司是开源的吗?

宋春雨:

开源的魅力在于将最先进的成果公开,使大家能够快速学习并在其基础上进行创新。这使得当前各大模型的学习和进化速度比以往快了几倍。例如,OpenAI在去年12月6日发布o1正式版,Deepseek-R1在今年年初达到与o1相似的性能水平。此后,行业内几乎每个月都会出现试图对标o1和R1的新模型。

开源也促进了算法、架构等技术的迅速传播与应用。比如,Deepseek取得成功之后,Meta在其Llama4中也采用了MoE架构。

Mistral之所以在2023年底迅速走红,是因为其开源的MoE大模型Mistral 8x7B性能达到了GPT-3.5的水平。

我们于去年年初投资了Mistral。我回到国内后,就要求我们的投资团队在国内寻找能够和Mistral对标的、并采用MoE架构的开源模型。去年2月份我们就和梁文锋有深度交流,但他们不融资。

问:不缺钱?

宋春雨:

我个人觉得梁文锋是坚信AGI

的人。第一,他是技术极客背景出身,他给自己的使命就是要去摸AGI的上限,或者说人类能达到硅基智能的上限是什么?他对商业化不感兴趣,这一轮Deepseek浪潮中,在用户体验方面,最大的赢家是腾讯的元宝,梁文锋所有的卡都用来做下一代的模型了。

梁文锋和DeepSeek公司主体(杭州深度求索人工智能基础技术研究有限公司)本身也不差钱,这点很重要,他们可以养的起团队。现在很多投资机构和大厂都要给DeepSeek融资,但梁文锋不接,因为他有实现AGI的使命感。从这一点来看,DeepSeek某种程度上回归了OpenAI最初作为非营利组织的初心与愿景。

所以开源的DeepSeek代表代际模型的最高水平,部署成本仅是闭源模式的几十分之一。马斯克下的xAI训练出对标o1和R1水平的模型,大约用了20万张卡,但梁文锋团队用的少了一个量级。

问:DeepSeek对创投行业也是分水岭?

宋春雨:

是的。从去年开始,我们一直在找拐点。在DeepSeek出来之前,中国创业者用GPT-4更多,但因为调用GPT-4成本高,这种模式不长久,我们要找的是能把大模型像水、电、煤一样接入社会的基础设施。

就像4G通信技术的普及曾催生移动互联网原生应用,比如滴滴、拼多多、大众点评、美团、小红书等,我们相信,AI时代也会诞生AI原生的SuperAPP。在DeepSeek出来之前,受基础模型性能与成本的双重制约,当时大家觉得这个Super APP很难出现。

问:为什么?

宋春雨:

用户对基础模型还没有培养起高度的使用粘性。比如在DeepSeek推出之前,豆包拥有1亿到1.5亿用户,但DeepSeek上线后,大量用户开始迁移。这也正是我特别佩服梁文锋的地方——他专注打磨基础模型,确保每一代模型都保持领先,只要模型足够好,客户自然会来。

问:你怎么评价梁文锋?

宋春雨:

他是我心中最完美的AGI创业者,初心纯粹,笃定AGI方向。

多模态是下一代大模型明确方向

问:听说咱们今年的行研已经结束了,与去年比,我们在大模型和AI领域得出结论有哪些变化?之前您认为开源大模型可能落后于闭源,Deepseek大火后,您的看法有了哪些改变?

宋春雨:

今年标志着一个新时代的开始,整体AI发展正在加速迈向硅基智能。以Deepseek为代表的开源大模型崛起,反映出AI普惠趋势明显加快。

我们得出三个主要结论。第一,去年我们在分析AI大模型格局时认为开源与闭源各占五成。Deepseek最大的价值是AI普惠了,AI普及加速,这会让开源和闭源模式变成八二开,开源大模型占比80%,闭源大模型占比20%。

Deepseek的开创性贡献体现在两方面,一是其不仅开源了推理模型,还大幅降低了模型部署成本,加速了智能体和AI应用的普及。同时,Deepseek在工具链、数据链以及调用性方面更透明,也促进了智能体之间的协作。例如,像Manus

这样的平台,使得多个智能体协同完成复杂任务成为可能。

第二,在大模型和AI领域,中国和美国已成全球两大核心力量,代表当前AI发展的最高水平。由于大模型高度依赖数据,主权AI的逻辑依然成立。

第三,Deepseek带来AI普惠后,下一阶段会有智能体的大爆发,垂域智能体和通用智能体会加速进化。在物理世界,我们看大模型对物理世界的影响主要是两个方向,一是车的自动驾驶,二是具身智能。会出现基于物理世界真实数据和仿真数据的专属具身智能大模型。

问:现在行业对具身智能判断两极分化,你怎么看?

宋春雨:

我个人认为具身智能是物理世界进化的终极形态。首先,在有限场景的泛化,比如工厂内的分拣工作,两年内能产生ROI;其次,未来的机器人将呈现多样化共存的状态,它们不一定是人形的,可能是轮式的,或者配备的不是五指灵巧手,而是简单的夹具等形式。

问:和第一波具身智能创业者相比,这波创业者有何不同?

宋春雨:

第一波创业者大多来自高校教授,而这波创业者很多都具有产业背景,比如创业者本身在智能驾驶公司、或者在特斯拉等工作过。

问:智能驾驶现在处于哪个阶段?

宋春雨:

智能驾驶现已进入快速收敛期,自动驾驶肯定是具身第一个成功的商业化成功的场景,毕竟自动驾驶本质上就是一种“四轮机器人”。

自动驾驶已经迎来了类似iPhone的突破时刻,这一进展主要由视觉大模型驱动,然而具身智能落地应用仍需进一步演进。在中国,自动驾驶领域的创业公司会进一步收敛集中。由于特斯拉的FSD在国内缺乏数据训练支持,这对中国的自动驾驶企业来说是一个机会。一旦这些企业能够提供超越用户体验门槛的产品,就会对市场产生重大影响。

问:多模态大模型

算今年的投资重点吗?

宋春雨:

从模型进化来看,Deepseek-R1和OpenAI的o1主要基于文本处理,下一代大模型比较明确发展方向是多模态。典型案例是GPT-4o的多模态能力,图像、声音等是大模型获取世界数据的方向。

问:怎么看文生视频方向?

宋春雨:

我个人感觉文生视频的技术框架上还没有完全走通,OpenAI的Sora相当于给大家放了个demo(一个演示性产品),模型本身还需要突破。

中美在模型算法上的差距为6个月

问:现在中美AI差距有多大?

宋春雨:

非常接近了,个人认为在算法层面的代差约为半年周期。真正的制约瓶颈在于算力基础设施,导致整体训练效率受限。但在算法上,中美的差距大约在6个月。

此外,人才结构也慢慢呈现本土化特征。从AI公司的员工配备看,这一代的AI人才已经不局限于吴恩达、李飞飞等有留学背景的人才,比如DeepSeek员工都是清北、浙大一群年轻人,他们的算法团队90%都在清华五道口那。

所以,这波AI是颠覆式创新的伟大时代,创业者都非常年轻,我们现在看的AI应用项目都是00后在做。

问:超级智能体会对人类产生哪些影响?

宋春雨:

这一波AI不仅重塑生产力,还重塑了生产关系。(杨)元庆在今年TechWorld给超级智能体做了分层,第一,能感知与交互;第二能认知与决策;第三是有自主学习与进化能力。智能体能自主演进和协作已经重塑了生产关系。

在美国,已经出现了这样的案例:两个人通过管理和协调各种智能体,创建了一家估值达到1亿美元的公司,这正是生产关系被重塑的典型实例。

问:现在agent发展处于哪个阶段?

宋春雨:

目前智能体(agent)在文本数据处理方面已相对成熟,比如订火车票、写PPT等任务已经可以较好完成。但多模态交互仍处于模型发展阶段,尚未完全成熟。当前的关键在于推动MCP

(模型上下文协议)的落地,实现不同模型之间的输入接口统一和协同

问:但在国内,让用户为智能体付费似乎比较困难。

宋春雨:

展望未来10到20年,中国有望像美国一样,大幅提升软件的价值。与上一代软件主要提高工作流程效率(约30%)不同,AI时代的新技术可以直接提升人效,比如达到以一抵三的效果。新一代AI需直接对企业KPI产生贡献,明确其带来的经济效益。在美国已经形成了一种新的商业模式,即通过AI直接帮助企业实现盈利,并根据利润进行分成。

问:这种模式适合国内吗?

宋春雨:

国内AI创业者有个现象,不愿意做To B领域,但美国创业者99%都在做To B的软件变革。

问:国内何时能出现两个人就做出了一个估值1亿美金的公司的情况?

宋春雨:

估计需要两三年,比如,YouMind就五六个人的团队,没花钱做推广也实现了盈利。

问:我们在投资AI应用时有没有特定的投资逻辑?标准是什么?

宋春雨:

AI应用是最难投的,因为非共识的成分大。我们的逻辑还是看人,看一个AI代替单位人工所能创造的价值。比如在AI面试方面,我们会考察该工具是否能够完全替代人类执行任务。对于只能提供辅助功能的AI应用,我们称之为copilot;而那些能够进行交互和协作的,则被定义为超级智能体。

问:这与移动互联网的投资逻辑不同吗?

宋春雨:

在移动互联网领域,可以进行像素级的复制模仿,但由于AI涉及底层技术的创新,这种逻辑并不适用,其不确定性更高。

问:决定投资一家AI公司时会考虑的因素?

宋春雨:

首先,该公司要有极高的人才密度;其次,一号位不仅要有定义产品的能力,还要有非常强的行业号召力;第三,大模型公司尤其要能展现出在早期就具备融资100亿人民币的能力。

评论 (0)