DeepSeek+华为芯片!硅基流动交出DeepSeek推理国产方案

作者|周一笑
过去一个月,DeepSeek 以惊人之势席卷全球 AI 市场。据 Sensor Tower 统计,其移动应用上线仅 18 天便斩获 1600 万次下载,几乎是 ChatGPT 同期数据的两倍,目前已在 140 个市场成为下载量最高的移动应用,在国内掀起的热潮,远远超过了当年 ChatGPT 横空出世时的热度。
作为业内首个支持联网功能的开源推理模型,DeepSeek 以完全免费的策略迅速俘获全球用户,然而,"泼天的流量"加上大规模 DDOS 攻击,也让 DeepSeek 也面临了严峻挑战。出现包括无法注册、"当前操作暂时无法完成"提示和 API 服务中断等问题,用户体验大打折扣。

1
国产模型 + 国产算力 + 国产云服务,国产 AI 闭环了?
面对 DeepSeek 官方服务频频宕机的现状,国内开发者和企业用户迫切需要更稳定、更可靠的推理服务。
2 月 1 日,以快速上线最新模型,甚至有时候比官方服务还要快而著称的"卷王"硅基流动,终于上线了期待已久的 R1 服务。
硅基流动创始人、CEO 袁进辉在社交媒体也透露了合作开发过程。

显然,这次最令人兴奋的是,这是一个与华为云合作推出的,基于昇腾云的 DeepSeek R1&V3 推理服务。
而根据多方消息,它也是业内首个基于国产昇腾 910B 芯片提供推理服务的 R1 模型产品。

根据硅基流动介绍:通过双方联合创新,并借助自研推理加速引擎,硅基流动团队基于华为云昇腾云服务部署的 DeepSeek 模型,已达全球高端 GPU 部署模型的同等效果。API 定价与 DeepSeek 官方优惠期价格保持一致。
在此之前,英伟达和亚马逊等头部算力平台也已经快速提供 DeepSeek 的模型服务,硅基流动在此提到的"全球高端 GPU "直指英伟达。
一个中国自己的顶级模型,一个中国厂商的推理芯片,在中国的新一代 AI 云技术平台推动下,有了放在全球范围都属一流的全过程部署方案。这显然是中国 AI 生态又一个历史时刻。
一直在关注 DeepSeek 的 a16z 知名投资人 Marc Andreessen 在推特上也转发了这个信息,并发了一个侧目的表情。

硅基流动与华为云此次合作,重新部署了完整的 R1 和 V3 模型,并提供便捷的 API 调用方式,不仅有效缓解了 DeepSeek 官方服务器的压力,避免了频繁掉线的问题,更满足了企业级业务的商用部署需求。通过 API 与本地客户端结合,企业和开发者还可以进行个人知识库配置等更多自定义操作,灵活度更高。
DeepSeekR1 使用英伟达 H800 GPU 进行训练,此前有分析师 Alexander Doria 推测,DeepSeek 在推理阶段主要依赖华为自研的 Ascend AI 加速器,以降低成本并减少对西方硬件的依赖,这次也算是某种程度上的"官宣"了。

在 DeepSeek 全球爆火引发算力紧张之际,硅基流动与华为云联手推出的国产化解决方案的意义,或许超出了缓解算力压力的初衷,更是为国产 AI 算力在大模型部署中开辟新赛道,同时也为更多企业提供了一个可借鉴的国产化落地思路。
这也是开源的魅力所在,基于开源的策略,DeepSeek 不是在分割一个固定的蛋糕。云服务商可以自主部署获得收益。应用开发商能以更低成本接入服务。全球各地的技术团队都能基于开源模型搭建本地化服务。还削弱了闭源 AI 模型公司依靠技术壁垒独占市场的做法,促使产业链利润向两端流动,从而撬动了更大的市场空间。这也解释了为何包括微软、亚马逊和 NVIDIA 在内的科技巨头,也纷纷选择接入 DeepSeek 的模型。
1
一边"质疑" DeepSeek,一边抢着接入的巨头们
DeepSeek 的横空出世,凭借创新技术路线和开源策略,以较低成本开发出具有竞争力的 AI 模型,迅速引发全球瞩目,也在美国政界和科技界激起了复杂的情绪。部分美国官员表达了担忧,一些议员甚至建议限制使用。Anthropic CEO Dario Amode 更是发布万字长文,向白宫隔空喊话,呼吁加强 AI 监管,矛头直指 DeepSeek。
OpenAI 在正式上线 o3-mini 之时,Sam Altman 携一众高管参加 reddit 的 AMA,罕见的承认 OpenAI 过去在开源方面"一直站在历史错误的一边"。不过这也并不妨碍发布 o3-mini 还要阴阳怪气一下 DeepSeek(配图:用五岁孩子能懂的方式解释一下 AI 蒸馏):

然而,与"质疑"声浪形成鲜明对比的是,英伟达、微软、亚马逊等美国科技巨头却纷纷选择将 DeepSeek 模型整合至自身服务体系。
1 月 31 日,受 DeepSeek 影响一度单日蒸发近 6000 亿美元市值的英伟达,官宣在其 NIM 微服务平台上线 DeepSeekR1 模型。英伟达表示,该模型在逻辑推理、数学运算、编程和语言理解等任务上具备"领先准确性",推理能力一流,运算效率极高。

"最先进的高效大型语言模型,在推理、数学和编程方面表现卓越"
而 OpenAI 的最大投资方微软,也于本周早些时候在 Azure 云计算平台和 GitHub 上宣布支持 R1,并计划未来在 Copilot+PC 设备上集成 R1 的精简版本。
Anthropic 的最大投资方亚马逊,其旗下的 AWS 也紧随其后,举办了一场关于部署 DeepSeek 模型的线上直播,并宣布 R1 模型已全面上线 Amazon Bedrock 和 Amazon SageMaker AI 平台。
至此,美股"七巨头"中已有三家接入 DeepSeek。而 Perplexity、Cursor、Windsurf 等明星创业公司早已第一时间宣布接入 DeepSeek R1, "真香定律"在全球科技圈持续上演。

前英特尔 CEO Pat Gelsinger 也在 X 上对 DeepSeek 赞赏有加,并从中提炼出计算机发展史上的三个重要经验:其一,计算领域遵循"气体定律",成本的显著降低必然带来市场扩张,而市场低估了这一点;其二,中国工程师在资源受限的情况下找到创造性解决方案,印证了工程的本质即解决约束;其三,开放策略终将胜出,DeepSeek 的做法将有助于重塑日益封闭的 AI 基础模型领域。Gelsinger 对 DeepSeek 团队表达了感谢,认为他们的实践将对整个 AI 行业产生深远影响。
根据 Tom's Hardware 的报道,在将 DeepSeek R1 与 OpenAI 的 o1 模型进行比较后,Pat Gelsinger 因其卓越性能和明显的成本效益,选择了 R1 用于他的新创业公司 Gloo。
全球开发社区对 DeepSeek 展示的狂热之下,事实上国产 AI 生态的发展有一点已变得明确——开源战略与技术创新的成功正在重塑全球 AI 产业的竞争格局,而中国公司在其中已经有了扛大旗的味道,并因此正在扭转着过往三年 ChatGPT 以降的格局。更多的中国 AI 生态历史时刻也会因此到来。