彻底摆脱辉达？传DeepSeek R2于5月发布全部用华为芯片

年初中企深度求索的DeepSeek R1大模型的问世撼动美国AI圈，甚至引发辉达的股价暴跌。在中国与全球AI竞争对手的高度关注下，市场传出更强的新版本DeepSeek R2即将在5月面世，将彻底摆脱辉达芯片，全部基于华为升腾910B（Ascend 910B）芯片。

快科技报导，市场最新爆料，R2大模型将采用更先进的混合专家模型（MoE），总参数量较前代R1提升约1倍，预计达1.2兆（R1总参数量为6710亿），单位推理成本较GPT-4大减97.4%。

googletag.cmd.push(function() { googletag.display(‘div-gpt-ad-1694617103692-0’); });

当下，中国与美国科技战、贸易战愈演愈烈，辉达H20芯片面临新一波出口管制。在DeepSeek R2预期发布时间临近的情况下，各界高度关注中国指针性的大模型，在缺乏美国芯片资源下的发展动向。

据传，R2规模与ChatGPT的GPT-4 Turbo以及谷歌的Gemini 2.0 Pro相当，还将结合更智能的门控网络层（Gating Network），进而优化高负载推理任务的性能。

消息指出，R2将彻底摆脱辉达芯片，训练全程均未使用辉达显卡，全部基于华为的升腾910B（Ascend 910B）芯片集群平台，在FP16精度下，计算性能达到512 PetaFLOPS，芯片利用率高达82%，整体性能约为NVIDIA上一代A100集群的91%。

市场预期，这将降低中国对海外高端AI芯片的依赖，且华为全新的升腾910C芯片，也开始进入大规模量产阶段。

成本方面，DeepSeek-R2的单位推理成本，较OpenAI旗下的GPT-4大减97.4%。其中，R2输入每百万个字符仅需0.07美元，而输出每百万个字符仅0.27美元。

分析认为，R2若如传闻般强势，可能再次引发市场对AI基础设施需求的质疑，加上使用华为AI芯片的国产替代，将对辉达带来更大影响。

彻底摆脱辉达？传DeepSeek R2于5月发布 全部用华为芯片