异动
登录注册
【SZ通信】NV财报背后的投资机会以及一些隐忧
小蚂蚁
孤独求败的半棵韭菜
2024-05-26 16:00:36
1、尽管业绩超市场预期但仅略超,环比增速在放缓,尤其对于Q2的指引,环比增速也仅有8%。一方面海外国内都在报告GPU供应的缓和,ov­e­r­b­o­o­k­i­ng现象极度缓解,预计未来两个季度仍将维持温和增长,在GB200规模出货的Q4可能业绩释放会加速。我们对于2024营收的预期在1250亿,2025为1573亿,即使切换2025估值也近30x,我们不知道美股何时会转向对2026的预期,可能分歧会比较大。

2、AI投资核心逻辑正在从训练驱动转向推理驱动。训练是遵循sc­a­l­i­n­g­l­aw,尽管目前还么有失效的迹象,未来AGI也只会成为少数巨头的游戏,NV每年一代GPU,这部分高端市场的需求会一直存在。但很快NV推理侧收入会超过训练侧,国内外大模型疯狂降价,整个行业又到了类似互联网烧钱拉流量的阶段。未来推理侧需求API调用能否有成百上千倍的增长这是支撑数据中心投资的关键。目前ag­e­nt落地C端怎么用、用的好不好、频次还没有共识,中小公司大模型变现怎么玩都是还没落地的议题。另外,进入到推理阶段就是跑运营,业主会测算op­ex并可以做各种工程优化,线性增长的逻辑不能再简单套用了。

3、NV首次公开了网络侧收入,Q1是31.7亿(我们猜测其中光模块13亿,毛利50%算,三个供应商供了50亿人民币),在DC占比14%。这个数字环比、同比是在减小的趋势(FY24 Q1是22%),为什么?猜测一是NV出货节奏问题,客户GPU先拉货再组网;二是选择以太的比例增加了;三是NV趋向优化网络成本占比(参考GB200的设计,可能是客户有这个诉求)。过去一年,网络侧成本占比的提升是刺激光模块高增的核心逻辑(传统云数据中心光模块成本占比也就4%),而对于NV的未来,我们认为高端产品线仍将sc­a­l­e­up进行到底,但是它会考虑工程优化了,比如GB200的铜,GR200是不是会用CPO?而推理侧会倾向于减少昂贵的光模块占比,比如用以太网然后解耦。

4、投资建议:当AI投资从训练转向推理驱动,一切要转向需求研究视角了。毫无疑问,2025年的光模块仍是低估的,但1.6T之后似乎催化乏力。我们更建议投资GB200的增量新环节,铜连接以及液冷。此外,让我们把视角更多转向国内,是时候关注国内这次资本开支超级周期了。

东北证券通信组廖文强提到交换滥机板块近期受到关注特别是国产大模型降本形成不 可 逆转趋势对硬件端产生影响包括速率升级等都指向交换机环节同时AI 领 域中交 换机的关注度不如光模块等但以太网的崛起为国内交换机产业带来机会
2国内外交换机投资增长情况
国内互联网公司在交换机领域的投资预计有 10%到 13%的增长去年投资大约在 1000 万 左 右今年预计达到 1100 到 1150 万增长主要由 AI 带动国外互联网公司去年投资约 4800 万今年预计升至5400万增长25%到27%同样由AI驱动
3非 AI 领域交换机增长情况
非 AI 领域即传统数据中心国滥内增长预计达到 15%去年数据中心数量为 2680 个今 年预计为 2900 个以上
4MOE 架构对交换机行业的影响
MOE 架构旨在减少 AI 运算时间尤其在训练阶段这通过专家模型实现增加服务器间 数 据交换量对于交换机而言这导致服务器间通信量增加可能需要扩展交换机性能 或数量
5交换机性能与网络设计
网络设计中为避免端口长时间高负载一般不会让端口流量超过 30%MOE 架构下流 量增加可能导致需要重新设计网络拓扑增加交换机数量或端口连接数
6交换机成本与市场价值量
随着从 200G 升级到 400G交换机的成本和市场价值量显著提升例如200G 交换机使 用 12.8T 芯片成本约 7 万人民币; 而 400G 交换机使用 25.6T 或 51.2T 芯片成本分别 约12 万和25万人民币
7MOE 架构对成本的影响
MOE 架构通过减少运算时间降低耗电量从而减少成本同时降低运算时间还能延 长 GPU使用寿命进一步降低成本
8国内交换机市场需求量
中国互联网大厂去年对交换机市场需求量为 1001 百万美元今年预计为 1130 百万美元增 长约 6%整体中国市场包括 AI 和运营商去年需求量为 2680 万台今年预计为 2925 万 台增长约 15%
9交换机企业受益分析
在 MOE 架构下白盒交换机需求增加锐捷网络和紫光华山等公司作为白牌交换机供应 商 可能受益华勤科技作为能够提供 800G 白牌交换机的公司也可能在 MOE 架构中扮 演重 要角色
10超节点网络与交换机芯片
超节点网络的发展与 MOE 架构紧密相关国内厂商如盛科已启动相关项目致力于通过 超 级节点提升整体性能这可能导致交换机芯片使用量的增加
11交换机芯片技术路线
交换机芯片有两条技术路线: 传统的流水线方案(如博通盛科) 和可编程方案(如已 停产 的 belfort profilo)可编程方案可能在降低延迟方面有优势但在 AI 时代传统 流水线方 案可能更具市场潜力
12结论与投资者建议
MOE 架构显著提升了交换机间数据通量互联网厂商开始引入新的组网架构投资者可 关 注相关上市公司的产品架构变化以及交换芯片市场的发展
Q&A
Q: 国内非 AI 交换机市场的现状和增长趋势是怎样的?
A: 国内非 AI 交换机市场即传滥统数据中心的交换机市场目前呈现出增长趋势与 互联 网公司相比传统数据中心的增长率更高平均增长率约为 15%而互联网公司的 增长率为 10%去年中国数据中心的数量为2680个预计今年将增长至2900多个整 体来看交换 机行业展现出较强的抗压能力市场表现良好
Q: MOE 架构对交换机行业的影响有哪些?
A: MOE 架构主要解决的问题是减少 AI 运算时间特别是在训练阶段它通过专家模型 来 实现这增加了服务器间的数据交换即 scale out 通讯在以太网交换机领域MOE 架构 的引入导致服务器间通讯量翻倍从原来的 1%不到增长至与机内通讯量相当甚至 更高这导致机外通讯交换机的负载大幅增加可能需要对交换机的性能或数量进行拓 展目前尽管还没有达到 400G 网卡的上线但随着 MOE 架构的进一步应用预计会 对交换机的设 计和部署产生重大影响业界正在参考英伟达的最佳实践采用三层架 构并保持服务器与 交换机之间的连接比例为 1:1以应对通讯量的增加Q:目前部署状态下以太网与ID的性能比较如何? A:目前部署状态下以太网的性 滥能相较于 ID 存在一定差距以太网的延迟是 ID 的四倍 以上导致其整体性能可能不 如 ID
Q: 针对 M1 机器互联环境网络改造的目标是什么?
A: 针对 M1 机器互联环境网络改造的目标是降低端口间的流量避免流量过大这是 因 为目前的网络配置是按照英伟达 1:1 的加速比来设计的即服务器网卡的性能与上行链 路到 另一台交换机的性能相匹配如果服务器网卡性能较高那么在与另一台交换机互 联时带 宽也应保持接近即使采用负载均衡方法链路的使用率也可能相对较高Q:在网络优化方面是否需要重新设计网络拓扑? A:是的在网络优化方面有必 要重新设计网络拓扑一种设计方案是增加更多的交换机以提高交换机之间的互联带 宽例如将一号交换机到二号交换机的连接从单根连接变为双 根或多根连接从而增 大交换机之间的带宽这样端口上的流量就不会像原来单一连接时 那么高有助于保 证在所谓的白嫖连接时不会过度使用带宽Q:如何根据历史经验来避免带宽使用率 过高? A:根据历史经验通常不会让带宽超过端口的30%以上这是一个经过二三十 年验证的经 验运维人员会将其作为一个参考点因此为了不超过这个限制可能需 要增加交换机的 数量以及交换机互联的端口数量从而带动相关光模块等投资的增 长Q:在网络优化工作中下一步的计划是什么? A:在网络优化工作中下一步的 计划是对 M1 进行优化这包括增加网络的带宽和链接交 换机的数量以实现优化状 态
Q:通信速率和交换机数量的关系是什么? A:通信速率的提升和交换机数量的增加有直 接关系为了保证每个端口的负载不超过 30%可能需要增加交换机的数量这是因为 在专家子模型的数据通信和分发汇总过程中通信量 可能会提升百倍以上从而需要更 高的速率和更多的交换机来处理这些数据Q:端口速率的变化和交换机端口处理能力的 关系如何? A:端口速率的变化实际上并没有太大变化交换机端口的处理能力保持稳 定物理端口一 端连接服务器另一端连接交换机端口速率与服务器网卡速率相匹 配例如如果服务器 网卡是 400G 的那么交换机端口也应是 400G 的而 800G 的端 口主要用于交换机之间的互 联
Q: 在大规模集群中MOE 架构对性能和端口流量的影响是什么?
A: 在大规模集群中MOE 架构可能会导致性能降低因为专家越多计算量越大例 如8K 集群的性能可能会降低 11%16K 集群降低 26%而 64K 集群降低 50%这表明 服务器数 量的增加会降低迭代时间然而目前还没有明确的数据显示端口上的流量具
体如何变化但可以推测 400G 端口的连接需求有显著增长Q: 为什么需要限制端口性 能不超过设计性能的30%? A:限制端口性能不超过设计性能的30%是一种行业惯例这 样做可以让整体机器处于一个 相对不高的负荷状态这是业界普遍接受的做法例如如果端口是 400G 的那么不希望 其性能超过 120 到 150G以保持机器在较低负荷状态 下运行
Q:增加交换机数量的考虑因素有哪些? A:增加交换机数量时需要考虑的因素包括拓 扑设计成本以及性能与成本之间的平衡例如原来两台交换机之间可能只有两条 链路增加新的交换机后可以增加到四条或更多 链路从而降低单条链路的带宽利用 率但同时也会带来成本上的压力Q:在引入MOE架构后是否需要更高的速率如400G以上? A:目前看来还没有 达到真正需要超过400G端口性能的状态尽管可能有短时间超过400G 的情况但通过 交换机的流量控制机制如 ROCE可以保持带宽在较低状态避免超过转 发性能如 果出现持续超过连接端口性能的情况可能会导致丢包因此 Q:丢包对运算和应用可 用性的影响是什么? A:丢包会导致运算中的数据丢失需要重新计算这会降低应用 的可用性因为丢失了一 些数据包重新计算会增加时间反而不如提高端口性能来避 免这种情况
Q: MOE 技术如何提升运算效率以及在满带宽情况下交换机性能的表现?
A: MOE 技术显著减少了单机或小集群环境下的运算时间避免了重传从而提高了效 率在满带宽或超过百分之百负载的情况下即使是高性能的 4D 交换机如果没有刚性 提升也只能通过提高端口速率来解决比如从四车道升级到八车道Q: 国内网络架 构是否正从 200G 向 400G 转变?
A: 是的去年国内主要是 200G 架构但现在已经逐渐转向 400G 架构例如阿里和 腾讯 等公司正在从 200G 向 400G 过渡阿里使用的网卡有英伟达的 C 系列 200G 网卡可以直接 升级到更高速率并且阿里自行研发了 IPGA 的 2200G 网卡并设计了适合自己 需求的流量 控制算法目前这些解决方案可能已经接近不够用预示着向 2400G 的升 级也将很快到 来
Q: 200G 架构在中国的特殊性以及未来的发展趋势是什么?
A: 200G 架构在中国是特殊的国外并没有这种配置随着阿里等云服务公司的兴起中国 的网络架构发展路径是 100G200G 到 400G目前随着技术的进步和需求的增 长预计 会从 200G 升级到 400G以适应更高的数据传输需求
Q: MOE 架构对交换机单价价值量的影响是什么? 从 200G 升级到 400G每台交换机的 价值 量提高了多少?
A: MOE 架构对交换机的价值量有显著影响目前200G 交换机主要使用的是 12.8T 的 交换 机芯片如果以博通芯片为例一颗芯片大约 1200 美元而整台交换机的价格大 约在 7 万 多元人民币升级到 400G使用的是 25.6T 或 51.2T 的芯片25.6T 的芯片价格 大约在2000 美元左右而整台交换机的市场价大约在12万元人民币左右由于51.2T芯 片产能不足导致 25.6T 芯片价格上涨价格大约在 4000 多美元相应的交换机市场价 约为 25 万元人民 币如果使用 51.2G 的芯片一颗芯片价格约为 8800 美元整台交换 机的价格在 25 万元人 民币左右因此从 7 万到 12 万再到 25 万可以看出随着技 术升级交换机的成本也在 增加
Q: 国内大厂的大模型 token 价格降幅是否主要由 MOE 技术带来的成本下降驱动还是由 于
价格战导致的?
A: 国内大厂的大模型 token 价格降幅是由 MOE 技术带来的成本下降和价格战两方面因素
共 同驱动的MOE 技术通过减少运算时间从而降低了耗电量这是成本下降的一个重 要因 素此外像 H100 这样的机器尽管使用了液冷技术但在长时间满载工作下其使用寿 命大约只有半年左右这意味着卡片的生命周期非常短如果通过 MOE 技术降 低了运算时 间也就延长了卡片的使用寿命从而降低了供应商的成本因此供应商 在价格战中拥有 一定的底气能够降低价格Q:今年国内交换机市场的需求量和市场产值是多少? A:今年国内交换机市场的需求量 和市场产值有所增长对于中国的互联网大厂去年的市 场产值按照美元计算大约是 100 亿美元今年预估会增长到 113 亿美元增长率大约为 6%对于整个中国市场包 括 AI 和运营商在内去年的市场产值大约是 268 亿美元今年预估 会增长到 292.5 亿美 元增长率约为15%这表明整个中国的数据中心对交换机的需求有15% 的增长而头 部几家互联网公司的增长为 6%整体市场前景仍然比较乐观
Q: 为什么 MA 架构导致交换机需求量增加 100 倍但增速只有十几个点?
A: 目前对于 MOE(多输出交换机) 的部署还处于探索和优化阶段尚无最终的拓扑架构 定 论不同公司对于带宽余量的要求也不尽相同有的保守有的则较为激进因此增速可 能受到这些因素影响导致增速没有达到需求量增加的幅度
Q: 国内在 MAE(多接入边缘计算) 方面的进展如何?
A: 国内在 MAE 方面的进展还在等待美国方面的最终定论和最佳实践目前阿里巴巴 的 SPN7.0架构是一个值得关注的新动向它是一个AI网络包含了MOE尽管阿里巴 巴是首 家公布此类设计的公司但并不代表其技术最为先进预计随着其他公司如 Meta 和微软逐 步公开相关信息最佳解决方案将逐渐明朗Q:MOE架构的服务器大概使用多少交换机? A:目前没有确切的比例数据但可以参 考英伟达的 GGX 最佳实践服务器与交换机的比例 关系大约是 1:1.1对于 MOE 架构目前还不清楚具体的比例变化但预计会有所提高Q:中国数据中心市场规模如何? A: 中国数据中心市场规模整体较大涉及的主要是 top 3 公司的情况具体数字以美元 计 算每年有数千万美元的规模
Q: 今年 AI 基础设施的投资增长情况如何?
A: 今年 AI 基础设施的投资增长显著特别是阿里和腾讯一季度的资本开支同比增长超过 三 倍主要用于 AI 基础设施建设尽管目前难以给出确切的全年增长预测但整体处于 扩张 状态
Q: 华为 800G 交换机的进展情况如何?
A: 华为在 800G 交换机方面有明确的进展计划尽管受到美国的限制华为已经成功设 计 并生产了 400G 端口的交换机芯片并计划在 2025 年底推出 51.2T 的 800G 交换机目 前华为通过增加端口数量来弥补单体性能的不足整体性能仍然满足需求
Q: 在 MOE 架构下哪些国内交换机企业可能会受益?
A: 在 MOE 架构下受益的国内交换机企业主要是那些专注于白盒交换机的厂商锐捷 网 络和紫光华山(云街) 在 25.6T 时代表现突出为互联网公司提供交换机而在 51.2T 或800G 的设备领域华擎科技(华勤)是主要的白牌机供应商也是字节跳动51.2T设 备的主力供 应商华为和中兴虽然具备芯片设计能力但主要聚焦于企业网而非白牌机 市场博通通过 锐捷和云街等公司提供 25.6T 或 51.2T 设备而圣科也在测试 12.8T 和 25.6T 产品作为国产 品牌在 MOE 环境中表现良好从芯片角度来看国产品牌宋科可 能占据一定市场份额但 主力可能是博通整机制造商中华清锐捷和志邦(AJ call) 在 MOE 环境中扮演重要角色
Q: ME 模型对网络需求的增加是否会影响英伟达等公司超节点网络产品的需求?
A: ME 模型确实可能增加对超节点网络产品的需求ME 模型主要涉及服务器间的流量
而 NV72架构涉及将多个GPU集成在一个大型机柜中类似于一个超级服务器这种架 构需要 在机柜内部实现高效的服务器间通信类似于 MOE 架构国内 AI 公司正在探索 类似的方向寒武纪摩尔等他们正在研究如何在机柜内部实现高效的通信由于 国内 AI 芯片性能 与英伟达有差距国内厂商倾向于通过超级节点连接多个芯片以提升整 体性能这种趋势可 能会增加交换机芯片的使用量因为它们作为 switch 的替代品能 够在超级节点架构中发 挥关键作用总的来说超节点的发展与 ME 趋势紧密相关可 能会带动相关网络产品的需 求增长Q:国内主流交换机厂商在超级节点领域有哪些机会? A:国内厂商如盛科在超级节点领 域走得最快已有 12.8T 和 25.6T 的产品可以交付华为 目前不对外销售相关产品而 其他厂商尚未有能拿出手的产品盛科在这方面处于领先地位Q:锐捷华三等交换 机厂商在服务器领域的布局如何? A:锐捷华三等交换机厂商中特别是能够做服务 器的厂商如华三正在快速发展华 三已成为腾讯超节点项目的主要供应商既提供 服务器也提供交换机这些交换机与传统形 态不同采用类似 Switch Tree 的方式直接 在大机柜内连接不使用光模块以降低时延Q:国内交换机市场目前是否主要基于 博通的解决方案? A:目前市场上主要使用的是基于博通的解决方案但由于博通的新一 代产品良品率低导 致产能不足市场上仍在使用上一代的 400G 25.6T TH4 产品TH4 的价格已经翻倍显示出 一定的稀缺性Q:在NV服务器内部芯片互联方面是否有博通体系内的替代芯片? A:博通有计划推 出新一代产品如 Tomahawak 2( 简称 TF1)它将替代 NV Switch除了 交换芯片 外还集成了网络计算功能这种芯片预计将在今年下半年发布如果腾讯的方案 能够 及时采用将使用这款新芯片Q:国产交换芯片在可编程能力方面是否较弱这是否 会影响其在中高端市场的表现? A: 国产交换芯片如盛科主要采用传统的流水线 ( pipeline) 方案而非可编程方案这可能 在降低延迟等方面不如可编程方案表现出 色然而随着带宽和容量的提升国产交换芯片 在 AI 时代仍有发挥空间
Q: MOE 架构对交换机数据通量的提升效果如何?
A: MOE 架构能显著提升交换机之间的数据通量带来百倍级的增量从今年一季度开 始互联网厂商已开始引入这种新的组网架。

作者利益披露:转载,不作为证券推荐或投资建议,旨在提供更多信息,作者不保证其内容准确性。
声明:文章观点来自网友,仅为作者个人研究意见,不代表韭研公社观点及立场,站内所有文章均不构成投资建议,请投资者注意风险,独立审慎决策。
S
紫光股份
S
菲菱科思
S
科瑞思
S
裕太微
S
盛科通信
工分
3.90
转发
收藏
投诉
复制链接
分享到微信
有用 6
打赏作者
无用
真知无价,用钱说话
0个人打赏
同时转发
评论(6)
只看楼主
热度排序
最新发布
最新互动
  • 只看TA
    05-26 18:14
    英伟达拥抱以太网,不仅是行业标杆的趋势,更是选择了一个技术革命的路径。
    0
    0
    打赏
    回复
    投诉
    于2024-05-26 18:38:41更新
    查看2条回复
  • 只看TA
    05-26 17:23
    紫光股份 9个涨停起步了
    1
    0
    打赏
    回复
    投诉
  • 只看TA
    05-27 05:14
    交换机居然市场表现不如电磁屏蔽
    0
    0
    打赏
    回复
    投诉
  • 只看TA
    05-26 16:21
    以太网
    0
    0
    打赏
    回复
    投诉
  • 1
前往