首页  >>  来自播客: Henry 的慢思考 更新   反馈  

Henry 的慢思考 - Agentic AI时代新的瓶颈,提前布局下一个5倍股

发布时间:   原节目
以下是对该视频内容的总结,包括所有提到的新闻、事实和观点: **核心论点:** AI已正式进入“Agentic AI时代”,正在经历一场悄悄的基础设施换代,但市场尚未完全反应过来。这种错位为投资者提供了巨大的机会,因为AI基础设施的需求重心已从GPU转向CPU及其相关的系统效率。 **1. Agentic AI与ChatGPT时代的区别:** * **ChatGPT时代:** AI主要回答问题,本质是大规模并行矩阵计算。GPU是核心,CPU仅负责Token化和转发。 * **Agentic AI时代:** AI执行任务,CPU成为核心,负责编排多个工具(数据库、外部API、模型),进行循环执行、路由处理、结果往返和下一步决策。工作流中“循环”(loop)越多,CPU负担越重。单个推理操作不复杂,但CPU的调度工作消耗大量资源。 * **物理现实:** GPU负责思考,但系统瓶颈正转向CPU的调度和执行层。AI数据库的形态正从“算力为中心”转向“系统效率为中心”,CPU是核心。 **2. CPU成为AI瓶颈的证据(研究报告和新闻):** * **Morgan Stanley与Georgia Tech研究图表:** * 随着AI任务复杂程度提升(从ChatGPT到复杂多Agent编排),系统总延迟中CPU的占比显著增加。 * ChatGPT场景:GPU占85%延迟,CPU占15%。 * Multi-Tool Agent:GPU占30%延迟。 * Complex Orchestration:GPU占不到10%延迟,超过90%延迟来自CPU的调度和处理。 * **学术层面验证(美国乔治亚大学,2024年3月论文):** * 研究结论:多GPU系统中,CPU配置不足会导致AI系统频繁超时。增加CPU配置后,系统响应时间可下降1.36到5.4倍(GPU数量不变)。 * 这意味着,即便数据中心在GPU上投入巨资,CPU不足仍会严重影响运算效率。 * **全球供应链信号(2024年3月-4月):** * Intel和AMD服务器CPU交货周期从1-2周暴涨到8-12周,部分订单延后至6个月。 * 亚马逊AWS高管披露:两家大客户尝试买断AWS Graviton CPU 2026年全年产能,但被AWS拒绝,因CPU需求过高,无法分配给单一客户。 * 结论:全球CPU算力短缺已不再是假设,正在发生,未来可能更严重。 **3. NVIDIA最新AI系统架构的变化:** * **ChatGPT时代:** 标准配置是1 CPU管理8个GPU(1:8)。 * **NVIDIA最新的Vero Rubin架构:** 官方规格为每72个GPU配36个Vero CPU(即2个GPU配1个CPU)。 * **影响:** CPU对GPU的比例从1:8变为2:1,数据中心需要采购比之前多400%的CPU数量。部分高端定制配置中,CPU比例还在进一步提升,表明CPU瓶颈比预期更严重。 **4. CPU投资选择:X86与ARM架构** * **X86架构(代表:Intel、AMD):** * 特点:大排量、高功率卡车,复杂指令集,暴力计算,擅长处理复杂、算力要求高的企业级任务。运算速度快,但耗电量大,散热困难。 * 优势:历史积累,大部分现有企业应用针对X86优化。 * **投资观点:** * **AMD:** 现阶段最清晰、即时受益方。EPYC服务器芯片市占率已超40%。新一代Venice处理器(2026下半年)最高256核,CPU-GPU带宽翻倍,由台积电代工,产能良品率有保障。风险相对较低。 * **Intel:** 新CPU架构有亮点,但18a制程良率和制造交付存在不确定性,良品率落后台积电。长远看有自身产能优势,但当下风险较高。 * **AMD利好:** 2月与Meta签大GPU订单,网传Unthorptic可能给AMD下大订单。 * **ARM架构(代表:AWS Graviton):** * 特点:高效电动车队,精简指令集,核心小、省电、易散热。适合AI Agent持续调用API、查询数据、执行轻量任务的场景。同机柜可塞入更多核心,低功耗。 * 优势:为云服务器量身打造,效能和散热优势大。 * **投资困境:** 大型云厂商想摆脱X86高昂授权费,自研ARM芯片(如谷歌Axon、AWS Graviton),但定制需要18-24个月,AI数据中心等不及。 * **投资机会:** 直接投资ARM Holding估值过高,谷歌亚马逊CPU业务占比小。应投资为云厂商量身打造定制ARM CPU的**Custom ASIC CPU设计服务商**。 * **Broadcom (AVGO):** * 谷歌TPU核心合作方,定制AI加速芯片领域市场主导。 * 真正护城河是软件**VMware**:企业数据中心虚拟化层王者,统一管理计算资源,分配AI Agent工作负载,保障数据安全。本地AI部署绕不开VMware。 * VMware带来高利润率订阅收入,支撑芯片研发。投资Broadcom可同时拥有定制芯片和软件。 * **Marvell (MRVL):** * 云厂商为避免垄断,将定制芯片订单分给Marvell,是谷歌Axon CPU的重要工程合作方。 * **“催化剂”:** 光模块。AI数据中心正从铜线传输转向光纤传输(柜内)。光信号转换需专用芯片,即光学DSP芯片。 * Marvell在全球光学DSP市场占70%份额,控制着机柜内光传输核心入口。 * 定位双重:定制ARM芯片 + 光传输核心。 **5. AI Agent时代被忽视的软件和应用投资机会:** * **市场普遍看法:** AI取代人工,SaaS软件(按人头订阅收费)商业模式面临崩溃。 * **视频观点:** 市场对传统SaaS的判断是对的。但Agentic AI时代,SaaS软件提供的是**数据基础设施层**。Agent越聪明,越依赖数据,数据基础设施层价值越高。 * **投资机会:** 专注于提供数据基础设施层的SaaS软件。企业原生数据层最具价值。 * **已投资且看好的(估值高):** * **Cloudflare (NET):** 基础设施提供商,全球20%互联网流量通过其搭建。AI Agent间通信需要网络基础设施。市场对其近期暴跌的担忧(Anthropic模型颠覆)是错误的,作者逢低买入。 * **Palantir (PLTR):** AI Agent的“操作系统”,整合企业散落数据,协调Agent工作,指导数据读取。是AI Agent时代最大受益股之一。 * **问题:** 估值很高,未来投资回报可能受限。 * **被市场低估、值得关注的公司:** * **Salesforce (CRM):** * 新闻(上周):推出Headless 360战略,平台转变为API和工具层。AI Agent可直接调用Salesforce数据、工作流和业务逻辑,实现无人化。 * 新定价模式:从按人头收费转向按任务量收费。Agent工作越多,Salesforce收入越高。 * 市场尚未完全定价。股价跌回2020年水平,风险收益比好。 * **Snowflake (SNOW):** * 商业模式:按计算量收费,而非订阅。 * Agent影响:AI Agent比人类分析师能跑更多查询(人类一天20条,AI一小时1万条),Agent工作越多,Snowflake计算量越大,收费越高。 * Cortex功能:企业可直接在Snowflake数据库中运行大语言模型,数据无需离开环境。对金融、医疗、国防等敏感行业极具吸引力。 * 定价:2024年4月推出统一AI Credit定价($2/credit),大幅降低企业部署AI Agent门槛。 * 市场被低估,前三个月被错杀,风险收益比不错。 **总结:** 2023年AI市场关注NVIDIA GPU,但到2024年,算力瓶颈已转向整个系统的协同效率。AI数据中心正从“算力中心”转向“系统效率中心”。这个转变尚处于早期阶段,视频中提及的公司值得投资者关注,提前布局才能获得丰厚回报。