Nvidia、AMD 与全新的算力竞赛
全球科技行业正经历一场关于算力定义与分配方式的剧烈变革。几十年来,中央处理器(CPU)一直是每台机器的核心,但那个时代已经结束了。如今,焦点已转向专为处理现代合成智能所需海量数学工作负载而设计的专用硅片。这不仅仅是一场比拼谁能制造出更快组件的竞赛,更是一场关于算力杠杆的争夺。Nvidia 和 AMD 是这场大戏中的主角,其影响远超硬件本身,更关乎未来十年软件开发基础设施的掌控权。胜者不仅是卖出产品,更是建立起一套他人必须依赖的平台。从通用计算向加速计算的转型,标志着科技界等级制度的根本性改变。 锁住云端的隐形代码要理解为何目前有一家公司主导了这个领域,就必须看透物理芯片之外的东西。大多数观察者关注的是晶体管数量或图形处理器(GPU)的时钟速度,但真正的实力在于硬件与开发者之间的软件层。Nvidia 花了近二十年时间构建了一个名为 CUDA 的专有环境。该环境允许程序员利用 GPU 的并行处理能力来执行与图形无关的任务。由于大量现有代码都是专门为该环境编写的,转向竞争对手的产品并非更换一张显卡那么简单,而是需要重写数千行复杂的指令。这就是软件护城河,它阻止了即便资金最雄厚的竞争对手也难以立即获得市场份额。这使得硬件实际上成为了进入特定软件生态系统的入场券。AMD 正试图通过名为 ROCm 的开源方案来应对。他们的策略是提供一种可行的替代方案,不让开发者被单一供应商锁定。虽然他们最新的硬件(如 MI300 系列)在原始性能上表现出巨大潜力,但软件差距仍是一道重大障碍。许多开发者发现,最新的工具和库优先针对 Nvidia 进行了优化,导致其他平台只能苦苦追赶。这种动态强化了现有巨头的统治地位。如果你是一名工程师,想在今天运行一个模型,你肯定会去文档最全、Bug 最少的地方。你可以通过官方技术文档了解更多关于 GPU 架构的最新进展。对于任何试图预测下一波创新浪潮源头的人来说,理解 人工智能基础设施 至关重要。现在的竞争,既是硅片的较量,也是开发者体验的博弈。 关于智能的各种地缘政治垄断这场算力竞赛的影响远超硅谷的资产负债表。我们正在目睹一种足以媲美二十世纪石油垄断的权力集中。包括 Microsoft、Amazon 和 Google 在内的少数几家超大规模云服务商(hyperscalers)是这些高端芯片的主要买家。这形成了一个反馈循环:最大的公司最先获得最好的硬件,从而构建出更强大的模型,进而产生更多收入来购买更多硬件。这种资源集中意味着较小的参与者甚至整个国家正处于日益扩大的鸿沟的另一端。那些拥有大规模算力集群的人,能够以一种他人无法企及的速度进行创新。这导致科技行业出现了一种双层体系:算力富裕者与算力贫困者。各国政府已经注意到了这种失衡。硅片现在被视为具有国家重要性的战略资产。出口限制已被实施,以防止先进芯片流向特定地区,实际上是将硬件作为外交政策的工具。这些限制不仅仅是为了防止军事用途,更是为了确保下一代软件的经济利益留在特定边界内。这些芯片的供应链也极其脆弱。大多数先进制造都集中在台湾的一个地点,这为整个全球经济制造了一个单点故障。在 2026 年,我们看到了供应限制如何导致多个行业的生产停滞。如果高端 GPU 的供应中断,现代软件的开发将陷入停滞。这种对少数公司和单一制造合作伙伴的依赖,是许多分析师认为尚未在市场中完全定价的风险。据 Reuters 的报道,这些供应链漏洞是全球贸易监管机构的首要任务。 算力饥渴的高昂代价想想当前环境下初创公司创始人的日常现实。他们最关心的不再仅仅是招聘顶尖人才或寻找产品市场契合点,而是花费大量时间去协商服务器使用时间。在典型的一天里,这位创始人可能会先审查他们的烧钱率(burn rate),却发现大部分资金都直接流向了云服务商,用于租用 H100 集群的访问权限。他们无法直接购买芯片,因为交货周期长达数月,而且他们缺乏在本地运行这些芯片的冷却基础设施。他们被迫在数字队列中等待,祈祷没有更大的客户出价更高来抢占优先访问权。这与互联网早期只需几台廉价服务器就能支持一个全球平台的时代大相径庭。严肃开发的准入门槛已从数千美元飙升至数百万美元。这一天还要继续与技术债务作斗争。因为他们使用的是租赁硬件,所以必须优化每一秒的训练时间。如果因为微小的代码错误导致任务失败,可能会损失数千美元的算力成本。这种压力扼杀了实验。当失败成本如此之高时,开发者不太可能尝试激进的新想法。 BotNews.today 使用人工智能工具进行内容研究、撰写、编辑和翻译。 我们的团队审查并监督整个过程,以确保信息有用、清晰和可靠。 当他们试图迁移工作负载时,还会遇到生态系统锁定的问题。他们可能会发现所使用的特定库只能在一种硬件上高效运行,使他们成为特定云服务商的被俘客户。创始人意识到,他们不仅是在构建产品,更是在为资金充当通道,这些资金从投资者手中直接流向了芯片制造商。这种现实正在改变获得投资的公司类型。投资者越来越倾向于寻找那些拥有算力保障的团队,而不仅仅是拥有好点子的团队。这种转变在 Gartner 最近的行业调查中得到了印证,调查强调了基础设施成本上升已成为进入市场的主要障碍。 你有什么想让我们报道的AI故事、工具、趋势或问题吗? 向我们提交你的文章想法 — 我们很乐意听取。 专有硅片的隐形税随着我们深入这个加速计算时代,必须提出关于长期后果的棘手问题。由极少数实体控制现代技术的基础是否健康?当一家公司同时提供硬件、软件环境和网络互连时,他们实际上拥有了整个技术栈。这为创新制造了一种隐形税。每一位为专有系统编写代码的开发者,都在助长一个日益难以打破的垄断。当数据必须通过共享云环境中的这些专用芯片时,数据隐私会怎样?虽然服务商声称数据是隔离的,但共享硅片的物理现实表明,新型侧信道攻击(side channel attacks)可能成为现实。我们正在用透明度换取性能,而这种交换的全部代价尚不为人知。此外还有环境可持续性的问题。这些新数据中心对电力的需求令人咋舌。我们正在建造巨大的设施,仅为了进行矩阵乘法运算,就需要消耗相当于小型城市的电力。这对地球来说是一条可持续的道路吗?如果对这些模型的需求继续以当前速度增长,我们最终将触及能源供应的物理极限。此外,如果目前围绕这些技术的兴奋感趋于平稳会怎样?我们目前正处于大规模建设阶段,但如果购买这些芯片的公司无法获得经济回报,我们可能会看到突然且剧烈的修正。无论其运行的软件是否盈利,为建设基础设施所背负的债务仍需偿还。我们必须考虑,我们是在沙滩上筑基,还是在重塑世界的运作方式。 AI 引擎的内部构造对于那些需要了解技术限制的人来说,故事不仅仅关乎 GPU。现代计算的瓶颈已从处理器转移到了内存和互连上。高带宽内存(HBM3e)目前是世界上最抢手的组件。它允许处理器以以前无法想象的速度访问数据。没有这种内存,最快的 GPU