创始人、批评家与研究者:那些值得一读的深度对话
大多数人能叫出 OpenAI 的 CEO,但很少有人能说出定义了当今大语言模型时代的论文作者是谁。这种认知偏差导致我们对技术进步的理解变得扭曲。我们往往把人工智能看作是一系列产品的发布,而实际上,它是一场数学突破的缓慢积累。创始人负责管理资本和公众叙事,而研究者则负责打磨模型权重和逻辑。理解这两者的区别,是看穿营销迷雾的唯一途径。如果你只关注创始人,你是在看电影;如果你关注研究者,你是在读剧本。本文将探讨为何这种区分至关重要,以及如何识别那些真正决定行业未来的信号。我们将跳过那些充满魅力的演讲,直面实验室里的冷峻现实。是时候把目光投向那些写代码的人,而不仅仅是那些签署新闻稿的人了。
机器时代的隐形建筑师
创始人是公众形象的代言人。他们在世界经济论坛上发言,在国会作证。他们的工作是确保数十亿美元的融资,并打造一个看似不可避免的品牌。他们使用充满魔力的词汇。而研究者则不同。他们沉浸在 Python 和 LaTeX 中,关心损失函数(loss functions)和 token 效率。创始人可能会说他们的模型在“思考”,但研究者会告诉你,它只是基于特定的概率分布预测下一个最可能的词。这种混淆之所以产生,是因为媒体将这两类人混为一谈。当 CEO 说模型将解决气候变化时,这是一种销售话术;而当研究者发表关于稀疏自动编码器(sparse autoencoders)的论文时,这是一个技术主张。前者是愿望,后者是事实。
公众往往将愿望误认为事实,这导致了“过度承诺、交付不足”的循环。要理解这个领域,你必须将卖车的人与设计引擎的人区分开来。引擎设计师清楚地知道哪里螺丝松了,但销售人员永远不会告诉你这些,因为他们的工作是维持高股价。每当有新模型发布,我们都会看到这一幕:创始人发一条晦涩的推文来制造炒作,而研究者则在 arXiv 上发布技术报告链接。推文获得百万浏览,而技术报告只有几千个真正动手构建产品的人在读。这形成了一个反馈循环,即最响亮的声音定义了其他所有人的现实。
超越创新的公众形象
这种分歧对全球政策有着巨大的影响。各国政府目前正根据创始人的警告制定法律。这些创始人经常警告那些听起来像科幻小说的生存风险,这使得焦点集中在假设的未来,而非当前的危害。与此同时,研究者们指出了数据偏见和能源消耗等迫在眉睫的问题。如果只听从那些名人的声音,我们可能会冒着监管方向错误的风险。我们可能会禁止未来的“超级智能”,却忽略了当前模型正在耗尽小城镇的水资源来冷却数据中心的事实。这不仅是美国的问题,在欧洲和亚洲,同样的动态也存在。
获得最多曝光的声音往往来自营销预算最雄厚的公司。这创造了一个“赢家通吃”的环境,少数公司为整个星球设定了议程。如果我们不拓宽视野,就会让硅谷的少数人定义什么是安全的、什么是可能的。这种权力的集中本身就是一种风险,它限制了该领域本应具备的思想多样性。我们需要倾听多伦多大学或东京实验室的声音,就像我们倾听旧金山的人一样。科学进步是全球性的努力,但目前的叙事却是一种局部垄断。我们需要关注像 Nature 这样的期刊,看看企业董事会之外正在发生的真正进步。
为什么世界总是在听错人的话?
想象一下某大实验室首席研究员的一天:他们醒来查看耗资三百万美元的训练运行结果,发现模型产生的幻觉比预期的多。他们花十个小时观察数据簇来寻找噪声。他们想的不是 2024 年大选或人类命运,而是为什么模型无法理解复杂句子中的否定逻辑。他们盯着神经元激活的热力图。他们的成功衡量标准是每字符比特数(bits per character)或特定基准测试的准确率。现在再看看创始人的一天:他们正乘坐私人飞机去会见国家元首,谈论新经济中万亿美元的机遇。
研究者处理的是“如何做”,而创始人处理的是“为什么它值钱”。对于构建 app 的开发者来说,研究者是更重要的人物。研究者决定了 API 延迟和上下文窗口(context window),而创始人决定了价格。如果你想创业,你需要知道技术是否真的能做到创始人所说的那样。通常,它做不到。我们在自动驾驶的早期阶段就看到了这一点:创始人说我们很快会有数百万辆无人出租车,而研究者深知大雨中的边缘情况(edge cases)仍是未解难题。公众相信了创始人,但研究者是对的。
同样的模式正在生成式 AI 领域重演。我们被告知模型很快将取代律师和医生。但如果你阅读技术论文,就会发现模型在基本的逻辑一致性上依然挣扎。演示与现实之间的差距,正是公司亏损的地方。你可以查看一份关于人工智能趋势的深度分析,了解这些技术限制在今天是如何被测试的。这种区别决定了它是稳健的投资还是投机泡沫。当你听到一个新的主张时,问问自己它来自论文还是新闻稿。答案会告诉你该给予它多少权重。MIT Technology Review 的记者经常强调实验室与大厅之间的这种差距。我们必须记住,创始人有动力隐藏缺陷,而研究者有动力发现缺陷。前者制造炒作,后者构建真理。从长远来看,真理是唯一能规模化的东西。我们在 2026 就看到了这一点,当时第一波炒作浪潮在技术现实的重压下开始降温。
实验室与董事会的周二
我们必须对当前的开发路径提出尖锐的问题。创始人声称将造福所有人的研究,到底是谁在买单?大多数顶级研究者已经离开学术界进入私人实验室,这意味着他们产生的知识不再是公共产品,而是企业机密。当证明观点的原始数据被隐藏在付费墙后时,科学方法会怎样?我们正看到从开放科学向封闭竞争优势模式的转变。少数人的名声是在帮助这个领域,还是在制造一种阻碍异议的个人崇拜?如果研究者在旗舰模型中发现重大缺陷,他们敢报告吗?如果这会拖累公司估值的话。
BotNews.today 使用人工智能工具进行内容研究、撰写、编辑和翻译。 我们的团队审查并监督整个过程,以确保信息有用、清晰和可靠。
这些公司面临的财务压力是巨大的。我们还必须考虑环境成本。为了稍微好一点的基准测试分数,耗费训练这些模型的巨大碳足迹真的值得吗?我们经常谈论 AI 对环境的好处,却很少看到平衡两者的账本。最后,这些模型所训练的文化归谁所有?研究者利用互联网的集体产出构建系统,创始人随后向公众收费以获取这些产出的精炼版本。这种财富转移在头条新闻中很少被讨论。这些不仅仅是技术问题,更是社会和伦理困境,仅靠更好的算法是无法解决的。
技术限制与本地部署
对于在这些平台上构建应用的人来说,技术细节比哲学更重要。当前的 API 限制是企业采用的主要瓶颈。大多数提供商都有严格的速率限制,阻碍了高并发的实时处理。这就是为什么许多公司正在研究本地存储和本地执行。使用像 Llama 3 这样的模型在本地硬件上运行,可以实现更好的数据隐私和更低的长期成本。然而,硬件要求很高。要以体面的速度运行一个 700 亿参数的模型,你需要配备大量 VRAM 的高端 GPU。这就是极客领域与金融领域交汇的地方。H100 集群的成本是一个准入门槛,将权力牢牢掌握在富人手中。
我们还看到向专门化微调(fine tuning)的转变。开发者不再用一个通用模型处理所有事情,而是使用在特定数据集上训练的小型模型。这提高了准确性并减少了 token 计数。这里的技术挑战在于数据整理。如果输入数据质量差,微调后的模型会比通用模型更糟糕。我们还看到更多使用检索增强生成(RAG)来将模型建立在事实数据上。这绕过了对巨大上下文窗口的需求并减少了幻觉。但 RAG 也有其局限性,特别是在处理检索文档的排序方式上。如果搜索步骤失败,模型输出就毫无用处。大多数用户没有意识到,AI 的表现很大程度上取决于它查询的数据库,而不仅仅是模型本身。
信息的最终过滤器
AI 的未来不是由某个人讲述的单一故事。它是一场混乱的、持续的辩论,发生在那些兜售愿景的人与那些构建现实的人之间。要成为科技新闻的聪明消费者,你必须学会看穿那些魅力十足的创始人。去寻找论文上的名字,去寻找那些愿意谈论模型做不到什么的诚实研究者。行业内的矛盾不是 bug,它们是故事中最真实的部分。这个领域将继续进化,因为技术问题远未解决。核心问题依然存在:我们能否在不消耗定义了当前时代那种巨大资源的情况下,构建一个真正智能的系统?在我们回答这个问题之前,炒作将继续超过科学。对于任何承诺完美解决方案却不提及权衡取舍的叙事,我们必须保持怀疑。
编者按:我们创建本网站,旨在作为一个多语言人工智能新闻和指南中心,为那些并非电脑极客,但仍然希望了解人工智能、更有信心地使用它并关注正在到来的未来的人群服务。
发现错误或需要更正的地方?告诉我们。