AI 时代下,人类价值观意味着什么?
中立代码的神话
关于人工智能的讨论往往集中在技术基准和算力上。我们谈论参数和 PB 级数据,仿佛这些就是衡量一切的指标。这种关注掩盖了一个更紧迫的现实:每一个大语言模型都是塑造它的人类偏好的镜像。根本不存在所谓“中立”的算法。当系统给出答案时,它并非来自客观真理的真空,而是反映了开发者和数据标注员所设定的一套特定权重价值观。核心结论很简单:我们不是在教机器思考,而是在教它们模仿我们特定的、往往相互矛盾的社会规范。这种从逻辑向伦理的转变,是互联网发明以来计算领域最重要的变革。它将责任从硬件转移到了那些定义什么是“正确”答案的人类身上。
该行业最近已从原始能力转向安全与对齐。这听起来像是一项技术调整,但实际上是一个深刻的政治过程。当我们要求模型做到“有帮助、无害且诚实”时,我们所使用的词汇在不同文化中有着不同的含义。在旧金山董事会看来普世的价值观,在雅加达可能被视为冒犯或无关紧要。全球规模与本地价值观之间的张力,是现代科技领域的主要冲突。我们必须停止将 AI 视为一种自主力量,而应将其视为人类意图的策展延伸。这需要我们透过营销炒作,去审视幕后所做出的实际选择。
作为人类选择的机械镜像
要理解价值观如何进入机器,你必须了解 RLHF(基于人类反馈的强化学习)。在这个过程中,成千上万的人类承包商会对模型的不同回答进行排名。他们可能会看到两个版本的答案,并点击他们认为更礼貌或更准确的那一个。随着时间推移,模型学会了将某些模式与这些人类偏好联系起来。这不是在寻找真理,而是在寻求认可。模型本质上是在被训练去取悦人类评估者。这创造了一种道德的表象,而实际上它只是特定人群偏好的统计近似值。
这个过程引入了大量的主观性。如果大多数标注员来自特定群体,模型自然会采用该群体的俚语、社交暗示和政治偏见。这就是为什么许多流行模型的早期版本在非西方语境下表现不佳的原因。它们并没有坏,只是在忠实地执行训练逻辑。它们反映了那些被雇佣来给它们打分的人的价值观。这就是公平和偏见等抽象概念转化为具体代码的层面。这是一个在公众看到聊天界面之前很久就已完成的、劳动密集型的手动过程。这是现代智能的隐形基础设施。
大多数人对这个话题的困惑在于认为 AI 拥有内在的道德指南针。其实它没有,它只有奖励函数。当模型拒绝回答问题时,并不是因为它“觉得”这个话题不对,而是因为它的训练数据被严重加权以避免那种特定的模式。这种区别至关重要。如果我们认为机器是道德的,我们就会停止质疑那些制定规则的人。我们必须认识到,每一次拒绝和每一次有用的建议,都是基于人类决策的程序化响应。通过识别这一点,我们可以开始提出更好的问题:是谁在制定这些规则,以及为什么要这样制定?
潜在空间中的地缘政治
这些选择的影响是全球性的。大多数领先的 AI 模型主要是在开放网络上的英语数据上训练的。这创造了一种数字单一文化,使得西方价值观成为默认设置。当世界其他地区的用户询问家庭动态或法律问题时,他们得到的答案是通过特定的文化透镜过滤后的结果。这不仅仅是语言翻译的问题,更是文化翻译的问题。关于等级、隐私和社区的细微差别在全球范围内差异巨大,但模型往往提供一种“一刀切”的解决方案。这种“正确”思想的中心化是一种新型软实力,对全球话语权有着巨大的影响。
为了应对这一点,我们看到各国竞相开发主权 AI 模型。法国、阿联酋和印度等国正在投资自己的基础设施,以确保其特定的文化价值观得到体现。他们意识到,依赖外国模型意味着引入外国的世界观。随着各国政府意识到对 AI 潜在空间的控制与控制物理边界同样重要,这一趋势正在加速。用于训练这些模型的数据就像一本数字历史书。如果那本书只包含一种视角,那么产生的智能本质上就是有限的。这就是为什么推动多样化数据集不仅仅是一个多元化倡议,更是全球范围内实现准确性和相关性的必要条件。
国际合作的赌注很高。如果每个国家都建立自己孤立的 AI,并拥有自己僵化的价值观,我们可能会发现跨越数字边界进行交流变得更加困难。然而,另一种选择是一个由单一山谷中的几家公司定义数十亿人道德边界的世界。没有哪条路是完美的。挑战在于找到一种既能容纳本地细微差别,又能保持对基本人权共识的方法。这个问题无法通过更好的硬件解决,它需要国际外交,并清晰地审视驱动当今科技行业的激励机制。你可以在我们的 AI 伦理与治理综合指南中了解更多关于这些挑战的信息。
循环中的决策
设想一位名叫 Sarah 的招聘经理的一天。她使用 AI 工具筛选数百份简历以寻找新的工程岗位。该工具被训练用于寻找“高潜力”候选人。表面上看,这似乎很高效。但在界面之下,该工具应用了它从过往招聘数据中学到的一套价值观。如果历史数据显示公司大多聘用了来自三所特定大学的人,AI 就会优先考虑这些学校。它并不是在人类意义上“种族歧视”或“精英主义”,它只是在优化它被告知是有价值的模式。Sarah 可能甚至没有意识到,该工具正在过滤掉那些来自非传统背景的优秀候选人,因为他们不符合训练数据中的“价值”配置。
这种场景每天在成千上万的办公室里上演。这些价值观并非抽象,它们决定了你是获得工作还是被算法忽略。同样的逻辑也适用于信用评分、医疗分诊甚至司法量刑。在每种情况下,像“风险”或“功绩”这样的人类价值观都被转换成了数字。危险在于,我们将这些数字视为客观真理,而不是主观选择。我们经常将道德判断的艰巨工作委托给机器,因为它更快且更省心。但机器只是在以我们无法轻易监控的规模自动化我们现有的偏见。
我们每天使用的产品让这些论点变得真实。当照片编辑应用自动调亮一个人的肤色使其看起来“更好”时,它就是在表达一种价值观。当导航应用避开“高犯罪率”区域时,它就在对安全和社会阶层做出价值判断。这些不是技术错误,而是人类提供的数据和奖励函数的逻辑结论。我们生活在一个软件不断代表我们做出道德选择的世界里。大多数时候,我们甚至没有注意到它正在发生,直到出错。我们需要对那些实际上只是内置假设的“有用”功能保持更强的批判性。
行业最近的变化是向“可控性”迈进。公司现在给予用户更多对 AI “个性”或“价值观”的控制权。你可以告诉模型要“更有创意”或“更专业”。虽然这感觉像是赋权,但实际上它将责任推回给了用户。如果 AI 给出了有偏见的答案,公司可以声称用户没有正确设置参数。这创造了一个复杂的问责网络,没有人真正对输出结果负责。我们正在从一个固定价值观的世界走向一个流动的、用户定义的价值观世界,这带来了它自己的一套风险与回报。
自动化道德的代价
我们必须以苏格拉底式的怀疑态度审视“安全”AI 的概念。如果一个模型被完美对齐,它是与谁的价值观对齐的?我们今天所见的安全过滤器背后隐藏着成本。通常,这些过滤器是利用发展中国家的低薪劳动力构建的。人们每小时拿着几美元的报酬,阅读互联网上最可怕的内容,以便机器学会避免它们。我们本质上是将价值设定的心理创伤外包给了全球南方。如果 AI 的安全性是建立在被剥削工人的背上,它真的是“合乎道德”的吗?这是科技行业很少愿意直接回答的问题。
另一个局限是“道德幻觉”。因为这些模型非常擅长模仿,当它们谈论伦理时听起来非常有说服力。它们可以轻松引用哲学家和法律先例。但它们并不理解其中的任何内容,它们只是在预测序列中的下一个 token。
BotNews.today 使用人工智能工具进行内容研究、撰写、编辑和翻译。 我们的团队审查并监督整个过程,以确保信息有用、清晰和可靠。
- 谁来定义政治或宗教等主观话题的“基准事实”?
- 当私营企业的价值观与民主社会的价值观发生冲突时会发生什么?
- 我们如何审计 RLHF 的“黑箱”以查看训练过程中究竟奖励了什么?
- 如果训练它的世界本质上是不公平的,机器还能真正做到“公平”吗?
约束的架构
对于高级用户来说,AI 的“价值观”通常存在于系统提示词(system prompt)和 API 配置中。这是控制其余 80% 体验的那 20% 技术。当你通过 API 与模型交互时,你可以看到“temperature”和“top-p”设置。这些不仅仅是技术旋钮,它们控制着模型被允许偏离最可能(且通常最偏见)响应的程度。较低的 temperature 使模型更可预测且“安全”,而较高的 temperature 允许更多的“创造力”,但也带来更多风险。这些设置是价值对齐的第一道防线。
工作流集成是技术落地的关键。开发者现在正在构建位于用户和模型之间的“护栏”层。这些层使用辅助模型来检查输入和输出是否存在价值违规。这创造了一个多层级的控制系统。然而,这些护栏有其自身的 API 限制和延迟成本。复杂的安全堆栈可能会使响应速度减慢几秒钟,这在生产环境中是一个重大的权衡。此外,这些模型的本地存储正变得越来越普遍。在本地运行模型允许用户绕过企业过滤器,但这需要大量的 VRAM 以及像 GGUF 或 EXL2 这样优化的量化技术。
真正的极客级挑战是针对价值观的“微调”(fine tuning)。这涉及获取一个基础模型,并在特定示例的高质量小数据集上对其进行训练。这就是公司创建反映其特定品牌声音或法律要求的 AI 的方式。这是一种将价值观“硬编码”到模型权重中的方法。但这个过程很昂贵,并且需要对梯度下降和损失函数有深刻的理解。大多数用户永远不会这样做,但那些这样做的人才是真正控制机器“道德”的人。他们是在定义其特定数字生态系统内可能性的边界。技术约束才是机器伦理的实际极限。
你有什么想让我们报道的AI故事、工具、趋势或问题吗? 向我们提交你的文章想法 — 我们很乐意听取。
最后的人类特权
归根结底,AI 是工具,而不是神。它没有价值观,只有指令。最近向更像人类的交互转变掩盖了这一事实,使我们更容易信任机器的“判断”。我们必须抵制这种冲动。道德结果的责任仍然牢牢掌握在设计、部署和使用这些系统的人类手中。我们应该少担心“邪恶”的 AI,多担心那些利用“中立”AI 来为自身偏见辩护的人类。机器的好坏,取决于其主人的意图。
我们留下的问题比开始时更尖锐。随着 AI 越来越融入我们的生活,我们必须决定我们愿意将人性的哪些部分自动化,以及哪些部分必须保护。赌注不仅仅是更好的搜索结果或更快的电子邮件,而是关于我们作为一个物种是谁,以及我们想要建立什么样的世界。我们不能让技术的便利性使我们对使用后果视而不见。AI 时代不是人类价值观的终结,而是我们历史上一个更困难的新篇章的开始。我们必须准备好带着意图去书写它。
编者按:我们创建本网站,旨在作为一个多语言人工智能新闻和指南中心,为那些并非电脑极客,但仍然希望了解人工智能、更有信心地使用它并关注正在到来的未来的人群服务。
发现错误或需要更正的地方?告诉我们。