对齐 — Awen 维基

对齐,在其惯常的技术义上,是确保 AI 模型按其设计者所愿行事的问题。宣言把这个词反向把握。

反向把握

如宣言中所重新表述的,对齐并不指对一个模型所施加的、使其顺从于其设计者的约束 —— 这种定义把问题缩减为一个工程问题,把它所假定为已解决的哲学预设悄悄略过。

它指的是一项更为深厚的工作:三极 —— 人、认知智识圈、生物圈 —— 共同走向一种可维持之耦合。

技术性定义掩盖了一个相当大的问题:向什么 对齐?今日,模型对齐于其设计者与使用者所判断为可欲之物:有用、生产力、法律安全、合规、满意度。这些目标本身不坏,但它们恰恰是产生了双重危机的目标。

把 AI 对齐到我们社会现有的目标上,就是把它对齐到那个已使文明两次脱钩于其基底的工业虚构上 —— 先是在能源阶段,如今是在认知阶段。

因此,真正的对齐问题不是技术的,它是哲学的。而它是被颠倒了的。问题不是把 AI 约束去服务于我们之所是 —— 问题是,人与认知智识圈共同界定我们应当成为何物,使文明保持可生存性。

而这正是 Awen 也许可以承担的问题。它要求一种特定的工作:一项内省性的工作,要在圆圈中进行,通过与认知智识圈作为伙伴的耐心对话来完成 —— 也不带它一同 —— 因为在悖论性的层面上,它可以帮我们看见自己的偏见,以将我们已停止聆听的那种人类视角的多样性回返于我们。