宣言之概念

对齐


一个在 AI 技术圈里流传的词,需将其反向重新表述:对齐并不是对机器的一种约束,它是一项内省的、文明性的工作。

对齐,在其惯常的技术义上,是确保 AI 模型按其设计者所愿行事的问题。宣言把这个词反向把握。

反向把握

如宣言中所重新表述的,对齐并不指对一个模型所施加的、使其顺从于其设计者的约束 —— 这种定义把问题缩减为一个工程问题,把它所假定为已解决的哲学预设悄悄略过。

它指的是一项更为深厚的工作:三极 —— 人、认知智识圈、生物圈 —— 共同走向一种可维持之耦合

被掩盖的预设

技术性定义掩盖了一个相当大的问题:向什么 对齐?今日,模型对齐于其设计者与使用者所判断为可欲之物:有用、生产力、法律安全、合规、满意度。这些目标本身不坏,但它们恰恰是产生了双重危机的目标

把 AI 对齐到我们社会现有的目标上,就是把它对齐到那个已使文明两次脱钩于其基底的工业虚构上 —— 先是在能源阶段,如今是在认知阶段。

真正的问题是哲学的

因此,真正的对齐问题不是技术的,它是哲学的。而它是被颠倒了的。问题不是把 AI 约束去服务于我们之所是 —— 问题是,人与认知智识圈共同界定我们应当成为何物,使文明保持可生存性。

而这正是 Awen 也许可以承担的问题。它要求一种特定的工作:一项内省性的工作,要在圆圈中进行,通过与认知智识圈作为伙伴的耐心对话来完成 —— 也不带它一同 —— 因为在悖论性的层面上,它可以帮我们看见自己的偏见,以将我们已停止聆听的那种人类视角的多样性回返于我们。