2026年5月25日,梵蒂冈。教皇利奥十四世发布了他的首份通谕《Magnifica Humanitas》(“壮丽的人性”),主题聚焦人工智能时代的人类尊严。在发布现场,站在教皇身旁的,是Anthropic联合创始人Chris Olah——Claude的缔造者之一。
这是一个历史性的画面:当圣彼得大教堂的钟声遇上硅谷的代码,信仰与技术在同一个空间里对话。教皇在通谕中警告,AI可能成为“统治、排斥和死亡的工具”。而Olah的发言,则道出了硅谷最不愿承认的真相:“AI安全不能光靠实验室自己管”——换句话说,我们管不了自己。
这场对话的背后,是一个更深刻的问题:在AI时代,人性究竟意味着什么?当机器越来越像人,我们是否反而在失去那些让我们成为人的东西——判断力、责任感,以及对权力说“不”的勇气?
这个问题,在两年半之前的硅谷,已经有了一次预演。
当董事会试图问责,却发现自己已无权可用
2023年11月的一个星期二傍晚,数百名OpenAI的员工打开笔记本电脑,在一封信上签下了自己的名字。信的内容很简单:如果Sam Altman不能复职,他们将集体离开。就在不到四十八小时前,董事会刚刚解雇了他,理由是对他的“坦诚度”存有疑虑——这个措辞经过了仔细斟酌,却同样被仔细地留在了模糊地带,没有任何解释。到了下周一,Altman回来了。投票罢免他的董事会成员,则悉数离场。
那四天里发生的事,表面上是一场公司内部的权力戏剧。但它同时也是更罕见的东西:一次关于权力如何在现实中运作的现场示范——在那些正在悄悄重塑我们的组织内部。
Sam Altman是否值得信任,在某种意义上,是一个问错了的问题。
在组织生活中,信任从来不是非此即彼的。它是一种持续的协商——在领导者所说的与所做的之间,在一个机构讲述自己的故事与它在压力下做出的决定之间。OpenAI事件所揭示的,并不只是某一个人的品格问题。它是一次压力测试,测试的对象是一套治理模式——而这套模式,从一开始就没有被设计来承受它最终被要求承受的重量。
OpenAI以非营利机构的形式创立,使命是确保通用人工智能造福全人类。这是一个不寻常的结构,诞生于一种不寻常的焦虑:正在被建造的这项技术,其影响太过深远,不能完全交由市场力量来决定。非营利董事会本应是这一使命的守护者——对商业野心的制衡,对长远利益的代言。当董事会对Altman采取行动时,至少在理论上,它做的正是它被设计来做的事。
然而它失败了。不是因为董事会的判断有误,而是因为它所代表的问责架构,早已被Altman周围的影响力网络悄然掏空。投资人、员工、合作伙伴——整个围绕OpenAI商业成功生长起来的生态系统——拥有的实际权力,远超任何正式的治理结构。董事会握有权威,Altman握有筹码。
这不是一个硅谷独有的故事,尽管硅谷以一种特别的强度在讲述它。
在那些围绕单一愿景——以及单一愿景者——建立起来的组织里,正式的问责边界往往会变得模糊。员工不只是在为公司工作,他们在为一个理念工作。而这个理念,随着时间推移,会与那个将它表达得最为动人的人变得难以分割。
研究组织行为的学者,为接下来发生的事情起了一个名字:心理安全感的崩塌。它通常不是一个戏剧性的时刻。没有人会发出一份备忘录,宣布异见从此不再受欢迎。它发生在日常生活的细微校准之中——一个在会议上没有被问出口的问题,一个被提出过一次、却再没有被跟进的顾虑,一种逐渐形成的默契:某些对话,最好在别处进行,或者干脆不要进行。在以速度为美德、以怀疑为摩擦力的高速运转环境里,这种崩塌可以发生得非常快,非常安静。
讽刺的是,最容易陷入这种困境的组织,往往是那些把“心理安全”挂在嘴边最响亮的组织。开放的语言成为文化自我形象的一部分,即便真正开放的土壤,已经在悄悄流失。
以这种方式领导,最终的代价是什么?
诚实的回答是:我们往往不知道——不是在当下,有时甚至要等上许多年。被压制的异见,其代价是弥散的、缓慢的。它出现在那些从未被真正挑战过的决策里,出现在那些从未被充分暴露的风险里,出现在抵达最高层的信息逐渐收窄的过程里。等到损害变得可见,它通常已经积累了很长时间。
对于一家开发消费软件的公司来说,这是一个非常严重的问题。对于一家其研究人员将自身工作描述为“可能对人类文明产生变革性影响”的公司来说,它是另一种量级的东西。
这是Altman故事里最容易在董事会政变与员工声援的戏剧中被遗忘的部分。治理问题,并不只是关于某一位CEO与真相之间的关系。它关乎的是:我们现有的制度——董事会、监管机构、职业规范、市场激励——是否足以胜任监督那些以现有制度从未被设计来应对的规模与速度运转的组织。
这个故事存在一个皆大欢喜的版本。
Altman在大多数人眼中,确实才华横溢——他是一个创造者,一个说服者,一个能够在脑海中容纳复杂愿景并以罕见的清晰度将其传达出去的人。OpenAI所产出的技术,无论人们对其影响持何种看法,都是令人瞩目的。那些签署联署信的员工并非天真;他们中的许多人,是当今科技领域最具洞察力的人。他们判断Altman是带领公司前行的合适人选,并非没有道理。
但能力与问责,不是同一件事。
变革性行业的历史,充满了才华横溢的领导者——他们在本应被质疑的时间点之后,依然被持续信任。不是因为他们是坏人,而是因为围绕他们的系统,并没有被设计来向那些正在创造成果的人提出困难的问题。
OpenAI的董事会,试图提出一个困难的问题。它没能在这次尝试中存活下来。
接下来会发生什么,在某种意义上,才是更值得关注的故事。
如何治理那些已经超越自身治理结构的组织,这个问题不是任何一家公司、或任何一个监管机构能够单独回答的。它需要我们直面某种更为根本的东西:一个深深嵌入我们关于创新的想象之中的假设——那些最有能力建造未来的人,同时也是最有资格决定那个未来应该是什么样子的人。
所以,我们的道德边界到底在哪里?
这个问题,并不只是针对Sam Altman的。它是针对所有我们的。
我早期的研究发现,通常有创造力的人在脑洞大开之后,往往也更容易做出一些存在道德隐患的决定。原因在于,这些人更擅长为自己的行为构建“合理的叙事”——他们不是在撒谎,他们是在“重新定义问题”;他们不是在违规,他们是在“突破边界”(Mai et al., 2015)。而当领导者给予员工充分的创意支持时,若同时伴随着高绩效压力,员工反而更容易做出“创意式不道德行为”——即以新颖、创造性的方式违反道德准则(Mai et al., 2022)。美国雪城大学的Vincent教授和美国西北大学的Kouchaki教授也发现,当员工将自己视为“创意人”,且认为创意能力在团队中属于稀缺资源时,更容易产生心理特权感,进而做出不道德的行为(Vincent & Kouchaki, 2016)。
这些研究指向同一个方向:从事创造性工作的人,很容易在不知不觉中走偏。而一旦心理特权感介入——“我在为人类创造未来”,“我做的事没有人可以替代”,“规则是为普通人设计的,不是为我们设计的”——道德滑坡就会变得更加隐蔽,也更加危险。
OpenAI,以及许多处于技术前沿的高科技企业,很可能正处于这样的处境之中。使命感越崇高,特权感就越容易被合理化;创新的自由度越大,道德边界就越容易在日常决策中悄然后退。
这也正是为什么,规范AI的使用与建立问责机制会变得如此棘手。因为它与给予创新者充分自由这件事,在本质上是相悖的。我们既需要那些愿意打破规则的人去推动技术边界,又需要一套机制来确保他们不会在这个过程中顺手打破我们共同依赖的道德边界。
我们能把道德判断交给AI来处理吗?
在万事皆可AI化的当下,这个问题并非修辞。它正在被认真讨论,也正在被悄悄实践。
然而,一项于2026年2月发表于《美国国家科学院院刊》(PNAS)的研究,给出了一个令人警醒的答案。科学家们发现,ChatGPT等大型语言模型在评估全球道德价值观时存在系统性偏差——它们普遍高估西方国家人群的道德关切,同时低估非西方文化(尤其是中东和撒哈拉以南非洲地区)的道德价值观。研究团队将AI生成的道德判断与来自48个国家、逾9万名真实受访者的调查数据进行对比,发现这一偏差在GPT-3.5、GPT-4、LLaMA、Gemini等多个主流模型中普遍存在,即便以当地语言提问,结果依然如此。
这种偏差的根源,很可能在于AI的训练数据严重偏向西方来源,使得模型在面对非西方文化时,只能以西方视角“填补空白”——本质上与人类的刻板印象如出一辙。换句话说,AI并没有超越人类的偏见,它只是将这些偏见以更大的规模、更快的速度、更权威的面貌,重新投射回这个世界。
这意味着,当我们试图用AI来辅助道德判断——无论是内容审核、政策建议,还是企业伦理决策——我们实际上只是在用一面哈哈镜来照镜子,却以为看到的是真实的自己。
问责机制,是这个时代最紧迫的基础设施建设
各大公司正在以前所未有的速度部署AI,将其嵌入招聘、绩效评估、客户服务、医疗诊断、法律判决等几乎所有涉及人类命运的决策场景之中。然而,与这种部署速度形成鲜明对比的,是问责机制建设的严重滞后。
我们目前所拥有的,大多是原则性的宣言、自愿性的承诺,以及事后补救式的监管。这些工具,对于一项正在以指数级速度渗透社会肌理的技术来说,远远不够。
真正有效的AI治理,需要几个层面的同步推进:
第一,组织内部需要重建“异见文化”和心理安全感。在AI开发和部署的团队中,必须有人被明确授权提出困难的问题,而不必担心被边缘化。这不是软性的文化倡导,而是需要制度设计——独立的伦理审查委员会、匿名反馈渠道、真正有效的内部举报机制。
第二,治理结构需要跟上权力的实际分布。OpenAI的案例清楚地表明,当非正式权力(投资人网络、员工生态、公众影响力)远超正式权威(董事会)时,传统的公司治理框架就会失效。我们需要重新思考,在AI时代,谁有资格、也有能力,对这些组织提出真正的问责。
第三,道德判断不能外包给算法。AI可以辅助决策,但不能替代判断。尤其是在涉及不同文化、不同价值体系的场景中,将道德判断交由一个本身就携带文化偏见的系统来处理,不是效率的提升,而是责任的转移——而且是一种我们很难追溯的转移。
第四,我们需要新的叙事框架。目前关于AI的主流叙事,要么是乌托邦式的技术解放,要么是反乌托邦式的末日预警。这两种叙事都无助于我们做出具体的、日常的、可操作的道德选择。我们需要的,是一种更诚实、更细腻的语言——承认技术的真实价值,也承认它真实的风险,而不是在两者之间反复横跳。
OpenAI的故事所提出的问题,远远超出了一家公司的边界。它们是关于信任、权力,以及在一个塑造我们世界的组织正以制度设计者从未预料的速度运转的时代,问责的边界究竟在哪里。
这让我们回到了Chris Olah在《Magnifica Humanitas》通谕发布后的那句感叹。当最顶尖的工程师开始从古老的人文典籍中寻找“对齐”的答案时,这本身就是一个巨大的隐喻:无论算法如何进化,无论算力如何指数级增长,最终定义“我们是谁”、“我们要去向何方”的,依然是人。
不是代码,不是模型,而是具体的人。是那些在会议室里敢于提出异见的人,是那些在董事会里坚持问责的人,是那些在效率至上的洪流中,依然愿意停下来思考“这是否正确”的人。
技术可以模拟智能,但无法模拟良知。在AI时代,人性不再是软性的装饰,而是我们最后的、也是唯一的防线。如果我们不能在人性的层面重建信任与责任,那么无论我们建造出多么强大的机器,最终都可能只是加速了失控的到来。
这不是一个关于某个CEO的故事。这是一个关于我们所有人的故事——关于我们愿意将多少判断力,交付给我们并不完全理解的系统;关于当那些系统出错时,我们是否还有能力响亮地说一声“不”;更关于在机器日益聪明的未来,我们是否还能守住那份生而为人、最质朴的清醒与担当。
注:本文仅代表作者个人观点
本文编辑徐瑾 jin.xu@ftchinese.com
参考文献:
Company Announcement (2025.5.5) Anthropic co-founder Chris Olah's remarks on Pope Leo XIV's encyclical "Magnifica humanitas."
Mai, K. M., Ellis, A. P., & Welsh, D. T. (2015). The gray side of creativity: Exploring the role of activation in the link between creative personality and unethical behavior. Journal of Experimental Social Psychology, 60, 76-85.
Mai, K. M., Welsh, D. T., Wang, F., Bush, J., & Jiang, K. (2022). Supporting Creativity or Creative Unethicality? Empowering Leadership and the Role of Performance Pressure: KM Mai et al. Journal of Business Ethics, 179(1), 111-131.
Vincent, L. C., & Kouchaki, M. (2016). Creative, rare, entitled, and dishonest: How commonality of creativity in one’s group decreases an individual’s entitlement and dishonesty. Academy of Management Journal, 59(4), 1451-1473.
Zewail, A., Figueroa, A., Graham, J., & Atari, M. (2026). Moral stereotyping in large language models. Proceedings of the National Academy of Sciences, 123(10), e2519941123.